***************************************************** ********** LAB3 - Trabalho Google Web APIs ********** ***************************************************** Data : 03/10/2002 Versão : 04/07/2007 Professor: Luís Alves Ferreira Autor : Leandro Salvador ( leandrosalvador.com.br ) * Desenvolver Suas Próprias Aplicações Usando o Google - com os serviço de APIs Web do Google, desenvolvedores de software podem carregar mais de 2 bilhões de documentos web diretamente de seus próprios programas de computador - o Google usa as regras SOAP e WSDL, então um desenvolvedor pode programar na sua plataforma favorita, como Java, Perl ou VisualStudio .NET - para começar a escrever programas usando o as APIs Web Google, deve-se seguir os seguintes passos - download o kit de desenvolvedor - criar uma conta no Google - escrever seu programa usando sua chave de licença - todas essas instruções estão na página http://www.google.com/apis/ * Download do Kit de Desenvolvimento de APIs Web Google - este kit de desenvolvimento contém tudo que você precisa para escrever programas usando as APIs do Google, incluindo - um arquivo WSDL que pode ser usado com qualquer plataforma de desenvolvimento que suporte serviços web - uma biblioteca Java que provê """wrapper""" em torno da interface SOAP das APIs do Google - um exemplo de programa .NET que invoca o serviço de APIs do Google - documentação que descreve a API SOAP e a biblioteca Java - o kit tem 666kB * Características Gerais - as APIs do Google são um programa web beta que permite desenvolvedores facilmente encontrar e manipular informação na web - as APIs do Google são destinadas a desenvolvedores e pesquisadores interessados em usar o Google como um recurso em suas aplicações - o serviço trabalha da seguinte maneira: os desenvolvedores escrevem programas que se conectam remotamente ao serviço de APIs Web Google; a comunicação é efetuada através de um mecanismo baseado em XML para troca de informação tipada chamado Simple Object Access Protocol (SOAP) - as APIs do Google são muito úteis porque dão ao programador acesso rápido ao serviço de procura web do Google, permitindo-lhe desenvolver programas que acessam bilhões de documentos web que são constantemente atualizados - questões sobre o uso das APIs do Google podem ser discutidas na página http://google.public.web-apis - SOAP é um protocolo que significa "Protocolo de Acesso a Objetos Simples", o qual é usado para troca de informações a RPC, geralmente sobre HTTP; mais informações podem ser encontradas em - Developmentor SOAP FAQ: http://www.develop.com/soap/soapfaq.htm - W3C specifications: http://www.w3.org/TR/SOAP/ - WSDL é uma linguagem que significa "Linguagem de Definição de Serviços Web", a qual permite uma descrição formal de um serviço web; o arquivo WSDL é tudo que é necessário para saber como chamar o serviço web; toolkits podem gerar código proxy de um arquivo WSDL diretamente; a definição oficial WSDL está em http://www.w3.org/TR/wsdl * Mecanismo - para procurar enviamos uma string de procura e alguns parâmetros pro Google, o qual retorna um conjunto de resultados da procura - os resultados da busca são derivados do índice do Google, que tem mais de 2 bilhões de Web pages - a limitação de sintaxe de procura é de 2048 bytes a 10 palavras individuais - parâmetros de busca - key - é requirido para autenticação e loggin - q - start - índice baseado no primeiro resultado desejado - maxResults - número de resultados desejados por pesquisa - o valor máximo por pesquisa é 10 - filter ativa ou desativa filtragem de resultados automática, a qual esconde resultados muito similares que venham de um mesmo Web host - restrict - restringe a procura para um subconjunto do índice do Google, como um país como "Brazil" ou um tópico como "Linux" - Brazil --> countryBR - United States --> countryUS - safeSearch - um valor booleano que ativa a filtragem de conteúdo adulto no resultado da busca - lr - language restrict - restringe a procura para documentos com uma ou mais linguagens - Portuguese --> lang_pt - English --> lang_en - Spanish --> lang_es - default search - não há necessidade de se utilizar "AND" entre termos - stop words - o Google ignora palavras e caracteres como "where", "how", alguns dígitos e letras - para prevenir que o Google ignore as "stop words", basta colocá-las entre aspas, como na frase "ser ou não ser" - special characters - todos os caracteres não-alfanuméricos que são incluídos numa busca são tratados como separadores de palavras - as únicas exceções são ", +, -, & - termos de busca especial - Include Query Term --> Star Wars Episode +I - Exclude Query Term --> bass -music - Phrase Search --> "yellow pages" - Boolean OR Search --> vacation london OR paris - Site Restricted Search --> computadores site:www.tancredo.br - Date Restricted Search --> Star Wars daterange:2452122-2452234 - utilizar a data Juliana (Julian date), a qual é calculada pelo número de dias desde 01/01/4713 a.C. - exemplo: 01/08/2001 --> 2452122 - Title Search (term) --> intitle:Google search - Title Search (all) --> allintitle: Google search - URL Search (term) --> inurl: Google search - URL Search (all --> allinurl: Google search - Text Only Search (all) --> allintext: Google search - Links Only Search (all) --> allinlinks: Google search - File Type Filtering --> Google filetype:doc OR filetype:pdf - File Type Exclusion --> Google -filetype:doc -filetype:pdf - Web Document Info --> info:www.google.com - Back Links --> link:www.google.com - Related Links --> related:www.google.com - Cached Results Page --> cache:www.google.com web * Acesso java com.google.soap.search.GoogleAPIDemo (search | cached | spell ) java -cp googleapi.jar com.google.soap.search.GoogleAPIDemo Q1lifd3TKlnrcebIsUInlLpYnG1dSfim search Foo java -cp googleapi.jar com.google.soap.search.GoogleAPIDemo Q1lifd3TKlnrcebIsUInlLpYnG1dSfim cached http://www.google.com/ java -cp googleapi.jar com.google.soap.search.GoogleAPIDemo Q1lifd3TKlnrcebIsUInlLpYnG1dSfim spell "britnay spars" ----------//----------