Busca na internet: além do básico no Google
Hoje vamos começar a “dissecar” o funcionamento do Google para que possamos tirar o melhor proveito dele. Já vimos que uma das maiores utilidades da internet para o jornalista é na pesquisa, mas você pode fazer mais do que imagina com o google…
Introdução: Diretórios x search engines
Índices da web x varreduras periódicas
A “revolução” do Google: PageRank algorithm. Cuidado: Cookies!
Explicações sobre o PageRank
A classificação das páginas (PageRank) confia na natureza excepcionalmente democrática da Web, usando sua vasta estrutura de links como um indicador do valor de uma página individual. Essencialmente, o Google interpreta um link da página A para a página B como um voto da página A para a página B. Mas o Google olha além do volume de votos, ou links, que uma página recebe; analisa também a página que dá o voto. Os votos dados por páginas “importantes” pesam mais e ajudam a tornar outras páginas “importantes.”
Sites importantes, de alta qualidade recebem uma nota de avaliação maior, que o Google grava a cada busca feita. Naturalmente, uma página importante não significa nada se não combinar com a sua busca. Assim, o Google combina os resultados de alta qualidade com a busca que você está realizando para que o resultado seja o mais relevante possível. O Google pesquisa quantas vezes a palavra procurada aparece nas páginas e examina todo o aspecto delas (e conteúdo das páginas ligadas a ela) para determinar o melhor resultado para a sua busca.
Não importa só o número de links para uma página para ela ter um bom ranking, mas principalmente é levada em conta a palavra âncora do link (relevância com a pesquisa).
- O Google não negocia classificações dentro dos resultados de busca (ou seja, não é possível comprar uma posição privilegiada na Listagem de Páginas).
- Google analiza a proximidade destes termos dentro da página. Ao contrário de muitos outros instrumentos de pesquisa, o Google dá prioridade aos resultados de acordo com a proximidade dos termos pesquisados
- Google só lista página com links externos pra ela ou log em servidores monitorados. Páginas que ainda não foram listadas provavelmente não foram incluídas porque outros sites ainda não oferecem link a ela — se outros sites não são ligaods a uma página, nós não podemos determinar um PageRank (nossa medida proprietária da importância de uma página) numa maneira razoável. Uma vez que outros tem links para uma página, nós a listaremos. O Google analisa como o link está conectado a outras páginas da web e os possibilita a abertura, na vasta natureza da internet para selecionar os resultados mais relevantes.
- Missão da empresa é “organize the immense amount of information available on the web”
- Founded: September 1998 by Larry Page and Sergey Brin
• Web pages searched: More than 8 billion
• File types searched include:
HyperText Markup Language (html)
Adobe Portable Document Format (pdf)
Adobe PostScript (ps)
Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
Lotus WordPro (lwp)
MacWrite (mw)
Microsoft Excel (xls)
Microsoft PowerPoint (ppt)
Microsoft Word (doc)
Microsoft Works (wks, wps, wdb)
Microsoft Write (wri)
Rich Text Format (rtf)
Shockwave Flash (swf)
Text (ans, txt)
• Images: 880 million+
• Usenet messages: 845 million+
- Consultas com “e” automático
O Google só retorna páginas que incluam todos os seus termos de busca. Não há necessidade de incluir “and” entre os termos. Para restringir uma busca com mais profundidade basta incluir mais termos.
- Palavras Descartáveis
O Google ignora palavras e caracteres comuns, conhecidos como palavras descartáveis. O Google automaticamente descarta termos como “http” e “.com”, assim como dígitos ou letras isoladas, porque eles raramente ajudam na busca e podem torná-la consideravelmente mais lenta.
Use o sinal “+” para incluir palavras descartáveis na sua pesquisa. Tenha a certeza de incluir um espaço antes do sinal “+”. [Você pode também incluir o sinal "+" na busca de frases.]
Maiúsculas, minúsculas ou acentos interessam?
As buscas no Google não são sensíveis a maiúsculas e minúsculas. Todas as palavras, independentemente da forma como forem escritas, serão entendidas como minúsculas. Por exemplo, buscas por “google”, “GOOGLE” ou “GoOgLe” trarão os mesmos resultados.
As pesquisas padrões do Google não são sensíveis a acentos ou sinais diacríticos, ou seja, [Muenchen] e [München] encontrarão as mesmas páginas. Se quiser discriminar as duas palavras, use um sinal + tanto para [+Muenchen] como para [+München].
- A INTERFACE DO GOOGLE
> Web: (busca na internet)
> Imagens: 390 milhões de imagens indexadas e disponíveis para visualização
> Grupos
Usenet: A world-wide system of discussion groups, with comments passed among hundreds of thousands of machines. Usenet is completely decentralized, with over 10,000 discussion areas, called newsgroups.
- Notícias
- Diretório:
O Diretório Web Google organiza a web por tópicos, assim você pode navegar por categorias para procurar palavras-chave para usar em sua busca. Ou simplesmente clique links de uma determinada categoria até encontrar a página que você quer.
- Preferências
- Ferramenta de idiomas
- Pesquisa avançada
Com todas as palavras:
busca todas as palavras, não importa se juntas ou não na página (de preferência juntas) e ignora os caracteres comuns (de, da etc).
com a expressão: “exatamente a expressão”.
com qualquer uma das palavras: tanto faz uma quanto a outra.
sem as palavras: excluir dos resultados as páginas que contenham essa(s) palavra(s)
Os resultados:
Título
Contexto onde aparece na página o termo pesquisado.
URL – peso – em cachê – páginas semelhantes
[xls]
Formato do arquivo: Microsoft Excel 2000 – Ver em HTML
Tabela Help do Google traduzida
Exercício
- Você está fazendo uma reportagem de revista sobre o comportamento dos jovens em relação ao consumo de informação. Pesquisando na internet para a construção da pauta você descobriu que a ANJ (Associação Nacional de Jornais) organiza um evento chamado “Jovens Leitores”.
Procure uma ou mais apresentações em power point usada(s) na última edição do evento (2006). Cole abaixo os resultados da sua busca e diga como você chegou até eles, ou seja, escreva quais campos do “pesquisa avançada” do Google você usou e com quais termos (ou opções) em cada um.
- Para Manuel Castells, quais as características da internet brasileira hoje?
- Encontrar planilha com as principais causas de morte em idosos no município de São Joaquim?
- Três mil metros cúbicos de água equivalem a quantos litros?
- Quem tem mais links para o seu site, Avai ou Figueirense?
BUSCA ACADÊMICA
1. Suponhamos que você leu o trabalho “Jornalismo Online e Identidade Profissional do Jornalista”, apresentado em 2001 por ZL ADGHIRNI no encontro Associação Nacional dos Programas de Pós-graduação em Comunicação – COMPÓS. Você gostaria de saber se há disponível na internet outros artigos acadêmicos que tenham citado este trabalho de Adghirni. Para responder esta questão, copie abaixo os resultados do Google Acadêmico que mostram os artigos que citam o trabalho “Jornalismo Online e Identidade Profissional do Jornalista”, de autoria de ZL Adghirni.
2. Você está fazendo uma reportagem sobre o uso de drogas entre estudantes e gostaria de encontrar um pesquisador do assunto para entrevistar, em Florianópolis. Encontre: o nome de um pesquisador com artigo acadêmico publicado sobre o assunto; a universidade e o departamento onde ele trabalha, seu telefone de trabalho e e-mail.
test Filed under Aulas, Ferramentas | Comment (1)Um comentário para o post “Busca na internet: além do básico no Google”
Participe com seu comentário











[...] em agosto do ano passado aqui no blog um post sobre busca na web que vai servir para orientar nossa aula de hoje. [...]