Pesquisa na internet: Google

março 14th, 2005

Introdução: Diretórios > search engines

Índices da web > varreduras periódicas

A “revolução” do Google: PageRank algorithm. Cuidado: Cookies!

Explicações sobre o PageRank
A classificação das páginas (PageRank) confia na natureza excepcionalmente democrática da Web, usando sua vasta estrutura de links como um indicador do valor de uma página individual. Essencialmente, o Google interpreta um link da página A para a página B como um voto da página A para a página B. Mas o Google olha além do volume de votos, ou links, que uma página recebe; analisa também a página que dá o voto. Os votos dados por páginas “importantes” pesam mais e ajudam a tornar outras páginas “importantes.”

Sites importantes, de alta qualidade recebem uma nota de avaliação maior, que o Google grava a cada busca feita. Naturalmente, uma página importante não significa nada se não combinar com a sua busca. Assim, o Google combina os resultados de alta qualidade com a busca que você está realizando para que o resultado seja o mais relevante possível. O Google pesquisa quantas vezes a palavra procurada aparece nas páginas e examina todo o aspecto delas (e conteúdo das páginas ligadas a ela) para determinar o melhor resultado para a sua busca.

Não importa só o número de links para uma página para ela ter um bom ranking, mas também é levada em conta a palavra âncora do link (relevância com a pesquisa).

UPDATE 2004-06-26: The consensus among observers is that PageRank is not nearly as important as it was up until mid-2003. Many sites with good PageRank are not doing well in Google, and many with poor PageRank are ranking well for keywords that are important to them. These days, the keywords in the anchor text of external links are more important than the mere fact of the link itself. (In its classic form, PageRank was computed from links without any consideration of content.) (do site www.google-watch.org)

- O Google não negocia classificações dentro dos resultados de busca (ou seja, não é possível comprar uma posição privilegiada na Listagem de Páginas).

- Google analiza a proximidade destes termos dentro da página. Ao contrário de muitos outros instrumentos de pesquisa, o Google dá prioridade aos resultados de acordo com a proximidade dos termos pesquisados

- Google só lista página com links externos pra ela ou log em servidores monitorados. Páginas que ainda não foram listadas provavelmente não foram incluídas porque outros sites ainda não oferecem link a ela — se outros sites não são ligaods a uma página, nós não podemos determinar um PageRank (nossa medida proprietária da importância de uma página) numa maneira razoável. Uma vez que outros tem links para uma página, nós a listaremos. O Google analisa como o link está conectado a outras páginas da web e os possibilita a abertura, na vasta natureza da internet para selecionar os resultados mais relevantes.

O Básico sobre o Google

- Missão da empresa é “organize the immense amount of information available on the web”

- Founded: September 1998 by Larry Page and Sergey Brin

- Google.com is one of the 5 most popular sites on the Internet and is used around the world by millions of people.
• Google is the #1 search engine in the UK, Germany, France, Italy, Netherlands, Spain, Switzerland, and Australia ( Nielsen//NetRatings 6/04)
• Global unique users per month: 81.9 million (Nielsen/NetRatings 6/03)
• Languages for which Google provides an interface: 97
• Languages in which Google offers results: 35
• Global audience: More than 50 percent of Google.com traffic is from outside the US
Google is the world’s largest search engine and through its partnerships with America Online, Netscape and others , answers more questions than any other service online.
• Web pages searched: More than 8 billion
• File types searched include:
HyperText Markup Language (html)
Adobe Portable Document Format (pdf)
Adobe PostScript (ps)
Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
Lotus WordPro (lwp)
MacWrite (mw)
Microsoft Excel (xls)
Microsoft PowerPoint (ppt)
Microsoft Word (doc)
Microsoft Works (wks, wps, wdb)
Microsoft Write (wri)
Rich Text Format (rtf)
Shockwave Flash (swf)
Text (ans, txt)
• Images: 880 million+
• Usenet messages: 845 million+

- Consultas com “e” automático
O Google só retorna páginas que incluam todos os seus termos de busca. Não há necessidade de incluir “and” entre os termos. Para restringir uma busca com mais profundidade basta incluir mais termos.

- Palavras Descartáveis
O Google ignora palavras e caracteres comuns, conhecidos como palavras descartáveis. O Google automaticamente descarta termos como “http” e “.com”, assim como dígitos ou letras isoladas, porque eles raramente ajudam na busca e podem torná-la consideravelmente mais lenta.
Use o sinal “+” para incluir palavras descartáveis na sua pesquisa. Tenha a certeza de incluir um espaço antes do sinal “+”. [Você pode também incluir o sinal "+" na busca de frases.]

Maiúsculas, minúsculas ou acentos interessam?
As buscas no Google não são sensíveis a maiúsculas e minúsculas. Todas as palavras, independentemente da forma como forem escritas, serão entendidas como minúsculas. Por exemplo, buscas por “google”, “GOOGLE” ou “GoOgLe” trarão os mesmos resultados.
As pesquisas padrões do Google não são sensíveis a acentos ou sinais diacríticos, ou seja, [Muenchen] e [München] encontrarão as mesmas páginas. Se quiser discriminar as duas palavras, use um sinal + tanto para [+Muenchen] como para [+München].

- A INTERFACE DO GOOGLE

> Web: (busca na internet)

> Imagens: 390 milhões de imagens indexadas e disponíveis para visualização

> Grupos
Usenet: A world-wide system of discussion groups, with comments passed among hundreds of thousands of machines. Usenet is completely decentralized, with over 10,000 discussion areas, called newsgroups.

- Diretório:
O Diretório Web Google organiza a web por tópicos, assim você pode navegar por categorias para procurar palavras-chave para usar em sua busca. Ou simplesmente clique links de uma determinada categoria até encontrar a página que você quer.

- Preferências
- Ferramenta de idiomas
- Pesquisa avançada (interface para usar os operadores do “cheat sheet”)
Com todas as palavras:
busca todas as palavras, não importa se juntas ou não na página (de preferência juntas) e ignora os caracteres comuns (de, da etc).
com a expressão: “exatamente a expressão”.
com qualquer uma das palavras: tanto faz uma quanto a outra.
sem as palavras: excluir dos resultados as páginas que contenham essa(s) palavra(s)

Os resultados:
Título
Contexto onde aparece na página o termo pesquisado.
URL – peso – em cachê – páginas semelhantes
[xls] <br /> Formato do arquivo: Microsoft Excel 2000 – Ver em HTML</p> <p><a href="http://www.floripaadventure.com/rmosimann/cheatsheet_traduzida.htm">Tabela Help do Google traduzida</a></p> <p><strong>Exercício</strong></p> <p>- Dados da Casan sobre população abastecida com água e servida com esgoto em SC (números absolutos e % da população)</p> <p>- Encontrar uma tese ou dissertação publicada na internet com link para o ClicRBS.</p> <p>- Encontrar planilha com as principais causas de morte em idosos no estado de SC?</p> <p>- Quem tem mais links para o seu site, Avai ou Figueirense?


Um comentário para o post “Pesquisa na internet: Google”

  1. [ IMD3 - internet e mídia digital ] » Pesquisas na internet on agosto 2, 2005 15:17

    [...] isado. URL – peso – em cachê – páginas semelhantes [xls] Atualização da aula de Março 14, 2005 @ 5:50 pm Permalink [...]

Link de retorno | Comments RSS

Participe com seu comentário

Nome (obrigatório)

E-mail (obrigatório)

Site

Vamos lá, sem timidez, fala aí: