-
A Internet: Como funciona a pesquisa
-
Olá, o meu nome é John.
-
Lidero as equipas de pesquisa e
machine learning na Google.
-
Penso que é incrivelmente inspirador
que as pessoas em todo o mundo
-
recorram aos motores de busca para fazer
perguntas triviais e perguntas incrivelmente importantes.
-
Por isso, é uma enorme responsabilidade
dar-lhes as melhores respostas que podemos.
-
Olá, o meu nome é Akshaya e
trabalho na equipa de pesquisa do Bing.
-
Há muitas vezes onde
vamos começar a procurar
-
em inteligência artificial
e aprendizagem mecânica,
-
mas temos de abordar como é que
os utilizadores vão utilizar isto,
-
porque no final do dia,
queremos ter impacto na sociedade.
-
Vamos fazer uma pergunta simples.
-
Quanto tempo demora a viagem a Marte?
-
De onde vieram estes resultados
-
e porque é que este foi listado
antes do outro?
-
Bem, vamos descobrir como
é que o motor de busca transformou
-
o teu pedido num resultado.
-
A primeira coisa que precisas de saber
é que quando fazes uma pesquisa,
-
o motor de pesquisa não está na realidade a ir à
World Wide Web fazer a tua pesquisa em tempo real.
-
Isto porque há mais de um bilião de páginas web
na internet, com novas páginas a ser criadas a cada minuto.
-
Então, se o motor de busca tivesse de procurar
em cada site para encontrar o que querias,
-
isso demoraria uma eternidade.
-
Para tornar a tua pesquisa mais rápida,
os motores de busca estão sempre
-
a vasculhar a web para registar as informações
que os possam ajudar em pesquisas posteriores.
-
Dessa forma, quando se pesquisa
sobre viagens a Marte,
-
o motor de busca
já tem o que precisa
-
para te dar uma resposta em tempo real.
-
Funciona assim…
-
A Internet é uma teia de páginas
ligadas entre si através de hiperligações.
-
Os motores de busca estão sempre
a correr um programa — chamado Spider
-
que vai passando nestas páginas web
para recolher informações sobre elas.
-
Sempre que encontra uma hiperligação,
-
segue-a até ter visitado todas as páginas
que é possível encontrar em toda a internet.
-
A cada página a aranha visita são registadas
todas as informações que possam ser precisas para pesquisa,
-
adicionando-as a uma base de dados especial
chamada índice de pesquisa.
-
Agora, voltemos a
essa pesquisa de há pouco
-
e ver se conseguimos descobrir
como o motor de busca
-
obteve os resultados.
-
Quando se pergunta quanto tempo leva
a viajar para Marte,
-
o motor de pesquisa procura procura
em cada uma dessas palavras
-
no índice de pesquisa para
obter imediatamente uma lista
-
de todas as páginas da internet
que contêm essas palavras.
-
Mas procurar apenas por estes termos de pesquisa
poderia resultar em milhões de páginas devolvidas,
-
por isso o motor de busca precisa de
conseguir determinar as melhores
-
correspondências para mostrar primeiro.
-
É aqui que se torna complicado,
porque o motor de busca
-
pode precisar de adivinhar o que procuras.
-
Cada motor de busca
usa o seu próprio algoritmo
-
para classificar as páginas com base
no que ele pensa que tu queres.
-
O algoritmo de ranking do
motor de busca pode ver
-
se o teu termo de pesquisa aparece
no título da página,
-
pode verificar se todas as palavras de
aparecem umas ao lado das outras,
-
ou qualquer número de outros cálculos
-
que a ajudam a determinar melhor
-
que páginas quererás ou não ver.
-
O Google inventou o mais famoso algoritmo
-
para escolher os resultados
mais relevantes de uma pesquisa,
-
considerando o número de outras páginas web
que se ligam a uma determinada página.
-
A ideia é que se muitos websites pensarem
que uma página web é interessante,
-
então é provavelmente a que tu procuras.
-
A este algoritmo chama-se 'page rank',
-
não porque classifica as páginas web,
-
mas porque recebeu o nome
do seu inventor, Larry Page,
-
que é um dos fundadores do Google.
-
Uma vez que é comum um site
ganhar dinheiro quando o visitas,
-
os spammers estão constantemente a
a tentar encontrar formas
-
para jogar o algoritmo de pesquisa
para que as suas páginas
-
estão listados mais acima nos resultados.
-
Os motores de pesquisa atualizam
regularmente os seus algoritmos
-
para evitar que sites falsos ou não fidedignos
cheguem ao topo.
-
Em última análise, cabe-te a ti
ficar atento
-
a estas páginas que não são dignas de confiança,
-
consultando o endereço web e
certificando-te de que é uma fonte fiável.
-
Os programas de pesquisa estão sempre a evoluir
-
para melhorar os algoritmos
e estes devolverem melhores resultados,
-
mais rápido do que os dos seus concorrentes.
-
Os motores de pesquisa actuais
utilizam até informação
-
que não tenhas fornecido explicitamente
para te ajudar a reduzir a tua pesquisa.
-
Por exemplo, se fizeste uma pesquisa
sobre parques para cães,
-
muitos motores de busca dar-te-iam resultados
sobre todos os parques de cães nas redondezas,
-
apesar de não teres inserido
a tua localização.
-
Os motores de pesquisa modernos
também compreendem mais
-
do que apenas as palavras de uma página,
-
mas também o que elas realmente significam
para encontrar o melhor resultado para o que procuras.
-
Por exemplo, se procurares por
corredor rápido,
-
saberá que estás
à procura de um atleta.
-
Mas se procurares um corredor grande,
-
encontrarás opções
relacionadas com a tua casa.
-
Para compreender melhor as palavras,
utilizamos algo chamado aprendizagem mecânica,
-
um tipo de inteligência artificial.
-
Permite pesquisar em
algoritmos para pesquisar
-
não apenas letras ou palavras
separadas na página,
-
mas também compreender
o significado subjacente das palavras.
-
A Internet está a crescer exponencialmente,
-
mas se nas equipas que concebem os motores de busca
fizermos bem o nosso trabalho,
-
a informação que queres deve estar
sempre a apenas algumas teclas de distância.