A Internet: Como funciona a pesquisa
Olá, o meu nome é John.
Lidero as equipas de pesquisa e
machine learning na Google.
Penso que é incrivelmente inspirador
que as pessoas em todo o mundo
recorram aos motores de busca para fazer
perguntas triviais e perguntas incrivelmente importantes.
Por isso, é uma enorme responsabilidade
dar-lhes as melhores respostas que podemos.
Olá, o meu nome é Akshaya e
trabalho na equipa de pesquisa do Bing.
Há muitas vezes onde
vamos começar a procurar
em inteligência artificial
e aprendizagem mecânica,
mas temos de abordar como é que
os utilizadores vão utilizar isto,
porque no final do dia,
queremos ter impacto na sociedade.
Vamos fazer uma pergunta simples.
Quanto tempo demora a viagem a Marte?
De onde vieram estes resultados
e porque é que este foi listado
antes do outro?
Bem, vamos descobrir como
é que o motor de busca transformou
o teu pedido num resultado.
A primeira coisa que precisas de saber
é que quando fazes uma pesquisa,
o motor de pesquisa não está na realidade a ir à
World Wide Web fazer a tua pesquisa em tempo real.
Isto porque há mais de um bilião de páginas web
na internet, com novas páginas a ser criadas a cada minuto.
Então, se o motor de busca tivesse de procurar
em cada site para encontrar o que querias,
isso demoraria uma eternidade.
Para tornar a tua pesquisa mais rápida,
os motores de busca estão sempre
a vasculhar a web para registar as informações
que os possam ajudar em pesquisas posteriores.
Dessa forma, quando se pesquisa
sobre viagens a Marte,
o motor de busca
já tem o que precisa
para te dar uma resposta em tempo real.
Funciona assim…
A Internet é uma teia de páginas
ligadas entre si através de hiperligações.
Os motores de busca estão sempre
a correr um programa — chamado Spider
que vai passando nestas páginas web
para recolher informações sobre elas.
Sempre que encontra uma hiperligação,
segue-a até ter visitado todas as páginas
que é possível encontrar em toda a internet.
A cada página a aranha visita são registadas
todas as informações que possam ser precisas para pesquisa,
adicionando-as a uma base de dados especial
chamada índice de pesquisa.
Agora, voltemos a
essa pesquisa de há pouco
e ver se conseguimos descobrir
como o motor de busca
obteve os resultados.
Quando se pergunta quanto tempo leva
a viajar para Marte,
o motor de pesquisa procura procura
em cada uma dessas palavras
no índice de pesquisa para
obter imediatamente uma lista
de todas as páginas da internet
que contêm essas palavras.
Mas procurar apenas por estes termos de pesquisa
poderia resultar em milhões de páginas devolvidas,
por isso o motor de busca precisa de
conseguir determinar as melhores
correspondências para mostrar primeiro.
É aqui que se torna complicado,
porque o motor de busca
pode precisar de adivinhar o que procuras.
Cada motor de busca
usa o seu próprio algoritmo
para classificar as páginas com base
no que ele pensa que tu queres.
O algoritmo de ranking do
motor de busca pode ver
se o teu termo de pesquisa aparece
no título da página,
pode verificar se todas as palavras de
aparecem umas ao lado das outras,
ou qualquer número de outros cálculos
que a ajudam a determinar melhor
que páginas quererás ou não ver.
O Google inventou o mais famoso algoritmo
para escolher os resultados
mais relevantes de uma pesquisa,
considerando o número de outras páginas web
que se ligam a uma determinada página.
A ideia é que se muitos websites pensarem
que uma página web é interessante,
então é provavelmente a que tu procuras.
A este algoritmo chama-se 'page rank',
não porque classifica as páginas web,
mas porque recebeu o nome
do seu inventor, Larry Page,
que é um dos fundadores do Google.
Uma vez que é comum um site
ganhar dinheiro quando o visitas,
os spammers estão constantemente a
a tentar encontrar formas
para jogar o algoritmo de pesquisa
para que as suas páginas
estão listados mais acima nos resultados.
Os motores de pesquisa atualizam
regularmente os seus algoritmos
para evitar que sites falsos ou não fidedignos
cheguem ao topo.
Em última análise, cabe-te a ti
ficar atento
a estas páginas que não são dignas de confiança,
consultando o endereço web e
certificando-te de que é uma fonte fiável.
Os programas de pesquisa estão sempre a evoluir
para melhorar os algoritmos
e estes devolverem melhores resultados,
mais rápido do que os dos seus concorrentes.
Os motores de pesquisa actuais
utilizam até informação
que não tenhas fornecido explicitamente
para te ajudar a reduzir a tua pesquisa.
Por exemplo, se fizeste uma pesquisa
sobre parques para cães,
muitos motores de busca dar-te-iam resultados
sobre todos os parques de cães nas redondezas,
apesar de não teres inserido
a tua localização.
Os motores de pesquisa modernos
também compreendem mais
do que apenas as palavras de uma página,
mas também o que elas realmente significam
para encontrar o melhor resultado para o que procuras.
Por exemplo, se procurares por
corredor rápido,
saberá que estás
à procura de um atleta.
Mas se procurares um corredor grande,
encontrarás opções
relacionadas com a tua casa.
Para compreender melhor as palavras,
utilizamos algo chamado aprendizagem mecânica,
um tipo de inteligência artificial.
Permite pesquisar em
algoritmos para pesquisar
não apenas letras ou palavras
separadas na página,
mas também compreender
o significado subjacente das palavras.
A Internet está a crescer exponencialmente,
mas se nas equipas que concebem os motores de busca
fizermos bem o nosso trabalho,
a informação que queres deve estar
sempre a apenas algumas teclas de distância.