Olá, o meu nome é John.
Lidero a pesquisa e a máquina
equipas de aprendizagem no Google.
Penso que é incrivelmente inspirador
que as pessoas em todo o mundo
recorrer aos motores de busca para
fazer perguntas triviais
e perguntas incrivelmente importantes.
Por isso, é uma enorme responsabilidade dar-lhes
as melhores respostas que pudermos.
Olá, o meu nome é Akshaya e
trabalho na equipa de pesquisa do Bing.
Há muitas vezes onde
vamos começar a procurar
em inteligência artificial
e aprendizagem mecânica,
mas temos de abordar como é que
os utilizadores vão utilizar isto,
porque no final do dia,
queremos ter impacto na sociedade.
Vamos fazer uma pergunta simples.
Quanto tempo demora a viagem a Marte?
De onde vieram estes resultados
e porque é que este foi listado
antes do outro?
Muito bem, vamos mergulhar e
ver como o motor de busca
transformou o seu pedido num resultado.
A primeira coisa que precisa de saber
é quando faz uma pesquisa,
o motor de pesquisa não está na realidade
a sair para a World Wide Web
para realizar a sua pesquisa em tempo real.
E isso porque há
mais de um bilião de sítios Web
na Internet e centenas mais estão a ser criadas a cada minuto
.
Assim, se o motor de busca
tivesse de procurar através
cada sítio para
encontrar aquele que desejava,
demoraria apenas uma eternidade.
Por isso, para tornar a sua pesquisa mais rápida,
os motores de busca estão constantemente a
a digitalizar a web com antecedência
para registar as informações que possam ajudar na sua pesquisa posterior em
.
Dessa forma, quando se pesquisa
sobre viagens a Marte,
o motor de busca
já tem o que precisa
para lhe dar uma resposta em tempo real.
Aqui está como funciona.
A Internet é uma teia de páginas
ligadas entre si através de hiperligações.
Os motores de busca são
constantemente a correr um programa
chamada Aranha que atravessa
através destas páginas web
para recolher informações sobre eles.
Cada vez que encontra um hyperlink,
segue-o até que
tenha visitado todas as páginas
que pode encontrar em toda a internet
.
Para cada página a aranha visita,
regista qualquer informação
que possa necessitar para uma pesquisa
adicionando-a a uma base de dados especial
chamada índice de pesquisa.
Agora, voltemos a
essa pesquisa de há pouco
e ver se conseguimos descobrir
como o motor de busca
obteve os resultados.
Quando se pergunta quanto tempo leva
a viajar para Marte,
o motor de pesquisa procura procura
em cada uma dessas palavras
no índice de pesquisa para
obter imediatamente uma lista
de todas as páginas da internet
que contêm essas palavras.
Mas basta procurar por estes termos de pesquisa
poderia devolver milhões de páginas,
por isso o motor de busca precisa de
para poder determinar
os melhores jogos para lhe mostrar primeiro.
É aqui que se torna complicado
porque o motor de busca
pode precisar de adivinhar o que procura em
.
Cada motor de busca
usa o seu próprio algoritmo
para classificar as páginas com base em
o que pensa que quer.
O ranking do motor de busca
algoritmo pode verificar
se o seu termo de pesquisa aparecer
no título da página,
pode verificar se todas as palavras de
aparecem umas ao lado das outras,
ou qualquer número de outros cálculos
que a ajudam a determinar melhor
que páginas quererá ver em
e quais não verá.
O Google inventou o mais famoso algoritmo
para escolher os resultados mais relevantes
para uma pesquisa, tendo em conta
quantas outras páginas Web
ligaram a uma dada página.
A ideia é que se
muitos websites pensarem
que uma página web é interessante,
então é provavelmente aquele
que procura.
A este algoritmo chama-se page rank,
não porque classifica as páginas web,
mas porque recebeu o nome de
, o seu inventor, Larry Page,
que é um dos fundadores do Google.
Porque um sítio web ganha muitas vezes dinheiro quando o visita
,
os spammers estão constantemente a
a tentar encontrar formas
para jogar o algoritmo de pesquisa
para que as suas páginas
estão listados mais acima nos resultados.
Motores de pesquisa regularmente
actualizam os seus algoritmos
para evitar que sites falsos ou não fidedignos
cheguem ao topo.
Em última análise, cabe-lhe a si
ficar de olho
para estas páginas que não são dignas de confiança
consultando o endereço web e
certificando-se de que é uma fonte fiável.
Os programas de pesquisa estão sempre a evoluir
para melhorar os algoritmos
a fim de que estes retornem melhores resultados,
resultados mais rápidos do que os dos seus concorrentes.
Os motores de pesquisa actuais
utilizam até informação
que não tenha fornecido explicitamente
para o ajudar a reduzir a sua pesquisa.
Assim, por exemplo,
se fez uma pesquisa de parques para cães,
muitos motores de busca
dar-lhe-iam resultados
para todos os parques caninos próximos,
apesar de não ter digitado
na sua localização.
Os motores de pesquisa modernos
também compreendem mais
do que apenas as palavras de uma página,
mas o que eles realmente significam
para encontrar o melhor
que corresponda ao que se procura.
Por exemplo, se procurar em
um lançador rápido,
saberá que está
à procura de um atleta.
Mas se procurar um jarro grande,
encontrará opções
para a sua cozinha.
Para compreender melhor as palavras,
utilizamos algo chamado aprendizagem mecânica,
um tipo de inteligência artificial.
Permite pesquisar em
algoritmos para pesquisar
não apenas cartas individuais
ou palavras na página,
mas compreender o significado subjacente das palavras
.
A Internet está a crescer exponencialmente,
mas se as equipas que concebem os motores de busca
fizerem bem o nosso trabalho,
a informação que deseja deve estar sempre a apenas alguns toques de tecla de
.