A Internet: Como funciona a pesquisa Olá, o meu nome é John. Lidero as equipas de pesquisa e machine learning na Google. Penso que é incrivelmente inspirador que as pessoas em todo o mundo recorram aos motores de busca para fazer perguntas triviais e perguntas incrivelmente importantes. Por isso, é uma enorme responsabilidade dar-lhes as melhores respostas que podemos. Olá, o meu nome é Akshaya e trabalho na equipa de pesquisa do Bing. Há muitas vezes onde vamos começar a procurar em inteligência artificial e aprendizagem mecânica, mas temos de abordar como é que os utilizadores vão utilizar isto, porque no final do dia, queremos ter impacto na sociedade. Vamos fazer uma pergunta simples. Quanto tempo demora a viagem a Marte? De onde vieram estes resultados e porque é que este foi listado antes do outro? Bem, vamos descobrir como é que o motor de busca transformou o teu pedido num resultado. A primeira coisa que precisas de saber é que quando fazes uma pesquisa, o motor de pesquisa não está na realidade a ir à World Wide Web fazer a tua pesquisa em tempo real. Isto porque há mais de um bilião de páginas web na internet, com novas páginas a ser criadas a cada minuto. Então, se o motor de busca tivesse de procurar em cada site para encontrar o que querias, isso demoraria uma eternidade. Para tornar a tua pesquisa mais rápida, os motores de busca estão sempre a vasculhar a web para registar as informações que os possam ajudar em pesquisas posteriores. Dessa forma, quando se pesquisa sobre viagens a Marte, o motor de busca já tem o que precisa para te dar uma resposta em tempo real. Funciona assim… A Internet é uma teia de páginas ligadas entre si através de hiperligações. Os motores de busca estão sempre a correr um programa — chamado Spider que vai passando nestas páginas web para recolher informações sobre elas. Sempre que encontra uma hiperligação, segue-a até ter visitado todas as páginas que é possível encontrar em toda a internet. A cada página a aranha visita são registadas todas as informações que possam ser precisas para pesquisa, adicionando-as a uma base de dados especial chamada índice de pesquisa. Agora, voltemos a essa pesquisa de há pouco e ver se conseguimos descobrir como o motor de busca obteve os resultados. Quando se pergunta quanto tempo leva a viajar para Marte, o motor de pesquisa procura procura em cada uma dessas palavras no índice de pesquisa para obter imediatamente uma lista de todas as páginas da internet que contêm essas palavras. Mas procurar apenas por estes termos de pesquisa poderia resultar em milhões de páginas devolvidas, por isso o motor de busca precisa de conseguir determinar as melhores correspondências para mostrar primeiro. É aqui que se torna complicado, porque o motor de busca pode precisar de adivinhar o que procuras. Cada motor de busca usa o seu próprio algoritmo para classificar as páginas com base no que ele pensa que tu queres. O algoritmo de ranking do motor de busca pode ver se o teu termo de pesquisa aparece no título da página, pode verificar se todas as palavras de aparecem umas ao lado das outras, ou qualquer número de outros cálculos que a ajudam a determinar melhor que páginas quererás ou não ver. O Google inventou o mais famoso algoritmo para escolher os resultados mais relevantes de uma pesquisa, considerando o número de outras páginas web que se ligam a uma determinada página. A ideia é que se muitos websites pensarem que uma página web é interessante, então é provavelmente a que tu procuras. A este algoritmo chama-se 'page rank', não porque classifica as páginas web, mas porque recebeu o nome do seu inventor, Larry Page, que é um dos fundadores do Google. Uma vez que é comum um site ganhar dinheiro quando o visitas, os spammers estão constantemente a a tentar encontrar formas para jogar o algoritmo de pesquisa para que as suas páginas estão listados mais acima nos resultados. Os motores de pesquisa atualizam regularmente os seus algoritmos para evitar que sites falsos ou não fidedignos cheguem ao topo. Em última análise, cabe-te a ti ficar atento a estas páginas que não são dignas de confiança, consultando o endereço web e certificando-te de que é uma fonte fiável. Os programas de pesquisa estão sempre a evoluir para melhorar os algoritmos e estes devolverem melhores resultados, mais rápido do que os dos seus concorrentes. Os motores de pesquisa actuais utilizam até informação que não tenhas fornecido explicitamente para te ajudar a reduzir a tua pesquisa. Por exemplo, se fizeste uma pesquisa sobre parques para cães, muitos motores de busca dar-te-iam resultados sobre todos os parques de cães nas redondezas, apesar de não teres inserido a tua localização. Os motores de pesquisa modernos também compreendem mais do que apenas as palavras de uma página, mas também o que elas realmente significam para encontrar o melhor resultado para o que procuras. Por exemplo, se procurares por corredor rápido, saberá que estás à procura de um atleta. Mas se procurares um corredor grande, encontrarás opções relacionadas com a tua casa. Para compreender melhor as palavras, utilizamos algo chamado aprendizagem mecânica, um tipo de inteligência artificial. Permite pesquisar em algoritmos para pesquisar não apenas letras ou palavras separadas na página, mas também compreender o significado subjacente das palavras. A Internet está a crescer exponencialmente, mas se nas equipas que concebem os motores de busca fizermos bem o nosso trabalho, a informação que queres deve estar sempre a apenas algumas teclas de distância.