0:00:06.070,0:00:07.120 Olá, o meu nome é John. 0:00:07.510,0:00:10.140 Lidero a pesquisa e a máquina[br]equipas de aprendizagem no Google. 0:00:12.130,0:00:14.230 Penso que é incrivelmente inspirador 0:00:14.230,0:00:16.214 que as pessoas em todo o mundo 0:00:16.215,0:00:19.160 recorrer aos motores de busca para[br]fazer perguntas triviais 0:00:19.160,0:00:20.930 e perguntas incrivelmente importantes. 0:00:20.930,0:00:23.450 Por isso, é uma enorme responsabilidade dar-lhes 0:00:23.450,0:00:24.864 as melhores respostas que pudermos. 0:00:26.710,0:00:30.610 Olá, o meu nome é Akshaya e [br]trabalho na equipa de pesquisa do Bing. 0:00:30.910,0:00:33.190 Há muitas vezes onde[br]vamos começar a procurar 0:00:33.190,0:00:35.800 em inteligência artificial[br]e aprendizagem mecânica, 0:00:35.830,0:00:39.010 mas temos de abordar como é que[br]os utilizadores vão utilizar isto, 0:00:39.140,0:00:42.390 porque no final do dia,[br]queremos ter impacto na sociedade. 0:00:43.780,0:00:45.400 Vamos fazer uma pergunta simples. 0:00:45.820,0:00:48.070 Quanto tempo demora a viagem a Marte? 0:00:49.330,0:00:50.950 De onde vieram estes resultados 0:00:51.370,0:00:54.100 e porque é que este foi listado[br]antes do outro? 0:00:55.700,0:00:58.150 Muito bem, vamos mergulhar e[br]ver como o motor de busca 0:00:58.150,0:00:59.860 transformou o seu pedido num resultado. 0:01:00.690,0:01:03.360 A primeira coisa que precisa de saber[br]é quando faz uma pesquisa, 0:01:03.430,0:01:06.480 o motor de pesquisa não está na realidade[br]a sair para a World Wide Web 0:01:06.480,0:01:08.010 para realizar a sua pesquisa em tempo real. 0:01:08.140,0:01:10.610 E isso porque há[br]mais de um bilião de sítios Web 0:01:10.610,0:01:14.140 na Internet e centenas mais estão a ser criadas a cada minuto[br]. 0:01:14.140,0:01:16.210 Assim, se o motor de busca[br]tivesse de procurar através 0:01:16.240,0:01:18.690 cada sítio para[br]encontrar aquele que desejava, 0:01:18.690,0:01:20.120 demoraria apenas uma eternidade. 0:01:20.500,0:01:21.940 Por isso, para tornar a sua pesquisa mais rápida, 0:01:21.970,0:01:24.940 os motores de busca estão constantemente a[br]a digitalizar a web com antecedência 0:01:25.420,0:01:28.560 para registar as informações que possam ajudar na sua pesquisa posterior em[br]. 0:01:28.930,0:01:31.270 Dessa forma, quando se pesquisa[br]sobre viagens a Marte, 0:01:31.630,0:01:33.700 o motor de busca[br]já tem o que precisa 0:01:33.700,0:01:35.728 para lhe dar uma resposta em tempo real. 0:01:36.250,0:01:37.540 Aqui está como funciona. 0:01:37.900,0:01:42.010 A Internet é uma teia de páginas[br]ligadas entre si através de hiperligações. 0:01:42.400,0:01:44.680 Os motores de busca são[br]constantemente a correr um programa 0:01:44.680,0:01:47.380 chamada Aranha que atravessa[br]através destas páginas web 0:01:47.380,0:01:49.040 para recolher informações sobre eles. 0:01:49.780,0:01:51.550 Cada vez que encontra um hyperlink, 0:01:52.090,0:01:55.000 segue-o até que[br]tenha visitado todas as páginas 0:01:55.030,0:01:57.240 que pode encontrar em toda a internet[br]. 0:01:57.335,0:01:59.170 Para cada página a aranha visita, 0:01:59.200,0:02:02.320 regista qualquer informação[br]que possa necessitar para uma pesquisa 0:02:02.500,0:02:05.650 adicionando-a a uma base de dados especial[br]chamada índice de pesquisa. 0:02:07.166,0:02:09.530 Agora, voltemos a[br]essa pesquisa de há pouco 0:02:09.590,0:02:11.990 e ver se conseguimos descobrir[br]como o motor de busca 0:02:11.990,0:02:13.333 obteve os resultados. 0:02:13.640,0:02:16.460 Quando se pergunta quanto tempo leva[br]a viajar para Marte, 0:02:16.640,0:02:18.860 o motor de pesquisa procura procura[br]em cada uma dessas palavras 0:02:18.920,0:02:21.410 no índice de pesquisa para[br]obter imediatamente uma lista 0:02:21.410,0:02:24.500 de todas as páginas da internet[br]que contêm essas palavras. 0:02:24.890,0:02:26.870 Mas basta procurar por estes termos de pesquisa 0:02:26.870,0:02:28.760 poderia devolver milhões de páginas, 0:02:28.760,0:02:31.110 por isso o motor de busca precisa de[br]para poder determinar 0:02:31.110,0:02:33.120 os melhores jogos para lhe mostrar primeiro. 0:02:33.340,0:02:36.010 É aqui que se torna complicado[br]porque o motor de busca 0:02:36.010,0:02:38.040 pode precisar de adivinhar o que procura em[br]. 0:02:38.930,0:02:41.360 Cada motor de busca[br]usa o seu próprio algoritmo 0:02:41.360,0:02:44.230 para classificar as páginas com base em[br]o que pensa que quer. 0:02:44.930,0:02:47.660 O ranking do motor de busca[br]algoritmo pode verificar 0:02:47.990,0:02:50.360 se o seu termo de pesquisa aparecer[br]no título da página, 0:02:50.900,0:02:53.820 pode verificar se todas as palavras de[br]aparecem umas ao lado das outras, 0:02:54.520,0:02:57.020 ou qualquer número de outros cálculos 0:02:57.020,0:02:58.610 que a ajudam a determinar melhor 0:02:58.670,0:03:01.420 que páginas quererá ver em[br]e quais não verá. 0:03:02.960,0:03:04.960 O Google inventou o mais famoso algoritmo 0:03:04.960,0:03:08.530 para escolher os resultados mais relevantes[br]para uma pesquisa, tendo em conta 0:03:08.560,0:03:11.230 quantas outras páginas Web[br]ligaram a uma dada página. 0:03:11.830,0:03:14.140 A ideia é que se[br]muitos websites pensarem 0:03:14.140,0:03:15.660 que uma página web é interessante, 0:03:15.660,0:03:17.940 então é provavelmente aquele [br]que procura. 0:03:18.190,0:03:20.020 A este algoritmo chama-se page rank, 0:03:20.590,0:03:22.330 não porque classifica as páginas web, 0:03:22.570,0:03:25.210 mas porque recebeu o nome de[br], o seu inventor, Larry Page, 0:03:25.480,0:03:27.333 que é um dos fundadores do Google. 0:03:27.940,0:03:30.520 Porque um sítio web ganha muitas vezes dinheiro quando o visita[br], 0:03:30.820,0:03:32.950 os spammers estão constantemente a[br]a tentar encontrar formas 0:03:32.950,0:03:35.741 para jogar o algoritmo de pesquisa [br]para que as suas páginas 0:03:35.742,0:03:37.931 estão listados mais acima nos resultados. 0:03:38.260,0:03:40.750 Motores de pesquisa regularmente[br]actualizam os seus algoritmos 0:03:40.750,0:03:44.296 para evitar que sites falsos ou não fidedignos[br]cheguem ao topo. 0:03:44.680,0:03:47.350 Em última análise, cabe-lhe a si [br]ficar de olho 0:03:47.500,0:03:49.450 para estas páginas que não são dignas de confiança 0:03:49.690,0:03:52.990 consultando o endereço web e[br]certificando-se de que é uma fonte fiável. 0:03:53.680,0:03:55.390 Os programas de pesquisa estão sempre a evoluir 0:03:55.420,0:03:58.420 para melhorar os algoritmos [br]a fim de que estes retornem melhores resultados, 0:03:58.540,0:04:00.460 resultados mais rápidos do que os dos seus concorrentes. 0:04:01.000,0:04:03.100 Os motores de pesquisa actuais[br]utilizam até informação 0:04:03.100,0:04:06.820 que não tenha fornecido explicitamente[br]para o ajudar a reduzir a sua pesquisa. 0:04:07.150,0:04:10.120 Assim, por exemplo,[br]se fez uma pesquisa de parques para cães, 0:04:10.240,0:04:12.190 muitos motores de busca[br]dar-lhe-iam resultados 0:04:12.190,0:04:13.840 para todos os parques caninos próximos, 0:04:14.080,0:04:16.260 apesar de não ter digitado[br]na sua localização. 0:04:17.800,0:04:20.530 Os motores de pesquisa modernos[br]também compreendem mais 0:04:20.530,0:04:22.060 do que apenas as palavras de uma página, 0:04:22.300,0:04:24.970 mas o que eles realmente significam[br]para encontrar o melhor 0:04:24.970,0:04:26.750 que corresponda ao que se procura. 0:04:27.130,0:04:29.980 Por exemplo, se procurar em [br]um lançador rápido, 0:04:30.280,0:04:32.300 saberá que está[br]à procura de um atleta. 0:04:32.500,0:04:34.450 Mas se procurar um jarro grande, 0:04:34.450,0:04:36.730 encontrará opções[br]para a sua cozinha. 0:04:38.420,0:04:41.910 Para compreender melhor as palavras, [br]utilizamos algo chamado aprendizagem mecânica, 0:04:41.910,0:04:43.985 um tipo de inteligência artificial. 0:04:43.985,0:04:46.050 Permite pesquisar em[br]algoritmos para pesquisar 0:04:46.090,0:04:48.400 não apenas cartas individuais[br]ou palavras na página, 0:04:48.400,0:04:51.280 mas compreender o significado subjacente das palavras[br]. 0:04:53.690,0:04:55.850 A Internet está a crescer exponencialmente, 0:04:56.210,0:04:59.810 mas se as equipas que concebem os motores de busca[br]fizerem bem o nosso trabalho, 0:05:00.080,0:05:04.090 a informação que deseja deve estar sempre a apenas alguns toques de tecla de[br].