0:00:06.070,0:00:07.120 Olá, meu nome é John. 0:00:07.510,0:00:10.140 Sou líder das equipes de pesquisa e aprendizagem de máquina no Google. 0:00:12.130,0:00:14.230 Acho incrivelmente inspirador 0:00:14.230,0:00:16.214 que pessoas de todo o mundo 0:00:16.215,0:00:19.160 recorram a mecanismos de[br]busca para fazer perguntas 0:00:19.160,0:00:20.930 triviais e perguntas [br]extremamente importantes. 0:00:20.930,0:00:23.450 Portanto, é uma imensa responsabilidade oferecer a elas 0:00:23.450,0:00:24.864 as melhores respostas que pudermos. 0:00:26.710,0:00:30.610 Olá, meu nome é Akshaya e trabalho na equipe de pesquisa do Bing. 0:00:30.910,0:00:33.190 Muitas vezes no voltamos à 0:00:33.190,0:00:35.800 inteligência artificial e à [br]aprendizagem de máquina, 0:00:35.830,0:00:39.010 mas temos de lidar com a forma como os usuários utilizam esses recursos, 0:00:39.140,0:00:42.390 porque, no final das contas, queremos causar um impacto na sociedade. 0:00:43.780,0:00:45.400 Vamos fazer uma pergunta simples. 0:00:45.820,0:00:48.070 Qual é o tempo de viagem [br]para chegar a Marte? 0:00:49.330,0:00:50.950 De onde vieram esses 0:00:51.370,0:00:54.100 resultados e por que foram [br]listados nesta ordem? 0:00:55.700,0:00:58.150 OK, vamos nos aprofundar e ver [br]como o mecanismo de busca 0:00:58.150,0:00:59.860 transformou nossa solicitação[br]em um resultado. 0:01:00.690,0:01:03.360 A primeira coisas que você precisa saber é que, quando você faz uma 0:01:03.430,0:01:06.480 pesquisa, o mecanismo de busca não está de fato navegando pela 0:01:06.480,0:01:08.010 Rede Mundial para realizar sua pesquisa em tempo real. 0:01:08.140,0:01:10.610 Isto porque há mais de um [br]bilhão de sites na internet 0:01:10.610,0:01:14.140 e mais centenas deles sendo [br]criados a cada minuto. 0:01:14.140,0:01:16.210 Então, se o mecanismo de busca precisasse pesquisar em 0:01:16.240,0:01:18.690 cada site individualmente para [br]encontrar o que você pediu, 0:01:18.690,0:01:20.120 ele levaria uma eternidade. 0:01:20.500,0:01:21.940 Para agilizar sua pesquisa, 0:01:21.970,0:01:24.940 o mecanismo de busca faz uma varredura constante na internet 0:01:25.420,0:01:28.560 antecipadamente, para registrar informações que podem ajudar [br]na sua pesquisa mais tarde. 0:01:28.930,0:01:31.270 Desta forma, quando você pesquisa sobre um viagem a Marte, 0:01:31.630,0:01:33.700 o mecanismo de busca[br]já tem o que precisa 0:01:33.700,0:01:35.728 para dar a você uma[br]resposta em tempo real. 0:01:36.250,0:01:37.540 Veja aqui como funciona o software: 0:01:37.900,0:01:42.010 A internet é uma rede de páginas conectadas por hyperlinks. 0:01:42.400,0:01:44.680 Os mecanismos de busca executam um programa constantemente, 0:01:44.680,0:01:47.380 conhecido como Spider, que navega nessas página na internet 0:01:47.380,0:01:49.040 para coletar informações sobre elas. 0:01:49.780,0:01:51.550 Toda vez que ele [br]encontra um hyperlink, 0:01:52.090,0:01:55.000 ele o abre, até que tenha [br]visitado todas as páginas 0:01:55.030,0:01:57.240 que encontrar em toda a internet. 0:01:57.335,0:01:59.170 Para cada página que o Spider visita, 0:01:59.200,0:02:02.320 ele registra todas as informações [br]que podem ser alvo de uma pesquisa, 0:02:02.500,0:02:05.650 acrescentando-as a uma base de dados conhecida como índice de pesquisa. 0:02:07.166,0:02:09.530 Agora, vamos voltar à pesquisa anterior 0:02:09.590,0:02:11.990 e ver se conseguimos descobrir [br]como o mecanismo de busca 0:02:11.990,0:02:13.333 chegou a esses resultados. 0:02:13.640,0:02:16.460 Quando você pergunta quanto [br]tempo leva pra viajar até Marte, 0:02:16.640,0:02:18.860 o mecanismo de busca [br]cada uma das palavras 0:02:18.920,0:02:21.410 no índice de pesquisa para [br]obter imediatamente um lista 0:02:21.410,0:02:24.500 com todas as páginas da internet [br]que contenham essas palavras. 0:02:24.890,0:02:26.870 Mas a simples busca por [br]esses termos de pesquisa 0:02:26.870,0:02:28.760 pode resultar em milhões de páginas, 0:02:28.760,0:02:31.110 então o mecanismo de busca [br]precisa ser capaz de determinar 0:02:31.110,0:02:33.120 as melhores correspondências [br]para exibir ao usuário. 0:02:33.340,0:02:36.010 É aqui que a coisa fica truculenta,[br]porque o mecanismo de busca 0:02:36.010,0:02:38.040 pode ter de adivinhar o [br]que você está procurando. 0:02:38.930,0:02:41.360 Cada mecanismo de busca [br]utiliza seu próprio algoritmo 0:02:41.360,0:02:44.230 para classifica as páginas, com base no que ele julga que você quer encontrar. 0:02:44.930,0:02:47.660 O algoritmo de classificação do mecanismo de busca pode verificar 0:02:47.990,0:02:50.360 se os termos da sua pesquisa aparecem no título de uma página, 0:02:50.900,0:02:53.820 e pode verificar se todas as [br]palavras aparecem lado a lado, 0:02:54.520,0:02:57.020 ou uma série de outros critérios 0:02:57.020,0:02:58.610 que ajudam a determinar melhor 0:02:58.670,0:03:01.420 as páginas que você quer ver [br]e as que você não vai ver. 0:03:02.960,0:03:04.960 O Google inventou o [br]algoritmo mais conhecido 0:03:04.960,0:03:08.530 para definir os resultados mais relevantes de uma pesquisa, levando 0:03:08.560,0:03:11.230 em conta quantas outras páginas têm um link para a página encontrada. 0:03:11.830,0:03:14.140 A ideia é que, se muitos [br]sites consideram 0:03:14.140,0:03:15.660 que um página na [br]internet é interessante, 0:03:15.660,0:03:17.940 então ela é provavelmente a[br]que você está procurando. 0:03:18.190,0:03:20.020 Esse algoritmo é [br]conhecido como page rank, 0:03:20.590,0:03:22.330 não por classificar as [br]páginas na internet, 0:03:22.570,0:03:25.210 mas por ter sido batizado em homenagem ao criador, Larry Page, 0:03:25.480,0:03:27.333 que é um dos fundadores do Google. 0:03:27.940,0:03:30.520 Como um site costuma ganhar [br]dinheiro quando você o visita, 0:03:30.820,0:03:32.950 os spammers estão constantemente tentando encontrar meios 0:03:32.950,0:03:35.741 de desvendar o algoritmo de [br]pesquisa para que suas páginas 0:03:35.742,0:03:37.931 apareçam primeiro nos resultados. 0:03:38.260,0:03:40.750 Os mecanismos de busca geralmente atualizam seus algoritmos 0:03:40.750,0:03:44.296 para evitar que sites falsos ou não confiáveis cheguem ao topo 0:03:44.680,0:03:47.350 das pesquisas. Finalmente, [br]cabe a você ficar de olho 0:03:47.500,0:03:49.450 nessas páginas não confiáveis, 0:03:49.690,0:03:52.990 verificando o endereço na internet e se certificando de que a fonte é confiável. 0:03:53.680,0:03:55.390 Os programas de pesquisa [br]estão em constante evolução 0:03:55.420,0:03:58.420 para melhorar seus algoritmos para que gerem resultados melhores, 0:03:58.540,0:04:00.460 e mais rápidos do [br]que seus concorrentes. 0:04:01.000,0:04:03.100 Os mecanismos de busca da [br]atualidade utilizam até informações 0:04:03.100,0:04:06.820 que você não forneceu explicitamente para ajudar a afunilar a pesquisa. 0:04:07.150,0:04:10.120 Por exemplo, se você fizer uma [br]busca por parques para cães, 0:04:10.240,0:04:12.190 muitos mecanismos de [br]busca gerariam resultados 0:04:12.190,0:04:13.840 para todos os parques [br]para cães nas redondezas, 0:04:14.080,0:04:16.260 apesar de você não ter [br]informado sua localização. 0:04:17.800,0:04:20.530 Os mecanismos de busca modernos também compreendem mais 0:04:20.530,0:04:22.060 do que meras palavras em uma página, 0:04:22.300,0:04:24.970 avaliando o verdadeiro [br]significado delas para encontrar 0:04:24.970,0:04:26.750 a melhor correspondência [br]ao que você está procurando. 0:04:27.130,0:04:29.980 Por exemplo, se você [br]pesquisar ‘médio volante’, 0:04:30.280,0:04:32.300 ele saberá que você está [br]procurando um esportista. 0:04:32.500,0:04:34.450 Mas se você buscar ‘volante médio’, 0:04:34.450,0:04:36.730 ele vai procurar acessórios[br]para o seu carro. 0:04:38.420,0:04:41.910 Para compreender melhor as palavras, utilizamos algo conhecido como aprendizagem de máquina, 0:04:41.910,0:04:43.985 um tipo de inteligência artificial 0:04:43.985,0:04:46.050 que permite pesquisar [br]algoritmos em busca 0:04:46.090,0:04:48.400 não apenas de letras ou [br]palavras específicas na página, 0:04:48.400,0:04:51.280 mas de compreender o [br]significado por trás das palavras. 0:04:53.690,0:04:55.850 A internet está crescendo exponencialmente, 0:04:56.210,0:04:59.810 mas se as equipes que projetam os mecanismos de busca fizerem 0:05:00.080,0:05:02.085 seu trabalho, as informações que você precisa estarão sempre 0:05:02.085,0:05:04.090 a algumas teclas de distância.