0:00:00.000,0:00:02.000 Erez Lieberman Aiden: Todos sabemos 0:00:02.000,0:00:05.000 que uma imagem vale mais que mil palavras 0:00:07.000,0:00:09.000 Mas nós em Harvard 0:00:09.000,0:00:12.000 questionámos se isso seria mesmo verdade. 0:00:12.000,0:00:14.000 (Risos) 0:00:14.000,0:00:18.000 Então, juntámos uma equipa de peritos, 0:00:18.000,0:00:20.000 que vieram de Harvard, do MIT, 0:00:20.000,0:00:23.000 do The American Heritage Dictionary,[br]da The Encyclopedia Britannica 0:00:23.000,0:00:25.000 e até dos nossos[br]orgulhosos patrocinadores, 0:00:25.000,0:00:28.000 a Google. 0:00:28.000,0:00:30.000 Debruçámo-nos sobre esta questão 0:00:30.000,0:00:32.000 durante cerca de quatro anos. 0:00:32.000,0:00:37.000 E chegámos a uma conclusão surpreendente. 0:00:37.000,0:00:40.000 Meus senhores, uma imagem[br]não vale mais que mil palavras. 0:00:40.000,0:00:42.000 Na verdade, encontrámos imagens 0:00:42.000,0:00:47.000 que valem 500 mil milhões de palavras. 0:00:47.000,0:00:49.000 Jean-Baptiste Michel:[br]Como chegámos a esta conclusão? 0:00:49.000,0:00:51.000 O Erez e eu pensámos em como obter 0:00:51.000,0:00:53.000 um panorama geral da cultura humana[br]e da história humana: 0:00:53.000,0:00:56.000 as mudanças através dos tempos. 0:00:56.000,0:00:58.000 Ao longo dos anos,[br]escreveram-se muitos livros. 0:00:58.000,0:01:00.000 Pensámos que a melhor maneira[br]de aprender com eles 0:01:00.000,0:01:02.000 seria ler todos esses milhões de livros. 0:01:02.000,0:01:05.000 Claro que, se houvesse uma escala[br]de como isso seria fantástico, 0:01:05.000,0:01:08.000 isso iria para a um patamar[br]muitíssimo elevado. 0:01:08.000,0:01:10.000 O problema é que há[br]um eixo X para isso, 0:01:10.000,0:01:12.000 que é o eixo prático. 0:01:12.000,0:01:14.000 O que o coloca num patamar muito baixo 0:01:14.000,0:01:17.000 (Aplausos) 0:01:17.000,0:01:20.000 As pessoas têm tendência a usar[br]uma abordagem alternativa, 0:01:20.000,0:01:22.000 que é pegar nalgumas fontes[br]e lê-las cuidadosamente. 0:01:22.000,0:01:24.000 Isto é extremamente prático,[br]mas não muito fantástico. 0:01:24.000,0:01:27.000 O que realmente se pretende 0:01:27.000,0:01:30.000 é chegar à parte fantástica[br]mas prática deste espaço. 0:01:30.000,0:01:33.000 Acontece que havia uma empresa[br]do outro lado do rio chamada Google 0:01:33.000,0:01:35.000 que iniciara um projeto[br]de digitalização há uns anos 0:01:35.000,0:01:37.000 que talvez permitisse essa abordagem. 0:01:37.000,0:01:39.000 Tinham digitalizado milhões de livros. 0:01:39.000,0:01:42.000 Isso significava que se podiam[br]usar métodos informáticos 0:01:42.000,0:01:44.000 para ler todos os livros[br]com o clique de um botão. 0:01:44.000,0:01:47.000 Isto é muito prático[br]e extremamente fantástico. 0:01:48.000,0:01:50.000 ELA: Vou falar-vos um pouco[br]de onde vêm os livros. 0:01:50.000,0:01:53.000 Desde tempos imemoriais[br]que existem autores. 0:01:53.000,0:01:56.000 Esses autores têm-se esforçado[br]por escrever livros. 0:01:56.000,0:01:58.000 Isso tornou-se muito mais fácil 0:01:58.000,0:02:00.000 com o desenvolvimento[br]da imprensa há uns séculos. 0:02:00.000,0:02:03.000 Desde então, os autores tiveram 0:02:03.000,0:02:05.000 129 milhões de ocasiões diferentes 0:02:05.000,0:02:07.000 para publicar livros, 0:02:07.000,0:02:09.000 Se esses livros[br]não se perderam na história 0:02:09.000,0:02:11.000 estão algures numa biblioteca, 0:02:11.000,0:02:14.000 e muitos desses livros[br]têm sido recuperados das bibliotecas 0:02:14.000,0:02:16.000 e digitalizados pela Google, 0:02:16.000,0:02:18.000 que já digitalizou[br]15 milhões de livros até agora. 0:02:18.000,0:02:21.000 Quando a Google digitaliza um livro,[br]põe-no num formato catita. 0:02:21.000,0:02:23.000 Agora, temos os dados[br]e temos ainda metadados. 0:02:23.000,0:02:26.000 Temos informação sobre onde foi publicado, 0:02:26.000,0:02:28.000 quem foi o autor,[br]quando foi publicado, etc. 0:02:28.000,0:02:31.000 Verificamos todos esses arquivos 0:02:31.000,0:02:35.000 e excluímos tudo o que não seja[br]da mais alta qualidade. 0:02:35.000,0:02:37.000 Aquilo que nos resta 0:02:37.000,0:02:40.000 é uma coleção de cinco milhões de livros, 0:02:40.000,0:02:43.000 500 mil milhões de palavras, 0:02:43.000,0:02:45.000 uma cadeia de caracteres[br]mil vezes mais longa 0:02:45.000,0:02:48.000 que o genoma humano, 0:02:48.000,0:02:50.000 um texto que,[br]se fosse escrito por extenso, 0:02:50.000,0:02:52.000 iria daqui até à Lua e voltava 0:02:52.000,0:02:54.000 mais de dez vezes, 0:02:54.000,0:02:58.000 um autêntico fragmento[br]do nosso genoma cultural. 0:02:58.000,0:03:00.000 Claro que aquilo que fizemos 0:03:00.000,0:03:03.000 perante tamanha hipérbole... 0:03:03.000,0:03:05.000 (Risos) 0:03:05.000,0:03:08.000 ... foi aquilo que teria feito 0:03:08.000,0:03:11.000 qualquer pesquisador que se preze. 0:03:11.000,0:03:13.000 Inspirámo-nos no XKDC, e dissemos: 0:03:13.000,0:03:15.000 "Afastem-se. Vamos tentar fazer ciência." 0:03:15.000,0:03:17.000 0:03:17.000,0:03:19.000 (Risos) 0:03:19.000,0:03:21.000 JM: Claro que estávamos a pensar 0:03:21.000,0:03:23.000 em publicar primeiro os dados 0:03:23.000,0:03:25.000 para que as pessoas[br]pudessem fazer ciência. 0:03:25.000,0:03:27.000 Mas depois pensámos:[br]""Que dados podemos publicar?" 0:03:27.000,0:03:29.000 Claro que queríamos pegar nos livros 0:03:29.000,0:03:31.000 e publicar o texto completo[br]destes cinco milhões de livros. 0:03:31.000,0:03:33.000 Mas a Google,[br]e o Jon Orwant em particular, 0:03:33.000,0:03:35.000 ensinou-nos uma pequena equação. 0:03:35.000,0:03:38.000 Temos cinco milhões de autores, ou seja, 0:03:38.000,0:03:41.000 cinco milhões de processos judiciais,[br]uma coisa monstruosa. 0:03:41.000,0:03:43.000 Assim, embora isso fosse fantástico 0:03:43.000,0:03:46.000 mais uma vez, era impraticável. 0:03:46.000,0:03:48.000 (Risos) 0:03:48.000,0:03:50.000 Mais uma vez, tivemos de ceder 0:03:50.000,0:03:53.000 e seguimos a abordagem prática,[br]que era menos fantástica. 0:03:53.000,0:03:55.000 Dissemos: "Em vez de publicarmos[br]o texto completo, 0:03:55.000,0:03:57.000 vamos publicar estatísticas[br]sobre os livros. 0:03:57.000,0:03:59.000 Por exemplo,[br]"Um brilho de felicidade". 0:03:59.000,0:04:01.000 São quatro palavras,[br]a que chamamos um quatro-grama. 0:04:01.000,0:04:03.000 Vamos dizer-vos quantas vezes[br]um determinado quatro-grama 0:04:03.000,0:04:05.000 apareceu em livros em 1801, 1802, 1803... 0:04:05.000,0:04:07.000 até 2008. 0:04:07.000,0:04:09.000 Isso dá-nos uma série temporal 0:04:09.000,0:04:11.000 de quantas vezes foi utilizada essa frase. 0:04:11.000,0:04:14.000 Fazemos isso para todas as palavras e frases[br]que surgem nesses livros. 0:04:14.000,0:04:17.000 Isso dá-nos uma enorme tabela[br]de dois mil milhões de linhas 0:04:17.000,0:04:19.000 que nos dizem como a cultura[br]tem vindo a mudar. 0:04:19.000,0:04:21.000 ELA: Chamamos a esses[br]dois mil milhões de linhas, 0:04:21.000,0:04:23.000 dois mil milhões de n-gramas. 0:04:23.000,0:04:25.000 O que é que eles nos dizem? 0:04:25.000,0:04:27.000 Os n-gramas individuais[br]medem tendências culturais. 0:04:27.000,0:04:29.000 Vou dar-vos um exemplo. 0:04:29.000,0:04:31.000 Vamos supôr que estou a prosperar, 0:04:31.000,0:04:33.000 e que amanhã quero contar[br]como me saí bem. 0:04:33.000,0:04:36.000 Posso dizer: "Ontem, eu vicejei." 0:04:36.000,0:04:39.000 Em alternativa, podia dizer:[br]"Ontem, eu prosperei. 0:04:39.000,0:04:42.000 "Então qual é que devo utilizar? 0:04:42.000,0:04:44.000 "Como é que hei de saber?" 0:04:44.000,0:04:46.000 Há cerca de seis meses, 0:04:46.000,0:04:48.000 o topo de gama neste campo 0:04:48.000,0:04:50.000 seria dirigir-se, por exemplo, 0:04:50.000,0:04:52.000 a um psicólogo com um cabelo fabuloso 0:04:52.000,0:04:54.000 e dizer: 0:04:54.000,0:04:57.000 "Steve, és perito em verbos. 0:04:57.000,0:04:59.000 "O que é que devo fazer?" 0:04:59.000,0:05:01.000 E ele responderia:[br]"Muitos dizem 'prosperei', 0:05:01.000,0:05:04.000 "mas alguns dizem 'vicejei'." 0:05:04.000,0:05:06.000 Também ficariam a saber, mais ou menos, 0:05:06.000,0:05:09.000 que, se recuassem 200 anos, 0:05:09.000,0:05:12.000 e perguntassem a este estadista[br]com um cabelo igualmente fabuloso: 0:05:12.000,0:05:15.000 (Risos) 0:05:15.000,0:05:17.000 "Tom, o que é que eu devo dizer?" 0:05:17.000,0:05:19.000 Ele diria: "No meu tempo,[br]a maior parte das pessoas vicejava, 0:05:19.000,0:05:22.000 "mas alguns prosperavam." 0:05:22.000,0:05:24.000 Agora vou mostrar-vos dados brutos. 0:05:24.000,0:05:28.000 Duas linhas desta tabela[br]com dois mil milhões de entradas. 0:05:28.000,0:05:30.000 Estão a ver a frequência, ano a ano, 0:05:30.000,0:05:33.000 de "prosperei" e "vicejei"[br]ao longo do tempo. 0:05:34.000,0:05:36.000 Estas são apenas duas 0:05:36.000,0:05:39.000 de dois mil milhões de linhas. 0:05:39.000,0:05:41.000 O conjunto total dos dados 0:05:41.000,0:05:44.000 é mil milhões de vezes mais fantástico[br]do que este slide. 0:05:44.000,0:05:46.000 (Risos) 0:05:46.000,0:05:50.000 (Aplausos) 0:05:50.000,0:05:52.000 JM: Há muitas imagens que valem mais[br]que 500 mil milhões de palavras. 0:05:52.000,0:05:54.000 Por exemplo, esta. 0:05:54.000,0:05:56.000 Se pegarmos em "gripe", 0:05:56.000,0:05:58.000 verão picos na época em que se sabia 0:05:58.000,0:06:01.000 que grandes epidemias de gripe[br]matavam pessoas em todo o globo. 0:06:01.000,0:06:04.000 ELA: Se ainda não estão convencidos, 0:06:04.000,0:06:06.000 os níveis do mar estão a subir, 0:06:06.000,0:06:09.000 assim como o CO2 na atmosfera[br]e a temperatura da Terra. 0:06:09.000,0:06:12.000 JM: Talvez queiram prestar atenção[br]a este n-grama em particular, 0:06:12.000,0:06:15.000 para dizer a Nietzsche[br]que Deus não está morto, 0:06:15.000,0:06:18.000 embora concordem que Ele precisa[br]de um relações públicas melhor. 0:06:18.000,0:06:20.000 (Risos) 0:06:20.000,0:06:23.000 ELA: Podemos obter conceitos bastante[br]abstratos com este tipo de análise. 0:06:23.000,0:06:25.000 Por exemplo, vou contar-vos a história 0:06:25.000,0:06:27.000 do ano de 1950. 0:06:27.000,0:06:29.000 Durante grande parte da história, 0:06:29.000,0:06:31.000 ninguém ligou nenhuma a 1950. 0:06:31.000,0:06:33.000 Em 1700, em 1800, em 1900, 0:06:33.000,0:06:36.000 ninguém se preocupou. 0:06:37.000,0:06:39.000 Durante os anos 30 e 40, 0:06:39.000,0:06:41.000 ninguém se preocupou. 0:06:41.000,0:06:43.000 De repente, a meio dos anos 40, 0:06:43.000,0:06:45.000 começa a haver um burburinho. 0:06:45.000,0:06:47.000 As pessoas percebem[br]que 1950 vai acontecer, 0:06:47.000,0:06:49.000 e pode ser uma coisa em grande. 0:06:49.000,0:06:52.000 (Risos) 0:06:52.000,0:06:55.000 Mas nada fez com que as pessoas[br]se interessassem mais pelo ano de 1950 0:06:55.000,0:06:58.000 do que o ano de 1950. 0:06:58.000,0:07:01.000 (Risos) 0:07:01.000,0:07:03.000 As pessoas andavam obcecadas. 0:07:03.000,0:07:05.000 Não conseguiam deixar de falar 0:07:05.000,0:07:08.000 sobre tudo o que tinham feito em 1950, 0:07:08.000,0:07:11.000 tudo o que planeavam fazer em 1950, 0:07:11.000,0:07:16.000 todos os sonhos[br]que queriam alcançar em 1950. 0:07:16.000,0:07:18.000 Na verdade, 1950 foi tão fascinante 0:07:18.000,0:07:20.000 que, anos depois, 0:07:20.000,0:07:23.000 as pessoas continuavam a falar[br]das coisas maravilhosas que tinham acontecido, 0:07:23.000,0:07:25.000 em 1951, 1952, 1953. 0:07:25.000,0:07:27.000 Finalmente, em 1954, 0:07:27.000,0:07:29.000 houve alguém que acordou e percebeu 0:07:29.000,0:07:33.000 que 1950 se tinha tornado[br]numa coisa do passado. 0:07:33.000,0:07:35.000 (Risos) 0:07:35.000,0:07:37.000 E de repente, rebentou a bolha. 0:07:37.000,0:07:39.000 (Risos) 0:07:39.000,0:07:41.000 A história de 1950 0:07:41.000,0:07:43.000 é a história de cada ano [br]que temos registado, 0:07:43.000,0:07:46.000 com uma ligeira diferença, porque agora[br]temos estes gráficos catitas. 0:07:46.000,0:07:49.000 Como temos estes gráficos catitas,[br]podemos comparar coisas. 0:07:49.000,0:07:51.000 Podemos dizer:[br]"Quão depressa rebenta a bolha?" 0:07:51.000,0:07:54.000 Acontece que conseguimos medir isso[br]com muita precisão. 0:07:54.000,0:07:57.000 Derivaram-se equações,[br]produziram-se gráficos, 0:07:57.000,0:07:59.000 e como resultado final 0:07:59.000,0:08:02.000 descobrimos que a bolha rebenta[br]cada vez mais depressa, 0:08:02.000,0:08:04.000 de ano para ano. 0:08:04.000,0:08:09.000 Estamos a perder interesse no passado[br]cada vez mais rapidamente. 0:08:09.000,0:08:11.000 JM: Agora, um pouco[br]de orientação profissional. 0:08:11.000,0:08:13.000 Os que querem ser famosos, 0:08:13.000,0:08:15.000 podem aprender[br]com os 25 políticos mais famosos, 0:08:15.000,0:08:17.000 autores, atores, etc.. 0:08:17.000,0:08:20.000 Se quiserem ser famosos cedo,[br]devem tornar-se atores, 0:08:20.000,0:08:22.000 porque a fama começa a aumentar[br]no final dos vinte anos, 0:08:22.000,0:08:24.000 ainda são jovens, isso é ótimo. 0:08:24.000,0:08:26.000 Se puderem esperar um bocadinho,[br]devem ser autores, 0:08:26.000,0:08:28.000 porque então podem chegar longe, 0:08:28.000,0:08:30.000 como Mark Twain, por exemplo,[br]extremamente famoso. 0:08:30.000,0:08:32.000 Mas se quiserem alcançar mesmo o topo, 0:08:32.000,0:08:34.000 não devem esperar resultados imediatos 0:08:34.000,0:08:36.000 e, claro, devem tornarem-se políticos. 0:08:36.000,0:08:38.000 Aqui começarão a ser famosos[br]no final dos 50 anos 0:08:38.000,0:08:40.000 e tornar-se-ão[br]muito famosos depois disso. 0:08:40.000,0:08:43.000 Os cientistas também ficam famosos[br]quando são muito mais velhos. 0:08:43.000,0:08:45.000 Por exemplo, os biológos e os físicos 0:08:45.000,0:08:47.000 podem ser tão famosos como os atores. 0:08:47.000,0:08:50.000 Um erro que não devem fazer[br]é tornarem-se matemáticos. 0:08:50.000,0:08:52.000 (Risos) 0:08:52.000,0:08:54.000 Se o fizerem, podem pensar: 0:08:54.000,0:08:57.000 "Ótimo. Vou fazer o meu melhor trabalho[br]aos 20 anos." 0:08:57.000,0:08:59.000 Mas, calculem, ninguém vai querer saber. 0:08:59.000,0:09:02.000 (Risos) 0:09:02.000,0:09:04.000 Há notas mais sóbrias 0:09:04.000,0:09:06.000 entre os n-gramas. 0:09:06.000,0:09:08.000 Por exemplo, esta é[br]a trajetória de Marc Chagall, 0:09:08.000,0:09:10.000 um artista nascido em 1887. 0:09:10.000,0:09:13.000 Parece-se com a trajetória normal[br]de uma pessoa famosa. 0:09:13.000,0:09:17.000 Torna-se cada vez mais famoso, 0:09:17.000,0:09:19.000 exceto se procurarem em alemão. 0:09:19.000,0:09:21.000 Se procurarem em alemão,[br]verão uma coisa bizarra, 0:09:21.000,0:09:23.000 uma coisa que habitualmente[br]não se observa. 0:09:23.000,0:09:25.000 Ele torna-se extremamente famoso 0:09:25.000,0:09:27.000 e, de repente, cai vertiginosamente, 0:09:27.000,0:09:30.000 atravessando o ponto mais baixo[br]entre 1933 e 1945, 0:09:30.000,0:09:33.000 antes de recuperar nos anos seguintes. 0:09:33.000,0:09:35.000 O que aqui observamos 0:09:35.000,0:09:38.000 é o facto de Marc Chagall[br]ser um artista judeu 0:09:38.000,0:09:40.000 na Alemanha nazi. 0:09:40.000,0:09:42.000 Estes sinais 0:09:42.000,0:09:44.000 na realidade são tão fortes 0:09:44.000,0:09:47.000 que não precisamos de saber[br]que alguém foi censurado. 0:09:47.000,0:09:49.000 Podemos chegar a essa conclusão 0:09:49.000,0:09:51.000 através do tratamento básico de sinais. 0:09:51.000,0:09:53.000 Esta é uma forma simples de o fazer. 0:09:53.000,0:09:55.000 Uma expetativa razoável 0:09:55.000,0:09:57.000 é a de que a fama de alguém[br]num dado período de tempo 0:09:57.000,0:09:59.000 deverá ser sensivelmete[br]a média da sua fama antes 0:09:59.000,0:10:01.000 e da sua fama depois desse período. 0:10:01.000,0:10:03.000 Isso é mais ou menos aquilo que se espera. 0:10:03.000,0:10:06.000 Comparamos isso com a fama[br]que observamos. 0:10:06.000,0:10:08.000 Depois é só dividir uma pela outra 0:10:08.000,0:10:10.000 para obter uma coisa a que chamamos[br]"índice de supressão". 0:10:10.000,0:10:13.000 Se o índice de supressão[br]for muito, muito baixo, 0:10:13.000,0:10:15.000 quase de certeza estão a ser reprimidos. 0:10:15.000,0:10:18.000 Se for muito alto, então talvez estejam[br]a beneficiar com a propaganda. 0:10:19.000,0:10:21.000 JM: Podemos mesmo ver 0:10:21.000,0:10:24.000 a distribuição de índices de supressão [br]em populações inteiras. 0:10:24.000,0:10:26.000 Por exemplo, aqui... 0:10:26.000,0:10:28.000 este índice de supressão[br]é de cinco mil pessoas 0:10:28.000,0:10:30.000 escolhidas em livros em inglês[br]onde não há supressão explícita... 0:10:30.000,0:10:32.000 seria como este, centrado numa pessoa. 0:10:32.000,0:10:34.000 O que se espera é aquilo que se observa. 0:10:34.000,0:10:36.000 Esta é a distribuição conforme[br]observada na Alemanha 0:10:36.000,0:10:38.000 — muito diferente,[br]desvia-se para a esquerda. 0:10:38.000,0:10:41.000 As pessoas falaram sobre isto [br]duas vezes menos do que o esperado. 0:10:41.000,0:10:43.000 Mas muito mais importante,[br]a distribuição é mais alargada. 0:10:43.000,0:10:46.000 Há muitas pessoas que acabam[br]na extrema esquerda nesta distribuição 0:10:46.000,0:10:49.000 de quem se falou menos dez vezes[br]do que seria de esperar. 0:10:49.000,0:10:51.000 Mas também muita gente[br]na extrema direita 0:10:51.000,0:10:53.000 parece beneficiar com a propaganda. 0:10:53.000,0:10:56.000 Esta imagem é a marca distintiva[br]da censura no registo dos livros. 0:10:56.000,0:10:58.000 ELA: "Culturómica" 0:10:58.000,0:11:00.000 é o que chamamos a este método. 0:11:00.000,0:11:02.000 É como genómica. 0:11:02.000,0:11:04.000 Excepto que a genómica[br]é uma lente sobre a biologia 0:11:04.000,0:11:07.000 através da janela da sequência[br]de bases no genoma humano. 0:11:07.000,0:11:09.000 A culturómica é parecida. 0:11:09.000,0:11:12.000 É a aplicação da análise da recolha[br]de dados em larga escala 0:11:12.000,0:11:14.000 ao estudo da cultura humana. 0:11:14.000,0:11:16.000 Aqui, em vez de ser[br]através da lente de um genoma, 0:11:16.000,0:11:19.000 é através da lente de peças digitalizadas[br]do registo histórico. 0:11:19.000,0:11:21.000 O que é genial na culturómica 0:11:21.000,0:11:23.000 é que todos a podem fazer. 0:11:23.000,0:11:25.000 Porque é que todos a podem fazer? 0:11:25.000,0:11:27.000 Todos a podem fazer[br]porque três indivíduos, 0:11:27.000,0:11:30.000 Jon Orwant, Matt Gray[br]e Will Brockman na Google, 0:11:30.000,0:11:32.000 viram o protótipo do NGram Viewer, 0:11:32.000,0:11:34.000 e disseram: "Isto é muito divertido. 0:11:34.000,0:11:37.000 "Temos de tornar isto[br]acessível às pessoas." 0:11:37.000,0:11:39.000 Em apenas duas semanas — as duas semanas[br]anteriores à publicação do nosso artigo — 0:11:39.000,0:11:42.000 fizeram o código para uma versão[br]do NGram Viewer para o público em geral. 0:11:42.000,0:11:45.000 Agora podemos escrever qualquer palavra[br]ou frase em que estejamos interessados 0:11:45.000,0:11:47.000 e vemos imediatamente o seu n-grama, 0:11:47.000,0:11:49.000 assim como vemos exemplos[br]de todos os diversos livros 0:11:49.000,0:11:51.000 onde surge esse n-grama. 0:11:51.000,0:11:53.000 Isto foi utilizado mais de um milhão [br]de vezes no primeiro dia, 0:11:53.000,0:11:55.000 o que é a melhor de todas as pesquisas. 0:11:55.000,0:11:58.000 As pessoas querem ser o seu melhor,[br]mostrar o seu melhor. 0:11:58.000,0:12:01.000 Mas acontece que, no século XVIII,[br]as pessoas não se preocupavam com isso. 0:12:01.000,0:12:04.000 Não queriam ser o seu melhor,[br]queriam ser o seu "milhor". 0:12:04.000,0:12:07.000 Claro que o que aconteceu[br]foi apenas um erro. 0:12:07.000,0:12:09.000 Não que é que se esforçassem[br]pela mediocridade, 0:12:09.000,0:12:12.000 é só porque o "e" escrevia-se[br]de forma diferente, como um "i". 0:12:12.000,0:12:15.000 A Google não se apercebeu disso na altura, 0:12:15.000,0:12:18.000 e nós referimos isso no artigo científico[br]que escrevemos. 0:12:18.000,0:12:20.000 Acontece que isto é apenas um lembrete 0:12:20.000,0:12:22.000 de que, embora seja tudo muito divertido, 0:12:22.000,0:12:24.000 quando interpretamos estes gráficos,[br]temos de ser cuidadosos. 0:12:24.000,0:12:27.000 Há que adotar os procedimentos[br]científicos de base. 0:12:27.000,0:12:30.000 ELA: As pessoas têm usado isto[br]para todo o tipo de diversão. 0:12:30.000,0:12:37.000 (Risos) 0:12:37.000,0:12:39.000 Na verdade, nem é preciso dizer, 0:12:39.000,0:12:42.000 vamos apenas mostrar-vos[br]todos os slides e ficar calados. 0:12:42.000,0:12:45.000 Esta pessoa estava interessada[br]na história da frustração. 0:12:45.000,0:12:48.000 Há vários tipos de frustração. 0:12:48.000,0:12:51.000 Se baterem com um dedo do pé,[br]isso é um "ai" com um A. 0:12:51.000,0:12:53.000 Se o planeta Terra for aniquilado[br]pelos Vogons 0:12:53.000,0:12:55.000 para criar um desvio interestelar, 0:12:55.000,0:12:57.000 isso é um "aaaaaaaai" com oito A's. 0:12:57.000,0:12:59.000 Esta pessoa estuda todos os "ais", 0:12:59.000,0:13:01.000 entre um a oito A's. 0:13:01.000,0:13:03.000 Acontece 0:13:03.000,0:13:05.000 que os "ais" menos frequentes 0:13:05.000,0:13:08.000 são os que correspondem[br]a coisas mais frustrantes, 0:13:08.000,0:13:11.000 excepto, por incrível que pareça,[br]nos princípios dos anos 80. 0:13:11.000,0:13:13.000 Talvez tenha alguma coisa[br]a ver com Reagan. 0:13:13.000,0:13:15.000 (Risos) 0:13:15.000,0:13:18.000 JM: Há muitas utilizações[br]para estes dados, 0:13:18.000,0:13:21.000 mas o mais importante é que[br]o registo histórico está a ser digitalizado. 0:13:21.000,0:13:23.000 A Google começou a digitalizar[br]15 milhões de livros. 0:13:23.000,0:13:25.000 São 12% de todos os livros já publicados. 0:13:25.000,0:13:28.000 É um pedaço considerável[br]da cultura humana. 0:13:28.000,0:13:31.000 Há muito mais na cultura,[br]há manuscritos, há jornais, 0:13:31.000,0:13:33.000 há coisas que não são textos,[br]como arte e quadros. 0:13:33.000,0:13:35.000 Tudo isto está nos nossos computadores, 0:13:35.000,0:13:37.000 nos computadores de todo o mundo. 0:13:37.000,0:13:40.000 Quando isso acontece,[br]irá transformar a forma 0:13:40.000,0:13:42.000 como entendemos o nosso passado,[br]o nosso presente e a nossa cultura humana. 0:13:42.000,0:13:44.000 Muito obrigado. 0:13:44.000,0:13:47.000 (Aplausos)