0:00:00.000,0:00:02.000 Erez Lieberman Aiden: Todos sabemos 0:00:02.000,0:00:05.000 que uma imagem vale mais que mil palavras 0:00:07.000,0:00:09.000 Mas nós em Harvard 0:00:09.000,0:00:12.000 perguntávamo-nos se isto era realmente verdade. 0:00:12.000,0:00:14.000 (Risos) 0:00:14.000,0:00:18.000 Então juntámos uma equipa de peritos, 0:00:18.000,0:00:20.000 abrangendo desde Harvard, o MIT, 0:00:20.000,0:00:23.000 The American Heritage Dictionary, The Encyclopedia Britannica 0:00:23.000,0:00:25.000 e até os nossos orgulhosos patrocinadores, 0:00:25.000,0:00:28.000 a Google. 0:00:28.000,0:00:30.000 E debruçámo-nos sobre esta questão 0:00:30.000,0:00:32.000 durante cerca de quatro anos. 0:00:32.000,0:00:37.000 E chegámos a uma conclusão surpreendente. 0:00:37.000,0:00:40.000 Senhoras e senhores, uma imagem não vale mais do que mil palavras. 0:00:40.000,0:00:42.000 Na realidade, encontrámos algumas imagens 0:00:42.000,0:00:47.000 que valem 500 mil milhões de palavras. 0:00:47.000,0:00:49.000 Jean-Baptiste Michel: Então como chegámos a esta conclusão? 0:00:49.000,0:00:51.000 Eu e o Erez estavámos a pensar em como 0:00:51.000,0:00:53.000 obter um panorama geral da cultura humana 0:00:53.000,0:00:56.000 e da história humana: mudança através dos tempos. 0:00:56.000,0:00:58.000 Foram escritos tantos livros ao longo dos anos. 0:00:58.000,0:01:00.000 E pensámos, bem a melhor maneira de aprender com eles 0:01:00.000,0:01:02.000 é ler todos estes milhões de livros. 0:01:02.000,0:01:05.000 Claro que, se houver uma escala de como isso é fantástico, 0:01:05.000,0:01:08.000 isso tem de ficar num patamar muito, muito elevado. 0:01:08.000,0:01:10.000 O problema é que há um eixo dos xx para isso, 0:01:10.000,0:01:12.000 que é o eixo prático. 0:01:12.000,0:01:14.000 Este está num patamar muito, muito baixo. 0:01:14.000,0:01:17.000 (Aplausos) 0:01:17.000,0:01:20.000 As pessoas têm tendência a usar uma abordagem alternativa, 0:01:20.000,0:01:22.000 que é pegar em algumas fontes e lê-las cuidadosamente. 0:01:22.000,0:01:24.000 Isto é extremamente prático, mas não muito fantástico. 0:01:24.000,0:01:27.000 O que realmente se pretende 0:01:27.000,0:01:30.000 é chegar à parte fantástica mas prática deste espaço. 0:01:30.000,0:01:33.000 Acontece que havia uma empresa do outro lado do rio chamada Google 0:01:33.000,0:01:35.000 que tinha iniciado um projecto de digitalização há alguns anos 0:01:35.000,0:01:37.000 que talvez permitisse esta abordagem. 0:01:37.000,0:01:39.000 Eles tinham digitalizado milhões de livros. 0:01:39.000,0:01:42.000 Isso significava que se podia usar métodos computacionais 0:01:42.000,0:01:44.000 para ler todos os livros com o clique de um botão. 0:01:44.000,0:01:47.000 Isto é muito prático e extremamente fantástico. 0:01:48.000,0:01:50.000 ELA: Deixem-me falar-vos um pouco sobre de onde vêm os livros. 0:01:50.000,0:01:53.000 Desde tempos imemoriais que existem autores. 0:01:53.000,0:01:56.000 Estes autores têm-se esforçado em escrever livros. 0:01:56.000,0:01:58.000 E isto tornou-se consideravelmente mais fácil 0:01:58.000,0:02:00.000 com o desenvolvimento da imprensa há alguns séculos atrás. 0:02:00.000,0:02:03.000 Desde então, os autores conseguiram 0:02:03.000,0:02:05.000 em 129 milhões de ocasiões distintas, 0:02:05.000,0:02:07.000 publicar livros. 0:02:07.000,0:02:09.000 Agora se esses livros não se perderam para a história 0:02:09.000,0:02:11.000 então estão algures numa biblioteca, 0:02:11.000,0:02:14.000 e muitos desses livros têm sido recuperados das bibliotecas 0:02:14.000,0:02:16.000 e digitalizados pela Google, 0:02:16.000,0:02:18.000 que já digitalizou quinze milhões de livros até agora. 0:02:18.000,0:02:21.000 Quando a Google digitaliza um livro, põe-no num formato mesmo catita. 0:02:21.000,0:02:23.000 Agora nós temos os dados e temos ainda metadados. 0:02:23.000,0:02:26.000 Temos informação sobre coisas como onde foi publicado, 0:02:26.000,0:02:28.000 quem foi o autor, quando foi publicado. 0:02:28.000,0:02:31.000 E o que fazemos é verificar todos esses registos 0:02:31.000,0:02:35.000 e excluir tudo aquilo que não é dados da mais alta qualidade. 0:02:35.000,0:02:37.000 Aquilo que nos resta 0:02:37.000,0:02:40.000 é uma colecção de cinco milhões de livros, 0:02:40.000,0:02:43.000 500 mil milhões de palavras, 0:02:43.000,0:02:45.000 uma cadeia de caracteres mil vezes mais longa 0:02:45.000,0:02:48.000 que o genoma humano... 0:02:48.000,0:02:50.000 um texto que, se fosse escrito por extenso, 0:02:50.000,0:02:52.000 iria daqui até à Lua e voltava 0:02:52.000,0:02:54.000 mais de dez vezes... 0:02:54.000,0:02:58.000 um autêntico fragmento do nosso genoma cultural. 0:02:58.000,0:03:00.000 Claro que aquilo que fizemos 0:03:00.000,0:03:03.000 perante tamanha hipérbole... 0:03:03.000,0:03:05.000 (Risos) 0:03:05.000,0:03:08.000 foi aquilo que qualquer pesquisador que se preze 0:03:08.000,0:03:11.000 teria feito. 0:03:11.000,0:03:13.000 Inspirámo-nos no XKDC, 0:03:13.000,0:03:15.000 e dissemos: «Afastem-se. 0:03:15.000,0:03:17.000 Vamos tentar fazer ciência.» 0:03:17.000,0:03:19.000 (Risos) 0:03:19.000,0:03:21.000 JM: Claro que pensávamos assim, 0:03:21.000,0:03:23.000 primeiro vamos por os dados lá fora 0:03:23.000,0:03:25.000 para que as pessoas façam ciência com eles. 0:03:25.000,0:03:27.000 E agora pensávamos, que dados podemos publicar? 0:03:27.000,0:03:29.000 Claro que se queria pegar nos livros 0:03:29.000,0:03:31.000 e publicar o texto completo destes cinco milhões de livros. 0:03:31.000,0:03:33.000 Mas a Google, e o Jon Orwant em particular, 0:03:33.000,0:03:35.000 mostrou-nos uma pequena equação a aprender. 0:03:35.000,0:03:38.000 Então temos cinco milhões, ou seja, cinco milhões de autores 0:03:38.000,0:03:41.000 e cinco milhões de queixosos são um processo legal monstruoso. 0:03:41.000,0:03:43.000 Então, embora isso fosse realmente fantástico 0:03:43.000,0:03:46.000 mais uma vez, é extremamente pouco prático. 0:03:46.000,0:03:48.000 (Risos) 0:03:48.000,0:03:50.000 Mais uma vez, tivemos de ceder mais ou menos, 0:03:50.000,0:03:53.000 e seguimos a abordagem muito prática, que é menos fantástica. 0:03:53.000,0:03:55.000 Dissemos: bem em vez de publicarmos o texto completo, 0:03:55.000,0:03:57.000 vamos publicar estatísticas sobre os livros. 0:03:57.000,0:03:59.000 Tome-se como exemplo «Um brilho de felicidade». 0:03:59.000,0:04:01.000 São quatro palavras; o que chamamos de quatro-grama. 0:04:01.000,0:04:03.000 Nós vamos dizer-vos quantas vezes um quatro-grama em particular 0:04:03.000,0:04:05.000 apareceu em livros em 1801, 1802, 1803, 0:04:05.000,0:04:07.000 até 2008. 0:04:07.000,0:04:09.000 Isso dá-nos uma série temporal 0:04:09.000,0:04:11.000 de quantas vezes esta frase em particular foi utilizada ao longo dos tempos. 0:04:11.000,0:04:14.000 Fazemos isso para todas as palavras e frases que surgem nestes livros, 0:04:14.000,0:04:17.000 e isso dá-nos uma enorme tabela de dois mil milhões de linhas 0:04:17.000,0:04:19.000 que nos dizem como a cultura tem vindo a mudar. 0:04:19.000,0:04:21.000 ELA: A estes dois mil milhões de linhas, 0:04:21.000,0:04:23.000 chamamos dois mil milhões de n-gramas. 0:04:23.000,0:04:25.000 O que é que eles nos dizem? 0:04:25.000,0:04:27.000 Bem, os n-gramas individuais medem tendências culturais. 0:04:27.000,0:04:29.000 Deixem-me dar-vos um exemplo. 0:04:29.000,0:04:31.000 Vamos supôr que estou a prosperar, 0:04:31.000,0:04:33.000 e que amanhã vos quero contar como me saí bem. 0:04:33.000,0:04:36.000 E então posso dizer «Ontem, eu vicejei.» 0:04:36.000,0:04:39.000 Em alternativa, podia dizer «Ontem, eu prosperei.» 0:04:39.000,0:04:42.000 Então qual é que devo utilizar? 0:04:42.000,0:04:44.000 Como é que se sabe? 0:04:44.000,0:04:46.000 Há cerca de seis meses atrás, 0:04:46.000,0:04:48.000 o topo de gama neste campo 0:04:48.000,0:04:50.000 seria dirigir-se, por exemplo, 0:04:50.000,0:04:52.000 a este psicólogo com um cabelo extraordinário 0:04:52.000,0:04:54.000 e dizer 0:04:54.000,0:04:57.000 «Steve, és perito nos verbos irregulares. 0:04:57.000,0:04:59.000 O que é que devo fazer?» 0:04:59.000,0:05:01.000 E ele responderia «Bem, muitos dizem prosperei, 0:05:01.000,0:05:04.000 mas alguns dizem vicejei.» 0:05:04.000,0:05:06.000 E ficariam a saber, mais ou menos, 0:05:06.000,0:05:09.000 que se voltassem 200 anos atrás 0:05:09.000,0:05:12.000 e perguntassem a este estadista com um cabelo igualmente extraordinário, 0:05:12.000,0:05:15.000 (Risos) 0:05:15.000,0:05:17.000 «Tom, o que é que eu devo dizer?» 0:05:17.000,0:05:19.000 Ele diria «Bem, no meu tempo a maior parte das pessoas vicejava, 0:05:19.000,0:05:22.000 mas alguns prosperavam.» 0:05:22.000,0:05:24.000 O que agora vos vou mostrar são dados brutos. 0:05:24.000,0:05:28.000 Duas linhas desta tabela com dois mil milhões de entradas. 0:05:28.000,0:05:30.000 O que estão a ver é a frequência por ano 0:05:30.000,0:05:33.000 de 'prosperei' e vicejei' ao longo do tempo. 0:05:34.000,0:05:36.000 Estas são apenas duas 0:05:36.000,0:05:39.000 de dois mil milhões de linhas. 0:05:39.000,0:05:41.000 O conjunto total dos dados 0:05:41.000,0:05:44.000 é mil milhões de vezes mais fantástico do que este slide. 0:05:44.000,0:05:46.000 (Risos) 0:05:46.000,0:05:50.000 (Aplausos) 0:05:50.000,0:05:52.000 JM: Há realmente muitas imagens que valem mais que 500 mil milhões de palavras. 0:05:52.000,0:05:54.000 Por exemplo, esta. 0:05:54.000,0:05:56.000 Se pegarmos em influenza, 0:05:56.000,0:05:58.000 verão picos no tempo onde sabiam que 0:05:58.000,0:06:01.000 grandes epidemias de gripe estavam a matar pessoas por todo o globo. 0:06:01.000,0:06:04.000 ELA: Se ainda não estão convencidos, 0:06:04.000,0:06:06.000 os níveis do mar estão a subir, 0:06:06.000,0:06:09.000 assim como o CO2 na atmosfera e a temperatura da Terra. 0:06:09.000,0:06:12.000 JM: Talvez queiram prestar atenção a este n-grama em particular, 0:06:12.000,0:06:15.000 para dizer a Nietzsche que Deus não está morto, 0:06:15.000,0:06:18.000 embora possam concordar que precisa de um relações públicas melhor. 0:06:18.000,0:06:20.000 (Risos) 0:06:20.000,0:06:23.000 ELA: Podem obter conceitos bastante abstractos com este tipo de análise. 0:06:23.000,0:06:25.000 Por exemplo, deixem-me contar-vos a história 0:06:25.000,0:06:27.000 do ano de 1950. 0:06:27.000,0:06:29.000 Durante grande parte da história, 0:06:29.000,0:06:31.000 ninguém ligou nenhuma a 1950. 0:06:31.000,0:06:33.000 Em 1700, em 1800, em 1900, 0:06:33.000,0:06:36.000 ninguém se preocupou. 0:06:37.000,0:06:39.000 Durante as décadas de 30 e 40, 0:06:39.000,0:06:41.000 ninguém se preocupou. 0:06:41.000,0:06:43.000 De repente, a meio da década de 40, 0:06:43.000,0:06:45.000 começou a haver um burburinho. 0:06:45.000,0:06:47.000 As pessoas perceberam que 1950 ia acontecer, 0:06:47.000,0:06:49.000 e podia ser algo em grande. 0:06:49.000,0:06:52.000 (Risos) 0:06:52.000,0:06:55.000 Mas nada fez com que as pessoas se interessassem mais pelo ano de 1950 0:06:55.000,0:06:58.000 como o ano de 1950. 0:06:58.000,0:07:01.000 (Risos) 0:07:01.000,0:07:03.000 As pessoas andavam obececadas. 0:07:03.000,0:07:05.000 Não conseguiam parar de falar 0:07:05.000,0:07:08.000 sobre tudo o que tinham feito em 1950, 0:07:08.000,0:07:11.000 tudo o que planeavam fazer em 1950, 0:07:11.000,0:07:16.000 todos os sonhos que queriam alcançar em 1950. 0:07:16.000,0:07:18.000 Na verdade, 1950 era tão fascinante 0:07:18.000,0:07:20.000 que durante anos depois, 0:07:20.000,0:07:23.000 as pessoas continuaram a falar sobre as coisas maravilhosas que tinha acontecido, 0:07:23.000,0:07:25.000 em 51, 52, 53. 0:07:25.000,0:07:27.000 Finalmente em 1954, 0:07:27.000,0:07:29.000 houve alguém que acordou e percebeu 0:07:29.000,0:07:33.000 que 1950 se tinha tornado em algo fora de moda. 0:07:33.000,0:07:35.000 (Risos) 0:07:35.000,0:07:37.000 E assim de repente, rebentou a bolha. 0:07:37.000,0:07:39.000 (Risos) 0:07:39.000,0:07:41.000 E a história de 1950 0:07:41.000,0:07:43.000 é a história de cada ano que temos registado, 0:07:43.000,0:07:46.000 com uma ligeira diferença, porque agora temos estes gráficos catitas. 0:07:46.000,0:07:49.000 E como temos estes gráficos catitas, podemos comparar coisas. 0:07:49.000,0:07:51.000 Podemos dizer: «Quão depressa rebenta a bolha?» 0:07:51.000,0:07:54.000 E acontece que conseguimos medir isso com muita precisão. 0:07:54.000,0:07:57.000 Foram obtidas equações, foram produzidos gráficos, 0:07:57.000,0:07:59.000 e o resultado final 0:07:59.000,0:08:02.000 é que descobrimos 0:08:02.000,0:08:04.000 a cada ano que passa. 0:08:04.000,0:08:09.000 Estamos a perder interesse no passado cada vez mais rapidamente. 0:08:09.000,0:08:11.000 JM: E agora um pouco de orientação profissional. 0:08:11.000,0:08:13.000 Para aqueles de vós que querem ser famosos, 0:08:13.000,0:08:15.000 podemos aprender com os 25 políticos mais famosos, 0:08:15.000,0:08:17.000 autores, actores e assim por diante. 0:08:17.000,0:08:20.000 Então se quiserem ser famosos cedo, devem tornar-se actores, 0:08:20.000,0:08:22.000 porque a fama começa a aumentar no final dos vossos vinte anos... 0:08:22.000,0:08:24.000 ainda são jovens, isso é óptimo. 0:08:24.000,0:08:26.000 Se puderem esperar um bocadinho, devem ser autores, 0:08:26.000,0:08:28.000 porque então podem chegar longe, 0:08:28.000,0:08:30.000 como Mark Twain, por exemplo: extremamente famoso. 0:08:30.000,0:08:32.000 mas se quiserem alcançar mesmo o topo, 0:08:32.000,0:08:34.000 não devem esperar resultados imediatos 0:08:34.000,0:08:36.000 e devem tornarem-se políticos, pois claro. 0:08:36.000,0:08:38.000 Aqui começarão a ser famosos no final dos vossos cinquenta, 0:08:38.000,0:08:40.000 e tornar-se-ão muito, muito famosos depois disso. 0:08:40.000,0:08:43.000 Os cientistas também têm tendência a tornar-se famosos quando são mais muito mais velhos. 0:08:43.000,0:08:45.000 Por exemplo, biológos e físicos 0:08:45.000,0:08:47.000 podem ser tão famosos como actores. 0:08:47.000,0:08:50.000 Um erro que não devem cometer é tornarem-se matemáticos. 0:08:50.000,0:08:52.000 (Risos) 0:08:52.000,0:08:54.000 Se o fizerem, 0:08:54.000,0:08:57.000 podem pensar «Óptimo. Vou fazer o meu melhor trabalho quando tiver 20 anos.» 0:08:57.000,0:08:59.000 Mas, adivinhem, ninguém vai querer saber. 0:08:59.000,0:09:02.000 (Risos) 0:09:02.000,0:09:04.000 Há notas mais sóbrias 0:09:04.000,0:09:06.000 por entre os n-gramas. 0:09:06.000,0:09:08.000 Por exemplo, aqui está a trajectória de Marc Chagall, 0:09:08.000,0:09:10.000 um artista nascido em 1887. 0:09:10.000,0:09:13.000 E que se parece com a trajectória normal de uma pessoa famosa. 0:09:13.000,0:09:17.000 Ele torna-se cada vez mais famoso, 0:09:17.000,0:09:19.000 excepto se virem em alemão. 0:09:19.000,0:09:21.000 Se virem em alemão, vêem algo completamente bizarro, 0:09:21.000,0:09:23.000 algo que quase nunca se observa, 0:09:23.000,0:09:25.000 que é ele tornar-se extremamente famoso 0:09:25.000,0:09:27.000 e então de repente cai vertiginosamente, 0:09:27.000,0:09:30.000 atravessando o ponto mais baixo entre 1933 e 1945, 0:09:30.000,0:09:33.000 antes de recuperar nos anos seguintes. 0:09:33.000,0:09:35.000 E claro o que observamos 0:09:35.000,0:09:38.000 é o facto de Marc Chagall ser um artista judeu 0:09:38.000,0:09:40.000 na Alemanha nazi. 0:09:40.000,0:09:42.000 Estes sinais 0:09:42.000,0:09:44.000 na realidade são tão fortes 0:09:44.000,0:09:47.000 que não precisamos de saber que alguém foi censurado. 0:09:47.000,0:09:49.000 Podemos chegar a essa conclusão 0:09:49.000,0:09:51.000 através do processamento bastante básico de sinais. 0:09:51.000,0:09:53.000 Aqui está uma forma simples de o fazer. 0:09:53.000,0:09:55.000 Uma expectativa razoável 0:09:55.000,0:09:57.000 é a de que a fama de alguém num dado período de tempo 0:09:57.000,0:09:59.000 deverá ser sensivelmete a média da sua fama antes 0:09:59.000,0:10:01.000 e da sua fama depois desse período. 0:10:01.000,0:10:03.000 Isso é mais ou menos aquilo que se espera. 0:10:03.000,0:10:06.000 E comparamos isso com a fama que observamos. 0:10:06.000,0:10:08.000 E depois é só dividir uma pela outra 0:10:08.000,0:10:10.000 para obter algo a que chamamos de índice de supressão. 0:10:10.000,0:10:13.000 Se o índice de supressão for muito, muito, muito baixo, 0:10:13.000,0:10:15.000 então quase de certeza estão a ser reprimidos. 0:10:15.000,0:10:18.000 Se for muito alto, então talvez estejam a beneficiar com a propaganda. 0:10:19.000,0:10:21.000 JM: Pode mesmo ver-se 0:10:21.000,0:10:24.000 a distribuição de índices de supressão em populações inteiras. 0:10:24.000,0:10:26.000 Por exemplo, aqui... 0:10:26.000,0:10:28.000 este índice de supressão é de cinco mil pessoas 0:10:28.000,0:10:30.000 escolhidas em livros em inglês onde não há supressão explícita... 0:10:30.000,0:10:32.000 seria como este, centrado basicamente numa pessoa. 0:10:32.000,0:10:34.000 O que se espera é basicamente aquilo que se observa. 0:10:34.000,0:10:36.000 Esta é a distribuição conforme observada na Alemanha... 0:10:36.000,0:10:38.000 muito diferente, desvia-se para a esquerda. 0:10:38.000,0:10:41.000 As pessoas falaram sobre isto duas vezes menos do que se esperaria. 0:10:41.000,0:10:43.000 Mas muito mais importante, a distribuição é muito mais alargada. 0:10:43.000,0:10:46.000 Há muitas pessoas que acabaram na extrema esquerda nesta distribuição 0:10:46.000,0:10:49.000 de quem se falou menos dez vezes do que seria de esperar. 0:10:49.000,0:10:51.000 Mas também muitas pessoas na extrema direita 0:10:51.000,0:10:53.000 parecem beneficiar com a propaganda. 0:10:53.000,0:10:56.000 Esta imagem é a marca distintiva da censura no registo dos livros. 0:10:56.000,0:10:58.000 Culturómica 0:10:58.000,0:11:00.000 é o que chamamos a este método. 0:11:00.000,0:11:02.000 É como genómica. 0:11:02.000,0:11:04.000 Excepto que a genómica é uma lente sobre a biologia 0:11:04.000,0:11:07.000 através da janela da sequência de bases no genoma humano. 0:11:07.000,0:11:09.000 A culturómica é parecida. 0:11:09.000,0:11:12.000 É a aplicação da análise da recolha de dados em larga escala 0:11:12.000,0:11:14.000 ao estudo da cultura humana. 0:11:14.000,0:11:16.000 Aqui, em vez de ser através da lente de um genoma, 0:11:16.000,0:11:19.000 através da lente de peças digitalizadas do registo histórico. 0:11:19.000,0:11:21.000 O que é genial sobre a culturómica 0:11:21.000,0:11:23.000 é que todos a podem fazer. 0:11:23.000,0:11:25.000 Porque é que todos a podem fazer? 0:11:25.000,0:11:27.000 Todos a podem fazer porque três indivíduos, 0:11:27.000,0:11:30.000 Jon Orwant, Matt Gray e Will Brockman na Google, 0:11:30.000,0:11:32.000 viram o protótipo do NGram Viewer, 0:11:32.000,0:11:34.000 e disseram: «Isto é tão divertido. 0:11:34.000,0:11:37.000 Temos de tornar isto acessível às pessoas.» 0:11:37.000,0:11:39.000 E então em apenas duas semanas - as duas semanas anteriores à publicação do nosso artigo - 0:11:39.000,0:11:42.000 fizeram o código para uma versão do NGram Viewer para o público em geral. 0:11:42.000,0:11:45.000 E agora vocês podem escrever qualquer palavra ou frase em que estejam interessados 0:11:45.000,0:11:47.000 e ver imediatamente o seu n-grama... 0:11:47.000,0:11:49.000 assim como ver exemplos de todos os diferentes livros 0:11:49.000,0:11:51.000 onde surge o vosso n-grama. 0:11:51.000,0:11:53.000 Isto foi utilizado mais de um milhão de vezes no primeiro dia, 0:11:53.000,0:11:55.000 o que é a melhor de todas as pesquisas, na verdade. 0:11:55.000,0:11:58.000 As pessoas querem ser o seu melhor, causar a melhor impressão que conseguirem. 0:11:58.000,0:12:01.000 Mas acontece que no século XVIII, as pessoas não se preocupavam com isso. 0:12:01.000,0:12:04.000 Elas não queriam ser o seu melhor, queriam ser o seu milhor. 0:12:04.000,0:12:07.000 O que aconteceu foi, claro está, apenas um erro. 0:12:07.000,0:12:09.000 Não que é que se esforçassem pela mediocridade, 0:12:09.000,0:12:12.000 é só porque o E era escrito de forma diferente, como um I. 0:12:12.000,0:12:15.000 Claro que a Google não se apercebeu disto na altura, 0:12:15.000,0:12:18.000 e então nós referimos isto no artigo científico que escrevemos. 0:12:18.000,0:12:20.000 Mas acontece que isto é apenas um lembrete 0:12:20.000,0:12:22.000 de que, embora seja tudo muito divertido, 0:12:22.000,0:12:24.000 quando se interpretam estes gráficos, temos de ser cuidadosos 0:12:24.000,0:12:27.000 e há que adoptar os procedimentos científicos de base. 0:12:27.000,0:12:30.000 ELA: As pessoas têm utilizado isto para toda a espécie de diversão. 0:12:30.000,0:12:37.000 (Risos) 0:12:37.000,0:12:39.000 Na verdade, nem precisamos de vos dizer, 0:12:39.000,0:12:42.000 vamos apenas mostrar-vos todos os slides e ficar calados. 0:12:42.000,0:12:45.000 Esta pessoa estava interessada na história da frustração. 0:12:45.000,0:12:48.000 Há vários tipos de frustração. 0:12:48.000,0:12:51.000 Se baterem com um dedo do pé, isso é um «argh» com um A. 0:12:51.000,0:12:53.000 Se o planeta Terra for aniquilado pelos Vogons 0:12:53.000,0:12:55.000 para criar um desvio interestelar, 0:12:55.000,0:12:57.000 isso é um «aaaaaaaargh» com oito As. 0:12:57.000,0:12:59.000 Esta pessoa estuda todos os «arghs», 0:12:59.000,0:13:01.000 entre um a oito As. 0:13:01.000,0:13:03.000 e acontece 0:13:03.000,0:13:05.000 que os «arghs» menos frequentes 0:13:05.000,0:13:08.000 são, claro, aqueles que correspondem a coisas mais frustrantes... 0:13:08.000,0:13:11.000 excepto, por incrível que pareça, nos princípios dos anos oitenta. 0:13:11.000,0:13:13.000 Pensamos que talvez tenha algo a ver com Reagan. 0:13:13.000,0:13:15.000 (Risos) 0:13:15.000,0:13:18.000 JM: Há muitas utilizações para estes dados, 0:13:18.000,0:13:21.000 mas o mais importante é que o registo histórico está a ser digitalizado. 0:13:21.000,0:13:23.000 A Google começou a digitalizar 15 milhões de livros. 0:13:23.000,0:13:25.000 São 12 por cento de todos os livros alguma vez publicados. 0:13:25.000,0:13:28.000 É um pedaço considerável da cultura humana. 0:13:28.000,0:13:31.000 Há muito mais na cultura: há manuscritos, há jornais, 0:13:31.000,0:13:33.000 há coisas que não são textos, como arte e quadros. 0:13:33.000,0:13:35.000 Tudo isto está nos nossos computadores, 0:13:35.000,0:13:37.000 nos computadores de todo o mundo. 0:13:37.000,0:13:40.000 E quando isso acontece, irá transformar a forma como 0:13:40.000,0:13:42.000 percebemos o nosso passado, o nosso presente e a nossa cultura humana. 0:13:42.000,0:13:44.000 Muito obrigado. 0:13:44.000,0:13:47.000 (Aplausos)