0:00:00.000,0:00:02.000 Erez Lieberman Aiden: Todos sabem 0:00:02.000,0:00:05.000 que uma imagem vale mil palavras. 0:00:07.000,0:00:09.000 Mas nós em Harvard 0:00:09.000,0:00:12.000 estávamos questionando se é mesmo verdade. 0:00:12.000,0:00:14.000 (Risos) 0:00:14.000,0:00:18.000 Assim montamos uma equipe de peritos, 0:00:18.000,0:00:20.000 desde Harvard, MIT, 0:00:20.000,0:00:23.000 The American Heritage Dictionary, Enciclopédia Britânica 0:00:23.000,0:00:25.000 e mesmo nossos orgulhosos patrocinadores, 0:00:25.000,0:00:28.000 o Google. 0:00:28.000,0:00:30.000 E pensamos sobre isto 0:00:30.000,0:00:32.000 por cerca de 4 anos. 0:00:32.000,0:00:37.000 Chegamos a uma surpreendente conclusão. 0:00:37.000,0:00:40.000 Senhoras e senhores, uma imagem não vale mil palavras. 0:00:40.000,0:00:42.000 De fato, encontramos algumas imagens 0:00:42.000,0:00:47.000 que valem 500 bilhões de palavras. 0:00:47.000,0:00:49.000 Jean-Baptiste Michel: Como chegamos a esta conclusão? 0:00:49.000,0:00:51.000 Erez e eu pensávamos em maneiras 0:00:51.000,0:00:53.000 de obter uma grande imagem da cultura e 0:00:53.000,0:00:56.000 história humana: a mudança através dos tempos. 0:00:56.000,0:00:58.000 Muitos livros tem sido escritos ao longo dos anos. 0:00:58.000,0:01:00.000 Pensávamos, a melhor maneira de aprender com eles 0:01:00.000,0:01:02.000 é ler todos estes milhões de livros. 0:01:02.000,0:01:05.000 Naturalmente, se há uma medida do incrível que isso é, 0:01:05.000,0:01:08.000 teria que ser colocado lá em cima. 0:01:08.000,0:01:10.000 O problema é que existe um eixo-X para isso, 0:01:10.000,0:01:12.000 que é o eixo da praticidade. 0:01:12.000,0:01:14.000 Que é muito, muito baixa. 0:01:14.000,0:01:17.000 (Aplausos) 0:01:17.000,0:01:20.000 As pessoas costumam usar um método alternativo, 0:01:20.000,0:01:22.000 que seria pegar algumas fontes e lê-las cuidadosamente. 0:01:22.000,0:01:24.000 É extremamente prático, mas nem um pouco incrível. 0:01:24.000,0:01:27.000 O que realmente se quer fazer 0:01:27.000,0:01:30.000 é alcançar o incrível junto com a parte prática deste espaço. 0:01:30.000,0:01:33.000 Aconteceu que havia uma empresa próxima chamada Google 0:01:33.000,0:01:35.000 que iniciou um projeto de digitalização alguns anos antes 0:01:35.000,0:01:37.000 que poderia viabilizar este método. 0:01:37.000,0:01:39.000 Eles haviam digitalizado milhões de livros. 0:01:39.000,0:01:42.000 O que significa, que alguém poderia usar métodos computacionais 0:01:42.000,0:01:44.000 para ler todos os livros com um clique de botão. 0:01:44.000,0:01:47.000 Isso é muito prático e extremamente incrível. 0:01:48.000,0:01:50.000 ELA: Permitam-me contar um pouco de onde os livros vêm. 0:01:50.000,0:01:53.000 Desde tempos imemoriais, existem os autores. 0:01:53.000,0:01:56.000 Estes autores tem se esforçado para escrever livros. 0:01:56.000,0:01:58.000 O que se tornou consideravelmente mais fácil 0:01:58.000,0:02:00.000 com o desenvolvimento da imprensa alguns séculos atrás. 0:02:00.000,0:02:03.000 Desde então, os autores venceram 0:02:03.000,0:02:05.000 em 129 milhões de ocasiões distintas, 0:02:05.000,0:02:07.000 publicando livros. 0:02:07.000,0:02:09.000 Agora se esses livros não se perderam na história, 0:02:09.000,0:02:11.000 então eles estão em algum lugar em uma biblioteca, 0:02:11.000,0:02:14.000 e muitos deles estão sendo recuperados das bibliotecas 0:02:14.000,0:02:16.000 e digitalizados pelo Google, 0:02:16.000,0:02:18.000 que escaneou 15 milhões de livros até agora. 0:02:18.000,0:02:21.000 Quando o Google digitaliza, eles o colocam em um formato muito legal. 0:02:21.000,0:02:23.000 Agora temos a informação, e temos os metadados. 0:02:23.000,0:02:26.000 Temos informações sobre coisas como onde foi publicado, 0:02:26.000,0:02:28.000 quem era o autor, quando foi publicado. 0:02:28.000,0:02:31.000 E o que fazemos é percorrer todos estes registros 0:02:31.000,0:02:35.000 e excluir tudo que não seja informação de alta qualidade. 0:02:35.000,0:02:37.000 O que permanece 0:02:37.000,0:02:40.000 é uma coleção de 5 milhões de livros, 0:02:40.000,0:02:43.000 500 bilhões de palavras, 0:02:43.000,0:02:45.000 uma sequência de caracteres mil vezes maior 0:02:45.000,0:02:48.000 que o genoma humano -- 0:02:48.000,0:02:50.000 um texto que, quando escrito, 0:02:50.000,0:02:52.000 se estenderia daqui até a Lua e de volta 0:02:52.000,0:02:54.000 mais de 10 vezes -- 0:02:54.000,0:02:58.000 um verdadeiro fragmento de nosso genoma cultural. 0:02:58.000,0:03:00.000 Claro que fizemos 0:03:00.000,0:03:03.000 quando encaramos tal ultrajante hipérbole... 0:03:03.000,0:03:05.000 (Risos) 0:03:05.000,0:03:08.000 foi o que qualquer pesquisador com respeito próprio 0:03:08.000,0:03:11.000 teria feito. 0:03:11.000,0:03:13.000 Pegamos uma webcomic do XKCD, 0:03:13.000,0:03:15.000 e dissemos, "Afastem-se. 0:03:15.000,0:03:17.000 Vamos tentar a ciência." 0:03:17.000,0:03:19.000 (Risos) 0:03:19.000,0:03:21.000 JM: Naturalmente, nós pensamos, 0:03:21.000,0:03:23.000 primeiro vamos mostrar os dados 0:03:23.000,0:03:25.000 para que as pessoas façam ciência com eles. 0:03:25.000,0:03:27.000 Depois pensamos, que informação podemos liberar? 0:03:27.000,0:03:29.000 Naturalmente, você quer pegar os livros 0:03:29.000,0:03:31.000 e liberar o texto completo destes 5 milhões de livros. 0:03:31.000,0:03:33.000 Aí o Google, e Jon Orwant em especial, 0:03:33.000,0:03:35.000 falaram sobre uma equação que devíamos aprender. 0:03:35.000,0:03:38.000 Você tem 5 milhões, que são, 5 milhões de autores 0:03:38.000,0:03:41.000 e 5 milhões de queixosos é um processo e tanto. 0:03:41.000,0:03:43.000 Ainda que fosse muito, mas muito incrível, 0:03:43.000,0:03:46.000 de novo, é extremamente, extremamente impraticável. 0:03:46.000,0:03:48.000 (Risos) 0:03:48.000,0:03:50.000 Então, nós meio que nos aprofundamos, 0:03:50.000,0:03:53.000 e fizemos uma alternativa prática, que foi só um pouco menos incrível. 0:03:53.000,0:03:55.000 Falamos, ao invés de liberar o texto completo, 0:03:55.000,0:03:57.000 vamos liberar estatísticas sobre os livros. 0:03:57.000,0:03:59.000 Peguem por exemplo "Um brilho de felicidade." 0:03:59.000,0:04:01.000 São 4 palavras: nós chamamos de 4-grama. 0:04:01.000,0:04:03.000 Vamos dizer a vocês quantas vezes um 4-grama em especial 0:04:03.000,0:04:05.000 apareceu nos livros em 1801, 1802, 1803, 0:04:05.000,0:04:07.000 até chegar em 2008. 0:04:07.000,0:04:09.000 Isso nos dá uma linha de tempo 0:04:09.000,0:04:11.000 da frequência com que esta frase foi utilizada através dos tempos. 0:04:11.000,0:04:14.000 Fizemos isso para todas as palavras e frases que aparecem nos livros, 0:04:14.000,0:04:17.000 o que nos dá uma grande tabela de 2 bilhões de linhas 0:04:17.000,0:04:19.000 que nos conta como a cultura tem se modificado. 0:04:19.000,0:04:21.000 ELA: Essas 2 bilhões de linhas, 0:04:21.000,0:04:23.000 nós chamamos de 2 bilhões de n-gramas. 0:04:23.000,0:04:25.000 O que eles nos dizem? 0:04:25.000,0:04:27.000 Os n-gramas individuais medem as tendências culturais. 0:04:27.000,0:04:29.000 Permitam-me dar um exemplo. 0:04:29.000,0:04:31.000 Suponhamos que eu esteja prosperando. 0:04:31.000,0:04:33.000 e amanhã eu queira contar como eu me dei bem. 0:04:33.000,0:04:36.000 Em inglês eu diria, "Ontem, eu 'throve'." 0:04:36.000,0:04:39.000 Ou eu poderia dizer, "Ontem, eu 'thrived'." 0:04:39.000,0:04:42.000 Qual deles eu deveria usar? 0:04:42.000,0:04:44.000 Como saber? 0:04:44.000,0:04:46.000 Como cerca de 6 meses atras, 0:04:46.000,0:04:48.000 o estado de arte nesta matéria 0:04:48.000,0:04:50.000 seria, por exemplo, 0:04:50.000,0:04:52.000 ir até este psicólogo com um cabelo fabuloso, 0:04:52.000,0:04:54.000 e dizer, 0:04:54.000,0:04:57.000 "Steve, você é um expert em verbos irregulares. 0:04:57.000,0:04:59.000 O que eu devo fazer?" 0:04:59.000,0:05:01.000 E ele diria, "Bem a maioria diria 'thrived', 0:05:01.000,0:05:04.000 mas algumas diriam 'throve'." 0:05:04.000,0:05:06.000 E vocês também sabem, talvez, 0:05:06.000,0:05:09.000 que se voltassem no tempo 200 anos 0:05:09.000,0:05:12.000 e perguntassem a esse estadista também de cabelo fabuloso, 0:05:12.000,0:05:15.000 (Risos) 0:05:15.000,0:05:17.000 "Tom, o que devo falar?" 0:05:17.000,0:05:19.000 Ele diria, "No meu tempo a maioria dizia 'throve', 0:05:19.000,0:05:22.000 mas alguns 'thrive'." 0:05:22.000,0:05:24.000 Agora o que vou lhes mostrar são dados crus. 0:05:24.000,0:05:28.000 Duas linhas desta tabela de 2 bilhões de lançamentos. 0:05:28.000,0:05:30.000 O que estão vendo é a frequencia ano a ano 0:05:30.000,0:05:33.000 de "thrived" e "throve" através dos tempos. 0:05:34.000,0:05:36.000 Isso são apenas duas 0:05:36.000,0:05:39.000 de 2 bilhões de linhas. 0:05:39.000,0:05:41.000 Assim o conjunto completo de dados 0:05:41.000,0:05:44.000 é 2 bilhões de vezes mais incrível que esse slide. 0:05:44.000,0:05:46.000 (Risos) 0:05:46.000,0:05:50.000 (Aplausos) 0:05:50.000,0:05:52.000 JM: Existem muitas outras imagens que valem 500 bilhões de palavras. 0:05:52.000,0:05:54.000 Por exemplo, esta aqui. 0:05:54.000,0:05:56.000 Se você escolher influenza, 0:05:56.000,0:05:58.000 verá picos nas épocas onde se sabe 0:05:58.000,0:06:01.000 de grandes epidemias de gripe que mataram pessoas pelo mundo. 0:06:01.000,0:06:04.000 ELA: Se vocês ainda não se convenceram, 0:06:04.000,0:06:06.000 o nível dos mares está subindo, 0:06:06.000,0:06:09.000 junto com o CO2 na atmosfera e a temperatura global. 0:06:09.000,0:06:12.000 JM: Vocês também podem querer dar uma olhada neste n-grama, 0:06:12.000,0:06:15.000 que diz ao Nietzsche que Deus não morreu, 0:06:15.000,0:06:18.000 apesar que ele podia ter um publicitário melhor. 0:06:18.000,0:06:20.000 (Risos) 0:06:20.000,0:06:23.000 ELA: Se pode entender alguns conceitos bem abstratos com essa coisa. 0:06:23.000,0:06:25.000 Por exemplo, permitam-me contar a história 0:06:25.000,0:06:27.000 do ano de 1950. 0:06:27.000,0:06:29.000 Durante todo o transcurso da história, 0:06:29.000,0:06:31.000 ninguém dava a mínima para 1950. 0:06:31.000,0:06:33.000 Em 1700, em 1800, em 1900, 0:06:33.000,0:06:36.000 ninguém ligava. 0:06:37.000,0:06:39.000 Nos anos 30 e 40, 0:06:39.000,0:06:41.000 ninguém ligava. 0:06:41.000,0:06:43.000 De repente, no meio dos anos 40, 0:06:43.000,0:06:45.000 começou um rumor. 0:06:45.000,0:06:47.000 As pessoas perceberam que 1950 viria, 0:06:47.000,0:06:49.000 e que seria algo grande. 0:06:49.000,0:06:52.000 (Risos) 0:06:52.000,0:06:55.000 Nada interessou tanto às pessoas em 1950 0:06:55.000,0:06:58.000 como o ano 1950. 0:06:58.000,0:07:01.000 (Risos) 0:07:01.000,0:07:03.000 As pessoas caminhavam obcecadas. 0:07:03.000,0:07:05.000 Não podiam parar de falar 0:07:05.000,0:07:08.000 sobre as coisas que fizeram em 1950, 0:07:08.000,0:07:11.000 tudo o que estavam planejando para 1950, 0:07:11.000,0:07:16.000 todos os sonhos que queriam alcançar em 1950. 0:07:16.000,0:07:18.000 De fato, 1950 foi tão fascinante 0:07:18.000,0:07:20.000 que nos anos seguintes, 0:07:20.000,0:07:23.000 as pessoas continuavam falando sobre as coisas incríveis que aconteceram, 0:07:23.000,0:07:25.000 em 51, 52, 53. 0:07:25.000,0:07:27.000 Finalmente em 1954, 0:07:27.000,0:07:29.000 alguém acordou e percebeu 0:07:29.000,0:07:33.000 que 1950 tinha ficado algo 'passé'. 0:07:33.000,0:07:35.000 (Risos) 0:07:35.000,0:07:37.000 E de repente, a bolha estourou. 0:07:37.000,0:07:39.000 (Risos) 0:07:39.000,0:07:41.000 A história de 1950 0:07:41.000,0:07:43.000 é a história de todo ano que temos registro, 0:07:43.000,0:07:46.000 com um toque a mais, porque agora temos estes gráficos. 0:07:46.000,0:07:49.000 E porque temos estes gráficos bacanas, podemos medir coisas. 0:07:49.000,0:07:51.000 Podemos dizer, "Quão rápido a bolha estourou?" 0:07:51.000,0:07:54.000 E acontece que podemos medir muito precisamente. 0:07:54.000,0:07:57.000 Equações foram derivadas, gráficos foram produzidos, 0:07:57.000,0:07:59.000 e o resultado líquido 0:07:59.000,0:08:02.000 é que descobrimos que a bolha estoura cada vez mais rápido 0:08:02.000,0:08:04.000 a cada ano que passa. 0:08:04.000,0:08:09.000 Perdemos interesse no passado cada vez mais rápido. 0:08:09.000,0:08:11.000 JM: Agora uma dica para a carreira. 0:08:11.000,0:08:13.000 Aqueles de vocês que procuram ser famosos, 0:08:13.000,0:08:15.000 podemos aprender com as 25 personalidades mais famosas, 0:08:15.000,0:08:17.000 políticos, autores, atores e demais. 0:08:17.000,0:08:20.000 Se você quer se tornar famoso cedo, deveria ser um ator, 0:08:20.000,0:08:22.000 porque sua fama começa ao final dos vinte anos -- 0:08:22.000,0:08:24.000 você ainda é jovem, é muito bom. 0:08:24.000,0:08:26.000 Agora se quiser esperar um pouco, deveria ser autor, 0:08:26.000,0:08:28.000 porque assim você alcançará grandes alturas, 0:08:28.000,0:08:30.000 como Mark Twain, por exemplo, extremamente famoso. 0:08:30.000,0:08:32.000 Mas se você quiser alcançar mesmo o topo, 0:08:32.000,0:08:34.000 deveria postergar o reconhecimento 0:08:34.000,0:08:36.000 e, claro, tornar-se um político. 0:08:36.000,0:08:38.000 Assim você se torna famoso no final dos seus 50, 0:08:38.000,0:08:40.000 e se torna muito, muito famoso depois. 0:08:40.000,0:08:43.000 Cientistas também tendem a ficar famosos quando são mais velhos. 0:08:43.000,0:08:45.000 Por exemplo, biólogos e físicos 0:08:45.000,0:08:47.000 tendem a ser tão famosos quanto atores. 0:08:47.000,0:08:50.000 Um erro que vocês devem evitar é serem matemáticos. 0:08:50.000,0:08:52.000 (Risos) 0:08:52.000,0:08:54.000 Se fizerem isso, 0:08:54.000,0:08:57.000 podem pensar, "Ótimo. Farei meu melhor trabalho quando estou com 20 anos." 0:08:57.000,0:08:59.000 Mas olha só, ninguém quer saber. 0:08:59.000,0:09:02.000 (Risos) 0:09:02.000,0:09:04.000 ELA: Existem notas mais sérias 0:09:04.000,0:09:06.000 entre os n-gramas. 0:09:06.000,0:09:08.000 Por exemplo, eis a trajetória de Marc Chagall, 0:09:08.000,0:09:10.000 artista nascido em 1887. 0:09:10.000,0:09:13.000 Parece a trajetória normal de uma pessoa famosa. 0:09:13.000,0:09:17.000 Ele fica mais e mais e mais famoso, 0:09:17.000,0:09:19.000 exceto se pesquisar em alemão. 0:09:19.000,0:09:21.000 Se pesquisar em alemão, verá algo totalmente bizarro, 0:09:21.000,0:09:23.000 algo que nunca se vê, 0:09:23.000,0:09:25.000 que é ele se tornar extremamente famoso 0:09:25.000,0:09:27.000 e de repente despenca, 0:09:27.000,0:09:30.000 chegando ao fundo do poço entre 1933 e 1945, 0:09:30.000,0:09:33.000 antes de retornar com tudo. 0:09:33.000,0:09:35.000 Naturalmente, o que vemos 0:09:35.000,0:09:38.000 é o fato de que Chagall era um artista judeu 0:09:38.000,0:09:40.000 na Alemanha nazista. 0:09:40.000,0:09:42.000 Estes sinais 0:09:42.000,0:09:44.000 são na verdade tão fortes 0:09:44.000,0:09:47.000 que não precisamos saber que alguém foi censurado. 0:09:47.000,0:09:49.000 Podemos ter uma ideia 0:09:49.000,0:09:51.000 usando até um básico processamento de sinais. 0:09:51.000,0:09:53.000 Eis um modo simples de fazer. 0:09:53.000,0:09:55.000 Uma expectativa razoável 0:09:55.000,0:09:57.000 é que a fama de alguém em um período de tempo 0:09:57.000,0:09:59.000 deveria ser mais ou menos a média de sua fama antes 0:09:59.000,0:10:01.000 e da fama depois. 0:10:01.000,0:10:03.000 É algo assim o que esperamos. 0:10:03.000,0:10:06.000 E comparamos isso com a fama que observamos. 0:10:06.000,0:10:08.000 E dividimos uma pela outra 0:10:08.000,0:10:10.000 para produzir algo que chamamos de índice de supressão. 0:10:10.000,0:10:13.000 Se o índice é muito, mas muito pequeno, 0:10:13.000,0:10:15.000 você pode muito bem estar sendo suprimido. 0:10:15.000,0:10:18.000 Se for muito grande, você pode estar se benificiando com a propaganda. 0:10:19.000,0:10:21.000 JM: Agora vocês podem até mesmo ver 0:10:21.000,0:10:24.000 a distribuição dos índices de supressão de populações inteiras. 0:10:24.000,0:10:26.000 Por exemplo, aqui -- 0:10:26.000,0:10:28.000 este índice é para 5.000 pessoas 0:10:28.000,0:10:30.000 escolhidas em livros ingleses onde não existe supressão conhecida -- 0:10:30.000,0:10:32.000 seria assim, basicamente centrada no 1. 0:10:32.000,0:10:34.000 O que se esperava é basicamente o que observamos. 0:10:34.000,0:10:36.000 Esta é a distribuição vista na Alemanha -- 0:10:36.000,0:10:38.000 bem diferente, é desviada para a esquerda. 0:10:38.000,0:10:41.000 As pessoas falaram menos que o dobro do costumeiro. 0:10:41.000,0:10:43.000 Mais importante, a distribuição é mais extensa. 0:10:43.000,0:10:46.000 Existem muitas pessoas que acabaram no lado esquerdo desta distribuição 0:10:46.000,0:10:49.000 que são faladas cerca de 10 vezes menos do que deveriam ter sido. 0:10:49.000,0:10:51.000 E também muitas pessoas bem à direita 0:10:51.000,0:10:53.000 que parecem ter se beneficiado da propaganda. 0:10:53.000,0:10:56.000 Esta imagem é a marca da censura no registro de livros. 0:10:56.000,0:10:58.000 ELA: Cultorômica 0:10:58.000,0:11:00.000 é como chamamos este método. 0:11:00.000,0:11:02.000 É como se fosse a genômica. 0:11:02.000,0:11:04.000 Só que a genômica é uma lente para que a biologia 0:11:04.000,0:11:07.000 veja através da janela de sequencias das bases no genoma humano. 0:11:07.000,0:11:09.000 Cultorômica é parecido. 0:11:09.000,0:11:12.000 É aplicação da análise da enorme quantidade de informações coletadas 0:11:12.000,0:11:14.000 para estudo da cultura humana. 0:11:14.000,0:11:16.000 Ao invés de olharmos através das lentes de um genoma, 0:11:16.000,0:11:19.000 olhamos através de pedaços digitalizados do registro histórico. 0:11:19.000,0:11:21.000 O bom da culturômica 0:11:21.000,0:11:23.000 é que todos podem participar. 0:11:23.000,0:11:25.000 Por que todos podem? 0:11:25.000,0:11:27.000 Todos podem porque três caras, 0:11:27.000,0:11:30.000 Jon Orwant, Matt Gray e Will Brockman no Google, 0:11:30.000,0:11:32.000 viram o protótipo do Visualizador de N-Gramas, 0:11:32.000,0:11:34.000 e disseram, "Isso é bem divertido. 0:11:34.000,0:11:37.000 Temos que disponibilizar para as pessoas." 0:11:37.000,0:11:39.000 Em exatamente 2 semanas - antes de nosso artigo ser publicado -- 0:11:39.000,0:11:42.000 eles programaram uma versão do Visualizador para o público em geral. 0:11:42.000,0:11:45.000 Assim vocês podem digitar qualquer palavra ou frase que se interessarem 0:11:45.000,0:11:47.000 e imediatamente podem ver o n-grama -- 0:11:47.000,0:11:49.000 e também listar exemplos de todos os muitos livros 0:11:49.000,0:11:51.000 nos quais o seu n-grama aparece. 0:11:51.000,0:11:53.000 JM: Já foi utilizado mais de um milhão de vezes no primeiro dia, 0:11:53.000,0:11:55.000 e é de fato a melhor de todas as procuras. 0:11:55.000,0:11:58.000 As pessoas querem ser as melhores, se destacar. 0:11:58.000,0:12:01.000 Mas acontece que no século 18, as pessoas não ligavam pra isso. 0:12:01.000,0:12:04.000 Elas não queriam ser as 'the best', elas queriam ser 'beft'. 0:12:04.000,0:12:07.000 O que aconteceu, é claro, foi apenas um equívoco. 0:12:07.000,0:12:09.000 Não é um esforço pela mediocridade, 0:12:09.000,0:12:12.000 apenas o 'S' costumava ser escrito diferente, quase um 'F'. 0:12:12.000,0:12:15.000 Lógico, o Google não pegou isso na ocasião, 0:12:15.000,0:12:18.000 assim nós relatamos no artigo científico que escrevemos. 0:12:18.000,0:12:20.000 Mas se tornou um lembrete 0:12:20.000,0:12:22.000 de que, mesmo sendo muito divertido, 0:12:22.000,0:12:24.000 quando se interpreta estes gráficos, temos que ter cuidado, 0:12:24.000,0:12:27.000 e vocês tem que adotar os métodos básicos da ciência. 0:12:27.000,0:12:30.000 ELA: Pessoas o tem utilizado para todo tipo de propósito. 0:12:30.000,0:12:37.000 (Risos) 0:12:37.000,0:12:39.000 Na verdade, não precisaremos falar, 0:12:39.000,0:12:42.000 vamos apenas mostrar todos os slides e ficar em silêncio. 0:12:42.000,0:12:45.000 Esta pessoa estava interessada na história da frustração. 0:12:45.000,0:12:48.000 Existem vários tipos de frustração. 0:12:48.000,0:12:51.000 Se você esfolar o dedo do pé, É um "ai" com um 'A'. 0:12:51.000,0:12:53.000 Se a Terra é aniquilada pelos Vogons 0:12:53.000,0:12:55.000 pra dar lugar à um atalho interestelar, 0:12:55.000,0:12:57.000 é um "aaaaaaaai" com 8 'A's. 0:12:57.000,0:12:59.000 Esta pessoa estudou todos os "ais", 0:12:59.000,0:13:01.000 de 1 até 8 'A's. 0:13:01.000,0:13:03.000 E acontece 0:13:03.000,0:13:05.000 que os "ais" menos frequentes 0:13:05.000,0:13:08.000 são os que correspondem às coisas mais frustrantes -- 0:13:08.000,0:13:11.000 exceto, curiosamente, no começo dos anos 80. 0:13:11.000,0:13:13.000 Achamos que deve ter algo a ver com o Reagan. 0:13:13.000,0:13:15.000 (Risos) 0:13:15.000,0:13:18.000 JM: Existem muitos usos para estas informações, 0:13:18.000,0:13:21.000 mas o principal é que o registro histórico está sendo digitalizado. 0:13:21.000,0:13:23.000 Google começou a digitalizar 15 milhões de livros. 0:13:23.000,0:13:25.000 É 12% de todos os livros já publicados. 0:13:25.000,0:13:28.000 É um pedaço considerável da cultura humana. 0:13:28.000,0:13:31.000 Há muito mais na cultura: existem manuscritos, jornais, 0:13:31.000,0:13:33.000 coisas que não são texto, como arte e pinturas. 0:13:33.000,0:13:35.000 Acontece que estes estão em nossos computadores, 0:13:35.000,0:13:37.000 em computadores ao redor do mundo. 0:13:37.000,0:13:40.000 E quando isso acontece, vai transformar a maneira 0:13:40.000,0:13:42.000 de compreender nosso passado, o presente e a cultura humana. 0:13:42.000,0:13:44.000 Muito obrigado. 0:13:44.000,0:13:47.000 (Aplausos)