0:00:00.000,0:00:01.400 Erez Lieberman Aiden: 0:00:01.400,0:00:06.120 Todos sabemos que uma imagem[br]vale mais que mil palavras 0:00:07.550,0:00:09.450 Mas nós em Harvard 0:00:09.450,0:00:12.200 questionámos se isso seria mesmo verdade. 0:00:12.340,0:00:14.000 (Risos) 0:00:14.330,0:00:17.100 Então, juntámos uma equipa de peritos, 0:00:17.100,0:00:19.770 que vieram de Harvard, do MIT, 0:00:19.770,0:00:23.180 do The American Heritage Dictionary,[br]da The Encyclopedia Britannica 0:00:23.180,0:00:27.240 e até dos nossos orgulhosos[br]patrocinadores, a Google. 0:00:27.240,0:00:28.640 (Risos) 0:00:28.940,0:00:30.920 Debruçámo-nos sobre esta questão 0:00:30.920,0:00:32.750 durante cerca de quatro anos. 0:00:32.750,0:00:36.660 E chegámos a uma conclusão surpreendente. 0:00:37.430,0:00:40.440 Meus senhores, uma imagem[br]não vale mais que mil palavras. 0:00:40.440,0:00:42.680 Na verdade, encontrámos imagens 0:00:42.680,0:00:46.740 que valem 500 mil milhões de palavras. 0:00:47.000,0:00:49.660 Jean-Baptiste Michel:[br]Como chegámos a esta conclusão? 0:00:49.660,0:00:51.850 O Erez e eu pensámos em como obter 0:00:51.850,0:00:54.950 um panorama geral da cultura humana[br]e da história humana: 0:00:54.950,0:00:56.690 as mudanças através dos tempos. 0:00:56.690,0:00:58.930 Ao longo dos anos,[br]escreveram-se muitos livros. 0:00:58.930,0:01:01.380 Pensámos que a melhor maneira[br]de aprender com eles 0:01:01.380,0:01:03.370 seria ler todos esses milhões de livros. 0:01:03.370,0:01:06.330 Se houvesse uma escala[br]de como isso seria fantástico, 0:01:06.330,0:01:08.880 isso seria classificado[br]a um nível muito elevado. 0:01:08.930,0:01:11.310 O problema é que há[br]um eixo X para isso, 0:01:11.310,0:01:12.860 que é o eixo da prática, 0:01:12.860,0:01:15.010 o que o colocaria num patamar muito baixo 0:01:15.010,0:01:17.000 (Aplausos) 0:01:17.750,0:01:20.570 As pessoas têm tendência a usar[br]uma abordagem alternativa, 0:01:20.570,0:01:23.010 que é pegar nalgumas fontes[br]e lê-las cuidadosamente. 0:01:23.010,0:01:25.350 É extremamente prático,[br]mas não muito fantástico. 0:01:25.350,0:01:27.500 O que realmente se pretende 0:01:27.520,0:01:30.500 é chegar à parte fantástica[br]mas prática deste espaço. 0:01:30.500,0:01:33.680 Acontece que havia uma empresa[br]do outro lado do rio chamada Google 0:01:33.680,0:01:36.140 que iniciara um projeto[br]de digitalização há uns anos 0:01:36.140,0:01:37.920 que talvez permitisse essa abordagem. 0:01:37.930,0:01:39.800 Tinham digitalizado milhões de livros. 0:01:39.800,0:01:42.490 Isso significava que se podiam[br]usar métodos informáticos 0:01:42.490,0:01:44.990 para ler todos os livros[br]com o clique de um botão. 0:01:44.990,0:01:47.790 Isto é muito prático[br]e extremamente fantástico. 0:01:48.420,0:01:50.600 ELA: Vou falar-vos de onde vêm os livros. 0:01:51.270,0:01:53.910 Desde tempos imemoriais[br]que existem autores. 0:01:53.910,0:01:56.750 Esses autores têm-se esforçado[br]por escrever livros. 0:01:56.750,0:01:58.550 Isso tornou-se muito mais fácil 0:01:58.550,0:02:00.850 com o desenvolvimento[br]da imprensa há uns séculos. 0:02:00.850,0:02:03.060 Desde então, os autores tiveram 0:02:03.080,0:02:06.450 129 milhões de ocasiões diferentes 0:02:06.450,0:02:08.250 para publicar livros, 0:02:08.250,0:02:10.350 Se esses livros[br]não se perderam na história 0:02:10.350,0:02:12.270 estão algures numa biblioteca, 0:02:12.290,0:02:15.140 e muitos desses livros[br]têm sido recuperados das bibliotecas 0:02:15.140,0:02:16.570 e digitalizados pela Google, 0:02:16.570,0:02:19.110 que já digitalizou[br]15 milhões de livros até agora. 0:02:19.120,0:02:22.080 Quando a Google digitaliza um livro,[br]põe-no num formato catita. 0:02:22.100,0:02:24.240 Agora, temos os dados[br]e temos ainda metadados. 0:02:24.240,0:02:26.590 Temos informação sobre onde foi publicado, 0:02:26.590,0:02:29.230 quem foi o autor,[br]quando foi publicado, etc. 0:02:29.230,0:02:32.140 Verificamos todos esses arquivos 0:02:32.140,0:02:35.480 e excluímos tudo o que não seja[br]da mais alta qualidade. 0:02:35.480,0:02:37.310 Aquilo que nos resta 0:02:37.310,0:02:40.600 é uma coleção de cinco milhões de livros, 0:02:40.600,0:02:43.570 500 mil milhões de palavras, 0:02:43.570,0:02:46.880 uma cadeia de caracteres[br]mil vezes mais longa 0:02:46.880,0:02:48.590 que o genoma humano, 0:02:48.590,0:02:50.590 um texto que,[br]se fosse escrito por extenso, 0:02:50.590,0:02:52.700 iria daqui até à Lua e voltava 0:02:52.700,0:02:54.520 mais de dez vezes, 0:02:54.520,0:02:57.750 um autêntico fragmento[br]do nosso genoma cultural. 0:02:58.850,0:03:00.540 Claro que aquilo que fizemos 0:03:00.540,0:03:03.150 perante tamanha hipérbole... 0:03:03.220,0:03:05.580 (Risos) 0:03:05.650,0:03:08.180 ... foi aquilo que teria feito 0:03:08.180,0:03:11.150 qualquer pesquisador que se preze. 0:03:11.150,0:03:13.840 Inspirámo-nos no XKDC, e dissemos: 0:03:14.070,0:03:17.250 "Afastem-se. Vamos tentar fazer ciência." 0:03:17.360,0:03:19.000 (Risos) 0:03:19.540,0:03:21.290 JM: Claro que estávamos a pensar 0:03:21.290,0:03:23.150 em publicar primeiro os dados 0:03:23.150,0:03:25.310 para que as pessoas[br]pudessem fazer ciência. 0:03:25.310,0:03:27.700 Mas depois pensámos:[br]""Que dados podemos publicar?" 0:03:27.700,0:03:29.450 Claro que queríamos pegar nos livros 0:03:29.450,0:03:31.850 e publicar o texto completo[br]de todos os livros. 0:03:31.850,0:03:33.920 Mas a Google,[br]e o Jon Orwant em particular, 0:03:33.920,0:03:35.850 ensinou-nos uma pequena equação. 0:03:35.850,0:03:38.000 Temos cinco milhões de autores, ou seja, 0:03:38.000,0:03:41.120 cinco milhões de processos judiciais,[br]uma coisa monstruosa. 0:03:41.320,0:03:43.540 Assim, embora isso fosse fantástico 0:03:43.540,0:03:46.370 mais uma vez, era impraticável. 0:03:46.540,0:03:48.460 (Risos) 0:03:48.530,0:03:50.750 Mais uma vez, tivemos de ceder 0:03:50.750,0:03:53.530 e seguimos a abordagem prática,[br]que era menos fantástica. 0:03:53.530,0:03:55.350 Em vez de publicarmos[br]o texto completo, 0:03:55.350,0:03:57.540 íamos publicar estatísticas[br]sobre os livros. 0:03:57.550,0:03:59.480 Por exemplo,[br]"Um brilho de felicidade". 0:03:59.480,0:04:01.990 São quatro palavras,[br]a que chamamos um quatro-grama. 0:04:01.990,0:04:04.620 Íamos dizer quantas vezes[br]um determinado quatro-grama 0:04:04.620,0:04:07.320 aparecia em livros em 1801,[br]1802, 1803... até 2008. 0:04:07.320,0:04:09.010 Isso dá-nos uma série temporal 0:04:09.010,0:04:11.340 de quantas vezes foi utilizada essa frase. 0:04:11.340,0:04:14.680 Fazemos isso para todas as palavras[br]e frases que surgem nesses livros. 0:04:14.680,0:04:17.460 Isso dá-nos uma enorme tabela[br]de dois mil milhões de linhas 0:04:17.460,0:04:19.680 que nos dizem como a cultura[br]tem vindo a mudar. 0:04:19.680,0:04:22.170 ELA: Chamamos a esses[br]dois mil milhões de linhas, 0:04:22.170,0:04:23.540 dois mil milhões de n-gramas. 0:04:23.550,0:04:24.950 O que é que eles nos dizem? 0:04:24.950,0:04:27.370 Os n-gramas individuais[br]medem tendências culturais. 0:04:27.370,0:04:29.000 Vou dar-vos um exemplo. 0:04:29.000,0:04:31.000 Vamos supor que estou a prosperar, 0:04:31.000,0:04:33.260 e que amanhã quero contar[br]como me saí bem. 0:04:33.260,0:04:36.370 Posso dizer: "Ontem, eu vicejei." 0:04:36.370,0:04:39.670 Em alternativa, podia dizer:[br]"Ontem, eu prosperei. 0:04:39.670,0:04:42.420 "Então qual é que devo utilizar? 0:04:42.420,0:04:44.130 "Como é que hei de saber?" 0:04:44.130,0:04:46.140 Há cerca de seis meses, 0:04:46.140,0:04:48.320 o topo de gama neste campo 0:04:48.340,0:04:50.070 seria dirigir-se, por exemplo, 0:04:50.070,0:04:52.580 a um psicólogo com um cabelo fabuloso 0:04:52.580,0:04:54.000 e dizer: 0:04:54.650,0:04:57.830 "Steve, és perito em verbos. 0:04:57.830,0:04:59.460 "O que é que devo fazer?" 0:04:59.460,0:05:02.010 E ele responderia:[br]"Muitos dizem 'prosperei', 0:05:02.010,0:05:04.240 "mas alguns dizem 'vicejei'." 0:05:04.240,0:05:06.730 Também ficariam a saber, mais ou menos, 0:05:06.730,0:05:09.240 que, se recuassem 200 anos, 0:05:09.240,0:05:12.330 e perguntassem a este estadista[br]com um cabelo igualmente fabuloso: 0:05:12.440,0:05:14.750 (Risos) 0:05:15.000,0:05:17.000 "Tom, o que é que eu devo dizer?" 0:05:17.000,0:05:19.550 Ele diria: "No meu tempo,[br]a maior parte das pessoas vicejava, 0:05:19.550,0:05:22.000 "mas alguns prosperavam." 0:05:22.240,0:05:24.520 Agora vou mostrar-vos dados brutos. 0:05:25.040,0:05:28.320 Duas linhas desta tabela[br]com dois mil milhões de entradas. 0:05:28.320,0:05:31.030 Estão a ver a frequência, ano a ano, 0:05:31.030,0:05:33.680 de "prosperei" e "vicejei"[br]ao longo do tempo. 0:05:34.630,0:05:36.670 Estas são apenas duas 0:05:36.670,0:05:39.220 entre dois mil milhões de linhas. 0:05:39.220,0:05:41.390 O conjunto total dos dados 0:05:41.390,0:05:44.530 é mil milhões de vezes mais fantástico[br]do que este slide. 0:05:44.680,0:05:46.680 (Risos) 0:05:47.070,0:05:49.600 (Aplausos) 0:05:49.720,0:05:52.980 JM: Há muitas imagens que valem mais[br]que 500 mil milhões de palavras. 0:05:52.980,0:05:54.000 Por exemplo, esta. 0:05:54.000,0:05:55.600 Se pegarmos em "gripe", 0:05:55.600,0:05:58.000 verão picos na época em que se sabia 0:05:58.000,0:06:01.000 que grandes epidemias de gripe[br]matavam pessoas em todo o globo. 0:06:01.910,0:06:04.240 ELA: Se ainda não estão convencidos, 0:06:04.240,0:06:06.140 os níveis do mar estão a subir, 0:06:06.140,0:06:09.000 assim como o CO2 na atmosfera[br]e a temperatura da Terra. 0:06:09.330,0:06:12.390 JM: Talvez queiram prestar atenção[br]a este n-grama em particular, 0:06:12.390,0:06:15.000 e dizer a Nietzsche[br]que Deus não está morto, 0:06:15.000,0:06:18.120 embora concordem que Ele precisa[br]de um relações públicas melhor. 0:06:18.240,0:06:20.000 (Risos) 0:06:20.150,0:06:23.580 ELA: Podemos obter conceitos bastante[br]abstratos com este tipo de análise. 0:06:23.580,0:06:26.970 Por exemplo, vou contar-vos[br]a história do ano de 1950. 0:06:27.370,0:06:29.540 Durante grande parte da história, 0:06:29.540,0:06:31.370 ninguém ligou nenhuma a 1950. 0:06:31.370,0:06:33.690 Em 1700, em 1800, em 1900, 0:06:33.690,0:06:36.320 ninguém se preocupou. 0:06:37.910,0:06:41.010 Durante os anos 30 e 40,[br]ninguém se preocupou. 0:06:41.010,0:06:43.460 De repente, a meio dos anos 40, 0:06:43.460,0:06:45.240 começa a haver um burburinho. 0:06:45.240,0:06:47.610 As pessoas percebem[br]que 1950 vai acontecer, 0:06:47.610,0:06:49.810 e pode ser uma coisa em grande. 0:06:49.920,0:06:51.650 (Risos) 0:06:52.180,0:06:56.230 Mas nada fez com que as pessoas[br]se interessassem mais pelo ano de 1950 0:06:56.230,0:06:58.590 do que o ano de 1950. 0:06:58.710,0:07:00.780 (Risos) 0:07:01.100,0:07:03.580 As pessoas andavam obcecadas. 0:07:03.580,0:07:05.310 Não conseguiam deixar de falar 0:07:05.310,0:07:08.130 sobre tudo o que tinham feito em 1950, 0:07:08.130,0:07:11.500 tudo o que planeavam fazer em 1950, 0:07:11.500,0:07:15.670 todos os sonhos[br]que queriam alcançar em 1950. 0:07:16.100,0:07:18.370 Na verdade, 1950 foi tão fascinante 0:07:18.370,0:07:20.000 que, anos depois, 0:07:20.000,0:07:22.680 as pessoas continuavam a falar[br]das coisas maravilhosas 0:07:22.680,0:07:25.510 que tinham acontecido[br]em 1951, 1952, 1953. 0:07:25.510,0:07:27.760 Finalmente, em 1954, 0:07:27.760,0:07:30.080 houve alguém que acordou e percebeu 0:07:30.080,0:07:32.950 que 1950 se tinha tornado[br]numa coisa do passado. 0:07:33.220,0:07:35.000 (Risos) 0:07:35.200,0:07:37.540 E de repente, rebentou a bolha. 0:07:37.630,0:07:39.120 (Risos) 0:07:39.320,0:07:41.000 A história de 1950 0:07:41.000,0:07:43.270 é a história de cada ano [br]que temos registado, 0:07:43.270,0:07:46.630 com uma ligeira diferença, porque agora[br]temos estes gráficos catitas. 0:07:46.630,0:07:49.470 Como temos estes gráficos catitas,[br]podemos comparar coisas. 0:07:49.470,0:07:51.860 Podemos dizer:[br]"Quão depressa rebenta a bolha?" 0:07:51.860,0:07:54.430 Acontece que conseguimos medir isso[br]com muita precisão. 0:07:54.430,0:07:57.650 Derivaram-se equações,[br]produziram-se gráficos, 0:07:57.650,0:07:59.610 e como resultado final 0:07:59.610,0:08:02.640 descobrimos que a bolha rebenta[br]cada vez mais depressa, 0:08:02.650,0:08:04.650 de ano para ano. 0:08:04.650,0:08:08.560 Estamos a perder interesse no passado[br]cada vez mais rapidamente. 0:08:09.000,0:08:11.230 JM: Agora, um pouco[br]de orientação profissional. 0:08:11.230,0:08:13.000 Os que querem ser famosos, 0:08:13.000,0:08:15.320 podem aprender[br]com os 25 políticos mais famosos, 0:08:15.320,0:08:17.490 autores, atores, etc.. 0:08:17.490,0:08:20.180 Se quiserem ser famosos cedo,[br]devem tornar-se atores, 0:08:20.180,0:08:22.870 porque a fama começa a aumentar[br]no final dos vinte anos, 0:08:22.870,0:08:24.670 ainda são jovens, isso é ótimo. 0:08:24.670,0:08:26.810 Se podem esperar um pouco,[br]devem ser autores, 0:08:26.810,0:08:28.480 porque então podem chegar longe, 0:08:28.480,0:08:30.840 como Mark Twain, por exemplo,[br]extremamente famoso. 0:08:30.840,0:08:33.260 Mas se quiserem alcançar mesmo o topo, 0:08:33.260,0:08:35.090 não devem esperar resultados imediatos 0:08:35.090,0:08:36.900 e, claro, devem tornarem-se políticos. 0:08:36.900,0:08:39.070 Começarão a ser famosos[br]no final dos 50 anos 0:08:39.070,0:08:41.050 e tornar-se-ão[br]muito famosos depois disso. 0:08:41.050,0:08:44.070 Os cientistas também ficam famosos[br]quando são muito mais velhos. 0:08:44.070,0:08:47.640 Por exemplo, os biólogos e os físicos[br]podem ser tão famosos como os atores. 0:08:47.640,0:08:50.640 Um erro que não devem fazer[br]é tornarem-se matemáticos. 0:08:50.680,0:08:52.010 (Risos) 0:08:52.110,0:08:54.360 Se o fizerem, podem pensar: 0:08:54.380,0:08:57.100 "Ótimo. Vou fazer o meu melhor trabalho[br]aos 20 anos." 0:08:57.100,0:08:59.570 Mas, calculem, ninguém vai querer saber. 0:08:59.640,0:09:01.820 (Risos) 0:09:04.130,0:09:06.690 ELA: Há notas mais sóbrias[br]entre os n-gramas. 0:09:06.690,0:09:09.110 Por exemplo, esta é[br]a trajetória de Marc Chagall, 0:09:09.110,0:09:11.150 um artista nascido em 1887. 0:09:11.150,0:09:14.020 Parece-se com a trajetória normal[br]de uma pessoa famosa. 0:09:14.020,0:09:17.170 Torna-se cada vez mais famoso, 0:09:17.170,0:09:19.440 exceto se procurarem em alemão. 0:09:19.440,0:09:21.790 Se procurarem em alemão,[br]verão uma coisa bizarra, 0:09:21.790,0:09:24.140 uma coisa que habitualmente[br]não se observa. 0:09:24.140,0:09:26.190 Ele torna-se extremamente famoso 0:09:26.190,0:09:27.980 e, de repente, cai vertiginosamente, 0:09:27.980,0:09:30.830 atravessando o ponto mais baixo[br]entre 1933 e 1945, 0:09:30.830,0:09:33.440 antes de recuperar nos anos seguintes. 0:09:33.440,0:09:35.180 O que aqui observamos 0:09:35.180,0:09:38.130 é o facto de Marc Chagall[br]ser um artista judeu 0:09:38.130,0:09:40.160 na Alemanha nazi. 0:09:40.500,0:09:43.890 Na realidade, estes sinais são tão fortes 0:09:44.000,0:09:47.910 que não precisamos de saber[br]que alguém foi censurado. 0:09:47.910,0:09:49.690 Podemos chegar a essa conclusão 0:09:49.690,0:09:51.820 através do tratamento básico de sinais. 0:09:51.820,0:09:53.700 Esta é uma forma simples de o fazer. 0:09:53.700,0:09:55.260 Uma expetativa razoável 0:09:55.260,0:09:57.770 é a de que a fama de alguém[br]num dado período de tempo 0:09:57.770,0:10:00.140 deverá ser sensivelmente[br]a média da sua fama antes 0:10:00.140,0:10:01.600 e da sua fama posterior. 0:10:01.600,0:10:03.460 Isso é aquilo que se espera. 0:10:03.460,0:10:05.640 Comparamos isso com a fama[br]que observamos. 0:10:05.640,0:10:07.480 Depois é só dividir uma pela outra 0:10:07.480,0:10:10.250 para obter uma coisa a que chamamos[br]"índice de supressão". 0:10:10.250,0:10:13.000 Se o índice de supressão[br]for muito, muito baixo, 0:10:13.000,0:10:15.320 quase de certeza estão a ser censurados. 0:10:15.320,0:10:18.610 Se for muito alto, então talvez estejam[br]a beneficiar com a propaganda. 0:10:19.190,0:10:21.000 JM: Podemos mesmo ver 0:10:21.000,0:10:24.200 a distribuição de índices de supressão [br]em populações inteiras. 0:10:24.200,0:10:25.550 Por exemplo, aqui... 0:10:25.550,0:10:27.790 este índice de supressão[br]é de cinco mil pessoas 0:10:27.790,0:10:30.890 escolhidas em livros em inglês[br]onde não há supressão explícita... 0:10:30.890,0:10:32.760 seria como este, centrado numa pessoa. 0:10:32.760,0:10:34.910 O que se espera é aquilo que se observa. 0:10:34.910,0:10:37.010 Esta é a distribuição[br]observada na Alemanha 0:10:37.010,0:10:38.550 — desvia-se para a esquerda. 0:10:38.550,0:10:41.420 As pessoas falaram disso [br]duas vezes menos do que o esperado. 0:10:41.420,0:10:43.730 Mais importante,[br]a distribuição é mais alargada. 0:10:43.730,0:10:46.680 Há muitas pessoas que acabam[br]na ponta esquerda na distribuição 0:10:46.680,0:10:49.580 de quem se falou menos dez vezes[br]do que seria de esperar. 0:10:49.580,0:10:51.610 Mas também muita gente[br]na ponta direita 0:10:51.610,0:10:53.480 parece beneficiar com a propaganda. 0:10:53.480,0:10:56.710 Esta imagem é a marca distintiva[br]da censura no registo dos livros. 0:10:56.830,0:10:58.850 ELA: "Culturómica" 0:10:58.850,0:11:00.510 é o que chamamos a este método. 0:11:00.510,0:11:01.840 É como genómica. 0:11:01.840,0:11:04.350 Exceto que a genómica[br]é uma lente sobre a biologia 0:11:04.350,0:11:07.540 através da janela da sequência[br]de bases no genoma humano. 0:11:07.540,0:11:09.000 A culturómica é parecida. 0:11:09.000,0:11:12.500 É a aplicação da análise da recolha[br]de dados em larga escala 0:11:12.500,0:11:14.320 ao estudo da cultura humana. 0:11:14.320,0:11:16.750 Aqui, em vez de ser[br]através da lente de um genoma, 0:11:16.750,0:11:19.930 é através da lente de peças digitalizadas[br]do registo histórico. 0:11:19.930,0:11:21.620 O que é genial na culturómica 0:11:21.620,0:11:23.150 é que todos a podem fazer. 0:11:23.150,0:11:25.000 Porque é que todos a podem fazer? 0:11:25.000,0:11:27.060 Todos a podem fazer[br]porque três indivíduos, 0:11:27.060,0:11:30.050 Jon Orwant, Matt Gray[br]e Will Brockman na Google, 0:11:30.050,0:11:32.270 viram o protótipo do NGram Viewer, 0:11:32.270,0:11:34.430 e disseram: "Isto é muito divertido. 0:11:34.430,0:11:37.060 "Temos de tornar isto[br]acessível às pessoas." 0:11:37.060,0:11:39.510 Nas duas semanas antes[br]da publicação do nosso artigo 0:11:39.510,0:11:42.200 fizeram o código para a versão pública[br]do NGram Viewer. 0:11:42.200,0:11:45.490 Podemos escrever qualquer palavra[br]ou frase em que estamos interessados 0:11:45.490,0:11:47.290 e vemos imediatamente o seu n-grama, 0:11:47.290,0:11:49.910 assim como vemos exemplos[br]de todos os diversos livros 0:11:49.910,0:11:51.540 onde surge esse n-grama. 0:11:51.540,0:11:54.570 JBM: Isto foi usado mais de um milhão [br]de vezes no primeiro dia, 0:11:54.570,0:11:56.570 o que é a melhor de todas as pesquisas. 0:11:56.570,0:11:58.840 Todos querem o seu melhor,[br]mostrar o seu melhor. 0:11:58.840,0:12:01.340 Acontece que, no século XVIII,[br]isso não acontecia. 0:12:01.600,0:12:04.480 Não queriam ser o seu melhor,[br]queriam ser o seu "milhor". 0:12:04.480,0:12:07.200 Claro que o que aconteceu[br]foi apenas um erro. 0:12:07.200,0:12:09.420 Não que é que se esforçassem[br]pela mediocridade, 0:12:09.420,0:12:12.670 é só porque o "e" escrevia-se[br]de forma diferente, como um "i". 0:12:12.670,0:12:15.360 A Google não se apercebeu disso na altura, 0:12:15.360,0:12:18.280 e nós referimos isso no artigo científico[br]que escrevemos. 0:12:18.280,0:12:20.170 Acontece que isto é apenas um lembrete 0:12:20.170,0:12:22.180 de que, embora seja tudo muito divertido, 0:12:22.180,0:12:24.820 quando interpretamos gráficos,[br]temos de ser cuidadosos. 0:12:24.820,0:12:27.440 Há que adotar os procedimentos[br]científicos de base. 0:12:27.920,0:12:30.790 ELA: As pessoas têm usado isto[br]para todo o tipo de diversão. 0:12:30.960,0:12:34.050 (Risos) 0:12:37.530,0:12:39.590 Na verdade, nem é preciso falar, 0:12:39.590,0:12:42.190 vamos apenas mostrar-vos[br]todos os slides e ficar calados. 0:12:42.830,0:12:45.550 Esta pessoa estava interessada[br]na história da frustração. 0:12:45.550,0:12:48.000 Há vários tipos de frustração. 0:12:48.000,0:12:51.000 Se baterem com um dedo do pé,[br]isso é um "ai" com um A. 0:12:51.150,0:12:53.910 Se o planeta Terra for aniquilado[br]pelos Vogons 0:12:53.910,0:12:55.800 para criar um desvio interestelar, 0:12:55.800,0:12:58.210 isso é um "aaaaaaaai" com oito A's. 0:12:58.210,0:13:00.120 Esta pessoa estuda todos os "ais", 0:13:00.120,0:13:02.000 entre um a oito A's. 0:13:02.160,0:13:05.480 Acontece que os "ais" menos frequentes 0:13:05.480,0:13:08.240 são os que correspondem[br]a coisas mais frustrantes, 0:13:08.240,0:13:11.140 exceto, por incrível que pareça,[br]nos princípios dos anos 80. 0:13:11.470,0:13:13.630 Talvez tenha alguma coisa[br]a ver com Reagan. 0:13:13.630,0:13:15.250 (Risos) 0:13:15.550,0:13:17.870 JM: Há muitas utilizações[br]para estes dados, 0:13:17.870,0:13:21.340 mas o mais importante é que está[br]a ser digitalizado o registo histórico. 0:13:21.340,0:13:23.940 A Google começou a digitalizar[br]15 milhões de livros. 0:13:23.940,0:13:26.120 São 12% de todos os livros já publicados. 0:13:26.120,0:13:28.620 É um pedaço considerável[br]da cultura humana. 0:13:28.620,0:13:31.110 Há muito mais na cultura,[br]há manuscritos, há jornais, 0:13:31.110,0:13:33.470 há coisas que não são textos,[br]como arte e quadros. 0:13:33.470,0:13:35.560 Tudo isto está nos nossos computadores, 0:13:35.560,0:13:37.800 nos computadores de todo o mundo. 0:13:37.800,0:13:40.000 Quando isso acontece,[br]irá transformar a forma 0:13:40.000,0:13:43.090 como entendemos o passado,[br]o presente e a cultura humana. 0:13:43.090,0:13:44.380 Muito obrigado. 0:13:44.430,0:13:47.600 (Aplausos)