0:00:00.000,0:00:02.000 Erez Lieberman Aiden: Tutti sanno 0:00:02.000,0:00:05.000 che un'immagine vale mille parole. 0:00:07.000,0:00:09.000 ma noi di Harward 0:00:09.000,0:00:12.000 ci stavamo chiedendo se fosse davvero così. 0:00:12.000,0:00:14.000 (Risate) 0:00:14.000,0:00:18.000 Perciò abbiamo messo insieme un gruppo di esperti, 0:00:18.000,0:00:20.000 provenienti da Harvard, dall'MIT, 0:00:20.000,0:00:23.000 dall'American Heritage Dictionary, dall'Encyclopedia Britannica 0:00:23.000,0:00:25.000 e persino dal nostro gentile sponsor, 0:00:25.000,0:00:28.000 Google. 0:00:28.000,0:00:30.000 E ci abbiamo rimuginato sopra 0:00:30.000,0:00:32.000 per circa quattro anni. 0:00:32.000,0:00:37.000 E siamo giunti ad una conclusione sorprendente. 0:00:37.000,0:00:40.000 Signore e signori, un'immagine non vale mille parole. 0:00:40.000,0:00:42.000 In effetti abbiamo scoperto alcune immagini 0:00:42.000,0:00:47.000 che valgono 500 miliardi di parole. 0:00:47.000,0:00:49.000 Jean-Baptiste Michel: Come siamo giunti a questa conclusione? 0:00:49.000,0:00:51.000 Erez e io stavamo pensando ai diversi modi 0:00:51.000,0:00:53.000 di ottenere una grande rappresentazione visiva della cultura umana, 0:00:53.000,0:00:56.000 della sua storia e dei loro cambiamenti nel corso del tempo. 0:00:56.000,0:00:58.000 Col passare degli anni sono stati scritti tantissimi libri, 0:00:58.000,0:01:00.000 così abbiamo pensato: 0:01:00.000,0:01:02.000 da questi milioni di libri é leggerli tutti.>. 0:01:02.000,0:01:05.000 Se esiste una scala per misurare il grado di grandiosità delle cose, 0:01:05.000,0:01:08.000 leggere tutti quei libri si piazza molto, molto in alto. 0:01:08.000,0:01:10.000 Il problema è che c'è anche un asse X di cui tenere conto, 0:01:10.000,0:01:12.000 l'asse della praticità. 0:01:12.000,0:01:14.000 Sul quale si piazza molto, molto in basso 0:01:14.000,0:01:17.000 (Applauso) 0:01:17.000,0:01:20.000 Molte persone tendono ad usare un approccio alternativo, 0:01:20.000,0:01:22.000 che consiste nel prendere solo alcune fonti e leggerle molto attentamente. 0:01:22.000,0:01:24.000 Estremamente pratico, ma non altrettanto grandioso. 0:01:24.000,0:01:27.000 La cosa ideale da fare 0:01:27.000,0:01:30.000 é riuscire ad arrivare nella parte grandiosa ma al contempo pratica di questo grafico. 0:01:30.000,0:01:33.000 Si scopre che c'è un'azienda dall'altra parte del fiume chiamata Google, 0:01:33.000,0:01:35.000 che alcuni anni prima aveva avviato un progetto di digitalizzazione 0:01:35.000,0:01:37.000 che avrebbe potuto rendere quest'ultimo approccio possibile. 0:01:37.000,0:01:39.000 Per questo progetto hanno digitalizzato milioni di libri. 0:01:39.000,0:01:42.000 Ciò significa che una persona può utilizzare metodi computazionali 0:01:42.000,0:01:44.000 per leggere tutti questi libri solo cliccando su un pulsante. 0:01:44.000,0:01:47.000 -Questo- é sia molto pratico che assolutamente grandioso. 0:01:48.000,0:01:50.000 ELA: Lasciate che vi racconti qualcosa sulla provenienza dei libri. 0:01:50.000,0:01:53.000 Da tempo immemore sono esistiti gli autori. 0:01:53.000,0:01:56.000 Questi autori hanno sempre avuto l'ardente desiderio di scrivere libri, 0:01:56.000,0:01:58.000 Cosa che divenne considerevolmente più facile 0:01:58.000,0:02:00.000 con lo sviluppo della macchina tipografica alcuni secoli fa. 0:02:00.000,0:02:03.000 Da allora, gli autori sono riusciti 0:02:03.000,0:02:05.000 in 129 milioni distinte occasioni, 0:02:05.000,0:02:07.000 a pubblicare libri. 0:02:07.000,0:02:09.000 Ora, se quei libri non sono andati persi nel corso della storia, 0:02:09.000,0:02:11.000 allora si trovano da qualche parte in una qualche libreria, 0:02:11.000,0:02:14.000 e molti di quei libri sono stati reperiti dalle biblioteche 0:02:14.000,0:02:16.000 e digitalizzati da Google, 0:02:16.000,0:02:18.000 che ad oggi ha scansionato 15 milioni di libri. 0:02:18.000,0:02:21.000 Ora, quando Google digitalizza un libro, lo converte in un formato digitale molto pratico. 0:02:21.000,0:02:23.000 Ora oltre ad avere i dati abbiamo anche i metadati. 0:02:23.000,0:02:26.000 Abbiamo informazioni su cose come dove il libro fu pubblicato, 0:02:26.000,0:02:28.000 chi era l'autore, quando venne pubblicato. 0:02:28.000,0:02:31.000 E quel che facciamo è esaminare tutte quelle informazioni 0:02:31.000,0:02:35.000 ed escludere tutto all'infuori dei dati della miglior qualità. 0:02:35.000,0:02:37.000 Quello che resta 0:02:37.000,0:02:40.000 è una selezione di cinque milioni di libri, 0:02:40.000,0:02:43.000 500 miliardi di parole, 0:02:43.000,0:02:45.000 una riga di caratteri mille volte più lunga 0:02:45.000,0:02:48.000 del genoma umano -- 0:02:48.000,0:02:50.000 un testo che, se venisse trascritto, 0:02:50.000,0:02:52.000 coprirebbe la distanza tra qui e la luna, andata e ritorno 0:02:52.000,0:02:54.000 per 10 volte -- 0:02:54.000,0:02:58.000 un autentico frammento del nostro genoma culturale. 0:02:58.000,0:03:00.000 Ovviamente ciò che abbiamo fatto 0:03:00.000,0:03:03.000 una volta messi di fronte ad una cosa così spaventosamente esagerata... 0:03:03.000,0:03:05.000 (Risate) 0:03:05.000,0:03:08.000 è stato ciò che qualunque ricercatore con un po' di amor proprio 0:03:08.000,0:03:11.000 avrebbe fatto. 0:03:11.000,0:03:13.000 Abbiamo preso una pagina di XKCD 0:03:13.000,0:03:15.000 e abbiamo detto: "Fatevi da parte. 0:03:15.000,0:03:17.000 Qui stiamo per fare la scienza." 0:03:17.000,0:03:19.000 (Risate) 0:03:19.000,0:03:21.000 JM: Ovviamente stavamo pensando: 0:03:21.000,0:03:23.000 limitiamoci a mettere questi dati a disposizione 0:03:23.000,0:03:25.000 di chiunque e lasciamo loro a "fare la scienza". 0:03:25.000,0:03:27.000 Ora stiamo pensando: "Quali dati possiamo divulgare?" 0:03:27.000,0:03:29.000 Quello che vorremmo fare é prendere i libri 0:03:29.000,0:03:31.000 e divulgare il testo integrale di questi cinque milioni di tomi. 0:03:31.000,0:03:33.000 Google, e Jon Orwant in particolare, 0:03:33.000,0:03:35.000 ci rivelarono una piccola equazione che dovremmo imparare. 0:03:35.000,0:03:38.000 Se hai cinque milioni di libri hai anche cinque milioni di autori, 0:03:38.000,0:03:41.000 e cinque milioni di querelanti fanno un'enorme causa legale. 0:03:41.000,0:03:43.000 Perciò, anche se sarebbe stato davvero davvero grandioso, 0:03:43.000,0:03:46.000 di nuovo, sarebbe stato anche molto molto poco fattibile. 0:03:46.000,0:03:48.000 (Risate) 0:03:48.000,0:03:50.000 E così cedemmo di nuovo 0:03:50.000,0:03:53.000 e ripiegammo sull'approccio più fattibile e un po' meno grandioso. 0:03:53.000,0:03:55.000 Ci dicemmo:" Ok, invece di divulgare il testo integrale 0:03:55.000,0:03:57.000 divulgheremo le statistiche sui libri". 0:03:57.000,0:03:59.000 Prendete per esempio "Un barlume di felicità". 0:03:59.000,0:04:01.000 Sono quattro parole, noi lo chiamiamo un "quattro grammi". 0:04:01.000,0:04:03.000 Riveleremo quante volte uno specifico "quattro grammi" 0:04:03.000,0:04:05.000 è apparso nei libri nel 1801, 1802, 1803, 0:04:05.000,0:04:07.000 fino al 2008. 0:04:07.000,0:04:09.000 Questo ci dà una serie temporale 0:04:09.000,0:04:11.000 di quanto frequentemente questa particolare frase è stata usata nel tempo. 0:04:11.000,0:04:14.000 Lo facciamo con tutte le parole e frasi che appaiono in quei libri, 0:04:14.000,0:04:17.000 ottenendo così una grande tabella con due miliardi di righe 0:04:17.000,0:04:19.000 che ci raccontano il modo in cui la cultura è cambiata. 0:04:19.000,0:04:21.000 ELA: Questi due miliardi di righe 0:04:21.000,0:04:23.000 noi le chiamiamo due miliardi di n-grammi. 0:04:23.000,0:04:25.000 Cosa ci raccontano? 0:04:25.000,0:04:27.000 Gli n-grammi individuali misurano le tendenze culturali. 0:04:27.000,0:04:29.000 Lasciate che vi faccia un esempio. 0:04:29.000,0:04:31.000 Prendiamo il verbo irregolare "to thrive", prosperare 0:04:31.000,0:04:33.000 e immaginiamo che vi voglia dire che ieri ho prosperato. 0:04:33.000,0:04:36.000 Potrei usare questa forma regolare. 0:04:36.000,0:04:39.000 O, in alternativa, potrei usare questa forma irregolare. 0:04:39.000,0:04:42.000 Hanno lo stesso significato, quale dovrei usare? 0:04:42.000,0:04:44.000 Come scoprirlo? 0:04:44.000,0:04:46.000 All'inirca sei mesi fa 0:04:46.000,0:04:48.000 l'approccio migliore in casi come questo 0:04:48.000,0:04:50.000 era rivolgersi, ad esempio, 0:04:50.000,0:04:52.000 a questo psicologo dalla favolosa capigliatura 0:04:52.000,0:04:54.000 e chiedergli: 0:04:54.000,0:04:57.000 "Steve, tu sei un esperto di verbi irregolari. 0:04:57.000,0:04:59.000 Cosa dovrei fare secondo te?" 0:04:59.000,0:05:01.000 E lui avrebbe detto: "Be' la maggioranza delle persone usa thrived, 0:05:01.000,0:05:04.000 ma alcune persone usano throve". 0:05:04.000,0:05:06.000 E tu sapevi anche, più o meno, 0:05:06.000,0:05:09.000 che se fossi dovuto tornare indietro nel tempo di 200 anni 0:05:09.000,0:05:12.000 e domandare al seguente luminare dalla capigliatura ugualmente favolosa, 0:05:12.000,0:05:15.000 (Risate) 0:05:15.000,0:05:17.000 "Tom, secondo te cosa dovrei dire?" 0:05:17.000,0:05:19.000 Lui avrebbe detto: "Be', di questi tempi la maggioranza della gente usa throve, 0:05:19.000,0:05:22.000 ma alcuni usano thrived". 0:05:22.000,0:05:24.000 Quelli che intendo mostrarvi ora sono dati grezzi. 0:05:24.000,0:05:28.000 Due righe da questa tabella di due miliardi di voci. 0:05:28.000,0:05:30.000 Ciò che state vedendo è la frequenza anno dopo anno 0:05:30.000,0:05:33.000 nell'uso di "thrived" e "throve" nella storia. 0:05:34.000,0:05:36.000 Ora queste sono solo due righe 0:05:36.000,0:05:39.000 fra due miliardi. 0:05:39.000,0:05:41.000 Perciò l'intera collezione di dati 0:05:41.000,0:05:44.000 è un miliardo di volte più grandiosa di questa diapositiva. 0:05:44.000,0:05:46.000 (Risate) 0:05:46.000,0:05:50.000 (Applausi) 0:05:50.000,0:05:52.000 JM: Ora, ci sono molte altre immagini che valgono 500 miliardi di parole. 0:05:52.000,0:05:54.000 Questa, ad esempio. 0:05:54.000,0:05:56.000 Se semplicemente prendete la parola influenza, 0:05:56.000,0:05:58.000 vedrete i picchi nel momento in cui sapevate 0:05:58.000,0:06:01.000 che c'erano grandi epidemie di influenza che stavano mietendo vittime in tutto il mondo. 0:06:01.000,0:06:04.000 ELA: Se ancora non foste convinti, 0:06:04.000,0:06:06.000 il livello del mare si sta innalzando, 0:06:06.000,0:06:09.000 così come i livelli di anidride carbonica nell'atmosfera e la temperatura globale. 0:06:09.000,0:06:12.000 JM: Potreste inoltre voler dare un'occhiata a questo particolare n-grammo, 0:06:12.000,0:06:15.000 giusto per poter dire a Nietzsche che Dio non è morto, 0:06:15.000,0:06:18.000 anche se forse sarete d'accordo nel dire che avrebbe bisogno di un migliore agente. 0:06:18.000,0:06:20.000 (Risate) 0:06:20.000,0:06:23.000 ELA: Si può arrivare anche a concetti abbastanza astratti con questo metodo. 0:06:23.000,0:06:25.000 Ad esempio, lasciate che vi racconti la storia 0:06:25.000,0:06:27.000 dell'anno 1950. 0:06:27.000,0:06:29.000 Durante buona parte della storia, 0:06:29.000,0:06:31.000 a nessuno gliene fregava nulla del 1950. 0:06:31.000,0:06:33.000 Nel 1700, nel 1800, nel 1900, 0:06:33.000,0:06:36.000 a nessuno importava. 0:06:37.000,0:06:39.000 Negli anni Trenta e Quaranta 0:06:39.000,0:06:41.000 a nessuno importava 0:06:41.000,0:06:43.000 Improvvisamente, a metà degli anni Quaranta, 0:06:43.000,0:06:45.000 cominciò ad esserci del fermento. 0:06:45.000,0:06:47.000 La gente si rese conto che il 1950 stava per arrivare, 0:06:47.000,0:06:49.000 e poteva essere grandioso. 0:06:49.000,0:06:52.000 (Risate) 0:06:52.000,0:06:55.000 Ma nulla fece interessare la gente al 1950 0:06:55.000,0:06:58.000 come l'anno 1950. 0:06:58.000,0:07:01.000 (Risate) 0:07:01.000,0:07:03.000 La gente se ne andava in giro ossessionata. 0:07:03.000,0:07:05.000 Non riuscivano a smettere di parlare 0:07:05.000,0:07:08.000 di tutte le cose che fecero nel 1950, 0:07:08.000,0:07:11.000 di tutte le cose che stavano pianificando di fare nel 1950, 0:07:11.000,0:07:16.000 di tutti i sogni di cose che che volevano realizzare nel 1950. 0:07:16.000,0:07:18.000 A conti fatti il 1950 fu così affascinante 0:07:18.000,0:07:20.000 che negli anni a seguire 0:07:20.000,0:07:23.000 la gente continuò a parlare di tutte le cose stupefacenti che accaddero, 0:07:23.000,0:07:25.000 nel '51, nel '52 e nel '53. 0:07:25.000,0:07:27.000 Alla fine nel 1954 0:07:27.000,0:07:29.000 qualcuno si svegliò e si rese conto 0:07:29.000,0:07:33.000 che il 1950 era in qualche modo passato di moda. 0:07:33.000,0:07:35.000 (Risate) 0:07:35.000,0:07:37.000 E improvvisamente la bolla esplose. 0:07:37.000,0:07:39.000 (Risate) 0:07:39.000,0:07:41.000 E la storia del 1950 0:07:41.000,0:07:43.000 è la storia di ogni anno che abbiamo in archivio, 0:07:43.000,0:07:46.000 con una piccola variante, perché ora abbiamo questi bei diagrammi. 0:07:46.000,0:07:49.000 E dato che abbiamo questi bei diagrammi, possiamo misurare le cose. 0:07:49.000,0:07:51.000 Possiamo dire: "Quanto velocemente la bolla esplode?". 0:07:51.000,0:07:54.000 E si scopre che possiamo misurarla in maniera precisissima. 0:07:54.000,0:07:57.000 Equazioni vennero dedotte, grafici furono realizzati 0:07:57.000,0:07:59.000 ed il risultato definitivo 0:07:59.000,0:08:02.000 é che scopriamo che la bolla esplode sempre più velocemente 0:08:02.000,0:08:04.000 col passare di ciascun anno. 0:08:04.000,0:08:09.000 Stiamo perdendo interesse nel passato più rapidamente. 0:08:09.000,0:08:11.000 JM: Ora un piccolissimo consiglio sulla carriera. 0:08:11.000,0:08:13.000 Per quanti di voi che desiderano essere famosi, 0:08:13.000,0:08:15.000 possiamo imparare dalle 25 figure politiche più famose, 0:08:15.000,0:08:17.000 autori, attori e così via. 0:08:17.000,0:08:20.000 Ad esempio, se volete diventare famosi da giovani, dovreste fare gli attori 0:08:20.000,0:08:22.000 perché in quel caso la fama inizia a crescere con l'avvicinarsi dei trent'anni 0:08:22.000,0:08:24.000 siete ancora giovani, è davvero meraviglioso. 0:08:24.000,0:08:26.000 Se invece potete attendere un po', potreste diventare degli autori, 0:08:26.000,0:08:28.000 perché in quel caso raggiungerete vette altissime, 0:08:28.000,0:08:30.000 come Mark Twain, ad esempio. Estremamente famoso. 0:08:30.000,0:08:32.000 Ma se volete raggiungere il massimo 0:08:32.000,0:08:34.000 dovreste rinviare le gratificazioni 0:08:34.000,0:08:36.000 e, ovviamente, diventare un politico. 0:08:36.000,0:08:38.000 In questo caso diventereste famosi verso la fine dei cinquant'anni, 0:08:38.000,0:08:40.000 e molto molto famosi da andando avanti con l'età. 0:08:40.000,0:08:43.000 Anche gli scienziati tendono a diventare famosi in età molto più avanzata. 0:08:43.000,0:08:45.000 Biologi e fisici, ad esempio, 0:08:45.000,0:08:47.000 tendono ad essere quasi tanto famosi quanto gli attori. 0:08:47.000,0:08:50.000 Un errore che non dovreste commettere è quello di diventare dei matematici. 0:08:50.000,0:08:52.000 (Risate) 0:08:52.000,0:08:54.000 Se lo faceste 0:08:54.000,0:08:57.000 potreste pensare: "Oh, fantastico! Realizzerò il mio miglior lavoro tra i venti e i trent'anni." 0:08:57.000,0:08:59.000 Ma, indovinate un po'? A nessuno importerà nulla. 0:08:59.000,0:09:02.000 (Risate) 0:09:02.000,0:09:04.000 ELA: Ci sono annotazioni più serie 0:09:04.000,0:09:06.000 tra gli n-grammi. 0:09:06.000,0:09:08.000 Ad esempio, ecco la traiettoria di Marc Chagall, 0:09:08.000,0:09:10.000 un artista nato nel 1887. 0:09:10.000,0:09:13.000 Questa sembra essere la normale traiettoria di una persona famosa. 0:09:13.000,0:09:17.000 Diventa sempre più famoso, 0:09:17.000,0:09:19.000 tranne quando si considerano gli n-grammi tedeschi. 0:09:19.000,0:09:21.000 Se date uno sguardo in Germania, vedrete qualcosa di assolutamente bizzarro, 0:09:21.000,0:09:23.000 qualcosa che non si vede praticamente mai, 0:09:23.000,0:09:25.000 ovvero il fatto che diventa estremamente famoso 0:09:25.000,0:09:27.000 e poi tutto a un tratto la sua fama precipita 0:09:27.000,0:09:30.000 raggiungendo il punto più basso tra il 1933 e il 45, 0:09:30.000,0:09:33.000 prima di recuperare terreno in seguito. 0:09:33.000,0:09:35.000 Ovviamente quello che stiamo guardando 0:09:35.000,0:09:38.000 è il fatto che Marc Chagall era un artista ebreo 0:09:38.000,0:09:40.000 nella Germania nazista. 0:09:40.000,0:09:42.000 Ora questi segnali 0:09:42.000,0:09:44.000 sono davvero tanto evidenti 0:09:44.000,0:09:47.000 da non rendere necessario il sapere che qualcuno è stato censurato. 0:09:47.000,0:09:49.000 Possiamo arrivarci tranquillamente 0:09:49.000,0:09:51.000 usando teorie dei segnali davvero elementari. 0:09:51.000,0:09:53.000 Ecco un modo facile per farlo. 0:09:53.000,0:09:55.000 Ci si può ragionevolmente aspettare 0:09:55.000,0:09:57.000 che la fama di una persona in un dato periodo di tempo 0:09:57.000,0:09:59.000 sia approssimativamente la media della sua precedente fama 0:09:59.000,0:10:01.000 e di quella successiva. 0:10:01.000,0:10:03.000 Questo è un po' quello che ci attendiamo. 0:10:03.000,0:10:06.000 Ora, confrontiamo questo con la fama che osserviamo. 0:10:06.000,0:10:08.000 E semplicemente dividiamo l'una per l'altra 0:10:08.000,0:10:10.000 per produrre qualcosa che noi chiamiamo indice di repressione. 0:10:10.000,0:10:13.000 Se l'indice di repressione di una persona è molto, molto, molto piccolo 0:10:13.000,0:10:15.000 quella persona potrebbe benissimo star venendo censurata. 0:10:15.000,0:10:18.000 Se è molto ampio, forse sta traendo beneficio dalla propaganda. 0:10:19.000,0:10:21.000 JM: Adesso potete dare un'occhiata 0:10:21.000,0:10:24.000 alla distribuzione degli indici di repressione sull'intera popolazione 0:10:24.000,0:10:26.000 Ad esempio, in questo caso: 0:10:26.000,0:10:28.000 questo indice di repressione è quello di 5.000 persone 0:10:28.000,0:10:30.000 estratte da libri inglesi in cui non risulta alcuna repressione. 0:10:30.000,0:10:32.000 La distribuzione sarebbe questa, fondamentalmente distribuito attorno all'1. 0:10:32.000,0:10:34.000 Ciò che si osserva è sostanzialmente identico alle aspettative. 0:10:34.000,0:10:36.000 Questa è la distribuzione come vista in Germania; 0:10:36.000,0:10:38.000 é molto diversa, spostata più a sinistra. 0:10:38.000,0:10:41.000 La gente ne parlava due volte meno di quanto avrebbe teoricamente dovuto. 0:10:41.000,0:10:43.000 Ma, cosa molto più importante, la distribuzione è molto più larga. 0:10:43.000,0:10:46.000 Ci sono molte persone che finiscono nella parte più a sinistra della distribuzione 0:10:46.000,0:10:49.000 di cui si parla circa 10 volte meno di quanto si sarebbe dovuto. 0:10:49.000,0:10:51.000 Ma al contempo molte persone sulla parte più a destra 0:10:51.000,0:10:53.000 che sembrano beneficiare della propaganda. 0:10:53.000,0:10:56.000 Questa immagine è il marchio della censura nella storia dell'editoria. 0:10:56.000,0:10:58.000 ELA: Culturomica; 0:10:58.000,0:11:00.000 è così che chiamiamo questo metodo. 0:11:00.000,0:11:02.000 E' un po' come la genomica. 0:11:02.000,0:11:04.000 Eccetto per il fatto che la genomica è uno spiraglio sulla biologia 0:11:04.000,0:11:07.000 attraverso la finestra della sequenza di basi nel genoma umano. 0:11:07.000,0:11:09.000 La culturomica è simile. 0:11:09.000,0:11:12.000 E' l'applicazione dell'analisi su larga scala di una raccolta di dati 0:11:12.000,0:11:14.000 allo studio della cultura umana. 0:11:14.000,0:11:16.000 Qui, invece che attraverso la lente di un genoma, 0:11:16.000,0:11:19.000 è attraverso la lente di frammenti digitalizzati di registrazioni di carattere storico. 0:11:19.000,0:11:21.000 La cosa esaltante della culturonomica 0:11:21.000,0:11:23.000 è che chiunque può praticarla. 0:11:23.000,0:11:25.000 Perché chiunque può praticarla? 0:11:25.000,0:11:27.000 Chiunque può perché queste tre persone, 0:11:27.000,0:11:30.000 Jon Orwant, Matt Gray e Will Brockman di Google 0:11:30.000,0:11:32.000 videro il prototipo dell'Ngram Viewer. 0:11:32.000,0:11:34.000 e dissero: "E' così divertente. 0:11:34.000,0:11:37.000 Dobbiamo renderlo disponibile al pubblico". 0:11:37.000,0:11:39.000 Quindi in due settimane giuste giuste, le due settimane precedenti alla pubblicazione del nostro saggio 0:11:39.000,0:11:42.000 programmarono una versione dell'Ngram Viewer per il vasto pubblico. 0:11:42.000,0:11:45.000 Così anche voi potete digitare una qualsiasi parola o frase alla quale siete interessati 0:11:45.000,0:11:47.000 e vedere il suo n-grammo immediatamente; 0:11:47.000,0:11:49.000 oltre a spulciare esempi di tutti i vari libri 0:11:49.000,0:11:51.000 in cui appare il vostro n-grammo . 0:11:51.000,0:11:53.000 JM: Questo programma venne utilizzato un milione di volte durante il primo giorno di rilascio, 0:11:53.000,0:11:55.000 e questa è la migliore di tutte le interrogazioni. 0:11:55.000,0:11:58.000 Tutti vogliono essere best-qualcosa: best seller, best player... 0:11:58.000,0:12:01.000 Ma si scopre che nel 18esimo secolo, alla gente non importava assolutamente nulla. 0:12:01.000,0:12:04.000 Non volevano affatto essere "best-qualcosa", volevano essere "beft-qualcosa". 0:12:04.000,0:12:07.000 Quello che è successo è, ovviamente, solamente un errore. 0:12:07.000,0:12:09.000 Non è che si sforzassero di essere mediocri. 0:12:09.000,0:12:12.000 Semplicemente un tempo si usava scrivere la S in maniera differente, un po' come la F. 0:12:12.000,0:12:15.000 Questa cosa Google al momento non la capì, 0:12:15.000,0:12:18.000 quindi lo riferimmo nell'articolo scientifico che abbiamo scritto. 0:12:18.000,0:12:20.000 Ma alla fine questo è solo un avvertimento 0:12:20.000,0:12:22.000 sul fatto che, pur essendo molto divertente, 0:12:22.000,0:12:24.000 interpretare questi grafici richiede molta cautela 0:12:24.000,0:12:27.000 e bisogna farlo seguendo le regole base della scienza. 0:12:27.000,0:12:30.000 ELA: Le persone hanno usato questo strumento in un sacco di modi spassosi. 0:12:30.000,0:12:37.000 (Risate) 0:12:37.000,0:12:39.000 In realtà, non avremo nemmeno bisogno di parlare, 0:12:39.000,0:12:42.000 ci limiteremo a mostrarvi tutte le diapositive restando in silenzio. 0:12:42.000,0:12:45.000 Questa persona era interessata alla storia della frustrazione. 0:12:45.000,0:12:48.000 Ci sono diversi tipi di frustrazione. 0:12:48.000,0:12:51.000 Se sbatti un dito del piede, è un "argh" con una A. 0:12:51.000,0:12:53.000 Se il pianeta Terra viene annientato dai Vogon 0:12:53.000,0:12:55.000 per fare spazio a un passaggio interstellare, 0:12:55.000,0:12:57.000 quello è un aaaaaaaargh" con otto A. 0:12:57.000,0:12:59.000 Questa persona studia tutti gli "argh" 0:12:59.000,0:13:01.000 composti da uno fino a otto A. 0:13:01.000,0:13:03.000 E si scopre 0:13:03.000,0:13:05.000 che meno frequenti "argh" 0:13:05.000,0:13:08.000 sono, ovviamente, quelli che corrispondono a cose che sono più frustranti; 0:13:08.000,0:13:11.000 tranne che, stranamente, all'inizio degli anni 80. 0:13:11.000,0:13:13.000 Noi pensiamo che possa avere qualcosa a che fare con Reagan. 0:13:13.000,0:13:15.000 (Risate) 0:13:15.000,0:13:18.000 JM: ci sono molti utilizzi per questi dati, 0:13:18.000,0:13:21.000 ma la cosa che più importa è che la registrazione storica stia venendo digitalizzata. 0:13:21.000,0:13:23.000 Google ha iniziato a digitalizzare 15 milioni di libri. 0:13:23.000,0:13:25.000 E' il 12% di tutti i libri che siano mai stati pubblicati. 0:13:25.000,0:13:28.000 E' una porzione enorme della cultura umana. 0:13:28.000,0:13:31.000 C'è molto di più nella cultura: ci sono i manoscritti, ci sono le riviste, 0:13:31.000,0:13:33.000 ci sono cose che non sono testo, come l'arte e la pittura. 0:13:33.000,0:13:35.000 Tutte cose che, casualmente, si trovano nei nostri computer, 0:13:35.000,0:13:37.000 nei computer di tutto il mondo; 0:13:37.000,0:13:40.000 E quando la digitalizzazione sarà completa, trasformerà il modo che abbiamo 0:13:40.000,0:13:42.000 di comprendere il nostro passato, il nostro presente e la cultura umana. 0:13:42.000,0:13:44.000 Grazie infinite a tutti. 0:13:44.000,0:13:47.000 (Applausi)