Cosa abbiamo imparato da 5 milioni di libri
-
0:00 - 0:02Erez Lieberman Aiden: Tutti sanno
-
0:02 - 0:05che un'immagine vale mille parole.
-
0:07 - 0:09ma noi di Harward
-
0:09 - 0:12ci stavamo chiedendo se fosse davvero così.
-
0:12 - 0:14(Risate)
-
0:14 - 0:18Perciò abbiamo messo insieme un gruppo di esperti,
-
0:18 - 0:20provenienti da Harvard, dall'MIT,
-
0:20 - 0:23dall'American Heritage Dictionary, dall'Encyclopedia Britannica
-
0:23 - 0:25e persino dal nostro gentile sponsor,
-
0:25 - 0:28Google.
-
0:28 - 0:30E ci abbiamo rimuginato sopra
-
0:30 - 0:32per circa quattro anni.
-
0:32 - 0:37E siamo giunti ad una conclusione sorprendente.
-
0:37 - 0:40Signore e signori, un'immagine non vale mille parole.
-
0:40 - 0:42In effetti abbiamo scoperto alcune immagini
-
0:42 - 0:47che valgono 500 miliardi di parole.
-
0:47 - 0:49Jean-Baptiste Michel: Come siamo giunti a questa conclusione?
-
0:49 - 0:51Erez e io stavamo pensando ai diversi modi
-
0:51 - 0:53di ottenere una grande rappresentazione visiva della cultura umana,
-
0:53 - 0:56della sua storia e dei loro cambiamenti nel corso del tempo.
-
0:56 - 0:58Col passare degli anni sono stati scritti tantissimi libri,
-
0:58 - 1:00così abbiamo pensato:
-
1:00 - 1:02da questi milioni di libri é leggerli tutti.>.
-
1:02 - 1:05Se esiste una scala per misurare il grado di grandiosità delle cose,
-
1:05 - 1:08leggere tutti quei libri si piazza molto, molto in alto.
-
1:08 - 1:10Il problema è che c'è anche un asse X di cui tenere conto,
-
1:10 - 1:12l'asse della praticità.
-
1:12 - 1:14Sul quale si piazza molto, molto in basso
-
1:14 - 1:17(Applauso)
-
1:17 - 1:20Molte persone tendono ad usare un approccio alternativo,
-
1:20 - 1:22che consiste nel prendere solo alcune fonti e leggerle molto attentamente.
-
1:22 - 1:24Estremamente pratico, ma non altrettanto grandioso.
-
1:24 - 1:27La cosa ideale da fare
-
1:27 - 1:30é riuscire ad arrivare nella parte grandiosa ma al contempo pratica di questo grafico.
-
1:30 - 1:33Si scopre che c'è un'azienda dall'altra parte del fiume chiamata Google,
-
1:33 - 1:35che alcuni anni prima aveva avviato un progetto di digitalizzazione
-
1:35 - 1:37che avrebbe potuto rendere quest'ultimo approccio possibile.
-
1:37 - 1:39Per questo progetto hanno digitalizzato milioni di libri.
-
1:39 - 1:42Ciò significa che una persona può utilizzare metodi computazionali
-
1:42 - 1:44per leggere tutti questi libri solo cliccando su un pulsante.
-
1:44 - 1:47-Questo- é sia molto pratico che assolutamente grandioso.
-
1:48 - 1:50ELA: Lasciate che vi racconti qualcosa sulla provenienza dei libri.
-
1:50 - 1:53Da tempo immemore sono esistiti gli autori.
-
1:53 - 1:56Questi autori hanno sempre avuto l'ardente desiderio di scrivere libri,
-
1:56 - 1:58Cosa che divenne considerevolmente più facile
-
1:58 - 2:00con lo sviluppo della macchina tipografica alcuni secoli fa.
-
2:00 - 2:03Da allora, gli autori sono riusciti
-
2:03 - 2:05in 129 milioni distinte occasioni,
-
2:05 - 2:07a pubblicare libri.
-
2:07 - 2:09Ora, se quei libri non sono andati persi nel corso della storia,
-
2:09 - 2:11allora si trovano da qualche parte in una qualche libreria,
-
2:11 - 2:14e molti di quei libri sono stati reperiti dalle biblioteche
-
2:14 - 2:16e digitalizzati da Google,
-
2:16 - 2:18che ad oggi ha scansionato 15 milioni di libri.
-
2:18 - 2:21Ora, quando Google digitalizza un libro, lo converte in un formato digitale molto pratico.
-
2:21 - 2:23Ora oltre ad avere i dati abbiamo anche i metadati.
-
2:23 - 2:26Abbiamo informazioni su cose come dove il libro fu pubblicato,
-
2:26 - 2:28chi era l'autore, quando venne pubblicato.
-
2:28 - 2:31E quel che facciamo è esaminare tutte quelle informazioni
-
2:31 - 2:35ed escludere tutto all'infuori dei dati della miglior qualità.
-
2:35 - 2:37Quello che resta
-
2:37 - 2:40è una selezione di cinque milioni di libri,
-
2:40 - 2:43500 miliardi di parole,
-
2:43 - 2:45una riga di caratteri mille volte più lunga
-
2:45 - 2:48del genoma umano --
-
2:48 - 2:50un testo che, se venisse trascritto,
-
2:50 - 2:52coprirebbe la distanza tra qui e la luna, andata e ritorno
-
2:52 - 2:54per 10 volte --
-
2:54 - 2:58un autentico frammento del nostro genoma culturale.
-
2:58 - 3:00Ovviamente ciò che abbiamo fatto
-
3:00 - 3:03una volta messi di fronte ad una cosa così spaventosamente esagerata...
-
3:03 - 3:05(Risate)
-
3:05 - 3:08è stato ciò che qualunque ricercatore con un po' di amor proprio
-
3:08 - 3:11avrebbe fatto.
-
3:11 - 3:13Abbiamo preso una pagina di XKCD
-
3:13 - 3:15e abbiamo detto: "Fatevi da parte.
-
3:15 - 3:17Qui stiamo per fare la scienza."
-
3:17 - 3:19(Risate)
-
3:19 - 3:21JM: Ovviamente stavamo pensando:
-
3:21 - 3:23limitiamoci a mettere questi dati a disposizione
-
3:23 - 3:25di chiunque e lasciamo loro a "fare la scienza".
-
3:25 - 3:27Ora stiamo pensando: "Quali dati possiamo divulgare?"
-
3:27 - 3:29Quello che vorremmo fare é prendere i libri
-
3:29 - 3:31e divulgare il testo integrale di questi cinque milioni di tomi.
-
3:31 - 3:33Google, e Jon Orwant in particolare,
-
3:33 - 3:35ci rivelarono una piccola equazione che dovremmo imparare.
-
3:35 - 3:38Se hai cinque milioni di libri hai anche cinque milioni di autori,
-
3:38 - 3:41e cinque milioni di querelanti fanno un'enorme causa legale.
-
3:41 - 3:43Perciò, anche se sarebbe stato davvero davvero grandioso,
-
3:43 - 3:46di nuovo, sarebbe stato anche molto molto poco fattibile.
-
3:46 - 3:48(Risate)
-
3:48 - 3:50E così cedemmo di nuovo
-
3:50 - 3:53e ripiegammo sull'approccio più fattibile e un po' meno grandioso.
-
3:53 - 3:55Ci dicemmo:" Ok, invece di divulgare il testo integrale
-
3:55 - 3:57divulgheremo le statistiche sui libri".
-
3:57 - 3:59Prendete per esempio "Un barlume di felicità".
-
3:59 - 4:01Sono quattro parole, noi lo chiamiamo un "quattro grammi".
-
4:01 - 4:03Riveleremo quante volte uno specifico "quattro grammi"
-
4:03 - 4:05è apparso nei libri nel 1801, 1802, 1803,
-
4:05 - 4:07fino al 2008.
-
4:07 - 4:09Questo ci dà una serie temporale
-
4:09 - 4:11di quanto frequentemente questa particolare frase è stata usata nel tempo.
-
4:11 - 4:14Lo facciamo con tutte le parole e frasi che appaiono in quei libri,
-
4:14 - 4:17ottenendo così una grande tabella con due miliardi di righe
-
4:17 - 4:19che ci raccontano il modo in cui la cultura è cambiata.
-
4:19 - 4:21ELA: Questi due miliardi di righe
-
4:21 - 4:23noi le chiamiamo due miliardi di n-grammi.
-
4:23 - 4:25Cosa ci raccontano?
-
4:25 - 4:27Gli n-grammi individuali misurano le tendenze culturali.
-
4:27 - 4:29Lasciate che vi faccia un esempio.
-
4:29 - 4:31Prendiamo il verbo irregolare "to thrive", prosperare
-
4:31 - 4:33e immaginiamo che vi voglia dire che ieri ho prosperato.
-
4:33 - 4:36Potrei usare questa forma regolare.
-
4:36 - 4:39O, in alternativa, potrei usare questa forma irregolare.
-
4:39 - 4:42Hanno lo stesso significato, quale dovrei usare?
-
4:42 - 4:44Come scoprirlo?
-
4:44 - 4:46All'inirca sei mesi fa
-
4:46 - 4:48l'approccio migliore in casi come questo
-
4:48 - 4:50era rivolgersi, ad esempio,
-
4:50 - 4:52a questo psicologo dalla favolosa capigliatura
-
4:52 - 4:54e chiedergli:
-
4:54 - 4:57"Steve, tu sei un esperto di verbi irregolari.
-
4:57 - 4:59Cosa dovrei fare secondo te?"
-
4:59 - 5:01E lui avrebbe detto: "Be' la maggioranza delle persone usa thrived,
-
5:01 - 5:04ma alcune persone usano throve".
-
5:04 - 5:06E tu sapevi anche, più o meno,
-
5:06 - 5:09che se fossi dovuto tornare indietro nel tempo di 200 anni
-
5:09 - 5:12e domandare al seguente luminare dalla capigliatura ugualmente favolosa,
-
5:12 - 5:15(Risate)
-
5:15 - 5:17"Tom, secondo te cosa dovrei dire?"
-
5:17 - 5:19Lui avrebbe detto: "Be', di questi tempi la maggioranza della gente usa throve,
-
5:19 - 5:22ma alcuni usano thrived".
-
5:22 - 5:24Quelli che intendo mostrarvi ora sono dati grezzi.
-
5:24 - 5:28Due righe da questa tabella di due miliardi di voci.
-
5:28 - 5:30Ciò che state vedendo è la frequenza anno dopo anno
-
5:30 - 5:33nell'uso di "thrived" e "throve" nella storia.
-
5:34 - 5:36Ora queste sono solo due righe
-
5:36 - 5:39fra due miliardi.
-
5:39 - 5:41Perciò l'intera collezione di dati
-
5:41 - 5:44è un miliardo di volte più grandiosa di questa diapositiva.
-
5:44 - 5:46(Risate)
-
5:46 - 5:50(Applausi)
-
5:50 - 5:52JM: Ora, ci sono molte altre immagini che valgono 500 miliardi di parole.
-
5:52 - 5:54Questa, ad esempio.
-
5:54 - 5:56Se semplicemente prendete la parola influenza,
-
5:56 - 5:58vedrete i picchi nel momento in cui sapevate
-
5:58 - 6:01che c'erano grandi epidemie di influenza che stavano mietendo vittime in tutto il mondo.
-
6:01 - 6:04ELA: Se ancora non foste convinti,
-
6:04 - 6:06il livello del mare si sta innalzando,
-
6:06 - 6:09così come i livelli di anidride carbonica nell'atmosfera e la temperatura globale.
-
6:09 - 6:12JM: Potreste inoltre voler dare un'occhiata a questo particolare n-grammo,
-
6:12 - 6:15giusto per poter dire a Nietzsche che Dio non è morto,
-
6:15 - 6:18anche se forse sarete d'accordo nel dire che avrebbe bisogno di un migliore agente.
-
6:18 - 6:20(Risate)
-
6:20 - 6:23ELA: Si può arrivare anche a concetti abbastanza astratti con questo metodo.
-
6:23 - 6:25Ad esempio, lasciate che vi racconti la storia
-
6:25 - 6:27dell'anno 1950.
-
6:27 - 6:29Durante buona parte della storia,
-
6:29 - 6:31a nessuno gliene fregava nulla del 1950.
-
6:31 - 6:33Nel 1700, nel 1800, nel 1900,
-
6:33 - 6:36a nessuno importava.
-
6:37 - 6:39Negli anni Trenta e Quaranta
-
6:39 - 6:41a nessuno importava
-
6:41 - 6:43Improvvisamente, a metà degli anni Quaranta,
-
6:43 - 6:45cominciò ad esserci del fermento.
-
6:45 - 6:47La gente si rese conto che il 1950 stava per arrivare,
-
6:47 - 6:49e poteva essere grandioso.
-
6:49 - 6:52(Risate)
-
6:52 - 6:55Ma nulla fece interessare la gente al 1950
-
6:55 - 6:58come l'anno 1950.
-
6:58 - 7:01(Risate)
-
7:01 - 7:03La gente se ne andava in giro ossessionata.
-
7:03 - 7:05Non riuscivano a smettere di parlare
-
7:05 - 7:08di tutte le cose che fecero nel 1950,
-
7:08 - 7:11di tutte le cose che stavano pianificando di fare nel 1950,
-
7:11 - 7:16di tutti i sogni di cose che che volevano realizzare nel 1950.
-
7:16 - 7:18A conti fatti il 1950 fu così affascinante
-
7:18 - 7:20che negli anni a seguire
-
7:20 - 7:23la gente continuò a parlare di tutte le cose stupefacenti che accaddero,
-
7:23 - 7:25nel '51, nel '52 e nel '53.
-
7:25 - 7:27Alla fine nel 1954
-
7:27 - 7:29qualcuno si svegliò e si rese conto
-
7:29 - 7:33che il 1950 era in qualche modo passato di moda.
-
7:33 - 7:35(Risate)
-
7:35 - 7:37E improvvisamente la bolla esplose.
-
7:37 - 7:39(Risate)
-
7:39 - 7:41E la storia del 1950
-
7:41 - 7:43è la storia di ogni anno che abbiamo in archivio,
-
7:43 - 7:46con una piccola variante, perché ora abbiamo questi bei diagrammi.
-
7:46 - 7:49E dato che abbiamo questi bei diagrammi, possiamo misurare le cose.
-
7:49 - 7:51Possiamo dire: "Quanto velocemente la bolla esplode?".
-
7:51 - 7:54E si scopre che possiamo misurarla in maniera precisissima.
-
7:54 - 7:57Equazioni vennero dedotte, grafici furono realizzati
-
7:57 - 7:59ed il risultato definitivo
-
7:59 - 8:02é che scopriamo che la bolla esplode sempre più velocemente
-
8:02 - 8:04col passare di ciascun anno.
-
8:04 - 8:09Stiamo perdendo interesse nel passato più rapidamente.
-
8:09 - 8:11JM: Ora un piccolissimo consiglio sulla carriera.
-
8:11 - 8:13Per quanti di voi che desiderano essere famosi,
-
8:13 - 8:15possiamo imparare dalle 25 figure politiche più famose,
-
8:15 - 8:17autori, attori e così via.
-
8:17 - 8:20Ad esempio, se volete diventare famosi da giovani, dovreste fare gli attori
-
8:20 - 8:22perché in quel caso la fama inizia a crescere con l'avvicinarsi dei trent'anni
-
8:22 - 8:24siete ancora giovani, è davvero meraviglioso.
-
8:24 - 8:26Se invece potete attendere un po', potreste diventare degli autori,
-
8:26 - 8:28perché in quel caso raggiungerete vette altissime,
-
8:28 - 8:30come Mark Twain, ad esempio. Estremamente famoso.
-
8:30 - 8:32Ma se volete raggiungere il massimo
-
8:32 - 8:34dovreste rinviare le gratificazioni
-
8:34 - 8:36e, ovviamente, diventare un politico.
-
8:36 - 8:38In questo caso diventereste famosi verso la fine dei cinquant'anni,
-
8:38 - 8:40e molto molto famosi da andando avanti con l'età.
-
8:40 - 8:43Anche gli scienziati tendono a diventare famosi in età molto più avanzata.
-
8:43 - 8:45Biologi e fisici, ad esempio,
-
8:45 - 8:47tendono ad essere quasi tanto famosi quanto gli attori.
-
8:47 - 8:50Un errore che non dovreste commettere è quello di diventare dei matematici.
-
8:50 - 8:52(Risate)
-
8:52 - 8:54Se lo faceste
-
8:54 - 8:57potreste pensare: "Oh, fantastico! Realizzerò il mio miglior lavoro tra i venti e i trent'anni."
-
8:57 - 8:59Ma, indovinate un po'? A nessuno importerà nulla.
-
8:59 - 9:02(Risate)
-
9:02 - 9:04ELA: Ci sono annotazioni più serie
-
9:04 - 9:06tra gli n-grammi.
-
9:06 - 9:08Ad esempio, ecco la traiettoria di Marc Chagall,
-
9:08 - 9:10un artista nato nel 1887.
-
9:10 - 9:13Questa sembra essere la normale traiettoria di una persona famosa.
-
9:13 - 9:17Diventa sempre più famoso,
-
9:17 - 9:19tranne quando si considerano gli n-grammi tedeschi.
-
9:19 - 9:21Se date uno sguardo in Germania, vedrete qualcosa di assolutamente bizzarro,
-
9:21 - 9:23qualcosa che non si vede praticamente mai,
-
9:23 - 9:25ovvero il fatto che diventa estremamente famoso
-
9:25 - 9:27e poi tutto a un tratto la sua fama precipita
-
9:27 - 9:30raggiungendo il punto più basso tra il 1933 e il 45,
-
9:30 - 9:33prima di recuperare terreno in seguito.
-
9:33 - 9:35Ovviamente quello che stiamo guardando
-
9:35 - 9:38è il fatto che Marc Chagall era un artista ebreo
-
9:38 - 9:40nella Germania nazista.
-
9:40 - 9:42Ora questi segnali
-
9:42 - 9:44sono davvero tanto evidenti
-
9:44 - 9:47da non rendere necessario il sapere che qualcuno è stato censurato.
-
9:47 - 9:49Possiamo arrivarci tranquillamente
-
9:49 - 9:51usando teorie dei segnali davvero elementari.
-
9:51 - 9:53Ecco un modo facile per farlo.
-
9:53 - 9:55Ci si può ragionevolmente aspettare
-
9:55 - 9:57che la fama di una persona in un dato periodo di tempo
-
9:57 - 9:59sia approssimativamente la media della sua precedente fama
-
9:59 - 10:01e di quella successiva.
-
10:01 - 10:03Questo è un po' quello che ci attendiamo.
-
10:03 - 10:06Ora, confrontiamo questo con la fama che osserviamo.
-
10:06 - 10:08E semplicemente dividiamo l'una per l'altra
-
10:08 - 10:10per produrre qualcosa che noi chiamiamo indice di repressione.
-
10:10 - 10:13Se l'indice di repressione di una persona è molto, molto, molto piccolo
-
10:13 - 10:15quella persona potrebbe benissimo star venendo censurata.
-
10:15 - 10:18Se è molto ampio, forse sta traendo beneficio dalla propaganda.
-
10:19 - 10:21JM: Adesso potete dare un'occhiata
-
10:21 - 10:24alla distribuzione degli indici di repressione sull'intera popolazione
-
10:24 - 10:26Ad esempio, in questo caso:
-
10:26 - 10:28questo indice di repressione è quello di 5.000 persone
-
10:28 - 10:30estratte da libri inglesi in cui non risulta alcuna repressione.
-
10:30 - 10:32La distribuzione sarebbe questa, fondamentalmente distribuito attorno all'1.
-
10:32 - 10:34Ciò che si osserva è sostanzialmente identico alle aspettative.
-
10:34 - 10:36Questa è la distribuzione come vista in Germania;
-
10:36 - 10:38é molto diversa, spostata più a sinistra.
-
10:38 - 10:41La gente ne parlava due volte meno di quanto avrebbe teoricamente dovuto.
-
10:41 - 10:43Ma, cosa molto più importante, la distribuzione è molto più larga.
-
10:43 - 10:46Ci sono molte persone che finiscono nella parte più a sinistra della distribuzione
-
10:46 - 10:49di cui si parla circa 10 volte meno di quanto si sarebbe dovuto.
-
10:49 - 10:51Ma al contempo molte persone sulla parte più a destra
-
10:51 - 10:53che sembrano beneficiare della propaganda.
-
10:53 - 10:56Questa immagine è il marchio della censura nella storia dell'editoria.
-
10:56 - 10:58ELA: Culturomica;
-
10:58 - 11:00è così che chiamiamo questo metodo.
-
11:00 - 11:02E' un po' come la genomica.
-
11:02 - 11:04Eccetto per il fatto che la genomica è uno spiraglio sulla biologia
-
11:04 - 11:07attraverso la finestra della sequenza di basi nel genoma umano.
-
11:07 - 11:09La culturomica è simile.
-
11:09 - 11:12E' l'applicazione dell'analisi su larga scala di una raccolta di dati
-
11:12 - 11:14allo studio della cultura umana.
-
11:14 - 11:16Qui, invece che attraverso la lente di un genoma,
-
11:16 - 11:19è attraverso la lente di frammenti digitalizzati di registrazioni di carattere storico.
-
11:19 - 11:21La cosa esaltante della culturonomica
-
11:21 - 11:23è che chiunque può praticarla.
-
11:23 - 11:25Perché chiunque può praticarla?
-
11:25 - 11:27Chiunque può perché queste tre persone,
-
11:27 - 11:30Jon Orwant, Matt Gray e Will Brockman di Google
-
11:30 - 11:32videro il prototipo dell'Ngram Viewer.
-
11:32 - 11:34e dissero: "E' così divertente.
-
11:34 - 11:37Dobbiamo renderlo disponibile al pubblico".
-
11:37 - 11:39Quindi in due settimane giuste giuste, le due settimane precedenti alla pubblicazione del nostro saggio
-
11:39 - 11:42programmarono una versione dell'Ngram Viewer per il vasto pubblico.
-
11:42 - 11:45Così anche voi potete digitare una qualsiasi parola o frase alla quale siete interessati
-
11:45 - 11:47e vedere il suo n-grammo immediatamente;
-
11:47 - 11:49oltre a spulciare esempi di tutti i vari libri
-
11:49 - 11:51in cui appare il vostro n-grammo .
-
11:51 - 11:53JM: Questo programma venne utilizzato un milione di volte durante il primo giorno di rilascio,
-
11:53 - 11:55e questa è la migliore di tutte le interrogazioni.
-
11:55 - 11:58Tutti vogliono essere best-qualcosa: best seller, best player...
-
11:58 - 12:01Ma si scopre che nel 18esimo secolo, alla gente non importava assolutamente nulla.
-
12:01 - 12:04Non volevano affatto essere "best-qualcosa", volevano essere "beft-qualcosa".
-
12:04 - 12:07Quello che è successo è, ovviamente, solamente un errore.
-
12:07 - 12:09Non è che si sforzassero di essere mediocri.
-
12:09 - 12:12Semplicemente un tempo si usava scrivere la S in maniera differente, un po' come la F.
-
12:12 - 12:15Questa cosa Google al momento non la capì,
-
12:15 - 12:18quindi lo riferimmo nell'articolo scientifico che abbiamo scritto.
-
12:18 - 12:20Ma alla fine questo è solo un avvertimento
-
12:20 - 12:22sul fatto che, pur essendo molto divertente,
-
12:22 - 12:24interpretare questi grafici richiede molta cautela
-
12:24 - 12:27e bisogna farlo seguendo le regole base della scienza.
-
12:27 - 12:30ELA: Le persone hanno usato questo strumento in un sacco di modi spassosi.
-
12:30 - 12:37(Risate)
-
12:37 - 12:39In realtà, non avremo nemmeno bisogno di parlare,
-
12:39 - 12:42ci limiteremo a mostrarvi tutte le diapositive restando in silenzio.
-
12:42 - 12:45Questa persona era interessata alla storia della frustrazione.
-
12:45 - 12:48Ci sono diversi tipi di frustrazione.
-
12:48 - 12:51Se sbatti un dito del piede, è un "argh" con una A.
-
12:51 - 12:53Se il pianeta Terra viene annientato dai Vogon
-
12:53 - 12:55per fare spazio a un passaggio interstellare,
-
12:55 - 12:57quello è un aaaaaaaargh" con otto A.
-
12:57 - 12:59Questa persona studia tutti gli "argh"
-
12:59 - 13:01composti da uno fino a otto A.
-
13:01 - 13:03E si scopre
-
13:03 - 13:05che meno frequenti "argh"
-
13:05 - 13:08sono, ovviamente, quelli che corrispondono a cose che sono più frustranti;
-
13:08 - 13:11tranne che, stranamente, all'inizio degli anni 80.
-
13:11 - 13:13Noi pensiamo che possa avere qualcosa a che fare con Reagan.
-
13:13 - 13:15(Risate)
-
13:15 - 13:18JM: ci sono molti utilizzi per questi dati,
-
13:18 - 13:21ma la cosa che più importa è che la registrazione storica stia venendo digitalizzata.
-
13:21 - 13:23Google ha iniziato a digitalizzare 15 milioni di libri.
-
13:23 - 13:25E' il 12% di tutti i libri che siano mai stati pubblicati.
-
13:25 - 13:28E' una porzione enorme della cultura umana.
-
13:28 - 13:31C'è molto di più nella cultura: ci sono i manoscritti, ci sono le riviste,
-
13:31 - 13:33ci sono cose che non sono testo, come l'arte e la pittura.
-
13:33 - 13:35Tutte cose che, casualmente, si trovano nei nostri computer,
-
13:35 - 13:37nei computer di tutto il mondo;
-
13:37 - 13:40E quando la digitalizzazione sarà completa, trasformerà il modo che abbiamo
-
13:40 - 13:42di comprendere il nostro passato, il nostro presente e la cultura umana.
-
13:42 - 13:44Grazie infinite a tutti.
-
13:44 - 13:47(Applausi)
- Title:
- Cosa abbiamo imparato da 5 milioni di libri
- Speaker:
- Jean-Baptiste Michel + Erez Lieberman Aiden
- Description:
-
Avete giocato con l'Ngram Viewer dei Google Labs? E' un'avvincente strumento che permette di cercare parole e idee in un database di 5 milioni di libri che attraversano diversi secoli. Erez Lieberman Aiden e Jean-Baptiste Michel ci mostrano some funziona, e alcune delle cose sorprendenti che si possono imparare da 500 miliardi di parole.
- Video Language:
- English
- Team:
closed TED
- Project:
- TEDTalks
- Duration:
- 13:48