< Return to Video

Cosa abbiamo imparato da 5 milioni di libri

  • 0:00 - 0:02
    Erez Lieberman Aiden: Tutti sanno
  • 0:02 - 0:05
    che un'immagine vale mille parole.
  • 0:07 - 0:09
    ma noi di Harward
  • 0:09 - 0:12
    ci stavamo chiedendo se fosse davvero così.
  • 0:12 - 0:14
    (Risate)
  • 0:14 - 0:18
    Perciò abbiamo messo insieme un gruppo di esperti,
  • 0:18 - 0:20
    provenienti da Harvard, dall'MIT,
  • 0:20 - 0:23
    dall'American Heritage Dictionary, dall'Encyclopedia Britannica
  • 0:23 - 0:25
    e persino dal nostro gentile sponsor,
  • 0:25 - 0:28
    Google.
  • 0:28 - 0:30
    E ci abbiamo rimuginato sopra
  • 0:30 - 0:32
    per circa quattro anni.
  • 0:32 - 0:37
    E siamo giunti ad una conclusione sorprendente.
  • 0:37 - 0:40
    Signore e signori, un'immagine non vale mille parole.
  • 0:40 - 0:42
    In effetti abbiamo scoperto alcune immagini
  • 0:42 - 0:47
    che valgono 500 miliardi di parole.
  • 0:47 - 0:49
    Jean-Baptiste Michel: Come siamo giunti a questa conclusione?
  • 0:49 - 0:51
    Erez e io stavamo pensando ai diversi modi
  • 0:51 - 0:53
    di ottenere una grande rappresentazione visiva della cultura umana,
  • 0:53 - 0:56
    della sua storia e dei loro cambiamenti nel corso del tempo.
  • 0:56 - 0:58
    Col passare degli anni sono stati scritti tantissimi libri,
  • 0:58 - 1:00
    così abbiamo pensato:
  • 1:00 - 1:02
    da questi milioni di libri é leggerli tutti.>.
  • 1:02 - 1:05
    Se esiste una scala per misurare il grado di grandiosità delle cose,
  • 1:05 - 1:08
    leggere tutti quei libri si piazza molto, molto in alto.
  • 1:08 - 1:10
    Il problema è che c'è anche un asse X di cui tenere conto,
  • 1:10 - 1:12
    l'asse della praticità.
  • 1:12 - 1:14
    Sul quale si piazza molto, molto in basso
  • 1:14 - 1:17
    (Applauso)
  • 1:17 - 1:20
    Molte persone tendono ad usare un approccio alternativo,
  • 1:20 - 1:22
    che consiste nel prendere solo alcune fonti e leggerle molto attentamente.
  • 1:22 - 1:24
    Estremamente pratico, ma non altrettanto grandioso.
  • 1:24 - 1:27
    La cosa ideale da fare
  • 1:27 - 1:30
    é riuscire ad arrivare nella parte grandiosa ma al contempo pratica di questo grafico.
  • 1:30 - 1:33
    Si scopre che c'è un'azienda dall'altra parte del fiume chiamata Google,
  • 1:33 - 1:35
    che alcuni anni prima aveva avviato un progetto di digitalizzazione
  • 1:35 - 1:37
    che avrebbe potuto rendere quest'ultimo approccio possibile.
  • 1:37 - 1:39
    Per questo progetto hanno digitalizzato milioni di libri.
  • 1:39 - 1:42
    Ciò significa che una persona può utilizzare metodi computazionali
  • 1:42 - 1:44
    per leggere tutti questi libri solo cliccando su un pulsante.
  • 1:44 - 1:47
    -Questo- é sia molto pratico che assolutamente grandioso.
  • 1:48 - 1:50
    ELA: Lasciate che vi racconti qualcosa sulla provenienza dei libri.
  • 1:50 - 1:53
    Da tempo immemore sono esistiti gli autori.
  • 1:53 - 1:56
    Questi autori hanno sempre avuto l'ardente desiderio di scrivere libri,
  • 1:56 - 1:58
    Cosa che divenne considerevolmente più facile
  • 1:58 - 2:00
    con lo sviluppo della macchina tipografica alcuni secoli fa.
  • 2:00 - 2:03
    Da allora, gli autori sono riusciti
  • 2:03 - 2:05
    in 129 milioni distinte occasioni,
  • 2:05 - 2:07
    a pubblicare libri.
  • 2:07 - 2:09
    Ora, se quei libri non sono andati persi nel corso della storia,
  • 2:09 - 2:11
    allora si trovano da qualche parte in una qualche libreria,
  • 2:11 - 2:14
    e molti di quei libri sono stati reperiti dalle biblioteche
  • 2:14 - 2:16
    e digitalizzati da Google,
  • 2:16 - 2:18
    che ad oggi ha scansionato 15 milioni di libri.
  • 2:18 - 2:21
    Ora, quando Google digitalizza un libro, lo converte in un formato digitale molto pratico.
  • 2:21 - 2:23
    Ora oltre ad avere i dati abbiamo anche i metadati.
  • 2:23 - 2:26
    Abbiamo informazioni su cose come dove il libro fu pubblicato,
  • 2:26 - 2:28
    chi era l'autore, quando venne pubblicato.
  • 2:28 - 2:31
    E quel che facciamo è esaminare tutte quelle informazioni
  • 2:31 - 2:35
    ed escludere tutto all'infuori dei dati della miglior qualità.
  • 2:35 - 2:37
    Quello che resta
  • 2:37 - 2:40
    è una selezione di cinque milioni di libri,
  • 2:40 - 2:43
    500 miliardi di parole,
  • 2:43 - 2:45
    una riga di caratteri mille volte più lunga
  • 2:45 - 2:48
    del genoma umano --
  • 2:48 - 2:50
    un testo che, se venisse trascritto,
  • 2:50 - 2:52
    coprirebbe la distanza tra qui e la luna, andata e ritorno
  • 2:52 - 2:54
    per 10 volte --
  • 2:54 - 2:58
    un autentico frammento del nostro genoma culturale.
  • 2:58 - 3:00
    Ovviamente ciò che abbiamo fatto
  • 3:00 - 3:03
    una volta messi di fronte ad una cosa così spaventosamente esagerata...
  • 3:03 - 3:05
    (Risate)
  • 3:05 - 3:08
    è stato ciò che qualunque ricercatore con un po' di amor proprio
  • 3:08 - 3:11
    avrebbe fatto.
  • 3:11 - 3:13
    Abbiamo preso una pagina di XKCD
  • 3:13 - 3:15
    e abbiamo detto: "Fatevi da parte.
  • 3:15 - 3:17
    Qui stiamo per fare la scienza."
  • 3:17 - 3:19
    (Risate)
  • 3:19 - 3:21
    JM: Ovviamente stavamo pensando:
  • 3:21 - 3:23
    limitiamoci a mettere questi dati a disposizione
  • 3:23 - 3:25
    di chiunque e lasciamo loro a "fare la scienza".
  • 3:25 - 3:27
    Ora stiamo pensando: "Quali dati possiamo divulgare?"
  • 3:27 - 3:29
    Quello che vorremmo fare é prendere i libri
  • 3:29 - 3:31
    e divulgare il testo integrale di questi cinque milioni di tomi.
  • 3:31 - 3:33
    Google, e Jon Orwant in particolare,
  • 3:33 - 3:35
    ci rivelarono una piccola equazione che dovremmo imparare.
  • 3:35 - 3:38
    Se hai cinque milioni di libri hai anche cinque milioni di autori,
  • 3:38 - 3:41
    e cinque milioni di querelanti fanno un'enorme causa legale.
  • 3:41 - 3:43
    Perciò, anche se sarebbe stato davvero davvero grandioso,
  • 3:43 - 3:46
    di nuovo, sarebbe stato anche molto molto poco fattibile.
  • 3:46 - 3:48
    (Risate)
  • 3:48 - 3:50
    E così cedemmo di nuovo
  • 3:50 - 3:53
    e ripiegammo sull'approccio più fattibile e un po' meno grandioso.
  • 3:53 - 3:55
    Ci dicemmo:" Ok, invece di divulgare il testo integrale
  • 3:55 - 3:57
    divulgheremo le statistiche sui libri".
  • 3:57 - 3:59
    Prendete per esempio "Un barlume di felicità".
  • 3:59 - 4:01
    Sono quattro parole, noi lo chiamiamo un "quattro grammi".
  • 4:01 - 4:03
    Riveleremo quante volte uno specifico "quattro grammi"
  • 4:03 - 4:05
    è apparso nei libri nel 1801, 1802, 1803,
  • 4:05 - 4:07
    fino al 2008.
  • 4:07 - 4:09
    Questo ci dà una serie temporale
  • 4:09 - 4:11
    di quanto frequentemente questa particolare frase è stata usata nel tempo.
  • 4:11 - 4:14
    Lo facciamo con tutte le parole e frasi che appaiono in quei libri,
  • 4:14 - 4:17
    ottenendo così una grande tabella con due miliardi di righe
  • 4:17 - 4:19
    che ci raccontano il modo in cui la cultura è cambiata.
  • 4:19 - 4:21
    ELA: Questi due miliardi di righe
  • 4:21 - 4:23
    noi le chiamiamo due miliardi di n-grammi.
  • 4:23 - 4:25
    Cosa ci raccontano?
  • 4:25 - 4:27
    Gli n-grammi individuali misurano le tendenze culturali.
  • 4:27 - 4:29
    Lasciate che vi faccia un esempio.
  • 4:29 - 4:31
    Prendiamo il verbo irregolare "to thrive", prosperare
  • 4:31 - 4:33
    e immaginiamo che vi voglia dire che ieri ho prosperato.
  • 4:33 - 4:36
    Potrei usare questa forma regolare.
  • 4:36 - 4:39
    O, in alternativa, potrei usare questa forma irregolare.
  • 4:39 - 4:42
    Hanno lo stesso significato, quale dovrei usare?
  • 4:42 - 4:44
    Come scoprirlo?
  • 4:44 - 4:46
    All'inirca sei mesi fa
  • 4:46 - 4:48
    l'approccio migliore in casi come questo
  • 4:48 - 4:50
    era rivolgersi, ad esempio,
  • 4:50 - 4:52
    a questo psicologo dalla favolosa capigliatura
  • 4:52 - 4:54
    e chiedergli:
  • 4:54 - 4:57
    "Steve, tu sei un esperto di verbi irregolari.
  • 4:57 - 4:59
    Cosa dovrei fare secondo te?"
  • 4:59 - 5:01
    E lui avrebbe detto: "Be' la maggioranza delle persone usa thrived,
  • 5:01 - 5:04
    ma alcune persone usano throve".
  • 5:04 - 5:06
    E tu sapevi anche, più o meno,
  • 5:06 - 5:09
    che se fossi dovuto tornare indietro nel tempo di 200 anni
  • 5:09 - 5:12
    e domandare al seguente luminare dalla capigliatura ugualmente favolosa,
  • 5:12 - 5:15
    (Risate)
  • 5:15 - 5:17
    "Tom, secondo te cosa dovrei dire?"
  • 5:17 - 5:19
    Lui avrebbe detto: "Be', di questi tempi la maggioranza della gente usa throve,
  • 5:19 - 5:22
    ma alcuni usano thrived".
  • 5:22 - 5:24
    Quelli che intendo mostrarvi ora sono dati grezzi.
  • 5:24 - 5:28
    Due righe da questa tabella di due miliardi di voci.
  • 5:28 - 5:30
    Ciò che state vedendo è la frequenza anno dopo anno
  • 5:30 - 5:33
    nell'uso di "thrived" e "throve" nella storia.
  • 5:34 - 5:36
    Ora queste sono solo due righe
  • 5:36 - 5:39
    fra due miliardi.
  • 5:39 - 5:41
    Perciò l'intera collezione di dati
  • 5:41 - 5:44
    è un miliardo di volte più grandiosa di questa diapositiva.
  • 5:44 - 5:46
    (Risate)
  • 5:46 - 5:50
    (Applausi)
  • 5:50 - 5:52
    JM: Ora, ci sono molte altre immagini che valgono 500 miliardi di parole.
  • 5:52 - 5:54
    Questa, ad esempio.
  • 5:54 - 5:56
    Se semplicemente prendete la parola influenza,
  • 5:56 - 5:58
    vedrete i picchi nel momento in cui sapevate
  • 5:58 - 6:01
    che c'erano grandi epidemie di influenza che stavano mietendo vittime in tutto il mondo.
  • 6:01 - 6:04
    ELA: Se ancora non foste convinti,
  • 6:04 - 6:06
    il livello del mare si sta innalzando,
  • 6:06 - 6:09
    così come i livelli di anidride carbonica nell'atmosfera e la temperatura globale.
  • 6:09 - 6:12
    JM: Potreste inoltre voler dare un'occhiata a questo particolare n-grammo,
  • 6:12 - 6:15
    giusto per poter dire a Nietzsche che Dio non è morto,
  • 6:15 - 6:18
    anche se forse sarete d'accordo nel dire che avrebbe bisogno di un migliore agente.
  • 6:18 - 6:20
    (Risate)
  • 6:20 - 6:23
    ELA: Si può arrivare anche a concetti abbastanza astratti con questo metodo.
  • 6:23 - 6:25
    Ad esempio, lasciate che vi racconti la storia
  • 6:25 - 6:27
    dell'anno 1950.
  • 6:27 - 6:29
    Durante buona parte della storia,
  • 6:29 - 6:31
    a nessuno gliene fregava nulla del 1950.
  • 6:31 - 6:33
    Nel 1700, nel 1800, nel 1900,
  • 6:33 - 6:36
    a nessuno importava.
  • 6:37 - 6:39
    Negli anni Trenta e Quaranta
  • 6:39 - 6:41
    a nessuno importava
  • 6:41 - 6:43
    Improvvisamente, a metà degli anni Quaranta,
  • 6:43 - 6:45
    cominciò ad esserci del fermento.
  • 6:45 - 6:47
    La gente si rese conto che il 1950 stava per arrivare,
  • 6:47 - 6:49
    e poteva essere grandioso.
  • 6:49 - 6:52
    (Risate)
  • 6:52 - 6:55
    Ma nulla fece interessare la gente al 1950
  • 6:55 - 6:58
    come l'anno 1950.
  • 6:58 - 7:01
    (Risate)
  • 7:01 - 7:03
    La gente se ne andava in giro ossessionata.
  • 7:03 - 7:05
    Non riuscivano a smettere di parlare
  • 7:05 - 7:08
    di tutte le cose che fecero nel 1950,
  • 7:08 - 7:11
    di tutte le cose che stavano pianificando di fare nel 1950,
  • 7:11 - 7:16
    di tutti i sogni di cose che che volevano realizzare nel 1950.
  • 7:16 - 7:18
    A conti fatti il 1950 fu così affascinante
  • 7:18 - 7:20
    che negli anni a seguire
  • 7:20 - 7:23
    la gente continuò a parlare di tutte le cose stupefacenti che accaddero,
  • 7:23 - 7:25
    nel '51, nel '52 e nel '53.
  • 7:25 - 7:27
    Alla fine nel 1954
  • 7:27 - 7:29
    qualcuno si svegliò e si rese conto
  • 7:29 - 7:33
    che il 1950 era in qualche modo passato di moda.
  • 7:33 - 7:35
    (Risate)
  • 7:35 - 7:37
    E improvvisamente la bolla esplose.
  • 7:37 - 7:39
    (Risate)
  • 7:39 - 7:41
    E la storia del 1950
  • 7:41 - 7:43
    è la storia di ogni anno che abbiamo in archivio,
  • 7:43 - 7:46
    con una piccola variante, perché ora abbiamo questi bei diagrammi.
  • 7:46 - 7:49
    E dato che abbiamo questi bei diagrammi, possiamo misurare le cose.
  • 7:49 - 7:51
    Possiamo dire: "Quanto velocemente la bolla esplode?".
  • 7:51 - 7:54
    E si scopre che possiamo misurarla in maniera precisissima.
  • 7:54 - 7:57
    Equazioni vennero dedotte, grafici furono realizzati
  • 7:57 - 7:59
    ed il risultato definitivo
  • 7:59 - 8:02
    é che scopriamo che la bolla esplode sempre più velocemente
  • 8:02 - 8:04
    col passare di ciascun anno.
  • 8:04 - 8:09
    Stiamo perdendo interesse nel passato più rapidamente.
  • 8:09 - 8:11
    JM: Ora un piccolissimo consiglio sulla carriera.
  • 8:11 - 8:13
    Per quanti di voi che desiderano essere famosi,
  • 8:13 - 8:15
    possiamo imparare dalle 25 figure politiche più famose,
  • 8:15 - 8:17
    autori, attori e così via.
  • 8:17 - 8:20
    Ad esempio, se volete diventare famosi da giovani, dovreste fare gli attori
  • 8:20 - 8:22
    perché in quel caso la fama inizia a crescere con l'avvicinarsi dei trent'anni
  • 8:22 - 8:24
    siete ancora giovani, è davvero meraviglioso.
  • 8:24 - 8:26
    Se invece potete attendere un po', potreste diventare degli autori,
  • 8:26 - 8:28
    perché in quel caso raggiungerete vette altissime,
  • 8:28 - 8:30
    come Mark Twain, ad esempio. Estremamente famoso.
  • 8:30 - 8:32
    Ma se volete raggiungere il massimo
  • 8:32 - 8:34
    dovreste rinviare le gratificazioni
  • 8:34 - 8:36
    e, ovviamente, diventare un politico.
  • 8:36 - 8:38
    In questo caso diventereste famosi verso la fine dei cinquant'anni,
  • 8:38 - 8:40
    e molto molto famosi da andando avanti con l'età.
  • 8:40 - 8:43
    Anche gli scienziati tendono a diventare famosi in età molto più avanzata.
  • 8:43 - 8:45
    Biologi e fisici, ad esempio,
  • 8:45 - 8:47
    tendono ad essere quasi tanto famosi quanto gli attori.
  • 8:47 - 8:50
    Un errore che non dovreste commettere è quello di diventare dei matematici.
  • 8:50 - 8:52
    (Risate)
  • 8:52 - 8:54
    Se lo faceste
  • 8:54 - 8:57
    potreste pensare: "Oh, fantastico! Realizzerò il mio miglior lavoro tra i venti e i trent'anni."
  • 8:57 - 8:59
    Ma, indovinate un po'? A nessuno importerà nulla.
  • 8:59 - 9:02
    (Risate)
  • 9:02 - 9:04
    ELA: Ci sono annotazioni più serie
  • 9:04 - 9:06
    tra gli n-grammi.
  • 9:06 - 9:08
    Ad esempio, ecco la traiettoria di Marc Chagall,
  • 9:08 - 9:10
    un artista nato nel 1887.
  • 9:10 - 9:13
    Questa sembra essere la normale traiettoria di una persona famosa.
  • 9:13 - 9:17
    Diventa sempre più famoso,
  • 9:17 - 9:19
    tranne quando si considerano gli n-grammi tedeschi.
  • 9:19 - 9:21
    Se date uno sguardo in Germania, vedrete qualcosa di assolutamente bizzarro,
  • 9:21 - 9:23
    qualcosa che non si vede praticamente mai,
  • 9:23 - 9:25
    ovvero il fatto che diventa estremamente famoso
  • 9:25 - 9:27
    e poi tutto a un tratto la sua fama precipita
  • 9:27 - 9:30
    raggiungendo il punto più basso tra il 1933 e il 45,
  • 9:30 - 9:33
    prima di recuperare terreno in seguito.
  • 9:33 - 9:35
    Ovviamente quello che stiamo guardando
  • 9:35 - 9:38
    è il fatto che Marc Chagall era un artista ebreo
  • 9:38 - 9:40
    nella Germania nazista.
  • 9:40 - 9:42
    Ora questi segnali
  • 9:42 - 9:44
    sono davvero tanto evidenti
  • 9:44 - 9:47
    da non rendere necessario il sapere che qualcuno è stato censurato.
  • 9:47 - 9:49
    Possiamo arrivarci tranquillamente
  • 9:49 - 9:51
    usando teorie dei segnali davvero elementari.
  • 9:51 - 9:53
    Ecco un modo facile per farlo.
  • 9:53 - 9:55
    Ci si può ragionevolmente aspettare
  • 9:55 - 9:57
    che la fama di una persona in un dato periodo di tempo
  • 9:57 - 9:59
    sia approssimativamente la media della sua precedente fama
  • 9:59 - 10:01
    e di quella successiva.
  • 10:01 - 10:03
    Questo è un po' quello che ci attendiamo.
  • 10:03 - 10:06
    Ora, confrontiamo questo con la fama che osserviamo.
  • 10:06 - 10:08
    E semplicemente dividiamo l'una per l'altra
  • 10:08 - 10:10
    per produrre qualcosa che noi chiamiamo indice di repressione.
  • 10:10 - 10:13
    Se l'indice di repressione di una persona è molto, molto, molto piccolo
  • 10:13 - 10:15
    quella persona potrebbe benissimo star venendo censurata.
  • 10:15 - 10:18
    Se è molto ampio, forse sta traendo beneficio dalla propaganda.
  • 10:19 - 10:21
    JM: Adesso potete dare un'occhiata
  • 10:21 - 10:24
    alla distribuzione degli indici di repressione sull'intera popolazione
  • 10:24 - 10:26
    Ad esempio, in questo caso:
  • 10:26 - 10:28
    questo indice di repressione è quello di 5.000 persone
  • 10:28 - 10:30
    estratte da libri inglesi in cui non risulta alcuna repressione.
  • 10:30 - 10:32
    La distribuzione sarebbe questa, fondamentalmente distribuito attorno all'1.
  • 10:32 - 10:34
    Ciò che si osserva è sostanzialmente identico alle aspettative.
  • 10:34 - 10:36
    Questa è la distribuzione come vista in Germania;
  • 10:36 - 10:38
    é molto diversa, spostata più a sinistra.
  • 10:38 - 10:41
    La gente ne parlava due volte meno di quanto avrebbe teoricamente dovuto.
  • 10:41 - 10:43
    Ma, cosa molto più importante, la distribuzione è molto più larga.
  • 10:43 - 10:46
    Ci sono molte persone che finiscono nella parte più a sinistra della distribuzione
  • 10:46 - 10:49
    di cui si parla circa 10 volte meno di quanto si sarebbe dovuto.
  • 10:49 - 10:51
    Ma al contempo molte persone sulla parte più a destra
  • 10:51 - 10:53
    che sembrano beneficiare della propaganda.
  • 10:53 - 10:56
    Questa immagine è il marchio della censura nella storia dell'editoria.
  • 10:56 - 10:58
    ELA: Culturomica;
  • 10:58 - 11:00
    è così che chiamiamo questo metodo.
  • 11:00 - 11:02
    E' un po' come la genomica.
  • 11:02 - 11:04
    Eccetto per il fatto che la genomica è uno spiraglio sulla biologia
  • 11:04 - 11:07
    attraverso la finestra della sequenza di basi nel genoma umano.
  • 11:07 - 11:09
    La culturomica è simile.
  • 11:09 - 11:12
    E' l'applicazione dell'analisi su larga scala di una raccolta di dati
  • 11:12 - 11:14
    allo studio della cultura umana.
  • 11:14 - 11:16
    Qui, invece che attraverso la lente di un genoma,
  • 11:16 - 11:19
    è attraverso la lente di frammenti digitalizzati di registrazioni di carattere storico.
  • 11:19 - 11:21
    La cosa esaltante della culturonomica
  • 11:21 - 11:23
    è che chiunque può praticarla.
  • 11:23 - 11:25
    Perché chiunque può praticarla?
  • 11:25 - 11:27
    Chiunque può perché queste tre persone,
  • 11:27 - 11:30
    Jon Orwant, Matt Gray e Will Brockman di Google
  • 11:30 - 11:32
    videro il prototipo dell'Ngram Viewer.
  • 11:32 - 11:34
    e dissero: "E' così divertente.
  • 11:34 - 11:37
    Dobbiamo renderlo disponibile al pubblico".
  • 11:37 - 11:39
    Quindi in due settimane giuste giuste, le due settimane precedenti alla pubblicazione del nostro saggio
  • 11:39 - 11:42
    programmarono una versione dell'Ngram Viewer per il vasto pubblico.
  • 11:42 - 11:45
    Così anche voi potete digitare una qualsiasi parola o frase alla quale siete interessati
  • 11:45 - 11:47
    e vedere il suo n-grammo immediatamente;
  • 11:47 - 11:49
    oltre a spulciare esempi di tutti i vari libri
  • 11:49 - 11:51
    in cui appare il vostro n-grammo .
  • 11:51 - 11:53
    JM: Questo programma venne utilizzato un milione di volte durante il primo giorno di rilascio,
  • 11:53 - 11:55
    e questa è la migliore di tutte le interrogazioni.
  • 11:55 - 11:58
    Tutti vogliono essere best-qualcosa: best seller, best player...
  • 11:58 - 12:01
    Ma si scopre che nel 18esimo secolo, alla gente non importava assolutamente nulla.
  • 12:01 - 12:04
    Non volevano affatto essere "best-qualcosa", volevano essere "beft-qualcosa".
  • 12:04 - 12:07
    Quello che è successo è, ovviamente, solamente un errore.
  • 12:07 - 12:09
    Non è che si sforzassero di essere mediocri.
  • 12:09 - 12:12
    Semplicemente un tempo si usava scrivere la S in maniera differente, un po' come la F.
  • 12:12 - 12:15
    Questa cosa Google al momento non la capì,
  • 12:15 - 12:18
    quindi lo riferimmo nell'articolo scientifico che abbiamo scritto.
  • 12:18 - 12:20
    Ma alla fine questo è solo un avvertimento
  • 12:20 - 12:22
    sul fatto che, pur essendo molto divertente,
  • 12:22 - 12:24
    interpretare questi grafici richiede molta cautela
  • 12:24 - 12:27
    e bisogna farlo seguendo le regole base della scienza.
  • 12:27 - 12:30
    ELA: Le persone hanno usato questo strumento in un sacco di modi spassosi.
  • 12:30 - 12:37
    (Risate)
  • 12:37 - 12:39
    In realtà, non avremo nemmeno bisogno di parlare,
  • 12:39 - 12:42
    ci limiteremo a mostrarvi tutte le diapositive restando in silenzio.
  • 12:42 - 12:45
    Questa persona era interessata alla storia della frustrazione.
  • 12:45 - 12:48
    Ci sono diversi tipi di frustrazione.
  • 12:48 - 12:51
    Se sbatti un dito del piede, è un "argh" con una A.
  • 12:51 - 12:53
    Se il pianeta Terra viene annientato dai Vogon
  • 12:53 - 12:55
    per fare spazio a un passaggio interstellare,
  • 12:55 - 12:57
    quello è un aaaaaaaargh" con otto A.
  • 12:57 - 12:59
    Questa persona studia tutti gli "argh"
  • 12:59 - 13:01
    composti da uno fino a otto A.
  • 13:01 - 13:03
    E si scopre
  • 13:03 - 13:05
    che meno frequenti "argh"
  • 13:05 - 13:08
    sono, ovviamente, quelli che corrispondono a cose che sono più frustranti;
  • 13:08 - 13:11
    tranne che, stranamente, all'inizio degli anni 80.
  • 13:11 - 13:13
    Noi pensiamo che possa avere qualcosa a che fare con Reagan.
  • 13:13 - 13:15
    (Risate)
  • 13:15 - 13:18
    JM: ci sono molti utilizzi per questi dati,
  • 13:18 - 13:21
    ma la cosa che più importa è che la registrazione storica stia venendo digitalizzata.
  • 13:21 - 13:23
    Google ha iniziato a digitalizzare 15 milioni di libri.
  • 13:23 - 13:25
    E' il 12% di tutti i libri che siano mai stati pubblicati.
  • 13:25 - 13:28
    E' una porzione enorme della cultura umana.
  • 13:28 - 13:31
    C'è molto di più nella cultura: ci sono i manoscritti, ci sono le riviste,
  • 13:31 - 13:33
    ci sono cose che non sono testo, come l'arte e la pittura.
  • 13:33 - 13:35
    Tutte cose che, casualmente, si trovano nei nostri computer,
  • 13:35 - 13:37
    nei computer di tutto il mondo;
  • 13:37 - 13:40
    E quando la digitalizzazione sarà completa, trasformerà il modo che abbiamo
  • 13:40 - 13:42
    di comprendere il nostro passato, il nostro presente e la cultura umana.
  • 13:42 - 13:44
    Grazie infinite a tutti.
  • 13:44 - 13:47
    (Applausi)
Title:
Cosa abbiamo imparato da 5 milioni di libri
Speaker:
Jean-Baptiste Michel + Erez Lieberman Aiden
Description:

Avete giocato con l'Ngram Viewer dei Google Labs? E' un'avvincente strumento che permette di cercare parole e idee in un database di 5 milioni di libri che attraversano diversi secoli. Erez Lieberman Aiden e Jean-Baptiste Michel ci mostrano some funziona, e alcune delle cose sorprendenti che si possono imparare da 500 miliardi di parole.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
13:48
Claudio Dinapoli added a translation

Italian subtitles

Revisions