< Return to Video

Ce am învățat din 5 milioane de cărți

  • 0:00 - 0:02
    Erez Lieberman Aiden: Toată lumea știe
  • 0:02 - 0:05
    că o poză valorează cât o mie de cuvinte.
  • 0:07 - 0:09
    Dar noi cei de la Harvard,
  • 0:09 - 0:12
    ne gândeam cât de adevărat este.
  • 0:12 - 0:14
    (Râsete)
  • 0:14 - 0:18
    Așa că am adunat o echipă de experți,
  • 0:18 - 0:20
    de la Harvard, MIT (Institutul Tehnologic din Massachusetts),
  • 0:20 - 0:23
    American Heritage Dictionary, Encyclopedia Britannica
  • 0:23 - 0:25
    și chiar și pe mândrii noștri sponsori,
  • 0:25 - 0:28
    Google.
  • 0:28 - 0:30
    Și am dezbătut această problemă
  • 0:30 - 0:32
    timp de aproape patru ani.
  • 0:32 - 0:37
    Și am ajuns la o concluzie surprinzătoare.
  • 0:37 - 0:40
    Doamnelor și domnilor, o poză nu valorează cât o mie de cuvinte.
  • 0:40 - 0:42
    Chiar am găsit unele poze,
  • 0:42 - 0:47
    care valorează 500 de miliarde de cuvinte.
  • 0:47 - 0:49
    Jean-Baptiste Michel: Cum am ajuns la această concluzie?
  • 0:49 - 0:51
    Eu și Erez ne gândeam la modalități
  • 0:51 - 0:53
    de a cuprinde într-o mare poză cultura umană
  • 0:53 - 0:56
    și istoria umanității: schimbarea de-a lungul timpului.
  • 0:56 - 0:58
    În toți acești ani au fost scrise foarte multe cărți.
  • 0:58 - 1:00
    Așa că ne gândeam că cea mai bună metodă să învățăm din ele,
  • 1:00 - 1:02
    este să citim toate aceste milioane de cărți.
  • 1:02 - 1:05
    Bineînțeles că dacă ar exista o scală pentru cât de grozavă e ideea,
  • 1:05 - 1:08
    s-ar afla undeva foarte, foarte sus.
  • 1:08 - 1:10
    Problema este că există și o axă X pentru asta,
  • 1:10 - 1:12
    care este axa practică.
  • 1:12 - 1:14
    Aceasta este foarte, foarte jos.
  • 1:14 - 1:17
    (Aplauze)
  • 1:17 - 1:20
    Oamenii au tendința unei alte abordări,
  • 1:20 - 1:22
    care este să ia câteva surse și să le citească cu atenție.
  • 1:22 - 1:24
    Ceea ce este foarte practic, dar nu foarte grozav.
  • 1:24 - 1:27
    Ceea ce se vrea de fapt este,
  • 1:27 - 1:30
    să avem și partea grozavă și partea practică a acestui spațiu.
  • 1:30 - 1:33
    Așa că am aflat că mai există o companie numită Google
  • 1:33 - 1:35
    care începuse cu câțiva ani în urmă un proiect de digitizare,
  • 1:35 - 1:37
    care ar putea să atingă această abordare.
  • 1:37 - 1:39
    Ei au digitizat milioane de cărți.
  • 1:39 - 1:42
    Ceea ce înseamnă, că prin metode computaționale,
  • 1:42 - 1:44
    cu un singur click, pot fi citite toate cărțile.
  • 1:44 - 1:47
    Ceea ce este foarte practic si foarte grozav.
  • 1:48 - 1:50
    ELA: Permiteți-mi să vă povestesc un pic despre originea cărților.
  • 1:50 - 1:53
    Încă din cele mai vechi timpuri, au existat autori.
  • 1:53 - 1:56
    Acești autori s-au străduit să scrie cărți.
  • 1:56 - 1:58
    Proces ce a devenit deosebit de facil
  • 1:58 - 2:00
    o dată cu dezvoltarea presei de tipar în urmă cu câteva secole.
  • 2:00 - 2:03
    De atunci, autorii au câștigat
  • 2:03 - 2:05
    în 129 de milioane de ocazii diferite,
  • 2:05 - 2:07
    publicarea cărților.
  • 2:07 - 2:09
    Dacă acele cărți nu s-au pierdut în istorie,
  • 2:09 - 2:11
    atunci se află undeva într-o bibliotecă,
  • 2:11 - 2:14
    și multe dintre acele cărți au fost scoase din biblioteci
  • 2:14 - 2:16
    și digitizate de către Google,
  • 2:16 - 2:18
    care până în ziua de azi a scanat 15 milioane de cărți.
  • 2:18 - 2:21
    Când Google digitizează o carte, o și așează într-un format frumos.
  • 2:21 - 2:23
    Acum avem datele și în plus avem și metadatele.
  • 2:23 - 2:26
    Avem informații despre locul de publicare,
  • 2:26 - 2:28
    despre autor, când a fost publicată.
  • 2:28 - 2:31
    Ceea ce facem noi este să filtrăm aceste informații
  • 2:31 - 2:35
    și să ștergem tot ce nu este de cea mai mare calitate.
  • 2:35 - 2:37
    Așa că ce avem acum
  • 2:37 - 2:40
    este o colecție de 5 milioane de cărți,
  • 2:40 - 2:43
    500 miliarde de cuvinte,
  • 2:43 - 2:45
    un șir de caractere de o mie de ori mai lung
  • 2:45 - 2:48
    decât un genom uman --
  • 2:48 - 2:50
    un text care, dacă ar fi scris,
  • 2:50 - 2:52
    s-ar întinde de aici, la lună și înapoi
  • 2:52 - 2:54
    de 10 ori --
  • 2:54 - 2:58
    o adevărată bucată din genomul nostru cultural.
  • 2:58 - 3:00
    Bineînțeles că ceea ce am făcut
  • 3:00 - 3:03
    când ne-am lovit de o asemenea hiperbolă...
  • 3:03 - 3:05
    (Râsete)
  • 3:05 - 3:08
    a fost ceea ce ar face orice cercetător
  • 3:08 - 3:11
    care se respectă.
  • 3:11 - 3:13
    Am luat o pagină din XKCD,
  • 3:13 - 3:15
    și am spus, „Dați-vă înapoi.
  • 3:15 - 3:17
    O să încercăm prin știință.”
  • 3:17 - 3:19
    (Râsete)
  • 3:19 - 3:21
    JM: Acum noi ne gândeam,
  • 3:21 - 3:23
    să punem datele acolo
  • 3:23 - 3:25
    și să lăsăm oamenii să experimenteze.
  • 3:25 - 3:27
    Apoi ne-am întrebat, ce informații să lansăm?
  • 3:27 - 3:29
    Normal că vrei să iei cărțile
  • 3:29 - 3:31
    și să vezi tot textul acestor cinci milioane de cărți.
  • 3:31 - 3:33
    Google-ul și în special Jon Orwant,
  • 3:33 - 3:35
    ne-au arătat o mică ecuație pe care ar trebui să o învățăm.
  • 3:35 - 3:38
    Așadar, ai cinci milioane, adică cinci milioane de autori
  • 3:38 - 3:41
    și cinci milioane de reclamanți într-un imens proces.
  • 3:41 - 3:43
    Și deși ar fi foarte foarte grozav,
  • 3:43 - 3:46
    din nou, este foarte, foarte ineficace.
  • 3:46 - 3:48
    (Râsete)
  • 3:48 - 3:50
    Atunci din nou ne-am cam prăbușit,
  • 3:50 - 3:53
    și am făcut ceea ce părea mai practic, dar mai puțin grozav.
  • 3:53 - 3:55
    Ne-am hotărât ca, în loc să punem întregul text,
  • 3:55 - 3:57
    vom publica statistici despre cărți.
  • 3:57 - 3:59
    Spre exemplu „Un strop de fericire.”
  • 3:59 - 4:01
    Sunt patru cuvinte; este ceea ce numim tetragramă.
  • 4:01 - 4:03
    Vă vom spune de câte ori apare o anumită tetragramă
  • 4:03 - 4:05
    în cărți, în 1801, 1802, 1803,
  • 4:05 - 4:07
    și până în anul 2008.
  • 4:07 - 4:09
    Ceea ce ne va oferi o serie temporală
  • 4:09 - 4:11
    cu frecvența de utilizare a acestei secvențe de-a lungul timpului.
  • 4:11 - 4:14
    Facem asta pentru toate cuvintele și expresiile care apar în acele cărți,
  • 4:14 - 4:17
    și acest lucru ne oferă un mare tabel de două miliarde de linii
  • 4:17 - 4:19
    care ne explică cum s-a schimbat cultura.
  • 4:19 - 4:21
    ELA: Așadar acele două miliarde de linii,
  • 4:21 - 4:23
    noi le numim două miliarde de n-grame.
  • 4:23 - 4:25
    Ce ne spun ele?
  • 4:25 - 4:27
    N-gramele individuale măsoară trendul cultural.
  • 4:27 - 4:29
    Să vă dau un exemplu.
  • 4:29 - 4:31
    Să presupunem că eu acum mă aflu într-o stare de prosperitate,
  • 4:31 - 4:33
    iar mâine aș vrea să vă spun dvs. cum mă descurc.
  • 4:33 - 4:36
    Așa că aș putea spune, „Ieri, am înflorit.”
  • 4:36 - 4:39
    Sau o altă variantă, aș putea spune, „Ieri, am prosperat.”
  • 4:39 - 4:42
    Pe care ar trebui să o folosesc?
  • 4:42 - 4:44
    De unde știi?
  • 4:44 - 4:46
    De cam șase luni încoace,
  • 4:46 - 4:48
    cel mai bun lucru pe care-l puteai face în acest domeniu,
  • 4:48 - 4:50
    ar fi ca, spre exemplu,
  • 4:50 - 4:52
    să mergi la un psiholog specializat cu coafură fabuloasă,
  • 4:52 - 4:54
    și să-i spui,
  • 4:54 - 4:57
    „Steve, tu ești expert în verbe.
  • 4:57 - 4:59
    Ce ar trebui să fac?”
  • 4:59 - 5:01
    Iar el ți-ar spune, „Păi, cei mai mulți oameni spun „a prospera”,
  • 5:01 - 5:04
    dar unii spun „a înflori”.
  • 5:04 - 5:06
    Și mai mult sau mai puțin știai și că,
  • 5:06 - 5:09
    dacă te-ai întoarce în timp cu 200 de ani
  • 5:09 - 5:12
    și ai întreba un politician cu coafură la fel de fabuloasă,
  • 5:12 - 5:15
    (Râsete)
  • 5:15 - 5:17
    „Tom, cum ar trebui să spun?”
  • 5:17 - 5:19
    El ar spune, „Păi, în vremea mea, cei mai mulți spuneau „a înflori”,
  • 5:19 - 5:22
    dar unii spuneau „a prospera.”
  • 5:22 - 5:24
    Ce vă voi arăta în continuare sunt date brute.
  • 5:24 - 5:28
    Două rânduri din acest tabel cu două miliarde de intrări.
  • 5:28 - 5:30
    Aici vedeți frecvența înregistrată an de an
  • 5:30 - 5:33
    de-a lungul timpului pentru „a prospera” și „a înflori”.
  • 5:34 - 5:36
    Acestea sunt doar două
  • 5:36 - 5:39
    dintre cele două miliarde de rânduri.
  • 5:39 - 5:41
    Așa că întreaga bază de date
  • 5:41 - 5:44
    este de un miliard de ori mai grozavă decât acest slide.
  • 5:44 - 5:46
    (Râsete)
  • 5:46 - 5:50
    (Aplauze)
  • 5:50 - 5:52
    JM: Sunt multe alte poze care valorează 500 de miliarde de cuvinte.
  • 5:52 - 5:54
    Aceasta spre exemplu.
  • 5:54 - 5:56
    Dacă alegi răceală,
  • 5:56 - 5:58
    veți vedea extreme în perioadele în care știați
  • 5:58 - 6:01
    că mari epidemii de gripă au ucis pe tot globul.
  • 6:01 - 6:04
    ELA: Dacă nu erați încă convinși,
  • 6:04 - 6:06
    nivelurile mării se ridică,
  • 6:06 - 6:09
    ceea ce înseamnă CO2 atmosferic și temperatura globală.
  • 6:09 - 6:12
    JM: Poate ați vrea să vă uitați mai atent la această n-gramă,
  • 6:12 - 6:15
    iar asta este pentru a-i spune lui Nietzsche că Dumnezeu nu este mort,
  • 6:15 - 6:18
    și poate credeți că ar avea nevoie de un editor mai bun.
  • 6:18 - 6:20
    (Râsete)
  • 6:20 - 6:23
    ELA: Poți ajunge la niște concepte destul de abstracte cu aceste lucruri.
  • 6:23 - 6:25
    Spre exemplu, permiteți-mi să vă spun istoria
  • 6:25 - 6:27
    anului 1950.
  • 6:27 - 6:29
    În cea mai mare parte a istoriei,
  • 6:29 - 6:31
    nimănui nu-i păsa de 1950.
  • 6:31 - 6:33
    În 1700, în 1800, în 1900,
  • 6:33 - 6:36
    nimănui nu-i păsa.
  • 6:37 - 6:39
    În anii 30 și 40,
  • 6:39 - 6:41
    nimănui nu-i păsa.
  • 6:41 - 6:43
    Dintr-o dată, pe la mijlocul anilor 40,
  • 6:43 - 6:45
    a început un zumzet.
  • 6:45 - 6:47
    Oamenii și-au dat seama că 1950 urma să se petreacă,
  • 6:47 - 6:49
    și putea să fie măreț.
  • 6:49 - 6:52
    (Râsete)
  • 6:52 - 6:55
    Dar în 1950, nimic nu i-a interesat mai mult pe oameni,
  • 6:55 - 6:58
    ca anul 1950.
  • 6:58 - 7:01
    (Râsete)
  • 7:01 - 7:03
    Oamenii erau absolut obsedați.
  • 7:03 - 7:05
    Nu mai încetau să vorbească
  • 7:05 - 7:08
    despre ce au făcut ei în 1950,
  • 7:08 - 7:11
    tot ce plănuiau să facă în 1950,
  • 7:11 - 7:16
    tot ce visau să îndeplinească în 1950.
  • 7:16 - 7:18
    1950 a fost așa de fascinant
  • 7:18 - 7:20
    încât la ani după,
  • 7:20 - 7:23
    oamenii încă mai vorbeau despre lucrurile minunate petrecute atunci,
  • 7:23 - 7:25
    în '51, '52, '53.
  • 7:25 - 7:27
    În 1954, într-un final,
  • 7:27 - 7:29
    cineva s-a trezit şi şi-a dat seama
  • 7:29 - 7:33
    că anul 1950 a cam trecut.
  • 7:33 - 7:35
    (Râsete)
  • 7:35 - 7:37
    Şi uite-aşa, balonul s-a spart.
  • 7:37 - 7:39
    (Râsete)
  • 7:39 - 7:41
    Şi povestea anului 1950
  • 7:41 - 7:43
    este povestea fiecărui an pe care l-am înregistrat,
  • 7:43 - 7:46
    cu o mică schimbare, pentru că acum avem aceste diagrame drăguţe.
  • 7:46 - 7:49
    Şi pentru că avem aceste diagrame drăguţe, putem să măsurăm anumite lucruri.
  • 7:49 - 7:51
    Putem întreba, "Cât de repede se sparge acest balon?"
  • 7:51 - 7:54
    Şi ne-am dat seama că putem măsura asta cu precizie mare.
  • 7:54 - 7:57
    Au reieşit ecuaţii, au fost produse grafice
  • 7:57 - 7:59
    iar rezultatul final
  • 7:59 - 8:02
    este că aceste baloane se sparg din ce în ce mai repede
  • 8:02 - 8:04
    cu fiecare an.
  • 8:04 - 8:09
    Ne pierdem interesul pentru istorie mai repede.
  • 8:09 - 8:11
    JM: Un mic sfat despre cariere.
  • 8:11 - 8:13
    Pentru aceia dintre voi care vor să fie faimoşi,
  • 8:13 - 8:15
    putem învăţa de la cele mai cunoscute 25 de personalităţi politice,
  • 8:15 - 8:17
    scriitori, actori şi aşa mai departe.
  • 8:17 - 8:20
    Aşa că dacă vreţi să fiţi cunoscuţi de tineri, ar trebui să fiţi actori,
  • 8:20 - 8:22
    pentru că devii faimos când te apropii de 30 de ani --
  • 8:22 - 8:24
    eşti încă tânăr, e minunat.
  • 8:24 - 8:26
    Dacă poţi să mai aştepţi puţin, poţi să fii scriitor,
  • 8:26 - 8:28
    pentru că atunci te ridic la culmi foarte înalte,
  • 8:28 - 8:30
    spre exemplu ca Mark Twain: foarte cunoscut.
  • 8:30 - 8:32
    Dar dacă vrei să ajungi în vârful piramidei,
  • 8:32 - 8:34
    ar trebui să întârzii recompensa,
  • 8:34 - 8:36
    şi bineînţeles, să devii politician.
  • 8:36 - 8:38
    Aici vei ajunge cunoscut când deja ai trecut de 50 de ani
  • 8:38 - 8:40
    şi foarte foarte cunoscut după vârsta asta.
  • 8:40 - 8:43
    Şi oamenii de ştiinţă devin cunoscuţi când sunt mult mai în vârstă.
  • 8:43 - 8:45
    Spre exemplu, biologii şi fizicienii
  • 8:45 - 8:47
    ajung la fel de faimoşi ca actorii.
  • 8:47 - 8:50
    O greşeală pe care nu trebuie să o faceţi, este să deveniţi matematicieni.
  • 8:50 - 8:52
    (Râsete)
  • 8:52 - 8:54
    Dacă faceţi asta,
  • 8:54 - 8:57
    o să vă gândiţi, "O, ce bine, o să-mi ating apogeul pe la 20 de ani."
  • 8:57 - 8:59
    Dar ghiciţi ce, nimănui nu-i pasă.
  • 8:59 - 9:02
    (Râsete)
  • 9:02 - 9:04
    ELA: Există şi note mai vesele
  • 9:04 - 9:06
    printre n-grame.
  • 9:06 - 9:08
    Spre exemplu, iată traiectoria lui Marc Chagall,
  • 9:08 - 9:10
    un artist născut în 1887.
  • 9:10 - 9:13
    Aşa arată traiectoria normală a unui om faimos.
  • 9:13 - 9:17
    Devine din ce în ce mai cunoscut,
  • 9:17 - 9:19
    doar dacă nu te uiţi în germană.
  • 9:19 - 9:21
    Dacă te uiţi în germană, se observă ceva foarte ciudat,
  • 9:21 - 9:23
    ceva ce se observă foarte rar,
  • 9:23 - 9:25
    adică devine extrem de faimos
  • 9:25 - 9:27
    şi apoi decade dintr-o dată,
  • 9:27 - 9:30
    trece printr-un nadir între 1933 şi 1945
  • 9:30 - 9:33
    înainte de a-şi reveni.
  • 9:33 - 9:35
    Ceea ce vedem este, bineînţeles,
  • 9:35 - 9:38
    că Marc Chagall este un artist evreu
  • 9:38 - 9:40
    într-o Germanie nazistă.
  • 9:40 - 9:42
    Aceste semnalmente
  • 9:42 - 9:44
    sunt atât de puternice
  • 9:44 - 9:47
    încât nu avem nevoie să ştim că acea persoană a fost cenzurată.
  • 9:47 - 9:49
    Ne putem da seama
  • 9:49 - 9:51
    folosind procese de semnalare de bază.
  • 9:51 - 9:53
    Iată o metodă de simplă de a o face.
  • 9:53 - 9:55
    Un rezultat așteptat
  • 9:55 - 9:57
    este ca faima cuiva într-o perioadă de timp
  • 9:57 - 9:59
    să fie calculată ca faima anterioară
  • 9:59 - 10:01
    și faima ulterioară.
  • 10:01 - 10:03
    Cam asta așteptăm noi.
  • 10:03 - 10:06
    Și comparăm rezultatul cu faima obeservată de noi.
  • 10:06 - 10:08
    Și am împărțit un rezultat la celălalt
  • 10:08 - 10:10
    pentru a reieși ceva ce noi numim index reprimat.
  • 10:10 - 10:13
    Dacă indexul de reprimare este foarte, foarte, foarte mic,
  • 10:13 - 10:15
    atunci este foarte posibil ca și tu să fii reprimat.
  • 10:15 - 10:18
    Dacă este foarte mare, atunci poate beneficiezi de propagandă.
  • 10:19 - 10:21
    JM: Acum puteți privi
  • 10:21 - 10:24
    distribuția indexului de reprimare pentru toate populațiile.
  • 10:24 - 10:26
    Așa că spre exemplu, aici --
  • 10:26 - 10:28
    indexul de reprimare este pentru 5.000 de persoane
  • 10:28 - 10:30
    alese din cărți engleze, unde nu se cunoaște vreo reprimare --
  • 10:30 - 10:32
    ar arăta cam așa, în principiu centrat pe una.
  • 10:32 - 10:34
    Ceea ce aștepți este în principiu ceea ce observi.
  • 10:34 - 10:36
    Așa arată distribuția în Germania --
  • 10:36 - 10:38
    total diferită, este mutată către stânga.
  • 10:38 - 10:41
    Oamenii au vorbit despre asta de două ori mai puțin decât ar fi trebuit.
  • 10:41 - 10:43
    Dar mai important este că distribuția este mult mai întinsă.
  • 10:43 - 10:46
    Sunt oameni care ajung în extrema stângă a distribuției
  • 10:46 - 10:49
    despre care se vorbește de 10 ori mai puțin decât ar trebui.
  • 10:49 - 10:51
    De asemenea, mulți oameni din extrema dreaptă
  • 10:51 - 10:53
    par să beneficieze de propagandă.
  • 10:53 - 10:56
    Această imagine este marca cenzurilor în arhiva cărții.
  • 10:56 - 10:58
    ELA: Așa că noi numim această metodă,
  • 10:58 - 11:00
    culturomică.
  • 11:00 - 11:02
    Se aseamană cu genomica.
  • 11:02 - 11:04
    Doar că genomica este o lupă asupra biologiei
  • 11:04 - 11:07
    prin fereastra de secvențe de bază din genomul uman.
  • 11:07 - 11:09
    Culturomica este similară.
  • 11:09 - 11:12
    Este o analiză realizată pe o colecție de date imensă aplicată
  • 11:12 - 11:14
    la studiul culturii umane.
  • 11:14 - 11:16
    Aici, nu privim prin lentilele unui genom
  • 11:16 - 11:19
    ci prin lentilele unor piese digitale din istorie.
  • 11:19 - 11:21
    Partea grozavă despre culturomică
  • 11:21 - 11:23
    este că oricine o poate face.
  • 11:23 - 11:25
    De ce o poate face oricine?
  • 11:25 - 11:27
    Toată lumea poate datorită a trei bărbați.
  • 11:27 - 11:30
    Jon Orwant, Matt Gray și Will Brockman de la Google
  • 11:30 - 11:32
    au văzut prototipul lui Ngram Viewer,
  • 11:32 - 11:34
    și au spus, „Este foarte distractiv.
  • 11:34 - 11:37
    Trebuie să-l facem accesibil tuturor.”
  • 11:37 - 11:39
    Așa că în fix două săptămâni -- cele două săptămâni dinainte să ne iasă actele --
  • 11:39 - 11:42
    au dezvoltat o versiune a Ngram Viewer pentru publicul larg.
  • 11:42 - 11:45
    Așa că și voi puteți să tastați orice cuvânt sau frază doriți
  • 11:45 - 11:47
    și imediat să-i vedeți n-grama --
  • 11:47 - 11:49
    și să explorați exemple din toate cărțile
  • 11:49 - 11:51
    în care apare n-grama voastră.
  • 11:51 - 11:53
    JM: În prima zi a fost folosit de peste un milion de ori,
  • 11:53 - 11:55
    iar asta este cea mai bună dintre toate interogările.
  • 11:55 - 11:58
    Așa că oamenii își dau silința, fac tot posibilul.
  • 11:58 - 12:01
    Se pare că în secolul 18, oamenilor nu le păsa deloc.
  • 12:01 - 12:04
    Nu doreau să fie cei mai buni, vroiau să fie cei mai buli.
  • 12:04 - 12:07
    Ceea ce s-a întâmplat este, bineînțeles, doar o greșeală.
  • 12:07 - 12:09
    Nu tindeau către mediocritate,
  • 12:09 - 12:12
    doar N-ul era scris diferit, se apropia de un L.
  • 12:12 - 12:15
    Bineînțeles, Google nu a ales asta atunci,
  • 12:15 - 12:18
    așa că am raportat acestă situație într-un articol științific pe care l-am scris.
  • 12:18 - 12:20
    Dar acesta a fost doar ca să ne amintească de faptul că,
  • 12:20 - 12:22
    deși este foarte distractiv,
  • 12:22 - 12:24
    atunci când interpretezi aceste grafice, trebuie să fii foarte atent,
  • 12:24 - 12:27
    și trebuie să adopți standardele de bază în aceste științe.
  • 12:27 - 12:30
    ELA: Oamenii le-au folosit în diferite scopuri distractive.
  • 12:30 - 12:37
    (Râsete)
  • 12:37 - 12:39
    De fapt, nu o să mai vorbim,
  • 12:39 - 12:42
    ci doar o să vă arătăm slide-urile și o să păstrăm liniștea.
  • 12:42 - 12:45
    Această persoană a fost interesată de istoria frustrării.
  • 12:45 - 12:48
    Există diferite tipuri de frustrare.
  • 12:48 - 12:51
    Dacă îți rupi tocul, este un singur „A”.
  • 12:51 - 12:53
    Dacă planeta Pământ este anihilată de Vogoni
  • 12:53 - 12:55
    pentru a permite un zbor interstelar,
  • 12:55 - 12:57
    este un A spus de opt ori „Aaaaaaaa”.
  • 12:57 - 12:59
    Această persoană studiază toate „a-urile”,
  • 12:59 - 13:01
    de la unu la opt A.
  • 13:01 - 13:03
    Și reiese
  • 13:03 - 13:05
    că cele mai rare „a-uri”
  • 13:05 - 13:08
    sunt, evident, cu evenimentele cele mai puțin frustrante --
  • 13:08 - 13:11
    cu excepția, ciudat, de la începutul anilor '80.
  • 13:11 - 13:13
    Noi credem că ar putea avea legătură cu Reagan.
  • 13:13 - 13:15
    (Râsete)
  • 13:15 - 13:18
    JM: Sunt multe utilizări ale acestei informații,
  • 13:18 - 13:21
    dar concluzia este că istoricul ei este digitizat.
  • 13:21 - 13:23
    Google a început să digitizeze 15 milioane de cărți.
  • 13:23 - 13:25
    Ceea ce înseamnă 12% din totalul de cărți vreodată publicat.
  • 13:25 - 13:28
    Este o parte considerabilă din cultura umană.
  • 13:28 - 13:31
    În cultură există mult mai multe lucruri: manuscripte, ziare,
  • 13:31 - 13:33
    există non-texte, ca arta și picturile.
  • 13:33 - 13:35
    Toate acestea se întâmplă să fie în calculatoarele noastre,
  • 13:35 - 13:37
    în calculatoare din întreaga lume.
  • 13:37 - 13:40
    Și când asta se întâmplă, va schimba felul în care noi
  • 13:40 - 13:42
    ne înțelegem trecutul, prezentul și cultura umană.
  • 13:42 - 13:44
    Vă mulțumesc foarte mult.
  • 13:44 - 13:47
    (Aplauze)
Title:
Ce am învățat din 5 milioane de cărți
Speaker:
Jean-Baptiste Michel + Erez Lieberman Aiden
Description:

V-ați jucat vreodată cu aplicația Google Ngram Viewer? Este un instrument care dă dependență și care permite căutarea unor cuvinte și idei într-o bază de date de 5 milioane de cărți din toate timpurile. Erez Lieberman Aiden și Jean-Baptiste Michel ne arată cum funcționează și câteva dintre lucrurile uimitoare pe care le putem învăța din 500 de miliarde de cuvinte.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
13:48
Mihaela - Patricia Vadan added a translation

Romanian subtitles

Revisions