Čo sme sa naučili z 5 miliónov kníh
-
0:00 - 0:02Erez Lieberman Aiden: Každý vie,
-
0:02 - 0:05že obrázok je hoden tisíc slov.
-
0:07 - 0:09Ale my na Harvarde
-
0:09 - 0:12sme sa zamysleli, či je to naozaj pravda.
-
0:12 - 0:14(Smiech)
-
0:14 - 0:18Zhromaždili sme teda tím odborníkov
-
0:18 - 0:20z Harvardu, MIT,
-
0:20 - 0:23The American Heritage Dictionary, Encyklopédie Britannica
-
0:23 - 0:25a aj od našich hrdých sponzorov
-
0:25 - 0:28z Googlu.
-
0:28 - 0:30A uvažovali sme o tom
-
0:30 - 0:32asi štyri roky.
-
0:32 - 0:37A došli sme k prekvapujúcemu záveru.
-
0:37 - 0:40Dámy a páni, obrázok nie je hoden tísíc slov.
-
0:40 - 0:42V skutočnosti sme našli obrázky
-
0:42 - 0:47hodné 500 miliárd slov.
-
0:47 - 0:49Jean-Baptiste Michel: Takže, ako sme dospeli k tomuto záveru?
-
0:49 - 0:51Erez a ja sme premýšľali o cestách
-
0:51 - 0:53k získaniu celistvého obrazu o ľudskej kultúre
-
0:53 - 0:56a ľudskej histórii: ich zmenách v priebehu času.
-
0:56 - 0:58Tak veľa kníh bolo napísaných za všetky tie roky.
-
0:58 - 1:00Takže sme si pomysleli: najlepší spôsob, ako sa z nich poučiť,
-
1:00 - 1:02je prečítať všetky tieto milióny kníh.
-
1:02 - 1:05Samozrejme, ak si predstavíme mieru úžasnosti niečoho takého,
-
1:05 - 1:08toto musí bodovať veľmi, veľmi vysoko.
-
1:08 - 1:10Problém je, že k tomu prislúcha aj X-ová os -
-
1:10 - 1:12os praktičnosti.
-
1:12 - 1:14Toto je veľmi, veľmi nízko.
-
1:14 - 1:17(Potlesk)
-
1:17 - 1:20Ľudia zvyknú používať alternatívny prístup,
-
1:20 - 1:22vyberú zopár prameňov a prečítajú ich veľmi pozorne.
-
1:22 - 1:24Toto je veľmi praktické, ale nie až také úžasné.
-
1:24 - 1:27Čo naozaj chcete dosiahnuť,
-
1:27 - 1:30je umiestniť sa do úžasnej, ešte však praktickej časti tohto priestoru.
-
1:30 - 1:33Tak sa stalo, že kúsok cez rieku bola spoločnosť nazývaná Google,
-
1:33 - 1:35ktorá pred pár rokmi začala digitalizačný projekt,
-
1:35 - 1:37ktorý by akurát mohol umožniť takýto prístup.
-
1:37 - 1:39Digitalizovali milióny kníh.
-
1:39 - 1:42To znamená, že je možné použiť výpočtové metódy
-
1:42 - 1:44na čítanie všetkých týchto kníh stlačením klávesy.
-
1:44 - 1:47To je veľmi praktické a extrémne úžasné.
-
1:48 - 1:50ELA: Dovoľte mi rozpovedať vám o tom, odkiaľ knihy prichádzajú.
-
1:50 - 1:53Od nepamäti existovali spisovatelia.
-
1:53 - 1:56Títo spisovatelia sa snažili písať kníhy.
-
1:56 - 1:58A to sa im významne zjednodušilo
-
1:58 - 2:00s rozvojom kníhtlače pred niekoľkými storočiami.
-
2:00 - 2:03Odvtedy sa spisovateľom podarilo,
-
2:03 - 2:05pri 129 miliónoch rôznych príležitostiach,
-
2:05 - 2:07vydať knihu.
-
2:07 - 2:09Ak sa tieto knihy nestratili v prúde času,
-
2:09 - 2:11potom sú niekde v nejakej knižnici,
-
2:11 - 2:14a mnoho z týchto kníh bolo získaných z týchto knižníc
-
2:14 - 2:16a digitalizovaných v Google,
-
2:16 - 2:18ktorý doteraz oskenoval 15 miliónov kníh.
-
2:18 - 2:21Keď Google digitalizuje knihu, uložia ju do ozaj pekného formátu.
-
2:21 - 2:23Máme dáta a navyše máme aj metadáta.
-
2:23 - 2:26Máme informácie o veciach ako je miesto vydania,
-
2:26 - 2:28autor, obdobie vydania.
-
2:28 - 2:31A naša činnosť potom spočíva v prehliadaní týchto záznamov
-
2:31 - 2:35a vylúčení všetkého, okrem dát najvyššej kvality.
-
2:35 - 2:37Čo nám zostane,
-
2:37 - 2:40je súbor piatich miliónov kníh,
-
2:40 - 2:43500 miliárd slov,
-
2:43 - 2:45reťazec znakov tisíckrát dlhší
-
2:45 - 2:48než ľudský genóm --
-
2:48 - 2:50text, ktorý, ak by sme ho napísali,
-
2:50 - 2:52by sa tiahol odtiaľ na Mesiac a späť
-
2:52 - 2:5410 krát --
-
2:54 - 2:58ozajstný úlomok nášho kultúrneho genómu.
-
2:58 - 3:00Samozrejme, čo sme urobili,
-
3:00 - 3:03čeliac takejto hroznej hyperbole ...
-
3:03 - 3:05(Smiech)
-
3:05 - 3:08sme urobili to, čo
-
3:08 - 3:11by býval urobil každý výskumník so štipkou sebaúcty.
-
3:11 - 3:13Vybrali sme stránku z XKCD,
-
3:13 - 3:15a riekli, "Ustúp.
-
3:15 - 3:17Ideme vyskúšať vedu."
-
3:17 - 3:19(Smiech)
-
3:19 - 3:21JM: Samozrejme, uvažovali sme,
-
3:21 - 3:23skúsme my len najprv zverejniť dáta,
-
3:23 - 3:25pre ostatných nech si na tom robia vedu.
-
3:25 - 3:27A tak uvažujeme, ktoré dáta môžeme zverejniť?
-
3:27 - 3:29Samozrejme, chcete vziať knihy
-
3:29 - 3:31a vydať plný text týchto piatich miliónov kníh.
-
3:31 - 3:33Google a osobitne Jon Orwant,
-
3:33 - 3:35nám ukázali malú rovnicu, ktorú sme sa museli naučiť.
-
3:35 - 3:38Vezmite päť miliónov kníh, to znamená päť miliónov autorov
-
3:38 - 3:41a päť miliónov žalobcov a máte masívny súdny proces.
-
3:41 - 3:43Takže, aj keď by to bolo veľmi, veľmi úžasné,
-
3:43 - 3:46opäť, extrémne, extrémne nepraktické.
-
3:46 - 3:48(Smiech)
-
3:48 - 3:50Opäť sme to svojim spôsobom vyriešili
-
3:50 - 3:53a zvolili sme veľmi praktický prístup, ktorý bol o kúsok menej úžasný.
-
3:53 - 3:55Povedali sme si, namiesto zverejnenia plného textu
-
3:55 - 3:57zverejníme štatistické informácie o knihách.
-
3:57 - 3:59Napríklad "A gleam of happiness" ("Záblesk šťastia").
-
3:59 - 4:01To sú štyri slová: nazývame to štyr-gram.
-
4:01 - 4:03Povieme vám, koľkokrát sa určitý štyr-gram
-
4:03 - 4:05objavuje v knihách v rokoch 1801, 1802, 1803,
-
4:05 - 4:07až do roku 2008.
-
4:07 - 4:09To nám dáva časovú závislosť
-
4:09 - 4:11frekvencie použitia určitej vety v priebehu času.
-
4:11 - 4:14Urobíme to pre všetky slová a frázy, ktoré sa objavujú v týchto knihách
-
4:14 - 4:17a to nám dáva veľkú tabuľku s dvoma miliardami riadkov,
-
4:17 - 4:19ktorá nám hovorí a cestách kultúrnych zmien.
-
4:19 - 4:21ELA: Teda tie dve miliardy riadkov,
-
4:21 - 4:23nazývame ich dve miliardy n-gramov.
-
4:23 - 4:25Čo nám hovoria?
-
4:25 - 4:27Individuálne n-gramy sú mierou kultúrnych trendov.
-
4:27 - 4:29Dovoľte mi uviesť vám jeden príklad.
-
4:29 - 4:31Predpokladajme, že je mi skvele,
-
4:31 - 4:33a potom zajtra vám chcem povedať, ako dobre mi bolo.
-
4:33 - 4:36A teda by som mohol povedať "Včera som si voľkal."
-
4:36 - 4:39Alternatívne by som mohol povedať "Včara som sa tešil."
-
4:39 - 4:42Ktorý z nich by som mal použiť?
-
4:42 - 4:44Ako sa rozhodnúť?
-
4:44 - 4:46Už približne šesť mesiacov
-
4:46 - 4:48špičkový prístup v tejto oblasti
-
4:48 - 4:50je, že by ste, napríklad,
-
4:50 - 4:52navštívili nasledujúceho psychológa s úžasným účesom,
-
4:52 - 4:54a riekli by ste,
-
4:54 - 4:57"Steve, vy ste expert na nepravidelné slovesá.
-
4:57 - 4:59Čo by som mal robiť?"
-
4:59 - 5:01A on by vám povedal, "Väčšina ľudí hovorí tešiť sa,
-
5:01 - 5:04ale niektorí ľudia hovoria voľkať si."
-
5:04 - 5:06A tiež ste vedeli, viac-menej,
-
5:06 - 5:09že, ak by ste sa presunuli späť v čase o 200 rokov
-
5:09 - 5:12a opýtali sa nasledujúceho štátnika s rovnako úžasným účesom:
-
5:12 - 5:15(Smiech)
-
5:15 - 5:17"Tom, čo by som mal povedať?"
-
5:17 - 5:19On by odpovedal, "Za mojich čias, väčšina ľudí používala voľkať si,
-
5:19 - 5:22no niektorí používali tešiť sa."
-
5:22 - 5:24Takže to, čo vám teraz ukážem sú iba holé dáta.
-
5:24 - 5:28Dva riadky z tabuľky s dvoma miliardami záznamov.
-
5:28 - 5:30To, čo vidíte je frekvencia výskytu, rok za rokom,
-
5:30 - 5:33"tešiť sa" a "voľkať si" v priebehu času.
-
5:34 - 5:36Toto sú iba dva
-
5:36 - 5:39z dvoch miliárd riadkov.
-
5:39 - 5:41Takže, celý set dát
-
5:41 - 5:44je miliardukrát úžasnejší než tento obrázok.
-
5:44 - 5:46(Smiech)
-
5:46 - 5:50(Potlesk)
-
5:50 - 5:52JM: Je mnoho ďalších obrázkov, ktoré sú hodné 500 miliárd slov.
-
5:52 - 5:54Napríklad tento.
-
5:54 - 5:56Ak vezmete slovo influenza,
-
5:56 - 5:58spozorujete zvýšený výskyt v časoch, o ktorých je známe,
-
5:58 - 6:01že chrípkové epidémie práve zabíjali ľudí po svete.
-
6:01 - 6:04ELA: Ak ešte nie ste presvedčení,
-
6:04 - 6:06hladiny morí stúpajú,
-
6:06 - 6:09rovnako aj atmosférický CO2 a globálna teplota.
-
6:09 - 6:12JM: Mohol by vás zaujímať aj tento partikulárny n-gram,
-
6:12 - 6:15ktorý Nietzschemu hovorí, že Boh nie je mŕtvy,
-
6:15 - 6:18aj keď by ste mohli súhlasiť, že by sa mu hodil lepší PR manažér.
-
6:18 - 6:20(Smiech)
-
6:20 - 6:23ELA: S touto vecičkou môžete dospieť k pekne abstraktným konceptom.
-
6:23 - 6:25Napríklad, dovoľte mi rozpovedať vám históriu
-
6:25 - 6:27roku 1950.
-
6:27 - 6:29Podstatnú väčšinu dejín,
-
6:29 - 6:31nikto na rok 1950 ani nekýchol
-
6:31 - 6:33v rokoch 1700, 1800, 1900,
-
6:33 - 6:36nik sa nezaujímal.
-
6:37 - 6:39V priebehu 30-tych a 40-tych,
-
6:39 - 6:41sa nik nezaujímal.
-
6:41 - 6:43Zrazu, v polovici 40-tych
-
6:43 - 6:45nastal šum.
-
6:45 - 6:47Ľudia si uvedomili, že rok 1950 prichádza
-
6:47 - 6:49a mohol by byť veľkolepý.
-
6:49 - 6:52(Smiech)
-
6:52 - 6:55Avšak nič ľudí nezaujalo počas roku 1950,
-
6:55 - 6:58tak, ako rok 1950.
-
6:58 - 7:01(Smiech)
-
7:01 - 7:03Ľudia chodili ako posadnutí.
-
7:03 - 7:05Nemohli prestať hovoriť
-
7:05 - 7:08o všetkom, čo robili počas roku 1950,
-
7:08 - 7:11všetkom, čo plánovali robiť v roku 1950,
-
7:11 - 7:16všetkých snoch, ktoré si chceli splniť v roku 1950.
-
7:16 - 7:18Fakticky, rok 1950 bol taký fascinujúci,
-
7:18 - 7:20že celé roky potom
-
7:20 - 7:23ľudia jednoducho ďalej hovorili o všetkých úžasných veciach, ktoré sa udiali.
-
7:23 - 7:25v rokoch 51, 52, 53.
-
7:25 - 7:27Konečne, v roku 1954
-
7:27 - 7:29sa ktosi prebral a nahliadol,
-
7:29 - 7:33že rok 1950 je akosi passé.
-
7:33 - 7:35(Smiech)
-
7:35 - 7:37A takto bublina spľasla.
-
7:37 - 7:39(Smiech)
-
7:39 - 7:41A príbeh roku 1950,
-
7:41 - 7:43je príbehom každého roku, o ktorom máme záznamy.
-
7:43 - 7:46s malým háčikom, pretože teraz máme tieto pekné tabuľky.
-
7:46 - 7:49A pretože máme tieto pekné tabuľky, môžeme veci merať.
-
7:49 - 7:51Môžeme sa opýtať: "Hm, ako rýchlo bublina spľasne?"
-
7:51 - 7:54A ukazuje sa, že to môžeme merať veľmi presne.
-
7:54 - 7:57Rovnice boli odvodené, grafy vytvorené,
-
7:57 - 7:59a výsledok je,
-
7:59 - 8:02že bubliny spľasnú rýchlejšie a rýchlejšie
-
8:02 - 8:04každým odchádzajúcim rokom.
-
8:04 - 8:09Záujem o minulosť strácame rýchlejšie.
-
8:09 - 8:11JM: Teraz malá rada ku kariérnemu rastu.
-
8:11 - 8:13Takže pre tých z vás, ktorí chcú byť slávni,
-
8:13 - 8:15sa môžeme poučiť od 25 najznámejších politikov,
-
8:15 - 8:17spisovateľov, hercov a tak ďalej.
-
8:17 - 8:20Takže ak sa chcete stať slávnym čo najskôr, mali by ste byť hercom,
-
8:20 - 8:22pretože potom vaša sláva začne rásť ešte pred tridsiatkou --
-
8:22 - 8:24ste ešte mladý, je to ozaj super.
-
8:24 - 8:26Ak môžete chvíľu počkať, staňte sa spisovateľom,
-
8:26 - 8:28pretože potom môžete dosiahnuť k výšinám,
-
8:28 - 8:30ako Mark Twain, napríklad: extrémne slávny.
-
8:30 - 8:32Ale ak chcete naozaj na vrchol,
-
8:32 - 8:34mali by ste odložiť príjemnosti
-
8:34 - 8:36a samozrejme, stať sa politikom.
-
8:36 - 8:38Takže tu sa stávate slávnym pred vašou šesťdesiatkou,
-
8:38 - 8:40a následne sa stávate veľmi, veľmi slávnym.
-
8:40 - 8:43Vedci sa k sláve dostávajú ako omnoho starší.
-
8:43 - 8:45Tak napríklad, biológovia a fyzici
-
8:45 - 8:47sú takmer takí slávni ako herci.
-
8:47 - 8:50Chyby, ktorej by ste sa mali vyvarovať je stať sa matematikom.
-
8:50 - 8:52(Smiech)
-
8:52 - 8:54Ak to urobíte,
-
8:54 - 8:57môžete si myslieť: "Ó, skvelé, do tridsiatky urobím svoju najlepšiu prácu."
-
8:57 - 8:59Ale hádajte čo? Nikoho to nebude naozaj zaujímať.
-
8:59 - 9:02(Smiech)
-
9:02 - 9:04ELA: N-gramy prinášajú
-
9:04 - 9:06ešte viac vytriezvujúcich poznatkov.
-
9:06 - 9:08Napríklad tu je trajektória Marca Chagalla,
-
9:08 - 9:10umelca narodeného v roku 1887.
-
9:10 - 9:13A toto vyzerá ako normálna trajektória slávnej osoby.
-
9:13 - 9:17Stáva sa slávnejším a slávnejším,
-
9:17 - 9:19s výnimkou, ak hľadáte v nemčine.
-
9:19 - 9:21Ak hľadáte v nemčine, uvidíte niečo úplne zvláštne,
-
9:21 - 9:23niečo, čo sa takmer nikdy neobjaví,
-
9:23 - 9:25teda, že sa stáva extrémne slávnym
-
9:25 - 9:27a potom z ničoho nič zmizne,
-
9:27 - 9:30prechádzajúc úplným minimom medzi rokmi 1933 a 1945,
-
9:30 - 9:33a následne opätovne narastajúc.
-
9:33 - 9:35Samozrejme, to, čo vidíme,
-
9:35 - 9:38je skutočnosť, že Marc Chagall bol židovským umelcom
-
9:38 - 9:40v nacistickom Nemecku.
-
9:40 - 9:42Tieto signály
-
9:42 - 9:44sú v skutočnosti také silné,
-
9:44 - 9:47že nepotrebujeme vedieť, či bol niekto cenzúrovaný.
-
9:47 - 9:49Môžeme na to jednoducho prísť
-
9:49 - 9:51použitím naozaj základného spracovania signálov.
-
9:51 - 9:53Tu je jednoduchý spôsob, ako to urobiť.
-
9:53 - 9:55Je rozumné predpokladať,
-
9:55 - 9:57že sláva danej osoby počas istého časového úseku,
-
9:57 - 9:59by mala byť približne priemerom jej slávy pred
-
9:59 - 10:01a slávy po ňom.
-
10:01 - 10:03Takže očakávame takéto niečo.
-
10:03 - 10:06A porovnáme to so slávou, ktorú pozorujeme.
-
10:06 - 10:08A jednoducho vydelíme jednu druhou,
-
10:08 - 10:10aby sme dostali niečo, čo nazývame index supresie.
-
10:10 - 10:13Ak je index supresie veľmi, veľmi, veľmi malý,
-
10:13 - 10:15potom je dosť možné, že ste potláčaný.
-
10:15 - 10:18Ak je veľmi veľký, je možné, že si pomáhate propagandou.
-
10:19 - 10:21JM: Vskutku sa môžete pozrieť na
-
10:21 - 10:24distribúciu indexov supresie cez celé populácie.
-
10:24 - 10:26Napríklad, tu --
-
10:26 - 10:28tento index supresie je vyrátaný pre 5000 ľudí
-
10:28 - 10:30vybraných v anglických knihách. Kde nie je žiadna supresia --
-
10:30 - 10:32vyzeralo by to takto, tesne centrované okolo jednotky.
-
10:32 - 10:34Čo očakávate, je, v podstate, to, čo pozorujete.
-
10:34 - 10:36Toto je distribúcia pozorovaná v Nemecku --
-
10:36 - 10:38veľmi rozdielna, je posunutá doľava.
-
10:38 - 10:41Ľudia o tom hovorili asi dvakrát menej ako by sa dalo očakávať,
-
10:41 - 10:43ale čo je ešte dôležitejšie, distribúcia je oveľa širšia.
-
10:43 - 10:46Je mnoho ľudí, ktorý skončia na ľavom konci tejto distribúcie,
-
10:46 - 10:49o ktorých sa hovorí asi 10 ráz menej, než by sa malo.
-
10:49 - 10:51Ale tiež mnoho ľudí na pravom konci,
-
10:51 - 10:53ktorým, zdá sa, pomáha propaganda.
-
10:53 - 10:56Tento obrázok predstavuje etalón cenzorstva v knižných záznamoch.
-
10:56 - 10:58ELA: Takže kulturonómia
-
10:58 - 11:00je termín, ktorý používame pre túto metódu.
-
11:00 - 11:02Je podobná genomike.
-
11:02 - 11:04Zatiaľ, čo genomika je objektívom biológie
-
11:04 - 11:07cez okno sekvencie ľudského genómu,
-
11:07 - 11:09kulturonómia je podobná.
-
11:09 - 11:12Je to aplikácia analýzy dát masívneho rozsahu
-
11:12 - 11:14pre štúdium ľudskej kultúry.
-
11:14 - 11:16Tu je genóm nahradený
-
11:16 - 11:19objektívom digitalizovaných historických záznamov.
-
11:19 - 11:21Skvelé na kulturonómii
-
11:21 - 11:23je, že ju môže robiť každý.
-
11:23 - 11:25Prečo každý?
-
11:25 - 11:27Môže ju robiť ktokoľvek, pretože traja chlapíci,
-
11:27 - 11:30Jon Orwant, Matt Gray a Will Brockman z Google
-
11:30 - 11:32sa pozreli na prototyp Ngram Viewer
-
11:32 - 11:34a povedali si, "Toto je taká zábava,
-
11:34 - 11:37musíme ju sprístupniť ľuďom!"
-
11:37 - 11:39Takže za dva týždne - dva týždne pred vydaním nášho článku -
-
11:39 - 11:42naprogramovali verziu Ngram Viewer-u pre verejnosť.
-
11:42 - 11:45Takže teraz môžete vpísať akékoľvek slovo alebo frázu, ktorá vás zaujíma
-
11:45 - 11:47a okamžite vidieť príslušný N-gram,
-
11:47 - 11:49a tiež prezerať príklady všetkých rôznych kníh,
-
11:49 - 11:51v ktorých sa objavuje váš N-gram.
-
11:51 - 11:53JM: Aplikácia bola použitá viac ako miliónkrát počas prvého dňa,
-
11:53 - 11:55a toto je naozaj najlepší zo všetkých dotazov.
-
11:55 - 11:58Takže ľudia sa snažia robiť všetko najlepšie ("their best") v službách pokroku.
-
11:58 - 12:01Ale ukazuje sa, že v 18-tom storočí, sa o to nestarali vôbec.
-
12:01 - 12:04Nechceli robiť "their best", robili "their beft".
-
12:04 - 12:07Čo sa stalo, je, samozrejme, iba chyba.
-
12:07 - 12:09Nebola to snaha po priemernosti,
-
12:09 - 12:12išlo len o to, že "s" sa písalo odlišne, podobne ako "f."
-
12:12 - 12:15Samozrejme, Google o tom vtedy ešte nevedel,
-
12:15 - 12:18takže sme to reportovali v našom odbornom článku.
-
12:18 - 12:20Ale to je iba pripomienka,
-
12:20 - 12:22že aj keď je toto veľká zábava,
-
12:22 - 12:24pri interpretácii grafov musíte byť veľmi opatrní
-
12:24 - 12:27a používať základné vedecké pravidlá.
-
12:27 - 12:30ELA: Ľudia to používajú na všetky možné srandovné účely.
-
12:30 - 12:37(Smiech)
-
12:37 - 12:39Vskutku, nemusíme ani rozprávať,
-
12:39 - 12:42iba vám mlčky ukážeme všetky zostávajúce obrázky
-
12:42 - 12:45Túto osobu zaujímala história frustrácie.
-
12:45 - 12:48Existujú rôzne druhy frustrácie.
-
12:48 - 12:51Ak si prepichnete prst je to "argh" (ach) s jedným "a"
-
12:51 - 12:53Ak je planéta Zem anihilovaná Vogónmi
-
12:53 - 12:55za účelom uvoľnenia priestoru pre vesmírnu diaľnicu,
-
12:55 - 12:57je to "aaaaaaaargh" o ôsmich "a."
-
12:57 - 12:59Táto osoba skúmala všetky "argh",
-
12:59 - 13:01s jedným až ôsmimi "a"
-
13:01 - 13:03A ukazuje sa
-
13:03 - 13:05že menej frekventované "arghs"
-
13:05 - 13:08sú, samozrejme, tie, ktoré zodpovedajú veciam, ktoré sú frustrujúcejšie --
-
13:08 - 13:11s výnimkou, prekvapujúco, začiatku 80-tych.
-
13:11 - 13:13Myslíme, že by to mohlo mať dočinenia s Reaganom.
-
13:13 - 13:15(Smiech)
-
13:15 - 13:18JM: Je veľa použití pre tieto dáta,
-
13:18 - 13:21ale najpodstatnejšie je, že historické záznamy sú digitalizované.
-
13:21 - 13:23Google začal s digitalizáciou 15 miliónov kníh.
-
13:23 - 13:25To je 12 percent všetkých kníh, ktoré kedy boli vydané.
-
13:25 - 13:28To predstavuje veľkú časť ľudskej kultúry.
-
13:28 - 13:31Kultúra je oveľa širšia: spadajú tam rukopisy, noviny,
-
13:31 - 13:33patria tam veci, ktoré nie sú textom, ako výtvarné umenie a maľby.
-
13:33 - 13:35Toto všetko bude na našich počítačoch,
-
13:35 - 13:37na počítačoch po celom svete.
-
13:37 - 13:40Až sa toto stane, transformuje to náš prístup
-
13:40 - 13:42k porozumeniu našej minulosti, prítomnosti a ľudstvu.
-
13:42 - 13:44Ďakujeme veľmi pekne.
-
13:44 - 13:47(Potlesk)
- Title:
- Čo sme sa naučili z 5 miliónov kníh
- Speaker:
- Jean-Baptiste Michel + Erez Lieberman Aiden
- Description:
-
Hrali ste sa už s Ngram Viewer od Google Labs? Je to návykový nástroj, ktorý Vám umožňuje vyhľadávať slová a idei v databáze 5 miliónov kníh z rôznych storočí. Erez LIeberman Aiden a Jean-Baptiste Michel ukazujú, ako funguje, a tiež niekoľko z prekvapujúcich vecí, ktoré sa možno naučiť z 500 miliárd slov.
- Video Language:
- English
- Team:
closed TED
- Project:
- TEDTalks
- Duration:
- 13:48