0:00:00.000,0:00:02.000 Erez Lieberman Aiden: Mindenki tudja, 0:00:02.000,0:00:05.000 hogy egy kép felér ezer szóval. 0:00:07.000,0:00:09.000 De mi a Harvardon 0:00:09.000,0:00:12.000 elgondolkoztunk, hogy ez tényleg így van-e. 0:00:12.000,0:00:14.000 (Nevetés) 0:00:14.000,0:00:18.000 Így összeraktunk egy szakértőkből álló csapatot, 0:00:18.000,0:00:20.000 Harvardról, MIT-ről 0:00:20.000,0:00:23.000 az American Heritage Dictionarytől, az Encyclopedia Britannicától 0:00:23.000,0:00:25.000 és még a büszke szponzorunktól is, 0:00:25.000,0:00:28.000 a Google-től. 0:00:28.000,0:00:30.000 És rágódtunk rajta 0:00:30.000,0:00:32.000 nagyjából négy évig. 0:00:32.000,0:00:37.000 És egy ijesztő megállapításra jutottunk. 0:00:37.000,0:00:40.000 Hölgyeim és uraim, egy kép nem ér fel ezer szóval. 0:00:40.000,0:00:42.000 Valójában, találtunk néhány képet 0:00:42.000,0:00:47.000 amely 500 milliárd szót ér. 0:00:47.000,0:00:49.000 Jean-Baptiste Michel: De hogyan jutottunk erre a következtetésre? 0:00:49.000,0:00:51.000 Erez és én olyan módszereket kerestünk, 0:00:51.000,0:00:53.000 amelyekből egy áttekintő képet kaphatunk az emberi kultúráról 0:00:53.000,0:00:56.000 és az emberi történelemről, időbeli változásáról. 0:00:56.000,0:00:58.000 Rengeteg könyvet írtak az évek során. 0:00:58.000,0:01:00.000 Így mi arra gondoltunk, legjobban úgy tanulhatunk belőlük, 0:01:00.000,0:01:02.000 ha ezt a több millió könyvet elolvassuk. 0:01:02.000,0:01:05.000 Természetesen, ha lenne arra egy skála, ez mennyire döbbenetes, 0:01:05.000,0:01:08.000 akkor ez extrém, extrém módon magas lenne. 0:01:08.000,0:01:10.000 A probléma viszont az, hogy van egy X tengelye is, 0:01:10.000,0:01:12.000 ami a praktikusság tengelye. 0:01:12.000,0:01:14.000 Ez nagyon, nagyon alacsony. 0:01:14.000,0:01:17.000 (Taps) 0:01:17.000,0:01:20.000 Manapság hajlamosak az emberek egy másfajta megközelítést használni: 0:01:20.000,0:01:22.000 vesznek néhány forrást és nagyon alaposan elolvassák. 0:01:22.000,0:01:24.000 Ez rendkívül hasznos, de nem annyira döbbenetes. 0:01:24.000,0:01:27.000 Amit igazán szeretnél 0:01:27.000,0:01:30.000 az az, hogy eljuss az ábra döbbenetes, mégis hasznos részére. 0:01:30.000,0:01:33.000 Kiderült, van egy vállalat, amely tudja a megoldást: a Google, 0:01:33.000,0:01:35.000 mely néhány évvel korábban elkezdett egy digitalizálási projektet, 0:01:35.000,0:01:37.000 ami lehetővé teheti ezt a megközelítést. 0:01:37.000,0:01:39.000 Könyvek millióit digitalizálták. 0:01:39.000,0:01:42.000 Mindez azt jelenti, hogy számítási metódusokkal 0:01:42.000,0:01:44.000 egy gombnyomásra elolvashatóak ezek a könyvek. 0:01:44.000,0:01:47.000 Ez nagyon hasznos és igazán döbbenetes. 0:01:48.000,0:01:50.000 ELA: Hadd beszéljek egy kicsit arról, honnan is jönnek ezek a könyvek. 0:01:50.000,0:01:53.000 Emberi emlékezet óta vannak szerzők. 0:01:53.000,0:01:56.000 Ezek a szerzők arra törekedtek, hogy könyveket írjanak. 0:01:56.000,0:01:58.000 És mindez nagyságrendekkel könnyebbé vált 0:01:58.000,0:02:00.000 a nyomtatott sajtó néhány századdal ezelőtti fejlődésével. 0:02:00.000,0:02:03.000 A szerzők azóta sikeresen, 0:02:03.000,0:02:05.000 129 millió különböző alkalommal 0:02:05.000,0:02:07.000 publikáltak könyvet. 0:02:07.000,0:02:09.000 Ha ezek a könyvek nem tűntek el a történelemben, 0:02:09.000,0:02:11.000 akkor valahol megtalálhatóak egy könyvtárban, 0:02:11.000,0:02:14.000 és a legtöbbjüket a Google kikölcsönözte 0:02:14.000,0:02:16.000 és digitalizálta -- 0:02:16.000,0:02:18.000 a mai napig 15 millió könyvet. 0:02:18.000,0:02:21.000 Amikor a Google bedigitalizál egy könyvet, egy elég szép formátumba rakja. 0:02:21.000,0:02:23.000 Szóval megvan az adat és megvan a metaadat. 0:02:23.000,0:02:26.000 Van információnk arról, hol publikálták, 0:02:26.000,0:02:28.000 ki volt a szerző, mikor publikálták. 0:02:28.000,0:02:31.000 Mi azt csináljuk, hogy átnézzük ezeket a rekordokat, 0:02:31.000,0:02:35.000 és kizárjuk azokat, amelyek nem a legjobb minőségűek. 0:02:35.000,0:02:37.000 A végén maradt egy 0:02:37.000,0:02:40.000 ötmillió könyvből álló kollekciónk, 0:02:40.000,0:02:43.000 500 milliárd szó, 0:02:43.000,0:02:45.000 egy ezerszer hosszabb karakterlánc, 0:02:45.000,0:02:48.000 mint az emberi genom -- 0:02:48.000,0:02:50.000 egy szöveg, mely leírva 0:02:50.000,0:02:52.000 elérne a Holdig és vissza 0:02:52.000,0:02:54.000 10-szer -- 0:02:54.000,0:02:58.000 a kulturális genom egy igazi darabja. 0:02:58.000,0:03:00.000 Természetesen, amikor 0:03:00.000,0:03:03.000 egy ilyen elképesztő túlzással találkozunk... 0:03:03.000,0:03:05.000 (Nevetés) 0:03:05.000,0:03:08.000 ugyanazt tesszük, mint bármely magára valamit is adó 0:03:08.000,0:03:11.000 kutató tenne. 0:03:11.000,0:03:13.000 Vettünk egy oldalt az XKCD-ről, 0:03:13.000,0:03:15.000 és azt mondtuk, "Egy kis helyet! 0:03:15.000,0:03:17.000 Kipróbáljuk a tudományt." 0:03:17.000,0:03:19.000 (Nevetés) 0:03:19.000,0:03:21.000 JM: Természetesen, gondoltuk mi, 0:03:21.000,0:03:23.000 elsőként adjuk oda az adatokat embereknek, 0:03:23.000,0:03:25.000 akik tanulmányozzák. 0:03:25.000,0:03:27.000 Arra gondoltunk, milyen adatot adhatunk oda? 0:03:27.000,0:03:29.000 Természetesen, veheted a könyveket 0:03:29.000,0:03:31.000 és kiadhatod mind az ötmillió könyv teljes szövegét. 0:03:31.000,0:03:33.000 Nos, a Google és különösképpen Jon Orwant 0:03:33.000,0:03:35.000 elmagyarázott nekünk egy kis egyenletet, amelyet meg kellene tanulnunk. 0:03:35.000,0:03:38.000 Ha van 5 millió, azaz 5 millió szerződ 0:03:38.000,0:03:41.000 és 5 millió felperes, az egy egész szép peres eljárás. 0:03:41.000,0:03:43.000 Így, annak ellenére, hogy az igazán, igazán döbbenetes lenne, 0:03:43.000,0:03:46.000 ismét csak, hihetetlenül, hihetetlenül haszontalan lenne. 0:03:46.000,0:03:48.000 (Nevetés) 0:03:48.000,0:03:50.000 Mi eléggé korlátoltak vagyunk, 0:03:50.000,0:03:53.000 és vettük az elég praktikus megközelítést, amely valamivel kevésbé döbbenetes. 0:03:53.000,0:03:55.000 Azt mondtuk, ahelyett, hogy kiadnánk a teljes szöveget, 0:03:55.000,0:03:57.000 statisztikákat fogunk kiadni a könyvekről. 0:03:57.000,0:03:59.000 Vegyünk egy példát: "A boldogság egy fénysugara." 0:03:59.000,0:04:01.000 Négy szó. Négy-gramnak hívjuk. 0:04:01.000,0:04:03.000 Meg fogjuk mondani, hogy egy bizonyos négy-gram hányszor 0:04:03.000,0:04:05.000 bukkant fel a könyvekben 1801-ben, 1802-ben, 1803-ban, 0:04:05.000,0:04:07.000 egészen 2008-ig. 0:04:07.000,0:04:09.000 Kapunk egy idősort arról, hogy 0:04:09.000,0:04:11.000 milyen gyakran használták ezt a bizonyos mondatot az idők során. 0:04:11.000,0:04:14.000 Megcsináljuk ezt minden szóra és kifejezésre, amely azokban a könyvekben előfordul, 0:04:14.000,0:04:17.000 amely egy 2 milliárd sorból álló halmazt ad, 0:04:17.000,0:04:19.000 amely elmondja, miként változott a kultúra. 0:04:19.000,0:04:21.000 ELA: Ezt a kétmilliárd sort 0:04:21.000,0:04:23.000 2 milliárd n-gramnak hívjuk. 0:04:23.000,0:04:25.000 Mit mondanak nekünk? 0:04:25.000,0:04:27.000 Nos, az egyes n-gramok a kulturális trendeket mérik. 0:04:27.000,0:04:29.000 Hadd mondjak egy példát! 0:04:29.000,0:04:31.000 Tegyük fel, hogy jómódban élek, 0:04:31.000,0:04:33.000 aztán holnap el akarom mondani, milyen jól éltem. 0:04:33.000,0:04:36.000 És azt mondhatom, "Tegnap jól éltem (throve)." 0:04:36.000,0:04:39.000 Másféleképpen, azt mondhatom, "Tegnap jól éltem (thrived)." 0:04:39.000,0:04:42.000 Nos, melyiket kellene használnom? 0:04:42.000,0:04:44.000 Honnan lehet tudni? 0:04:44.000,0:04:46.000 Nagyjából 6 hónappal ezelőtt, 0:04:46.000,0:04:48.000 a tudomány akkori állása szerint 0:04:48.000,0:04:50.000 megtehetted volna például, 0:04:50.000,0:04:52.000 hogy felkeresed az alábbi furcsa hajú pszichológust, 0:04:52.000,0:04:54.000 és azt mondod, 0:04:54.000,0:04:57.000 "Steve, a rendhagyó igék szakértője vagy. 0:04:57.000,0:04:59.000 Mit kéne tennem?" 0:04:59.000,0:05:01.000 És azt mondta volna, "Nos, a legtöbb ember a 'thrived'-ot használja, 0:05:01.000,0:05:04.000 de néhányan a 'throve'-ot." 0:05:04.000,0:05:06.000 És többé-kevésbé azt is tudnád, 0:05:06.000,0:05:09.000 ha 200 évet visszamész az időben, 0:05:09.000,0:05:12.000 és megkérdezed az alábbi, szintén furcsa hajú államférfit, 0:05:12.000,0:05:15.000 (Nevetés) 0:05:15.000,0:05:17.000 "Tom, melyiket kellene használnom?" 0:05:17.000,0:05:19.000 Azt mondaná, "Nos, az én időmben a legtöbb ember a 'throve'-ot, 0:05:19.000,0:05:22.000 de néhányan a 'thrived'-ot." 0:05:22.000,0:05:24.000 Amit most meg fogok mutatni azok nyers adatok. 0:05:24.000,0:05:28.000 Két sort ebből a kétmilliárdos halmazból. 0:05:28.000,0:05:30.000 Az ábrán a "thrive" és a "throve" 0:05:30.000,0:05:33.000 előfordulási gyakorisága látható az évek során. 0:05:34.000,0:05:36.000 Nos, ez csak kettő 0:05:36.000,0:05:39.000 a kétmilliárd sorból. 0:05:39.000,0:05:41.000 Az egész adathalmaz 0:05:41.000,0:05:44.000 kétmilliárdszor döbbenetesebb, mint ez a dia. 0:05:44.000,0:05:46.000 (Nevetés) 0:05:46.000,0:05:50.000 (Taps) 0:05:50.000,0:05:52.000 JM: Számtalan más kép van, amely felér 500 milliárd szóval. 0:05:52.000,0:05:54.000 Például ez. 0:05:54.000,0:05:56.000 Ha csupán az influenzát vesszük, 0:05:56.000,0:05:58.000 kiugrásokat fogunk látni azokra az időszakokra, ahol tudjuk, hogy 0:05:58.000,0:06:01.000 nagy influenza fertőzésekben haltak meg az emberek világszerte. 0:06:01.000,0:06:04.000 ELA: Ha még mindig nem lennének meggyőzve, 0:06:04.000,0:06:06.000 a tengerszint emelkedik, 0:06:06.000,0:06:09.000 akárcsak a légkör CO2 tartalma és a globális hőmérséklet. 0:06:09.000,0:06:12.000 JM: Vagy akár megnézhetitek ezt a bizonyos n-gramot, 0:06:12.000,0:06:15.000 melyben Nietzsche szerint Isten nem halott, 0:06:15.000,0:06:18.000 habár azzal egyetértenének, hogy jobb publicistára lenne szüksége. 0:06:18.000,0:06:20.000 (Nevetés) 0:06:20.000,0:06:23.000 ELA: Egészen szép absztrakt koncepciókat kaphatsz ilyen dolgokkal. 0:06:23.000,0:06:25.000 Például, hadd meséljek az 1950. év 0:06:25.000,0:06:27.000 történelméről! 0:06:27.000,0:06:29.000 Nagy valószínűséggel a történelem túlnyomó részében 0:06:29.000,0:06:31.000 senkit sem érdekelt 1950. 0:06:31.000,0:06:33.000 1700-ban, 1800-ban, 1900-ban 0:06:33.000,0:06:36.000 senkit sem érdekelt. 0:06:37.000,0:06:39.000 A 30-as és a 40-es években 0:06:39.000,0:06:41.000 senkit sem érdekelt. 0:06:41.000,0:06:43.000 A 40-es évek közepén hirtelen 0:06:43.000,0:06:45.000 elkezdődött a mozgolódás. 0:06:45.000,0:06:47.000 Rájöttek az emberek, hogy hamarosan 1950 lesz, 0:06:47.000,0:06:49.000 és nagy lehet. 0:06:49.000,0:06:52.000 (Nevetés) 0:06:52.000,0:06:55.000 1950-ben azonban semmi más nem érdekelte úgy az embereket, 0:06:55.000,0:06:58.000 mint az 1950. év. 0:06:58.000,0:07:01.000 (Nevetés) 0:07:01.000,0:07:03.000 Az emberek megszállottan járkáltak. 0:07:03.000,0:07:05.000 Egyfolytában azokról a dolgokról beszéltek, 0:07:05.000,0:07:08.000 mit csináltak 1950-ben, 0:07:08.000,0:07:11.000 mit fognak csinálni 1950-ben, 0:07:11.000,0:07:16.000 az álmokról, amelyeket meg szeretnének valósítani 1950-ben. 0:07:16.000,0:07:18.000 1950 valójában annyira szenzációs volt, 0:07:18.000,0:07:20.000 hogy évekkel utána is, 0:07:20.000,0:07:23.000 az emberek egyfolytában az akkor történt csodálatos dolgokról beszéltek, 0:07:23.000,0:07:25.000 '51-ben, '52-ben, '53-ban. 0:07:25.000,0:07:27.000 Végül 1954-ben, 0:07:27.000,0:07:29.000 felébred valaki és rájött, hogy 0:07:29.000,0:07:33.000 1950 valahogyan... elmúlt. 0:07:33.000,0:07:35.000 (Nevetés) 0:07:35.000,0:07:37.000 És egy csapásra a buborék kipukkant. 0:07:37.000,0:07:39.000 (Nevetés) 0:07:39.000,0:07:41.000 És 1950 története 0:07:41.000,0:07:43.000 megegyezik valamennyi rendelkezésünkre álló év történetével, 0:07:43.000,0:07:46.000 egy kis csavarral, hiszen megvannak ezek a szép ábráink. 0:07:46.000,0:07:49.000 És mivel megvannak ezek a szép ábrák, meg tudunk mérni dolgokat. 0:07:49.000,0:07:51.000 Azt mondhatjuk, "Nézzük, milyen gyorsan pukkant ki a buborék?" 0:07:51.000,0:07:54.000 És kiderül, ezt egészen pontosan meg tudjuk mérni. 0:07:54.000,0:07:57.000 Egyenleteket írtunk, grafikonokat állítottunk fel, 0:07:57.000,0:07:59.000 és a végső eredmény az, hogy 0:07:59.000,0:08:02.000 a buborék egyre gyorsabban és gyorsabban pukkan ki, 0:08:02.000,0:08:04.000 ahogy telnek az egyes évek. 0:08:04.000,0:08:09.000 Egyre gyorsabban veszítjük el a múlttal kapcsolatos érdeklődésünket. 0:08:09.000,0:08:11.000 JM: Most pedig egy kis karrier tanács. 0:08:11.000,0:08:13.000 Mindazok, akik híresek akarnak lenni, 0:08:13.000,0:08:15.000 tanulhatnak a 25 leghíresebb politikai szereplőtől, 0:08:15.000,0:08:17.000 szerzőtől, színésztől és így tovább. 0:08:17.000,0:08:20.000 Szóval ha idejekorán híres akarsz lenni, színésznek kell menned, 0:08:20.000,0:08:22.000 mert a hírnév a 20-as éveid végén kezd el növekedni -- 0:08:22.000,0:08:24.000 még fiatal vagy, ez igazán nagyszerű. 0:08:24.000,0:08:26.000 Ha tudsz egy kicsit tovább várni, szerzőnek kell menned, 0:08:26.000,0:08:28.000 mivel akkor igen nagy magasságokba emelkedhetsz, 0:08:28.000,0:08:30.000 mint Mark Twain például: elképesztően híres. 0:08:30.000,0:08:32.000 Ha viszont a legmagasabbra akarsz jutni, 0:08:32.000,0:08:34.000 késleltetned kell az önmegvalósítást, és 0:08:34.000,0:08:36.000 természetesen, politikusnak kell állnod. 0:08:36.000,0:08:38.000 Így az 50-es éveid végére kezdesz híres lenni, 0:08:38.000,0:08:40.000 és csak aztán leszel nagyon, nagyon híres. 0:08:40.000,0:08:43.000 A tudósok is akkor kezdenek híressé válni, amikor idősebbek lesznek. 0:08:43.000,0:08:45.000 Mint például a biológusok és fizikusok, 0:08:45.000,0:08:47.000 akik csaknem olyan híressé válhatnak, mint a színészek. 0:08:47.000,0:08:50.000 Egy hibát nem szabad elkövetned: matematikusnak menned. 0:08:50.000,0:08:52.000 (Nevetés) 0:08:52.000,0:08:54.000 Ha így döntesz, 0:08:54.000,0:08:57.000 azt gondolhatod, "Oh, remek. A legjobbat fogom teljesíteni, amikor a 20-as éveimben járok." 0:08:57.000,0:08:59.000 De tudod mit? Senkit nem fog érdekelni. 0:08:59.000,0:09:02.000 (Nevetés) 0:09:02.000,0:09:04.000 ELA: Vannak még jobban kijózanító megjegyzések 0:09:04.000,0:09:06.000 az n-gramok között. 0:09:06.000,0:09:08.000 Itt van például Marc Chagall pályája, 0:09:08.000,0:09:10.000 egy 1887-ben született művészé. 0:09:10.000,0:09:13.000 Ez úgy néz ki, mint egy híres ember átlagos pályája. 0:09:13.000,0:09:17.000 Egyre jobban és jobban híres lett, 0:09:17.000,0:09:19.000 kivéve, ha Németországban nézed. 0:09:19.000,0:09:21.000 Ha Németországban nézed, valami egészen bizarr dolgot láthatsz, 0:09:21.000,0:09:23.000 valamit, amit szinte még sosem láttál, 0:09:23.000,0:09:25.000 nevezetesen, hogy hihetetlen híres lesz, 0:09:25.000,0:09:27.000 aztán egyszercsak bezuhan, 0:09:27.000,0:09:30.000 egy mélypontra érve 1933 és 1945 között, 0:09:30.000,0:09:33.000 mielőtt ismét visszapattanna. 0:09:33.000,0:09:35.000 Természetesen, amit látunk 0:09:35.000,0:09:38.000 az az a tény, hogy Marc Chagall egy zsidó művész volt 0:09:38.000,0:09:40.000 a náci Németországban. 0:09:40.000,0:09:42.000 Ezek a jelek 0:09:42.000,0:09:44.000 igazából annyira erősek, hogy 0:09:44.000,0:09:47.000 nem kell tudnunk, hogy valaki cenzorálva volt. 0:09:47.000,0:09:49.000 Valójában ki tudjuk találni, 0:09:49.000,0:09:51.000 egészen egyszerű jelzőrendszer segítségével. 0:09:51.000,0:09:53.000 Itt egy egyszerű módszer minderre. 0:09:53.000,0:09:55.000 Egy ésszerű várakozás, hogy 0:09:55.000,0:09:57.000 egy adott időszakban valakinek a hírneve 0:09:57.000,0:09:59.000 a korábbi és a későbbi hírnevének 0:09:59.000,0:10:01.000 az átlaga. 0:10:01.000,0:10:03.000 Ez az amit várnánk. 0:10:03.000,0:10:06.000 És ezt összehasonlítjuk az általunk megfigyelt hírnévvel. 0:10:06.000,0:10:08.000 Aztán elosztjuk egyiket a másikkal, hogy 0:10:08.000,0:10:10.000 előállítsunk valamit, amit elnyomási indexnek hívunk. 0:10:10.000,0:10:13.000 Ha az elnyomási index nagyon, nagyon, nagyon alacsony, 0:10:13.000,0:10:15.000 akkor nagyon el lehetsz nyomva. 0:10:15.000,0:10:18.000 Ha nagyon nagy, akkor lehet, hogy propaganda áldozata vagy. 0:10:19.000,0:10:21.000 Igazából meg tudod nézni 0:10:21.000,0:10:24.000 az elnyomási index eloszlását a teljes populáción. 0:10:24.000,0:10:26.000 Így például, itt -- 0:10:26.000,0:10:28.000 ez 5000 ember elnyomási indexe, melyet 0:10:28.000,0:10:30.000 olyan angol nyelvű könyvekből választottunk ki, ahol nincs tudomásunk elnyomásról -- 0:10:30.000,0:10:32.000 így kellene kinéznie, nagyjából az egy körül csoportosulva. 0:10:32.000,0:10:34.000 Amire számítasz az az általad megfigyelt. 0:10:34.000,0:10:36.000 Ez a Németországban megfigyelhető eloszlás -- 0:10:36.000,0:10:38.000 nagyon különböző, a baloldalra tolódott. 0:10:38.000,0:10:41.000 Az emberek kétszer kevesebbszer beszéltek róla, mint kellett volna. 0:10:41.000,0:10:43.000 De sokkal fontosabb, hogy az eloszlás sokkal szélesebb. 0:10:43.000,0:10:46.000 Sokan vannak, akik az eloszlás bal szélén helyezkednek el, 0:10:46.000,0:10:49.000 akikről 10-szer kevesebbszer beszéltek, mint ahogy kellett volna. 0:10:49.000,0:10:51.000 De aztán sokan vannak a jobb szélén, 0:10:51.000,0:10:53.000 akik feltehetően propaganda áldozatai. 0:10:53.000,0:10:56.000 Ez a kép jól illusztrálja a könyvekben megjelenő cenzúrát. 0:10:56.000,0:10:58.000 ELA: Kulturonómia, 0:10:58.000,0:11:00.000 így hívjuk ezt a módszert. 0:11:00.000,0:11:02.000 Olyan, mint a genomika. 0:11:02.000,0:11:04.000 Azt leszámítva, hogy a genomika a biológia egyik lencséje, 0:11:04.000,0:11:07.000 melyen keresztül az emberi genom alapvető szekvenciáit vizsgáljuk. 0:11:07.000,0:11:09.000 A kulturonómia hasonló. 0:11:09.000,0:11:12.000 Egy hatalmas méretű adatgyűjtemény analizálásának eszköze, 0:11:12.000,0:11:14.000 amellyel az emberi kultúrát tanulmányozhatjuk. 0:11:14.000,0:11:16.000 Itt nem a genom lencséjén keresztül, hanem 0:11:16.000,0:11:19.000 a történelmi emlékek digitalizált darabjain keresztül. 0:11:19.000,0:11:21.000 A kulturonómia nagy előnye, hogy 0:11:21.000,0:11:23.000 bárki művelheti. 0:11:23.000,0:11:25.000 Miért teheti meg bárki? 0:11:25.000,0:11:27.000 Azért teheti, mivel három srác, 0:11:27.000,0:11:30.000 Jon Orwant, Matt Gray és Will Brockman a Google-nél 0:11:30.000,0:11:32.000 meglátta az Ngram Viewer prototípusát, 0:11:32.000,0:11:34.000 és azt mondta, "Ez vicces. 0:11:34.000,0:11:37.000 Az emberek számára elérhetővé kell tenni." 0:11:37.000,0:11:39.000 Így nagyjából 2 hét alatt -- a tanulmányunk megjelenése előtti 2 hétben -- 0:11:39.000,0:11:42.000 összerakták az Ngram Viewer publikus verziójának kódját. 0:11:42.000,0:11:45.000 És így bármilyen szót vagy kifejezést be tudsz táplálni, ami érdekel 0:11:45.000,0:11:47.000 és azonnal láthatod az n-gramját -- 0:11:47.000,0:11:49.000 még példákat is mutat a különféle könyvekből, 0:11:49.000,0:11:51.000 melyekben az n-gramod megtalálható. 0:11:51.000,0:11:53.000 JM: Az első napon több mint egymilliószor használták, 0:11:53.000,0:11:55.000 és ez a legjobb az összes keresés közül. 0:11:55.000,0:11:58.000 Az emberek a legjobbak akarnak lenni, a legjobban előre haladni. 0:11:58.000,0:12:01.000 De kiderült, hogy a 18. században az emberek egyáltalán nem törődtek ezzel. 0:12:01.000,0:12:04.000 Nem a legjobbak (best) akartak lenni, hanem a legjobbak (beft). 0:12:04.000,0:12:07.000 Természetesen ami történt az csak egy hiba. 0:12:07.000,0:12:09.000 Nem egy szándékos középszerűség, 0:12:09.000,0:12:12.000 hanem csak az, hogy az S betűt régen másképp írták, kicsit hasonlóan, mint az F-et. 0:12:12.000,0:12:15.000 A Google természetesen nem jött rá időben, 0:12:15.000,0:12:18.000 így ezt jeleztük is az általunk írt tudományos cikkünkben. 0:12:18.000,0:12:20.000 De igazából ez csak egy figyelmeztetés, hogy 0:12:20.000,0:12:22.000 habár igen szórakoztató amikor ezeket 0:12:22.000,0:12:24.000 a grafikonokat értelmezed, nagyon óvatosnak kell lenned, 0:12:24.000,0:12:27.000 és el kell fogadnod a tudomány alapfeltételeit. 0:12:27.000,0:12:30.000 ELA: Az emberek a legkülönfélébb célokra használják. 0:12:30.000,0:12:37.000 (Nevetés) 0:12:37.000,0:12:39.000 Igazából, nem is kell beszélnünk, 0:12:39.000,0:12:42.000 csak megmutatjuk az összes diát és csendben maradunk. 0:12:42.000,0:12:45.000 Ez a személy a frusztráció történelmére volt kíváncsi. 0:12:45.000,0:12:48.000 Különféle frusztrációk vannak. 0:12:48.000,0:12:51.000 Ha levágod a lábujjad, az egy A-s "argh". 0:12:51.000,0:12:53.000 Ha a Földet elpusztítják a Vogonok, 0:12:53.000,0:12:55.000 hogy helyet adjanak egy csillagközi kerülőútnak, 0:12:55.000,0:12:57.000 az egy 8 A-s "aaaaaaaargh". 0:12:57.000,0:12:59.000 Ez a személy valamennyi "argh"-ot tanulmányozza, 0:12:59.000,0:13:01.000 egytől nyolc A-ig. 0:13:01.000,0:13:03.000 És kiderül, hogy 0:13:03.000,0:13:05.000 a legkevésbé gyakori "argh" 0:13:05.000,0:13:08.000 természetesen a legjobban frusztráló dolgokhoz kapcsolódik -- 0:13:08.000,0:13:11.000 leszámítva, furcsán, a 80-as évek elejét. 0:13:11.000,0:13:13.000 Szerintünk ez valahogy összefügg Reagennel. 0:13:13.000,0:13:15.000 (Nevetés) 0:13:15.000,0:13:18.000 JM: Sokféle felhasználási módja van ezeknek az adatoknak, 0:13:18.000,0:13:21.000 de a lényeg, hogy a történelmi emlékek digitalizálva lettek. 0:13:21.000,0:13:23.000 A Google elkezdett 15 millió könyvet bedigitalizálni. 0:13:23.000,0:13:25.000 Ez 12 százaléka a valaha megjelent összes könyvnek. 0:13:25.000,0:13:28.000 Az emberi kultúra egy méretes darabja. 0:13:28.000,0:13:31.000 Sokkal több van a kultúrában: kéziratok, újságok, 0:13:31.000,0:13:33.000 vannak dolgok, amelyek nem szövegek, mint a műalkotások és festmények. 0:13:33.000,0:13:35.000 Hamarosan mindezek a számítógépünkön lesznek, 0:13:35.000,0:13:37.000 számítógépeken világszerte. 0:13:37.000,0:13:40.000 És amikor ez megtörténik, megváltozik a módszer, 0:13:40.000,0:13:42.000 ahogy korábban a múltunkat, a jelenünket és emberi kultúránkat vizsgáltuk. 0:13:42.000,0:13:44.000 Köszönjük szépen. 0:13:44.000,0:13:47.000 (Taps)