< Return to Video

Amit 5 millió könyvből tanultunk

  • 0:00 - 0:02
    Erez Lieberman Aiden: Mindenki tudja,
  • 0:02 - 0:05
    hogy egy kép felér ezer szóval.
  • 0:07 - 0:09
    De mi a Harvardon
  • 0:09 - 0:12
    elgondolkoztunk, hogy ez tényleg így van-e.
  • 0:12 - 0:14
    (Nevetés)
  • 0:14 - 0:18
    Így összeraktunk egy szakértőkből álló csapatot,
  • 0:18 - 0:20
    Harvardról, MIT-ről
  • 0:20 - 0:23
    az American Heritage Dictionarytől, az Encyclopedia Britannicától
  • 0:23 - 0:25
    és még a büszke szponzorunktól is,
  • 0:25 - 0:28
    a Google-től.
  • 0:28 - 0:30
    És rágódtunk rajta
  • 0:30 - 0:32
    nagyjából négy évig.
  • 0:32 - 0:37
    És egy ijesztő megállapításra jutottunk.
  • 0:37 - 0:40
    Hölgyeim és uraim, egy kép nem ér fel ezer szóval.
  • 0:40 - 0:42
    Valójában, találtunk néhány képet
  • 0:42 - 0:47
    amely 500 milliárd szót ér.
  • 0:47 - 0:49
    Jean-Baptiste Michel: De hogyan jutottunk erre a következtetésre?
  • 0:49 - 0:51
    Erez és én olyan módszereket kerestünk,
  • 0:51 - 0:53
    amelyekből egy áttekintő képet kaphatunk az emberi kultúráról
  • 0:53 - 0:56
    és az emberi történelemről, időbeli változásáról.
  • 0:56 - 0:58
    Rengeteg könyvet írtak az évek során.
  • 0:58 - 1:00
    Így mi arra gondoltunk, legjobban úgy tanulhatunk belőlük,
  • 1:00 - 1:02
    ha ezt a több millió könyvet elolvassuk.
  • 1:02 - 1:05
    Természetesen, ha lenne arra egy skála, ez mennyire döbbenetes,
  • 1:05 - 1:08
    akkor ez extrém, extrém módon magas lenne.
  • 1:08 - 1:10
    A probléma viszont az, hogy van egy X tengelye is,
  • 1:10 - 1:12
    ami a praktikusság tengelye.
  • 1:12 - 1:14
    Ez nagyon, nagyon alacsony.
  • 1:14 - 1:17
    (Taps)
  • 1:17 - 1:20
    Manapság hajlamosak az emberek egy másfajta megközelítést használni:
  • 1:20 - 1:22
    vesznek néhány forrást és nagyon alaposan elolvassák.
  • 1:22 - 1:24
    Ez rendkívül hasznos, de nem annyira döbbenetes.
  • 1:24 - 1:27
    Amit igazán szeretnél
  • 1:27 - 1:30
    az az, hogy eljuss az ábra döbbenetes, mégis hasznos részére.
  • 1:30 - 1:33
    Kiderült, van egy vállalat, amely tudja a megoldást: a Google,
  • 1:33 - 1:35
    mely néhány évvel korábban elkezdett egy digitalizálási projektet,
  • 1:35 - 1:37
    ami lehetővé teheti ezt a megközelítést.
  • 1:37 - 1:39
    Könyvek millióit digitalizálták.
  • 1:39 - 1:42
    Mindez azt jelenti, hogy számítási metódusokkal
  • 1:42 - 1:44
    egy gombnyomásra elolvashatóak ezek a könyvek.
  • 1:44 - 1:47
    Ez nagyon hasznos és igazán döbbenetes.
  • 1:48 - 1:50
    ELA: Hadd beszéljek egy kicsit arról, honnan is jönnek ezek a könyvek.
  • 1:50 - 1:53
    Emberi emlékezet óta vannak szerzők.
  • 1:53 - 1:56
    Ezek a szerzők arra törekedtek, hogy könyveket írjanak.
  • 1:56 - 1:58
    És mindez nagyságrendekkel könnyebbé vált
  • 1:58 - 2:00
    a nyomtatott sajtó néhány századdal ezelőtti fejlődésével.
  • 2:00 - 2:03
    A szerzők azóta sikeresen,
  • 2:03 - 2:05
    129 millió különböző alkalommal
  • 2:05 - 2:07
    publikáltak könyvet.
  • 2:07 - 2:09
    Ha ezek a könyvek nem tűntek el a történelemben,
  • 2:09 - 2:11
    akkor valahol megtalálhatóak egy könyvtárban,
  • 2:11 - 2:14
    és a legtöbbjüket a Google kikölcsönözte
  • 2:14 - 2:16
    és digitalizálta --
  • 2:16 - 2:18
    a mai napig 15 millió könyvet.
  • 2:18 - 2:21
    Amikor a Google bedigitalizál egy könyvet, egy elég szép formátumba rakja.
  • 2:21 - 2:23
    Szóval megvan az adat és megvan a metaadat.
  • 2:23 - 2:26
    Van információnk arról, hol publikálták,
  • 2:26 - 2:28
    ki volt a szerző, mikor publikálták.
  • 2:28 - 2:31
    Mi azt csináljuk, hogy átnézzük ezeket a rekordokat,
  • 2:31 - 2:35
    és kizárjuk azokat, amelyek nem a legjobb minőségűek.
  • 2:35 - 2:37
    A végén maradt egy
  • 2:37 - 2:40
    ötmillió könyvből álló kollekciónk,
  • 2:40 - 2:43
    500 milliárd szó,
  • 2:43 - 2:45
    egy ezerszer hosszabb karakterlánc,
  • 2:45 - 2:48
    mint az emberi genom --
  • 2:48 - 2:50
    egy szöveg, mely leírva
  • 2:50 - 2:52
    elérne a Holdig és vissza
  • 2:52 - 2:54
    10-szer --
  • 2:54 - 2:58
    a kulturális genom egy igazi darabja.
  • 2:58 - 3:00
    Természetesen, amikor
  • 3:00 - 3:03
    egy ilyen elképesztő túlzással találkozunk...
  • 3:03 - 3:05
    (Nevetés)
  • 3:05 - 3:08
    ugyanazt tesszük, mint bármely magára valamit is adó
  • 3:08 - 3:11
    kutató tenne.
  • 3:11 - 3:13
    Vettünk egy oldalt az XKCD-ről,
  • 3:13 - 3:15
    és azt mondtuk, "Egy kis helyet!
  • 3:15 - 3:17
    Kipróbáljuk a tudományt."
  • 3:17 - 3:19
    (Nevetés)
  • 3:19 - 3:21
    JM: Természetesen, gondoltuk mi,
  • 3:21 - 3:23
    elsőként adjuk oda az adatokat embereknek,
  • 3:23 - 3:25
    akik tanulmányozzák.
  • 3:25 - 3:27
    Arra gondoltunk, milyen adatot adhatunk oda?
  • 3:27 - 3:29
    Természetesen, veheted a könyveket
  • 3:29 - 3:31
    és kiadhatod mind az ötmillió könyv teljes szövegét.
  • 3:31 - 3:33
    Nos, a Google és különösképpen Jon Orwant
  • 3:33 - 3:35
    elmagyarázott nekünk egy kis egyenletet, amelyet meg kellene tanulnunk.
  • 3:35 - 3:38
    Ha van 5 millió, azaz 5 millió szerződ
  • 3:38 - 3:41
    és 5 millió felperes, az egy egész szép peres eljárás.
  • 3:41 - 3:43
    Így, annak ellenére, hogy az igazán, igazán döbbenetes lenne,
  • 3:43 - 3:46
    ismét csak, hihetetlenül, hihetetlenül haszontalan lenne.
  • 3:46 - 3:48
    (Nevetés)
  • 3:48 - 3:50
    Mi eléggé korlátoltak vagyunk,
  • 3:50 - 3:53
    és vettük az elég praktikus megközelítést, amely valamivel kevésbé döbbenetes.
  • 3:53 - 3:55
    Azt mondtuk, ahelyett, hogy kiadnánk a teljes szöveget,
  • 3:55 - 3:57
    statisztikákat fogunk kiadni a könyvekről.
  • 3:57 - 3:59
    Vegyünk egy példát: "A boldogság egy fénysugara."
  • 3:59 - 4:01
    Négy szó. Négy-gramnak hívjuk.
  • 4:01 - 4:03
    Meg fogjuk mondani, hogy egy bizonyos négy-gram hányszor
  • 4:03 - 4:05
    bukkant fel a könyvekben 1801-ben, 1802-ben, 1803-ban,
  • 4:05 - 4:07
    egészen 2008-ig.
  • 4:07 - 4:09
    Kapunk egy idősort arról, hogy
  • 4:09 - 4:11
    milyen gyakran használták ezt a bizonyos mondatot az idők során.
  • 4:11 - 4:14
    Megcsináljuk ezt minden szóra és kifejezésre, amely azokban a könyvekben előfordul,
  • 4:14 - 4:17
    amely egy 2 milliárd sorból álló halmazt ad,
  • 4:17 - 4:19
    amely elmondja, miként változott a kultúra.
  • 4:19 - 4:21
    ELA: Ezt a kétmilliárd sort
  • 4:21 - 4:23
    2 milliárd n-gramnak hívjuk.
  • 4:23 - 4:25
    Mit mondanak nekünk?
  • 4:25 - 4:27
    Nos, az egyes n-gramok a kulturális trendeket mérik.
  • 4:27 - 4:29
    Hadd mondjak egy példát!
  • 4:29 - 4:31
    Tegyük fel, hogy jómódban élek,
  • 4:31 - 4:33
    aztán holnap el akarom mondani, milyen jól éltem.
  • 4:33 - 4:36
    És azt mondhatom, "Tegnap jól éltem (throve)."
  • 4:36 - 4:39
    Másféleképpen, azt mondhatom, "Tegnap jól éltem (thrived)."
  • 4:39 - 4:42
    Nos, melyiket kellene használnom?
  • 4:42 - 4:44
    Honnan lehet tudni?
  • 4:44 - 4:46
    Nagyjából 6 hónappal ezelőtt,
  • 4:46 - 4:48
    a tudomány akkori állása szerint
  • 4:48 - 4:50
    megtehetted volna például,
  • 4:50 - 4:52
    hogy felkeresed az alábbi furcsa hajú pszichológust,
  • 4:52 - 4:54
    és azt mondod,
  • 4:54 - 4:57
    "Steve, a rendhagyó igék szakértője vagy.
  • 4:57 - 4:59
    Mit kéne tennem?"
  • 4:59 - 5:01
    És azt mondta volna, "Nos, a legtöbb ember a 'thrived'-ot használja,
  • 5:01 - 5:04
    de néhányan a 'throve'-ot."
  • 5:04 - 5:06
    És többé-kevésbé azt is tudnád,
  • 5:06 - 5:09
    ha 200 évet visszamész az időben,
  • 5:09 - 5:12
    és megkérdezed az alábbi, szintén furcsa hajú államférfit,
  • 5:12 - 5:15
    (Nevetés)
  • 5:15 - 5:17
    "Tom, melyiket kellene használnom?"
  • 5:17 - 5:19
    Azt mondaná, "Nos, az én időmben a legtöbb ember a 'throve'-ot,
  • 5:19 - 5:22
    de néhányan a 'thrived'-ot."
  • 5:22 - 5:24
    Amit most meg fogok mutatni azok nyers adatok.
  • 5:24 - 5:28
    Két sort ebből a kétmilliárdos halmazból.
  • 5:28 - 5:30
    Az ábrán a "thrive" és a "throve"
  • 5:30 - 5:33
    előfordulási gyakorisága látható az évek során.
  • 5:34 - 5:36
    Nos, ez csak kettő
  • 5:36 - 5:39
    a kétmilliárd sorból.
  • 5:39 - 5:41
    Az egész adathalmaz
  • 5:41 - 5:44
    kétmilliárdszor döbbenetesebb, mint ez a dia.
  • 5:44 - 5:46
    (Nevetés)
  • 5:46 - 5:50
    (Taps)
  • 5:50 - 5:52
    JM: Számtalan más kép van, amely felér 500 milliárd szóval.
  • 5:52 - 5:54
    Például ez.
  • 5:54 - 5:56
    Ha csupán az influenzát vesszük,
  • 5:56 - 5:58
    kiugrásokat fogunk látni azokra az időszakokra, ahol tudjuk, hogy
  • 5:58 - 6:01
    nagy influenza fertőzésekben haltak meg az emberek világszerte.
  • 6:01 - 6:04
    ELA: Ha még mindig nem lennének meggyőzve,
  • 6:04 - 6:06
    a tengerszint emelkedik,
  • 6:06 - 6:09
    akárcsak a légkör CO2 tartalma és a globális hőmérséklet.
  • 6:09 - 6:12
    JM: Vagy akár megnézhetitek ezt a bizonyos n-gramot,
  • 6:12 - 6:15
    melyben Nietzsche szerint Isten nem halott,
  • 6:15 - 6:18
    habár azzal egyetértenének, hogy jobb publicistára lenne szüksége.
  • 6:18 - 6:20
    (Nevetés)
  • 6:20 - 6:23
    ELA: Egészen szép absztrakt koncepciókat kaphatsz ilyen dolgokkal.
  • 6:23 - 6:25
    Például, hadd meséljek az 1950. év
  • 6:25 - 6:27
    történelméről!
  • 6:27 - 6:29
    Nagy valószínűséggel a történelem túlnyomó részében
  • 6:29 - 6:31
    senkit sem érdekelt 1950.
  • 6:31 - 6:33
    1700-ban, 1800-ban, 1900-ban
  • 6:33 - 6:36
    senkit sem érdekelt.
  • 6:37 - 6:39
    A 30-as és a 40-es években
  • 6:39 - 6:41
    senkit sem érdekelt.
  • 6:41 - 6:43
    A 40-es évek közepén hirtelen
  • 6:43 - 6:45
    elkezdődött a mozgolódás.
  • 6:45 - 6:47
    Rájöttek az emberek, hogy hamarosan 1950 lesz,
  • 6:47 - 6:49
    és nagy lehet.
  • 6:49 - 6:52
    (Nevetés)
  • 6:52 - 6:55
    1950-ben azonban semmi más nem érdekelte úgy az embereket,
  • 6:55 - 6:58
    mint az 1950. év.
  • 6:58 - 7:01
    (Nevetés)
  • 7:01 - 7:03
    Az emberek megszállottan járkáltak.
  • 7:03 - 7:05
    Egyfolytában azokról a dolgokról beszéltek,
  • 7:05 - 7:08
    mit csináltak 1950-ben,
  • 7:08 - 7:11
    mit fognak csinálni 1950-ben,
  • 7:11 - 7:16
    az álmokról, amelyeket meg szeretnének valósítani 1950-ben.
  • 7:16 - 7:18
    1950 valójában annyira szenzációs volt,
  • 7:18 - 7:20
    hogy évekkel utána is,
  • 7:20 - 7:23
    az emberek egyfolytában az akkor történt csodálatos dolgokról beszéltek,
  • 7:23 - 7:25
    '51-ben, '52-ben, '53-ban.
  • 7:25 - 7:27
    Végül 1954-ben,
  • 7:27 - 7:29
    felébred valaki és rájött, hogy
  • 7:29 - 7:33
    1950 valahogyan... elmúlt.
  • 7:33 - 7:35
    (Nevetés)
  • 7:35 - 7:37
    És egy csapásra a buborék kipukkant.
  • 7:37 - 7:39
    (Nevetés)
  • 7:39 - 7:41
    És 1950 története
  • 7:41 - 7:43
    megegyezik valamennyi rendelkezésünkre álló év történetével,
  • 7:43 - 7:46
    egy kis csavarral, hiszen megvannak ezek a szép ábráink.
  • 7:46 - 7:49
    És mivel megvannak ezek a szép ábrák, meg tudunk mérni dolgokat.
  • 7:49 - 7:51
    Azt mondhatjuk, "Nézzük, milyen gyorsan pukkant ki a buborék?"
  • 7:51 - 7:54
    És kiderül, ezt egészen pontosan meg tudjuk mérni.
  • 7:54 - 7:57
    Egyenleteket írtunk, grafikonokat állítottunk fel,
  • 7:57 - 7:59
    és a végső eredmény az, hogy
  • 7:59 - 8:02
    a buborék egyre gyorsabban és gyorsabban pukkan ki,
  • 8:02 - 8:04
    ahogy telnek az egyes évek.
  • 8:04 - 8:09
    Egyre gyorsabban veszítjük el a múlttal kapcsolatos érdeklődésünket.
  • 8:09 - 8:11
    JM: Most pedig egy kis karrier tanács.
  • 8:11 - 8:13
    Mindazok, akik híresek akarnak lenni,
  • 8:13 - 8:15
    tanulhatnak a 25 leghíresebb politikai szereplőtől,
  • 8:15 - 8:17
    szerzőtől, színésztől és így tovább.
  • 8:17 - 8:20
    Szóval ha idejekorán híres akarsz lenni, színésznek kell menned,
  • 8:20 - 8:22
    mert a hírnév a 20-as éveid végén kezd el növekedni --
  • 8:22 - 8:24
    még fiatal vagy, ez igazán nagyszerű.
  • 8:24 - 8:26
    Ha tudsz egy kicsit tovább várni, szerzőnek kell menned,
  • 8:26 - 8:28
    mivel akkor igen nagy magasságokba emelkedhetsz,
  • 8:28 - 8:30
    mint Mark Twain például: elképesztően híres.
  • 8:30 - 8:32
    Ha viszont a legmagasabbra akarsz jutni,
  • 8:32 - 8:34
    késleltetned kell az önmegvalósítást, és
  • 8:34 - 8:36
    természetesen, politikusnak kell állnod.
  • 8:36 - 8:38
    Így az 50-es éveid végére kezdesz híres lenni,
  • 8:38 - 8:40
    és csak aztán leszel nagyon, nagyon híres.
  • 8:40 - 8:43
    A tudósok is akkor kezdenek híressé válni, amikor idősebbek lesznek.
  • 8:43 - 8:45
    Mint például a biológusok és fizikusok,
  • 8:45 - 8:47
    akik csaknem olyan híressé válhatnak, mint a színészek.
  • 8:47 - 8:50
    Egy hibát nem szabad elkövetned: matematikusnak menned.
  • 8:50 - 8:52
    (Nevetés)
  • 8:52 - 8:54
    Ha így döntesz,
  • 8:54 - 8:57
    azt gondolhatod, "Oh, remek. A legjobbat fogom teljesíteni, amikor a 20-as éveimben járok."
  • 8:57 - 8:59
    De tudod mit? Senkit nem fog érdekelni.
  • 8:59 - 9:02
    (Nevetés)
  • 9:02 - 9:04
    ELA: Vannak még jobban kijózanító megjegyzések
  • 9:04 - 9:06
    az n-gramok között.
  • 9:06 - 9:08
    Itt van például Marc Chagall pályája,
  • 9:08 - 9:10
    egy 1887-ben született művészé.
  • 9:10 - 9:13
    Ez úgy néz ki, mint egy híres ember átlagos pályája.
  • 9:13 - 9:17
    Egyre jobban és jobban híres lett,
  • 9:17 - 9:19
    kivéve, ha Németországban nézed.
  • 9:19 - 9:21
    Ha Németországban nézed, valami egészen bizarr dolgot láthatsz,
  • 9:21 - 9:23
    valamit, amit szinte még sosem láttál,
  • 9:23 - 9:25
    nevezetesen, hogy hihetetlen híres lesz,
  • 9:25 - 9:27
    aztán egyszercsak bezuhan,
  • 9:27 - 9:30
    egy mélypontra érve 1933 és 1945 között,
  • 9:30 - 9:33
    mielőtt ismét visszapattanna.
  • 9:33 - 9:35
    Természetesen, amit látunk
  • 9:35 - 9:38
    az az a tény, hogy Marc Chagall egy zsidó művész volt
  • 9:38 - 9:40
    a náci Németországban.
  • 9:40 - 9:42
    Ezek a jelek
  • 9:42 - 9:44
    igazából annyira erősek, hogy
  • 9:44 - 9:47
    nem kell tudnunk, hogy valaki cenzorálva volt.
  • 9:47 - 9:49
    Valójában ki tudjuk találni,
  • 9:49 - 9:51
    egészen egyszerű jelzőrendszer segítségével.
  • 9:51 - 9:53
    Itt egy egyszerű módszer minderre.
  • 9:53 - 9:55
    Egy ésszerű várakozás, hogy
  • 9:55 - 9:57
    egy adott időszakban valakinek a hírneve
  • 9:57 - 9:59
    a korábbi és a későbbi hírnevének
  • 9:59 - 10:01
    az átlaga.
  • 10:01 - 10:03
    Ez az amit várnánk.
  • 10:03 - 10:06
    És ezt összehasonlítjuk az általunk megfigyelt hírnévvel.
  • 10:06 - 10:08
    Aztán elosztjuk egyiket a másikkal, hogy
  • 10:08 - 10:10
    előállítsunk valamit, amit elnyomási indexnek hívunk.
  • 10:10 - 10:13
    Ha az elnyomási index nagyon, nagyon, nagyon alacsony,
  • 10:13 - 10:15
    akkor nagyon el lehetsz nyomva.
  • 10:15 - 10:18
    Ha nagyon nagy, akkor lehet, hogy propaganda áldozata vagy.
  • 10:19 - 10:21
    Igazából meg tudod nézni
  • 10:21 - 10:24
    az elnyomási index eloszlását a teljes populáción.
  • 10:24 - 10:26
    Így például, itt --
  • 10:26 - 10:28
    ez 5000 ember elnyomási indexe, melyet
  • 10:28 - 10:30
    olyan angol nyelvű könyvekből választottunk ki, ahol nincs tudomásunk elnyomásról --
  • 10:30 - 10:32
    így kellene kinéznie, nagyjából az egy körül csoportosulva.
  • 10:32 - 10:34
    Amire számítasz az az általad megfigyelt.
  • 10:34 - 10:36
    Ez a Németországban megfigyelhető eloszlás --
  • 10:36 - 10:38
    nagyon különböző, a baloldalra tolódott.
  • 10:38 - 10:41
    Az emberek kétszer kevesebbszer beszéltek róla, mint kellett volna.
  • 10:41 - 10:43
    De sokkal fontosabb, hogy az eloszlás sokkal szélesebb.
  • 10:43 - 10:46
    Sokan vannak, akik az eloszlás bal szélén helyezkednek el,
  • 10:46 - 10:49
    akikről 10-szer kevesebbszer beszéltek, mint ahogy kellett volna.
  • 10:49 - 10:51
    De aztán sokan vannak a jobb szélén,
  • 10:51 - 10:53
    akik feltehetően propaganda áldozatai.
  • 10:53 - 10:56
    Ez a kép jól illusztrálja a könyvekben megjelenő cenzúrát.
  • 10:56 - 10:58
    ELA: Kulturonómia,
  • 10:58 - 11:00
    így hívjuk ezt a módszert.
  • 11:00 - 11:02
    Olyan, mint a genomika.
  • 11:02 - 11:04
    Azt leszámítva, hogy a genomika a biológia egyik lencséje,
  • 11:04 - 11:07
    melyen keresztül az emberi genom alapvető szekvenciáit vizsgáljuk.
  • 11:07 - 11:09
    A kulturonómia hasonló.
  • 11:09 - 11:12
    Egy hatalmas méretű adatgyűjtemény analizálásának eszköze,
  • 11:12 - 11:14
    amellyel az emberi kultúrát tanulmányozhatjuk.
  • 11:14 - 11:16
    Itt nem a genom lencséjén keresztül, hanem
  • 11:16 - 11:19
    a történelmi emlékek digitalizált darabjain keresztül.
  • 11:19 - 11:21
    A kulturonómia nagy előnye, hogy
  • 11:21 - 11:23
    bárki művelheti.
  • 11:23 - 11:25
    Miért teheti meg bárki?
  • 11:25 - 11:27
    Azért teheti, mivel három srác,
  • 11:27 - 11:30
    Jon Orwant, Matt Gray és Will Brockman a Google-nél
  • 11:30 - 11:32
    meglátta az Ngram Viewer prototípusát,
  • 11:32 - 11:34
    és azt mondta, "Ez vicces.
  • 11:34 - 11:37
    Az emberek számára elérhetővé kell tenni."
  • 11:37 - 11:39
    Így nagyjából 2 hét alatt -- a tanulmányunk megjelenése előtti 2 hétben --
  • 11:39 - 11:42
    összerakták az Ngram Viewer publikus verziójának kódját.
  • 11:42 - 11:45
    És így bármilyen szót vagy kifejezést be tudsz táplálni, ami érdekel
  • 11:45 - 11:47
    és azonnal láthatod az n-gramját --
  • 11:47 - 11:49
    még példákat is mutat a különféle könyvekből,
  • 11:49 - 11:51
    melyekben az n-gramod megtalálható.
  • 11:51 - 11:53
    JM: Az első napon több mint egymilliószor használták,
  • 11:53 - 11:55
    és ez a legjobb az összes keresés közül.
  • 11:55 - 11:58
    Az emberek a legjobbak akarnak lenni, a legjobban előre haladni.
  • 11:58 - 12:01
    De kiderült, hogy a 18. században az emberek egyáltalán nem törődtek ezzel.
  • 12:01 - 12:04
    Nem a legjobbak (best) akartak lenni, hanem a legjobbak (beft).
  • 12:04 - 12:07
    Természetesen ami történt az csak egy hiba.
  • 12:07 - 12:09
    Nem egy szándékos középszerűség,
  • 12:09 - 12:12
    hanem csak az, hogy az S betűt régen másképp írták, kicsit hasonlóan, mint az F-et.
  • 12:12 - 12:15
    A Google természetesen nem jött rá időben,
  • 12:15 - 12:18
    így ezt jeleztük is az általunk írt tudományos cikkünkben.
  • 12:18 - 12:20
    De igazából ez csak egy figyelmeztetés, hogy
  • 12:20 - 12:22
    habár igen szórakoztató amikor ezeket
  • 12:22 - 12:24
    a grafikonokat értelmezed, nagyon óvatosnak kell lenned,
  • 12:24 - 12:27
    és el kell fogadnod a tudomány alapfeltételeit.
  • 12:27 - 12:30
    ELA: Az emberek a legkülönfélébb célokra használják.
  • 12:30 - 12:37
    (Nevetés)
  • 12:37 - 12:39
    Igazából, nem is kell beszélnünk,
  • 12:39 - 12:42
    csak megmutatjuk az összes diát és csendben maradunk.
  • 12:42 - 12:45
    Ez a személy a frusztráció történelmére volt kíváncsi.
  • 12:45 - 12:48
    Különféle frusztrációk vannak.
  • 12:48 - 12:51
    Ha levágod a lábujjad, az egy A-s "argh".
  • 12:51 - 12:53
    Ha a Földet elpusztítják a Vogonok,
  • 12:53 - 12:55
    hogy helyet adjanak egy csillagközi kerülőútnak,
  • 12:55 - 12:57
    az egy 8 A-s "aaaaaaaargh".
  • 12:57 - 12:59
    Ez a személy valamennyi "argh"-ot tanulmányozza,
  • 12:59 - 13:01
    egytől nyolc A-ig.
  • 13:01 - 13:03
    És kiderül, hogy
  • 13:03 - 13:05
    a legkevésbé gyakori "argh"
  • 13:05 - 13:08
    természetesen a legjobban frusztráló dolgokhoz kapcsolódik --
  • 13:08 - 13:11
    leszámítva, furcsán, a 80-as évek elejét.
  • 13:11 - 13:13
    Szerintünk ez valahogy összefügg Reagennel.
  • 13:13 - 13:15
    (Nevetés)
  • 13:15 - 13:18
    JM: Sokféle felhasználási módja van ezeknek az adatoknak,
  • 13:18 - 13:21
    de a lényeg, hogy a történelmi emlékek digitalizálva lettek.
  • 13:21 - 13:23
    A Google elkezdett 15 millió könyvet bedigitalizálni.
  • 13:23 - 13:25
    Ez 12 százaléka a valaha megjelent összes könyvnek.
  • 13:25 - 13:28
    Az emberi kultúra egy méretes darabja.
  • 13:28 - 13:31
    Sokkal több van a kultúrában: kéziratok, újságok,
  • 13:31 - 13:33
    vannak dolgok, amelyek nem szövegek, mint a műalkotások és festmények.
  • 13:33 - 13:35
    Hamarosan mindezek a számítógépünkön lesznek,
  • 13:35 - 13:37
    számítógépeken világszerte.
  • 13:37 - 13:40
    És amikor ez megtörténik, megváltozik a módszer,
  • 13:40 - 13:42
    ahogy korábban a múltunkat, a jelenünket és emberi kultúránkat vizsgáltuk.
  • 13:42 - 13:44
    Köszönjük szépen.
  • 13:44 - 13:47
    (Taps)
Title:
Amit 5 millió könyvből tanultunk
Speaker:
Jean-Baptiste Michel + Erez Lieberman Aiden
Description:

Játszottál már a Google Labs Ngram Viewerével? Ez egy olyan addiktív eszköz, melynek segítségével szavakra és ötletekre kereshetsz rá az elmúlt évszázad 5 millió könyvét tartalmazó adatbázisban. Erez Lieberman Aiden és Jean-Baptiste Michel bemutatja nekünk, hogyan működik, valamint mutat néhány érdekes példát arra, mit tanulhatunk 500 milliárd szóból.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
13:48
Krisztian Lukacs added a translation

Hungarian subtitles

Revisions