0:00:00.000,0:00:02.000 Erez Lieberman Aiden: Svi znaju 0:00:02.000,0:00:05.000 da slika vrijedi tisuću riječi. 0:00:07.000,0:00:09.000 No, mi smo se na Harvardu 0:00:09.000,0:00:12.000 zapitali je li to stvarno istina. 0:00:12.000,0:00:14.000 (Smijeh) 0:00:14.000,0:00:18.000 Tako smo okupili tim stručnjaka, 0:00:18.000,0:00:20.000 koji obuhvaća ljude na Harvardu i MIT-u, 0:00:20.000,0:00:23.000 one koji rade na rječniku American Heritage i Encyclopediji Britannici, 0:00:23.000,0:00:25.000 čak i naše ponosne sponzore, 0:00:25.000,0:00:28.000 Google. 0:00:28.000,0:00:30.000 Razmišljali smo o tome 0:00:30.000,0:00:32.000 oko četiri godine 0:00:32.000,0:00:37.000 i došli smo do začuđujućeg zaključka. 0:00:37.000,0:00:40.000 Dame i gospodo, slika ne vrijedi tisuću riječi. 0:00:40.000,0:00:42.000 Čak smo pronašli neke slike 0:00:42.000,0:00:47.000 koje vrijede 500 milijardi riječi. 0:00:47.000,0:00:49.000 Jean-Baptiste Michel: Kako smo došlo do tog zaključka? 0:00:49.000,0:00:51.000 Erez i ja razmišljali smo o načinima 0:00:51.000,0:00:53.000 na koje bismo mogli steći općenitu sliku ljudske kulture 0:00:53.000,0:00:56.000 i ljudske povijesti: promjene kroz vrijeme. 0:00:56.000,0:00:58.000 Kroz vrijeme je zapravo napisano mnogo knjiga. 0:00:58.000,0:01:00.000 Stoga smo mislili kako je najbolji način da nešto naučimo iz njih 0:01:00.000,0:01:02.000 taj da pročitamo sve te milijune knjiga. 0:01:02.000,0:01:05.000 Naravno, ako postoji ljestvica za mjerenje koliko je to fenomenalno, 0:01:05.000,0:01:08.000 tako nešto mora biti rangirano vrlo, vrlo visoko. 0:01:08.000,0:01:10.000 Problem je što za to postoji os x 0:01:10.000,0:01:12.000 ili praktična os. 0:01:12.000,0:01:14.000 Na njoj se to nalazi vrlo, vrlo nisko. 0:01:14.000,0:01:17.000 (Pljesak) 0:01:17.000,0:01:20.000 Ljudi su skloni primjenjivanju alternativnog pristupa, 0:01:20.000,0:01:22.000 a to je da izaberu nekoliko izvora i njih pročitaju vrlo pažljivo. 0:01:22.000,0:01:24.000 To je vrlo praktično, ali nije baš fenomenalno. 0:01:24.000,0:01:27.000 Ono što zapravo želite 0:01:27.000,0:01:30.000 jest doći do dijela koji je i fenomenalan i praktičan. 0:01:30.000,0:01:33.000 Ispada da s druge strane rijeke postoji tvrtka koja se zove Google, 0:01:33.000,0:01:35.000 koja je prije nekoliko godina počela s projektom digitalizacije 0:01:35.000,0:01:37.000 koji bi mogao omogućiti upravo ovaj pristup. 0:01:37.000,0:01:39.000 Digitalizirali su milijune knjiga. 0:01:39.000,0:01:42.000 A to znači da se možemo služiti računalnim metodama 0:01:42.000,0:01:44.000 kako bismo sve knjige pročitali pritiskom na tipku. 0:01:44.000,0:01:47.000 To je vrlo praktično i poprilično fenomenalno. 0:01:48.000,0:01:50.000 ELA: Ispričat ću vam malo o tome odakle dolaze knjige. 0:01:50.000,0:01:53.000 Od pamtivijeka postoje autori. 0:01:53.000,0:01:56.000 Oni teže tome da pišu knjige. 0:01:56.000,0:01:58.000 To je postalo znatno lakše 0:01:58.000,0:02:00.000 s razvojem tehnike tiskanja prije nekoliko stoljeća. 0:02:00.000,0:02:03.000 Od tada su autori pobijedili 0:02:03.000,0:02:05.000 129 milijuna puta 0:02:05.000,0:02:07.000 i objavili su knjige. 0:02:07.000,0:02:09.000 Ako se te knjige s vremenom nisu izgubile, 0:02:09.000,0:02:11.000 znači da su negdje u nekoj knjižnici. 0:02:11.000,0:02:14.000 Mnoge od tih knjiga izvučene su iz knjižnica 0:02:14.000,0:02:16.000 i Google ih je digitalizirao. 0:02:16.000,0:02:18.000 Do danas je skenirano 15 milijuna knjiga. 0:02:18.000,0:02:21.000 Kad Google digitalizira knjigu, stavlja ju u zaista zgodan format. 0:02:21.000,0:02:23.000 Imamo podatke, a imamo i metapodatke. 0:02:23.000,0:02:26.000 Imamo informacije o stvarima kao što su mjesto izdavanja, 0:02:26.000,0:02:28.000 ime autora, datum izdavanja. 0:02:28.000,0:02:31.000 I mi tada prolazimo kroz sve te zapise 0:02:31.000,0:02:35.000 i izostavljamo sve što nisu podaci najviše kvalitete. 0:02:35.000,0:02:37.000 Ono što nam ostaje 0:02:37.000,0:02:40.000 zbirka je od pet milijuna knjiga, 0:02:40.000,0:02:43.000 500 milijardi riječi, 0:02:43.000,0:02:45.000 niz likova koji je tisuću puta dulji 0:02:45.000,0:02:48.000 od ljudskog genoma -- 0:02:48.000,0:02:50.000 tekst koji bi, kad bi se ispisao, 0:02:50.000,0:02:52.000 protezao 10 puta odavde do Mjeseca 0:02:52.000,0:02:54.000 i natrag -- 0:02:54.000,0:02:58.000 zaista tek djelić našeg kulturnog genoma. 0:02:58.000,0:03:00.000 Naravno, ono što smo učinili, 0:03:00.000,0:03:03.000 kad smo se suočili s tako skandaloznom hiperbolom... 0:03:03.000,0:03:05.000 (Smijeh) 0:03:05.000,0:03:08.000 bilo je isto što bi učinili bilo koji istraživači 0:03:08.000,0:03:11.000 koji drže do sebe. 0:03:11.000,0:03:13.000 Uzeli smo jednu stranicu s XKCD-a 0:03:13.000,0:03:15.000 i rekli: "Odmaknite se! 0:03:15.000,0:03:17.000 Pokušat ćemo nešto znanstveno!" 0:03:17.000,0:03:19.000 (Smijeh) 0:03:19.000,0:03:21.000 JM: Naravno, mislili smo, 0:03:21.000,0:03:23.000 hajdemo prvo omogućiti pristup podacima 0:03:23.000,0:03:25.000 kako bi ih ljudi mogli znanstveno promotriti. 0:03:25.000,0:03:27.000 Razmišljali smo kojim podacima možemo omogućiti pristup? 0:03:27.000,0:03:29.000 Naravno, želite uzeti te knjige 0:03:29.000,0:03:31.000 i omogućiti pristup kompletnom tekstu tih pet milijuna knjiga. 0:03:31.000,0:03:33.000 Google, a pogotovo Jon Orwant, 0:03:33.000,0:03:35.000 pokazali su nam malu jednadžbu koju smo morali naučiti. 0:03:35.000,0:03:38.000 Imate pet milijuna knjiga, odnosno pet miljuna autora 0:03:38.000,0:03:41.000 i pet milijuna tužitelja u masovnoj tužbi. 0:03:41.000,0:03:43.000 Dakle, iako bi to bilo stvarno, stvarno fenomenalno, 0:03:43.000,0:03:46.000 to je opet vrlo, vrlo nepraktično. 0:03:46.000,0:03:48.000 (Smijeh) 0:03:48.000,0:03:50.000 Opet smo popustilli 0:03:50.000,0:03:53.000 i primijenili vrlo praktičan pristup, koji je bio nešto manje fenomenalan. 0:03:53.000,0:03:55.000 Rekli smo, umjesto da omogućimo pristup kompletnom tekstu, 0:03:55.000,0:03:57.000 omogućit ćemo pristup statistikama o knjigama. 0:03:57.000,0:03:59.000 Uzmite primjerice "tračak sreće" (a gleam of happiness). 0:03:59.000,0:04:01.000 To su četiri riječi i to zovemo četverogram. 0:04:01.000,0:04:03.000 Reći ćemo vam koliko se puta određeni četverogram 0:04:03.000,0:04:05.000 pojavio u knjigama 1801., 1802., 1803. godine, 0:04:05.000,0:04:07.000 i tako sve do 2008. 0:04:07.000,0:04:09.000 Tako dobivamo vremenski niz 0:04:09.000,0:04:11.000 učestalosti korištenja određene rečenice kroz vrijeme, 0:04:11.000,0:04:14.000 To smo napravili za sve riječi i izraze koji se pojavljuju u tim knjigama, 0:04:14.000,0:04:17.000 što nam daje veliku tablicu od dvije milijarde redaka 0:04:17.000,0:04:19.000 koji nam prikazuju način na koji se kultura mijenja. 0:04:19.000,0:04:21.000 ELA: Te dvije milijarde redaka 0:04:21.000,0:04:23.000 zovemo dvije milijarde n-grama. 0:04:23.000,0:04:25.000 Što nam oni govore? 0:04:25.000,0:04:27.000 Pojedinačni n-grami mjere kulturne trendove. 0:04:27.000,0:04:29.000 Dat ću vam primjer. 0:04:29.000,0:04:31.000 Pretpostavimo da ja težim nečemu (thrive), 0:04:31.000,0:04:33.000 a sutra vam želim ispričati koliko sam bio uspješan. 0:04:33.000,0:04:36.000 Mogao bih koristiti oblik za prošlo vrijeme "throve", 0:04:36.000,0:04:39.000 a mogao koristiti i oblike "thrived". 0:04:39.000,0:04:42.000 Koji bih trebao koristiti? 0:04:42.000,0:04:44.000 Kako to znati? 0:04:44.000,0:04:46.000 Prije otprilike šest mjeseci, 0:04:46.000,0:04:48.000 najsuvremeniji podaci u tom polju 0:04:48.000,0:04:50.000 kažu da biste, primjerice, 0:04:50.000,0:04:52.000 otišli do ovog psihologa fantastične kose 0:04:52.000,0:04:54.000 i rekli biste: 0:04:54.000,0:04:57.000 "Steve, ti si stručnjak za nepravilne glagole. 0:04:57.000,0:04:59.000 Što da radim?" 0:04:59.000,0:05:01.000 A on bi vam rekao: "Pa, većina ljudi koristi "thrived", 0:05:01.000,0:05:04.000 ali neki ljudi kažu "throve". 0:05:04.000,0:05:06.000 A znali biste i, više-manje, 0:05:06.000,0:05:09.000 da kad biste se vratili 200 godina u prošlost 0:05:09.000,0:05:12.000 i pitali ovog državnika jednako fantastične kose, 0:05:12.000,0:05:15.000 (Smijeh) 0:05:15.000,0:05:17.000 "Tome, kako bih trebao govoriti?" 0:05:17.000,0:05:19.000 On bi vam rekao: "Pa, u moje vrijeme većina je ljudi koristila "throve", 0:05:19.000,0:05:22.000 ali neki su koristili "thrived". 0:05:22.000,0:05:24.000 Sad ću vam pokazati samo sirove podatke. 0:05:24.000,0:05:28.000 Dva reda iz ove tablice od dvije milijarde unosa. 0:05:28.000,0:05:30.000 Sada gledate učestalost godinu za godinom 0:05:30.000,0:05:33.000 korištenja "thrived" i "throve" kroz vrijeme. 0:05:34.000,0:05:36.000 Dakle, to su samo dva reda 0:05:36.000,0:05:39.000 od dvije milijarde redova. 0:05:39.000,0:05:41.000 Ukupan skup podataka 0:05:41.000,0:05:44.000 milijardu je puta fenomenalniji od ovog slajda. 0:05:44.000,0:05:46.000 (Smijeh) 0:05:46.000,0:05:50.000 (Pljesak) 0:05:50.000,0:05:52.000 JM: Postoji mnogo drugih slika koje vrijede 500 milijardi riječi. 0:05:52.000,0:05:54.000 Na primjer, ova ovdje. 0:05:54.000,0:05:56.000 Ako uzmete samo gripu, 0:05:56.000,0:05:58.000 vidjet ćete vrhove u vrijeme za koje znate 0:05:58.000,0:06:01.000 da su velike epidemije tada ubijale ljude u cijelom svijetu. 0:06:01.000,0:06:04.000 ELA: Ako vam treba još dokaza, 0:06:04.000,0:06:06.000 diže se razina mora, 0:06:06.000,0:06:09.000 kao i CO2 i temperatura u svijetu. 0:06:09.000,0:06:12.000 JM: Možda ne bi bilo loše da pogledate i ovaj konkretni n-gram, 0:06:12.000,0:06:15.000 koji govori Nietzscheu da Bog nije mrtav, 0:06:15.000,0:06:18.000 iako se možda slažete da bi mu trebao bolji izdavač. 0:06:18.000,0:06:20.000 (Smijeh) 0:06:20.000,0:06:23.000 ELA: Na ovaj način možete dobiti prilično apstraktne koncepte. 0:06:23.000,0:06:25.000 Na primjer, ispričat ću vam priču 0:06:25.000,0:06:27.000 o 1950. godini. 0:06:27.000,0:06:29.000 Veliki dio povijesti, 0:06:29.000,0:06:31.000 nikoga nije bilo briga za 1950. godinu. 0:06:31.000,0:06:33.000 1700. godine, 1800., 1900., 0:06:33.000,0:06:36.000 nikoga nije bilo briga. 0:06:37.000,0:06:39.000 30-ih i 40-ih godina, 0:06:39.000,0:06:41.000 nikoga nije bilo briga. 0:06:41.000,0:06:43.000 Odjednom, sredinom 40-ih, 0:06:43.000,0:06:45.000 počelo se brujati o tome. 0:06:45.000,0:06:47.000 Ljudi su shvatili da će doći 1950. godina 0:06:47.000,0:06:49.000 i da bi mogla biti važna. 0:06:49.000,0:06:52.000 (Smijeh) 0:06:52.000,0:06:55.000 Ali ništa nije ljude zainteresiralo za 1950. godinu 0:06:55.000,0:06:58.000 kao 1950. godina. 0:06:58.000,0:07:01.000 (Smijeh) 0:07:01.000,0:07:03.000 Ljudi su hodali uokolo opsjednuti. 0:07:03.000,0:07:05.000 Nisu mogli prestati govoriti 0:07:05.000,0:07:08.000 o svim stvarima koje su učinili 1950. godine, 0:07:08.000,0:07:11.000 o svim stvarima koje planiraju učiniti 1950. godine, 0:07:11.000,0:07:16.000 o svim snovima koje žele ostvariti 1950. godine. 0:07:16.000,0:07:18.000 Zapravo, 1950. godina bila je toliko fascinantna 0:07:18.000,0:07:20.000 da su i godinama kasnije 0:07:20.000,0:07:23.000 ljudi i dalje govorili o fantastičnim stvarima koje su se dogodile, 0:07:23.000,0:07:25.000 '51., '52., '53. 0:07:25.000,0:07:27.000 Na kraju, 1954. godine, 0:07:27.000,0:07:29.000 netko se otrijeznio i shvatio 0:07:29.000,0:07:33.000 da je 1950. godina postala passé. 0:07:33.000,0:07:35.000 (Smijeh) 0:07:35.000,0:07:37.000 I tako se iznenada mjehurić rasprsnuo. 0:07:37.000,0:07:39.000 (Smijeh) 0:07:39.000,0:07:41.000 Priča o 1950. godini 0:07:41.000,0:07:43.000 priča je o svakoj godini koju smo zabilježili, 0:07:43.000,0:07:46.000 s malom razlikom, jer sad imamo ove krasne grafove. 0:07:46.000,0:07:49.000 A budući da imamo te krasne grafove, možemo mjeriti razne stvari. 0:07:49.000,0:07:51.000 Možemo pitati: "Koliko će se brzo mjehurić rasprsnuti?" 0:07:51.000,0:07:54.000 Ispada da to možemo vrlo precizno izmjeriti. 0:07:54.000,0:07:57.000 Jednadžbe su se derivirale, grafovi su se crtali, 0:07:57.000,0:07:59.000 a ukupni rezultat 0:07:59.000,0:08:02.000 jest taj da smo otkrili da se mjehurić rasprsne sve brže 0:08:02.000,0:08:04.000 sa svakom godinom koja prođe. 0:08:04.000,0:08:09.000 Sve brže gubimo zanimanje za prošlost. 0:08:09.000,0:08:11.000 JM: A sad mali savjet o odabiru karijere. 0:08:11.000,0:08:13.000 Oni među vama koji žele biti slavni 0:08:13.000,0:08:15.000 mogu ponešto naučiti od 25 najpoznatijih političkih ličnosti, 0:08:15.000,0:08:17.000 pisaca, glumaca i drugih. 0:08:17.000,0:08:20.000 Dakle, ako želite rano postati slavni, trebate postati glumac 0:08:20.000,0:08:22.000 jer tada postajete slavni do kraja svojih 20-ih godina -- 0:08:22.000,0:08:24.000 još uvijek ste mladi i to je odlično. 0:08:24.000,0:08:26.000 Ako možete malo čekati, trebali biste biti pisac 0:08:26.000,0:08:28.000 jer tada se možete vrlo visoko uzdignuti, 0:08:28.000,0:08:30.000 poput primjerice Marka Twaina, on je bio zaista slavan. 0:08:30.000,0:08:32.000 Ali ako želite dosegnuti sam vrh, 0:08:32.000,0:08:34.000 trebali biste odgoditi zadovoljstvo 0:08:34.000,0:08:36.000 i, naravno, postati političar. 0:08:36.000,0:08:38.000 U tom ćete slučaju postati poznati do kraja svojih 50-ih godina, 0:08:38.000,0:08:40.000 i ostati vrlo, vrlo poznati nakon toga. 0:08:40.000,0:08:43.000 Znanstvenici uglavnom, isto tako, postaju poznati kad ostare. 0:08:43.000,0:08:45.000 Biolozi i fizičari, primjerice, 0:08:45.000,0:08:47.000 znaju biti gotovo jednako slavni kao i glumci. 0:08:47.000,0:08:50.000 Trebate izbjeći samo jednu pogrešku - da postanete matematičar. 0:08:50.000,0:08:52.000 (Smijeh) 0:08:52.000,0:08:54.000 Ako to učinite, 0:08:54.000,0:08:57.000 možda ćete pomisliti: "Odlično, u 20-ima ću napraviti napraviti svoje najbolje radove." 0:08:57.000,0:08:59.000 No, znate što, nikoga neće biti briga. 0:08:59.000,0:09:02.000 (Smijeh) 0:09:02.000,0:09:04.000 ELA: Postoje i neke ozbiljnije činjenice 0:09:04.000,0:09:06.000 među n-gramima. 0:09:06.000,0:09:08.000 Primjerice, evo putanje Marca Chagalla, 0:09:08.000,0:09:10.000 umjetnika rođenog 1887. godine. 0:09:10.000,0:09:13.000 Ovo izgleda kao normalna putanja poznate osobe. 0:09:13.000,0:09:17.000 Postaje sve poznatiji i poznatiji, 0:09:17.000,0:09:19.000 osim ako gledate za njemački jezik. 0:09:19.000,0:09:21.000 Ako gledate za njemački, vidjet ćete nešto vrlo bizarno, 0:09:21.000,0:09:23.000 nešto što gotovo nikad ne vidite, 0:09:23.000,0:09:25.000 a to je da postaje iznimno poznat, 0:09:25.000,0:09:27.000 a nakon toga mu popularnost iznenada padne, 0:09:27.000,0:09:30.000 pri čemu su najniže točke bile između 1933. i 1945. godine, 0:09:30.000,0:09:33.000 nakon čega mu se opet vratila popularnost. 0:09:33.000,0:09:35.000 Naravno, on što zapravo vidimo 0:09:35.000,0:09:38.000 jest činjenica da je Marc Chagall bio židovski umjetnik 0:09:38.000,0:09:40.000 u nacističkoj Njemačkoj. 0:09:40.000,0:09:42.000 Ovi su signali 0:09:42.000,0:09:44.000 zapravo toliko jaki 0:09:44.000,0:09:47.000 da ne trebamo ni znati da su nekoga cenzurirali. 0:09:47.000,0:09:49.000 Zapravo to možemo zaključiti 0:09:49.000,0:09:51.000 koristeći osnovnu obradu znakova. 0:09:51.000,0:09:53.000 Evo jednostavnog načina kako to učiniti. 0:09:53.000,0:09:55.000 Razumno je za očekivati 0:09:55.000,0:09:57.000 da će nečija slava u određenom razdoblju 0:09:57.000,0:09:59.000 biti otprilike prosjek slave te osobe 0:09:59.000,0:10:01.000 prije i nakon tog razdoblja. 0:10:01.000,0:10:03.000 To je otprilike ono što mi očekujemo. 0:10:03.000,0:10:06.000 I to uspoređujemo sa slavom koju promatramo. 0:10:06.000,0:10:08.000 Samo podijelimo jedno drugim 0:10:08.000,0:10:10.000 kako bismo dobili takozvani indeks zabrane. 0:10:10.000,0:10:13.000 Ako je indeks zabrane vrlo, vrlo, vrlo malen, 0:10:13.000,0:10:15.000 onda ste vrlo vjerojatno bili zabranjeni. 0:10:15.000,0:10:18.000 Ako je vrlo velik, možda profitirate od propagande. 0:10:19.000,0:10:21.000 JM: Zapravo možete promatrati 0:10:21.000,0:10:24.000 raspored indeksa zabrane unutar populacija. 0:10:24.000,0:10:26.000 Na primjer, ovdje -- 0:10:26.000,0:10:28.000 ovo je indeks zabrane za 5.000 ljudi 0:10:28.000,0:10:30.000 odabranih u engleskim knjigama u kojima nije zabilježeno zabranjivanje -- 0:10:30.000,0:10:32.000 bilo bi ovako, usko centrirano oko jednog. 0:10:32.000,0:10:34.000 Ono što očekujete u biti je ono što i vidite. 0:10:34.000,0:10:36.000 Ovo je raspored za Njemačku -- 0:10:36.000,0:10:38.000 vrlo različito, pomaknuto je ulijevo. 0:10:38.000,0:10:41.000 Ljudi su o tome razgovarali upola manje nego što su trebali. 0:10:41.000,0:10:43.000 No, mnogo je važnije da je raspored širi. 0:10:43.000,0:10:46.000 Ima mnogo ljudi koji su sasvim na lijevoj strani rasporeda 0:10:46.000,0:10:49.000 i o kojima se govori 10 puta manje nego što bi se trebalo. 0:10:49.000,0:10:51.000 Ali isto tako ima mnogo ljudi na sasvim desnoj strani 0:10:51.000,0:10:53.000 koji, izgleda, profitiraju od propagande. 0:10:53.000,0:10:56.000 Ova je slika glavni simbol cenzure u knjigama. 0:10:56.000,0:10:58.000 ELA: Dakle, kulturomika 0:10:58.000,0:11:00.000 jest ime koje smo dali ovoj metodi. 0:11:00.000,0:11:02.000 Nalikuje na genomiku. 0:11:02.000,0:11:04.000 Osim što je genomika pogled na biologiju, 0:11:04.000,0:11:07.000 pogled na slijed baza u ljudskom genomu. 0:11:07.000,0:11:09.000 Kulturomika je slična tome. 0:11:09.000,0:11:12.000 To je primjena analize ogromnog skupa podataka 0:11:12.000,0:11:14.000 na proučavanje ljudske kulture. 0:11:14.000,0:11:16.000 Ovdje, umjesto da promatramo genom, 0:11:16.000,0:11:19.000 promatramo digitalizirane dijelove povijesnih zapisa. 0:11:19.000,0:11:21.000 Ono što je odlično kod kulturomike 0:11:21.000,0:11:23.000 jest to da se svi mogu njome baviti. 0:11:23.000,0:11:25.000 Zašto se svi mogu njome baviti? 0:11:25.000,0:11:27.000 Svi se mogu njome baviti jer su tri tipa, 0:11:27.000,0:11:30.000 Jon Orwant, Matt Gray i Will Brockman iz Googlea 0:11:30.000,0:11:32.000 vidjeli prototip preglednika Ngram 0:11:32.000,0:11:34.000 i rekli: "Ovo je tako zabavno. 0:11:34.000,0:11:37.000 Moramo ljudima omogućiti pristup tome." 0:11:37.000,0:11:39.000 Za samo dva tjedna -- dva tjedna prije nego nam je objavljen članak -- 0:11:39.000,0:11:42.000 iskodirali su verziju pregledika Ngram za javnost. 0:11:42.000,0:11:45.000 Tako da i vi možete unijeti bilo koju riječ ili izraz koji vas zanima 0:11:45.000,0:11:47.000 i odmah vidjeti njegove n-grame -- 0:11:47.000,0:11:49.000 isto tako možete pregledavati primjere iz svih knjiga 0:11:49.000,0:11:51.000 u kojima se pojavljuje vaš n-gram. 0:11:51.000,0:11:53.000 JM: Ovaj je preglednik korišten više od milijun puta prvog dana, 0:11:53.000,0:11:55.000 i ovo je zapravo najbolji od svih upita. 0:11:55.000,0:11:58.000 Ljudi žele dati sve od sebe, pokazati se u najboljem svijetlu. 0:11:58.000,0:12:01.000 Ali ispada da u 18. stoljeću ljudima uopće nije bilo stalo do toga. 0:12:01.000,0:12:04.000 Nisu željeli dati sve od sebe, željeli su dati fve od sebe. 0:12:04.000,0:12:07.000 Naravno, ovdje se radi samo o pogrešci. 0:12:07.000,0:12:09.000 Nije da su težili osrednjosti, 0:12:09.000,0:12:12.000 već se S prije pisao drugačije, pomalo nalik na F. 0:12:12.000,0:12:15.000 Naravno, Google to nije prepoznao 0:12:15.000,0:12:18.000 i to smo napomenuli u znanstvenom članku koji smo napisali. 0:12:18.000,0:12:20.000 No, ispada da je ovo samo podsjetnik da, 0:12:20.000,0:12:22.000 iako je ovo vrlo zabavno, 0:12:22.000,0:12:24.000 kad tumačite ove grafove, morate biti vrlo oprezni 0:12:24.000,0:12:27.000 i morate usvojiti ove temeljne znastvene standarde. 0:12:27.000,0:12:30.000 ELA: Ljudi ovo koriste za razne zabavne namjene. 0:12:30.000,0:12:37.000 (Smijeh) 0:12:37.000,0:12:39.000 Zapravo, ne moramo ni govoriti, 0:12:39.000,0:12:42.000 samo ćemo vam pokazati sve slajdove i šutjeti. 0:12:42.000,0:12:45.000 Ovu osobu je zanimala povijest frustracije. 0:12:45.000,0:12:48.000 Postoje različite vrste frustracija. 0:12:48.000,0:12:51.000 Kad se udarite u nožni prst, to je "argh" s jednim A. 0:12:51.000,0:12:53.000 Ako plant Zemlju unište Vogonci 0:12:53.000,0:12:55.000 kako bi napravili mjesta za međuzvjezdanu zaobilaznicu, 0:12:55.000,0:12:57.000 to je "aaaaaaaargh" s 8 A-ova. 0:12:57.000,0:12:59.000 Ova osoba proučava sve "arghove", 0:12:59.000,0:13:01.000 od jednog do 8 A-ova. 0:13:01.000,0:13:03.000 Ispada da su 0:13:03.000,0:13:05.000 manje učestali "arghovi" 0:13:05.000,0:13:08.000 naravno, oni koji odgovaraju stvarima koje izazivaju veću frustraciju -- 0:13:08.000,0:13:11.000 osim, čudno, početkom 80-ih. 0:13:11.000,0:13:13.000 Mislimo da to možda ima veze s Reaganom. 0:13:13.000,0:13:15.000 (Smijeh) 0:13:15.000,0:13:18.000 JM: Ovi se podaci mogu koristiti za razne namjene, 0:13:18.000,0:13:21.000 ali ono što je bitno jest da se povijesni zapisi digitaliziraju. 0:13:21.000,0:13:23.000 Google je počeo digitalizirati 15 milijuna knjiga. 0:13:23.000,0:13:25.000 To je 12 posto svih knjiga koje su ikad izdane. 0:13:25.000,0:13:28.000 To je povelik dio ljudske kulture. 0:13:28.000,0:13:31.000 U kulturi ima još mnogo toga: rukopisi, novine, 0:13:31.000,0:13:33.000 postoje stvari koje nisu tekst, poput umjetnosti i slika. 0:13:33.000,0:13:35.000 To će sve biti na našim računalima, 0:13:35.000,0:13:37.000 na računalima u cijelome svijetu. 0:13:37.000,0:13:40.000 A kad se to dogodi, promijenit će se način na koji smo 0:13:40.000,0:13:42.000 shvaćali svoju prošlost, svoju sadašnjost i ljudsku kulturu. 0:13:42.000,0:13:44.000 Hvala vam puno. 0:13:44.000,0:13:47.000 (Pljesak)