Czego nauczyliśmy się z 5 milionów książek
-
0:00 - 0:02Erez Lieberman Aiden: Każdy wie,
-
0:02 - 0:05że jeden obraz jest wart tysiąca słów.
-
0:07 - 0:09Ale my na Harvardzie
-
0:09 - 0:12zastanawialiśmy się, czy to rzeczywiście prawda.
-
0:12 - 0:14(Śmiech)
-
0:14 - 0:18Więc zebraliśmy zespół ekspertów,
-
0:18 - 0:20obejmujący Harvard, MIT,
-
0:20 - 0:23słownik American Heritage Dictionary, encyklopedię Britannica,
-
0:23 - 0:25a nawet naszych dumnych sponsorów -
-
0:25 - 0:28Google.
-
0:28 - 0:30I rozmyślaliśmy nad tym
-
0:30 - 0:32przez około czterech lat.
-
0:32 - 0:37I doszliśmy do zaskakującego wniosku.
-
0:37 - 0:40Panie i panowie, obraz nie jest wart tysiąca słów.
-
0:40 - 0:42W rzeczywistości dowiedzieliśmy się, że niektóre obrazy
-
0:42 - 0:47są warte 500 miliardów słów.
-
0:47 - 0:49Jean-Baptiste Michel: Więc jak doszliśmy do tego wniosku?
-
0:49 - 0:51Erez i ja myśleliśmy o sposobach
-
0:51 - 0:53uzyskania pełnego obrazu ludzkiej kultury
-
0:53 - 0:56i historii: zmiany na przestrzeni lat.
-
0:56 - 0:58Tak wiele książek zostało napisanych przez lata.
-
0:58 - 1:00Więc myśleliśmy, najlepszą drogą do nauczenia się z nich
-
1:00 - 1:02jest przeczytanie tych wszystkich milionów książek.
-
1:02 - 1:05Oczywiście jeśli jest skala tego, jak bardzo jest to wspaniałe,
-
1:05 - 1:08musi się to plasować bardzo, bardzo wysoko.
-
1:08 - 1:10Problem polega na tym, że jest także oś X,
-
1:10 - 1:12która jest osią praktyczności.
-
1:12 - 1:14Ta jest bardzo, bardzo niska.
-
1:14 - 1:17(Oklaski)
-
1:17 - 1:20Ludzie używają innego podejścia,
-
1:20 - 1:22które polega na wzięci kilku źródeł i przeczytania ich bardzo uważnie.
-
1:22 - 1:24To jest bardzo praktyczne, ale nie tak wspaniałe.
-
1:24 - 1:27Tak naprawdę chcielibyśmy
-
1:27 - 1:30mieścić się w jednocześnie wspaniałej i praktycznej części tej przestrzeni.
-
1:30 - 1:33Więc okazuje się, że była za morzem firma o nazwie Google,
-
1:33 - 1:35która zaczęła kilka lat temu projekt cyfryzacji,
-
1:35 - 1:37który może pozwolić na takie podejście.
-
1:37 - 1:39Zcyfryzowali miliony książek.
-
1:39 - 1:42Oznacza to, że można by użyć metod obliczeniowych,
-
1:42 - 1:44by przeczytać wszystkie te książki za jednym kliknięciem.
-
1:44 - 1:47To bardzo praktyczne i niezwykle wspaniałe.
-
1:48 - 1:50ELA: Opowiem wam trochę o tym, skąd wzięły się książki.
-
1:50 - 1:53Od niepamiętnych czasów byli autorzy.
-
1:53 - 1:56Ci autorzy pisali książki.
-
1:56 - 1:58A to stało się znacznie łatwiejsze
-
1:58 - 2:00z rozwojem prasy drukarskiej kilka wieków temu.
-
2:00 - 2:03Od tego czasu, autorom udało sie
-
2:03 - 2:05129 milionów razy
-
2:05 - 2:07wydać książkę.
-
2:07 - 2:09Jeśli te książki nie są stracone dla historii,
-
2:09 - 2:11wówczas są gdzieś w bibliotece,
-
2:11 - 2:14a wiele z tych książek zostało wyciągniętych z bibliotek
-
2:14 - 2:16i zcyfryzowanych przez Google,
-
2:16 - 2:18które do dzisiejszego dnia zeskanowało 15 milionów książek.
-
2:18 - 2:21Kiedy Google zmienia postać książki na cyfrową, umieszcza ją w bardzo ładnym formacie.
-
2:21 - 2:23Mamy teraz dane, plus mamy metadane.
-
2:23 - 2:26Mamy informacje o rzeczach takich jak gdzie została ona wydana,
-
2:26 - 2:28kim był autor, kiedy była ona wydana.
-
2:28 - 2:31I przechodzimy przez te wszystkie zapisy
-
2:31 - 2:35i wykluczamy wszystko, co nie jest danymi najwyższej jakości.
-
2:35 - 2:37Zostajemy ze
-
2:37 - 2:40zbiorem pięciu milionów książek,
-
2:40 - 2:43500 miliardów słów,
-
2:43 - 2:45ciąg znaków tysiąc razy dłuższy
-
2:45 - 2:48niż ludzki genom -
-
2:48 - 2:50tekst który, po jego zapisaniu,
-
2:50 - 2:52rozciągałby się stąd do księżyca i z powrotem
-
2:52 - 2:5410 razy -
-
2:54 - 2:58prawdziwy kryształ naszego genomu kulturowego.
-
2:58 - 3:00Oczywiście to, co zrobiliśmy
-
3:00 - 3:03w obliczu takiej wygórowanej hiperboli...
-
3:03 - 3:05(Śmiech)
-
3:05 - 3:08było tym, co każdy szanujący się naukowiec
-
3:08 - 3:11by zrobił.
-
3:11 - 3:13Wzięliśmy pasek komiksu o nauce XKDC
-
3:13 - 3:15i powiedzieliśmy, "Cofnijcie się.
-
3:15 - 3:17Spróbujemy nauki."
-
3:17 - 3:19(Śmiech)
-
3:19 - 3:21JM: Oczywiście myśleliśmy
-
3:21 - 3:23o tym, by wydobyć dane
-
3:23 - 3:25dla ludzi, by zrobili z nimi naukę.
-
3:25 - 3:27Teraz pomyśleliśmy jakie dane możemy uwolnić?
-
3:27 - 3:29Oczywiście chcemy wziąć książki
-
3:29 - 3:31i uwolnić pełny tekst tych pięciu milionów książek.
-
3:31 - 3:33Google i Jon Orwant w szczególności
-
3:33 - 3:35powiedział nam o małym równaniu, które powinniśmy zapamiętać.
-
3:35 - 3:38Więc mamy pięć milionów, to znaczy, pięć milionów autorów
-
3:38 - 3:41a pięć milionów powodów to wielki pozew.
-
3:41 - 3:43Więc choć byłoby to naprawdę, naprawdę wspaniałe
-
3:43 - 3:46znów, jest to bardzo, bardzo niepraktyczne.
-
3:46 - 3:48(Śmiech)
-
3:48 - 3:50Jakoś się poddaliśmy
-
3:50 - 3:53i zastosowaliśmy to bardzo praktyczne podejście, które było troszkę mniej wspaniałe.
-
3:53 - 3:55Powiedzieliśmy, cóż zamiast uwalniania pełnego tekstu,
-
3:55 - 3:57uwolnimy statystyki dotyczące książek.
-
3:57 - 3:59Weźmy na przykład "błysk szczęścia"
-
3:59 - 4:01To dwa słowa. Nazywamy to dwugramem.
-
4:01 - 4:03Powiemy wam jak wiele razy poszczególny czterogram
-
4:03 - 4:05pojawił się w książkach w 1801, 1802, 1803,
-
4:05 - 4:07aż do 2008.
-
4:07 - 4:09Daje nam to szereg czasowy
-
4:09 - 4:11częstotliwości pojawiania się tego konkretnego zdania w ciągu tych lat.
-
4:11 - 4:14Robimy to dla wszystkich słów i zwrotów, które występują w tych książkach,
-
4:14 - 4:17a to daje nam wielką tabelę z dwóch miliardów linijek,
-
4:17 - 4:19która mówi nam o sposobie, w jaki zmieniała się kultura.
-
4:19 - 4:21ELA: Więc te dwa miliardy wierszy,
-
4:21 - 4:23nazywamy jest dwoma miliardami n-gramów.
-
4:23 - 4:25Co nam mówią?
-
4:25 - 4:27Poszczególne n-gramy mierzą trendy kulturowe.
-
4:27 - 4:29Pozwólcie, że podam wam przykład.
-
4:29 - 4:31Załóżmy, że kwitnę,
-
4:31 - 4:33a jutro będę chciał wam powiedzieć jak dobrze mi poszło.
-
4:33 - 4:36Więc mogę powiedzieć "Wczoraj kwitłem."
-
4:36 - 4:39Względnie, mogę powiedzieć "Wczoraj kwitnąłem."
-
4:39 - 4:42Którego z tych zwrotów powinienem użyć?
-
4:42 - 4:44Skąd to wiedzieć?
-
4:44 - 4:46Około sześć miesięcy temu,
-
4:46 - 4:48praktyką w tej dziedzinie
-
4:48 - 4:50było, na przykład,
-
4:50 - 4:52pójście do tego psychologa z fantstycznymi włosami
-
4:52 - 4:54i powiedzenie:
-
4:54 - 4:57"Steve, jesteś ekspertem od czasowników nieregularnych.
-
4:57 - 4:59Co powinienem zrobić?"
-
4:59 - 5:01A on by powiedział "Cóż, większość ludzi mówi "kwitnąć",
-
5:01 - 5:04ale niektórzy mówią "kwiść".
-
5:04 - 5:06I wiadomo także było,
-
5:06 - 5:09że jeśli cofnąłbyś się w czasie o 200 lat
-
5:09 - 5:12i spytał tego męża stanu z równie fantastycznymi włosami,
-
5:12 - 5:15(Śmiech)
-
5:15 - 5:17"Tom, co powinienem zrobić?"
-
5:17 - 5:19Powiedziałby, "Cóż, w moich czasach, większość ludzi kwitła,
-
5:19 - 5:22ale niektórzy kwitnęli."
-
5:22 - 5:24Teraz pokażę wam surowe dane.
-
5:24 - 5:28Dwa wiersze z tej tabeli dwóch miliardów danych.
-
5:28 - 5:30Widzicie częstotliwość z roku na rok
-
5:30 - 5:33"kwitnęłem" i "kwitnąłem" na przestrzeni czasu.
-
5:34 - 5:36To tylko dwa
-
5:36 - 5:39z dwóch miliardów wierszy.
-
5:39 - 5:41Więc cały zestaw danych
-
5:41 - 5:44jest miliard razy wspanialszy niż tej slajd.
-
5:44 - 5:46(Śmiech)
-
5:46 - 5:50(Oklaski)
-
5:50 - 5:52JM:Jest wiele innych obrazków, które są warte 500 miliardów słów.
-
5:52 - 5:54Na przykład ten.
-
5:54 - 5:56Jeśli weźmiecie grypę,
-
5:56 - 5:58zobaczycie wzrosty w czasie, kiedy wiadomo,
-
5:58 - 6:01że wielkie epidemie grypy zabijały ludzi na świecie.
-
6:01 - 6:04ELA: Jeśli jeszcze nie jesteście przekonani,
-
6:04 - 6:06poziomy morza się podnoszą,
-
6:06 - 6:09tak samo jak poziom CO2 w atmosferze i temperatura na Ziemi.
-
6:09 - 6:12JM: Moglibyście także chcieć się przyjrzeć temu n-gramowi,
-
6:12 - 6:15żeby powiedzieć Nietzschemu, że Bóg nie umarł,
-
6:15 - 6:18choć moglibyście się zgodzić, że potrzebuje lepszego publicysty.
-
6:18 - 6:20(Śmiech)
-
6:20 - 6:23ELA: Można dojść do całkiem abstrakcyjnych koncepcji z takimi rzeczami.
-
6:23 - 6:25Na przykład, opowiem wam historię
-
6:25 - 6:27roku 1950.
-
6:27 - 6:29Przez większość historii,
-
6:29 - 6:31nikogo nie obchodził 1950.
-
6:31 - 6:33W 1700, 1800, w 1900,
-
6:33 - 6:36nikt się nie przejmował.
-
6:37 - 6:39W latach 30-tych i 40-tych,
-
6:39 - 6:41nikt się nie przejmował.
-
6:41 - 6:43Nagle, w połowie lat 40-tych
-
6:43 - 6:45zrobił się wokół tego szum.
-
6:45 - 6:47Ludzie zdali sobie sprawę, że 1950 nadejdzie
-
6:47 - 6:49i może być czymś wielkim.
-
6:49 - 6:52(Śmiech)
-
6:52 - 6:55Ale nic nie interesowało ludzi w 1950 tak,
-
6:55 - 6:58jak rok 1950.
-
6:58 - 7:01(Śmiech)
-
7:01 - 7:03Ludzie chodzili jak opętami.
-
7:03 - 7:05Nie mogli przestać opowiadać
-
7:05 - 7:08o wszystkich rzeczach, które robili w 1950,
-
7:08 - 7:11wszystkich rzeczach, które planowali zrobić w 1950,
-
7:11 - 7:16wszystkich marzeniach o tym, co chcieli osiągnąć w 1950.
-
7:16 - 7:18W rzeczywistości 1950 był tak fascynujący,
-
7:18 - 7:20że przez dwa lata po nim,
-
7:20 - 7:23ludzie po prostu wciąż opowiadali o niezwykłych rzeczach, które się wydarzyły,
-
7:23 - 7:25w '51, '52, '53.
-
7:25 - 7:27Wreszcie w 1954
-
7:27 - 7:29ktoś się ocknął i zdał sobie sprawę,
-
7:29 - 7:33że 1950 jest cokolwiek passe.
-
7:33 - 7:35(Śmiech)
-
7:35 - 7:37I tak pękła bańka.
-
7:37 - 7:39(Śmiech)
-
7:39 - 7:41I historia 1950
-
7:41 - 7:43jest historią każdego roku, który mamy w zapisach,
-
7:43 - 7:46z pewnym urozmaiceniem, ponieważ mamy te ładne wykresy.
-
7:46 - 7:49A ponieważ mamy te ładne wykresy, możemy mierzyć różne rzeczy.
-
7:49 - 7:51Możemy powiedzieć "Jak szybko pęka bańka?"
-
7:51 - 7:54I okazuje się, że możemy to zmierzyć bardzo dokładnie.
-
7:54 - 7:57Stworzony równania, narysowano wykresy
-
7:57 - 7:59i wynik sieciowy jest taki,
-
7:59 - 8:02że bańka pęka szybko i szybciej
-
8:02 - 8:04z każdym mijającym rokiem.
-
8:04 - 8:09Tracimy zainteresowanie przeszłością coraz szybciej.
-
8:09 - 8:11JM: Teraz drobna rada dotycząca kariery.
-
8:11 - 8:13Dla tych z was, którzy chcą zostać sławni,
-
8:13 - 8:15możemy się uczyć od 25 najsławniejszych polityków,
-
8:15 - 8:17autorów, aktorów itd.
-
8:17 - 8:20Więc jeśli chcesz zostać sławny wcześnie, powinieneś być aktorem,
-
8:20 - 8:22ponieważ wówczas sława zaczyna rosnąć do końca trzeciej dekady życia -
-
8:22 - 8:24wciąż jesteś młody, to naprawdę wspaniałe.
-
8:24 - 8:26Teraz jeśli możesz trochę poczekać, powinieneś być autorem,
-
8:26 - 8:28ponieważ wówczas wzrasta się do prawdziwej wielkości,
-
8:28 - 8:30jak na przykład Mark Twain: bardzo sławny.
-
8:30 - 8:32Ale jeśli chcesz osiągnąć sam szczyt,
-
8:32 - 8:34powinieneś opóźnić gratyfikację
-
8:34 - 8:36i, oczywiście, zostać politykiem.
-
8:36 - 8:38Tak zostaniecie sławni do końca szóstej dekady życia,
-
8:38 - 8:40i zostaniecie bardzo, bardzo sławni potem.
-
8:40 - 8:43Naukowcy także stają się sławni, jeśli są znacznie starsi.
-
8:43 - 8:45Jak na przykład, biolodzy i fizycy
-
8:45 - 8:47są tak sławni jak aktorzy.
-
8:47 - 8:50Jedynym błędem, którego nie należy robić jest zostanie matematykiem.
-
8:50 - 8:52(Śmiech
-
8:52 - 8:54Jeśli to zrobisz,
-
8:54 - 8:57możesz myśleć: "Wspaniale, wykonam swoje najwspanialsze dzieła w wieku lat dwudziestu kilku".
-
8:57 - 8:59Ale wiecie co, nikogo to nie będzie obchodzić.
-
8:59 - 9:02(Śmiech)
-
9:02 - 9:04ELA: Są bardziej otrzeźwiające informacje
-
9:04 - 9:06w n-gramach.
-
9:06 - 9:08Na przykład, to trajektoria Marca Chagalla,
-
9:08 - 9:10artysty urodzonego w 1887.
-
9:10 - 9:13Wygląda to jak normalna trajektoria dla sławnej osoby.
-
9:13 - 9:17Staje się bardziej i bardziej i bardziej sławny,
-
9:17 - 9:19z
-
9:19 - 9:21Jeśli sprawdzicie w Niemczech, zobaczycie coś dziwacznego,
-
9:21 - 9:23coś, czego nigdy się nie obserwuje,
-
9:23 - 9:25staje się ona bardzo sławny,
-
9:25 - 9:27a potem to zainteresowanie nagle spada,
-
9:27 - 9:30przeżywając kryzys między 1933 i 1945,
-
9:30 - 9:33by się potem znów odbić.
-
9:33 - 9:35I oczywiście, to, co widzimy,
-
9:35 - 9:38to fakt, że Marc Chagall był Żydowskim artystą
-
9:38 - 9:40w nazistowskich Niemczech.
-
9:40 - 9:42Te sygnały
-
9:42 - 9:44są tak silne,
-
9:44 - 9:47że nie musimy wiedzieć, że ktoś był ocenzurowany.
-
9:47 - 9:49Możemy to wywnioskować
-
9:49 - 9:51używając naprawdę podstawowego przetwarzania sygnałów.
-
9:51 - 9:53To prosty sposób.
-
9:53 - 9:55Racjonalnym oczekiwaniem
-
9:55 - 9:57jest to, że czyjaś sława w określonym okresie czasu
-
9:57 - 9:59powinna być średnią jego sławy przed
-
9:59 - 10:01i po.
-
10:01 - 10:03Tego oczekujemy.
-
10:03 - 10:06I porównujemy to z obserwowaną sławą.
-
10:06 - 10:08Po prostu dzielimy jedno przez drugie
-
10:08 - 10:10by uzyskać coś, co nazywamy wskaźnikiem tłumienia.
-
10:10 - 10:13Jeśli wskaźnik tłumienia jest bardzo, bardzo, bardzo mału,
-
10:13 - 10:15wówczas możesz być rzeczywiście tłumiony.
-
10:15 - 10:18Jeśli jest bardzo wielki, może korzystasz na propagandzie.
-
10:19 - 10:21JM: Można spojrzeć
-
10:21 - 10:24na rozkład wskaźników tłumienia całej populacji.
-
10:24 - 10:26Więc na przykład tutaj -
-
10:26 - 10:28wskaźnik tłumienia dla 5 000 osób
-
10:28 - 10:30wybranych z angielskich książek, gdzie nie ma tłumienia, o którym byśmy wiedzieli -
-
10:30 - 10:32będzie to wyglądało tak, ściśle upakowane koło jedynki.
-
10:32 - 10:34Obserwujemy to, czego byśmy oczekiwali.
-
10:34 - 10:36To rozkład w Niemczech -
-
10:36 - 10:38bardzo odmienny, przesunięty w lewo.
-
10:38 - 10:41Ludzie mówili o tym dwa razy mniej niż powinni.
-
10:41 - 10:43Ale co znacznie ważniejsze, rozkład jest znacznie szerszy.
-
10:43 - 10:46Jest wielu ludzi, którzy są skrajnie z lewej w tym rozkładzie,
-
10:46 - 10:49mówi się o nich około 10 razy rzadziej niż się powinno.
-
10:49 - 10:51Ale także jest wielu ludzi po prawej,
-
10:51 - 10:53którzy korzystają na propagandzie.
-
10:53 - 10:56Ten obrazek jest oznaką cenzury w książkach.
-
10:56 - 10:58ELA: Nazywamy tą metodę
-
10:58 - 11:00kulturomiką.
-
11:00 - 11:02To coś jak genomika.
-
11:02 - 11:04Poza tym, że genomika patrzy na biologię
-
11:04 - 11:07przez okno sekwencji zasad w ludzkim genomie.
-
11:07 - 11:09Kulturomika jest podobna.
-
11:09 - 11:12To zastosowanie analizy zbieranych danych na wielką skalę
-
11:12 - 11:14do badania ludzkiej kultury.
-
11:14 - 11:16Tutaj, zamiast przez genom,
-
11:16 - 11:19dokonuje się to przez zcyfryzowane dane historyczne.
-
11:19 - 11:21Wielką rzeczą w kulturomice
-
11:21 - 11:23jest to, że każdy może to robić.
-
11:23 - 11:25Dlaczego każdy może to robić?
-
11:25 - 11:27Każdy może ponieważ trzech gości,
-
11:27 - 11:30Jon Orwant, Matt Gray i Will Brockman z Google
-
11:30 - 11:32zobaczyli prototyp Ngram Viewera
-
11:32 - 11:34i powiedziało: "To jest taka frajda.
-
11:34 - 11:37Musimy to udostępnić ludziom."
-
11:37 - 11:39Więc przez dwa tygodnie - dwa tygodnie przed publikacją naszego artykułu -
-
11:39 - 11:42napisali kod wersji Ngram Viewera dla szerokiej publiczności.
-
11:42 - 11:45Więc wy także możecie wpisać każde słowo lub zwrot, który was interesuje
-
11:45 - 11:47i zobaczyć od razu jego n-gram -
-
11:47 - 11:49a także wyszukać przykłady różnych książek,
-
11:49 - 11:51w których pojawia się wasz n-gram.
-
11:51 - 11:53JM: Użyto tego przeszło milion razy w pierwszym dniu,
-
11:53 - 11:55a to jest najlepsze ze wszystkich wyszukiwań.
-
11:55 - 11:58Więc ludzie chcą się pokazać z najlepszej strony.
-
11:58 - 12:01Ale okazuje się, że w XVIII wieku ludzi to naprawdę nie obchodziło.
-
12:01 - 12:04Nie chcieli być najlepsi (best), a "beft".
-
12:04 - 12:07Oczywiście jest to pomyłka.
-
12:07 - 12:09To nie walka o przecietność,
-
12:09 - 12:12a fakt, że "s" pisano inaczej, raczej jak "f".
-
12:12 - 12:15Oczywiście Google nie wychwycił tego wówczas,
-
12:15 - 12:18więc zgłosiliśmy to w artykule naukowym, który napisaliśmy.
-
12:18 - 12:20Ale okazuje się to tylko przypomnieniem,
-
12:20 - 12:22że choć to wiele zabawy,
-
12:22 - 12:24kiedy interpretuje się te wykresy, trzeba być bardzo ostrożnym
-
12:24 - 12:27i przyjąć te podstawowe standardy naukowe.
-
12:27 - 12:30ELA: Ludzie używali tego do zabawy na różne sposoby.
-
12:30 - 12:37(Śmiech)
-
12:37 - 12:39Nie będziemy mówili,
-
12:39 - 12:42po prostu pokażemy wam te slajdy i będziemy cicho.
-
12:42 - 12:45Ta osoba była zainteresowana historią frustracji.
-
12:45 - 12:48To różne rodzaje frustracji.
-
12:48 - 12:51Jeśli uderzysz się w palec, to jedno "a" w "argh"
-
12:51 - 12:53Jeśli Ziemia jest anihilowana przez Vogonów,
-
12:53 - 12:55by zrobić miejsce na międzygwiezdny tunel,
-
12:55 - 12:57jest to "aaaaaaaargh" przez 8 "a".
-
12:57 - 12:59Ta osoba zbadała wszystkie "argh"
-
12:59 - 13:01przez od 1 do 8 "a".
-
13:01 - 13:03I okazuje się,
-
13:03 - 13:05że rzadsze "argh"
-
13:05 - 13:08są, oczywiście, tymi, które odpowiadają bardziej frustrującym rzeczom -
-
13:08 - 13:11poza, co dziwne, we wczesnych latach 80-tych.
-
13:11 - 13:13Myślimy, że to może mieć coś wspólnego z Reaganem.
-
13:13 - 13:15(Śmiech)
-
13:15 - 13:18JM: Jest wiele zastosowań dla tych danych,
-
13:18 - 13:21ale puenta jest taka, że dane historyczne są cyfryzowane.
-
13:21 - 13:23Google zaczęła cyfryzować 15 milionów książek.
-
13:23 - 13:25To 12% wszystkich książek, które kiedykolwiek zostały wydane.
-
13:25 - 13:28To pokaźny kawał ludzkiej kultury.
-
13:28 - 13:31Jest znacznie więcej aspektów: manuskrypty, gazety,
-
13:31 - 13:33rzeczy, które nie są tekstem, jak sztuka i malarstwo.
-
13:33 - 13:35Wszystkie są w naszych komputerach,
-
13:35 - 13:37na całym świecie.
-
13:37 - 13:40A kiedy to się stanie, odmieni to sposób, w jaki
-
13:40 - 13:42będziemy rozumieli naszą przeszłość, teraźniejszość, ludzką kulturę.
-
13:42 - 13:44Dziękujemy bardzo.
-
13:44 - 13:47(Oklaski)
- Title:
- Czego nauczyliśmy się z 5 milionów książek
- Speaker:
- Jean-Baptiste Michel + Erez Lieberman Aiden
- Description:
-
Bawiliście się Ngram Viewerem od Google? To wciągające narzędzie, które pozwala na wyszukiwanie słów i pomysłów w bazie danych obejmującej 5 milionów książek z różnych wieków. Erez Lieberman Aiden i Jean-Baptiste Michel pokazują nam jak to działa i kilka zaskakujących rzeczy, których możemy się dowiedzieć z 500 miliardów słów.
- Video Language:
- English
- Team:
closed TED
- Project:
- TEDTalks
- Duration:
- 13:48