WEBVTT 00:00:00.000 --> 00:00:02.000 Ерез Лийберман Айден: Всеки знае, 00:00:02.000 --> 00:00:05.000 че една картина струва хиляда думи. 00:00:07.000 --> 00:00:09.000 Но ние от Харвард 00:00:09.000 --> 00:00:12.000 се чудехме дали това наистина е вярно. 00:00:12.000 --> 00:00:14.000 (Смях) 00:00:14.000 --> 00:00:18.000 Затова събрахме екип от експерти, 00:00:18.000 --> 00:00:20.000 който включва Харвард, МИТ, 00:00:20.000 --> 00:00:23.000 Американския речник "Херитидж", енциклопедия "Британика" 00:00:23.000 --> 00:00:25.000 и дори гордите ни спонсори- 00:00:25.000 --> 00:00:28.000 Гугъл. 00:00:28.000 --> 00:00:30.000 Размишлявахме върху това 00:00:30.000 --> 00:00:32.000 около 4 години 00:00:32.000 --> 00:00:37.000 и стигнахме до стряскащ извод. 00:00:37.000 --> 00:00:40.000 Дами и господа, една картина не струва хиляда думи. 00:00:40.000 --> 00:00:42.000 Всъщност намерихме няколко картини, 00:00:42.000 --> 00:00:47.000 които струват 500 милиарда думи. NOTE Paragraph 00:00:47.000 --> 00:00:49.000 Жан Батист Мишел: Как стигнахме до този извод? 00:00:49.000 --> 00:00:51.000 Ерез и аз търсихме начини 00:00:51.000 --> 00:00:53.000 да добием пълна представа за човешката култура 00:00:53.000 --> 00:00:56.000 и история-как се променят във времето. 00:00:56.000 --> 00:00:58.000 Много книги са били написани през вековете. 00:00:58.000 --> 00:01:00.000 Та си мислехме: "Добре, най-добрият начин да се научим от тях 00:01:00.000 --> 00:01:02.000 е да прочетем всички тези милиони книги" 00:01:02.000 --> 00:01:05.000 Разбира се, ако има степен колко невероятно е това, 00:01:05.000 --> 00:01:08.000 това трябва да е доста, доста голяма степен. 00:01:08.000 --> 00:01:10.000 Проблемът е, че има ос Х за това, 00:01:10.000 --> 00:01:12.000 която е практическата ос. 00:01:12.000 --> 00:01:14.000 Това е много, много ниско. NOTE Paragraph 00:01:14.000 --> 00:01:17.000 (Аплодисменти) NOTE Paragraph 00:01:17.000 --> 00:01:20.000 Сега хората използват алтернативен подход, 00:01:20.000 --> 00:01:22.000 който включва намирането на няколко източника и прочитането им много внимателно. 00:01:22.000 --> 00:01:24.000 Това е много практично, но не толкова невероятно. 00:01:24.000 --> 00:01:27.000 Това, което наистина искаш да направиш, 00:01:27.000 --> 00:01:30.000 е да стигнеш до невероятната, но практична част в тази област. 00:01:30.000 --> 00:01:33.000 Оказва се, че има компания отвъд реката на име Гугъл, 00:01:33.000 --> 00:01:35.000 която е била започнала преди няколко години проект по дигитизация, 00:01:35.000 --> 00:01:37.000 който може и да осъществи този подход. 00:01:37.000 --> 00:01:39.000 Те са направили електронен вариант на милиони книги. 00:01:39.000 --> 00:01:42.000 Това означава, че човек може да използва компютърни методи, 00:01:42.000 --> 00:01:44.000 за да чете всяка книга само с едно кликване. 00:01:44.000 --> 00:01:47.000 Това е много практично и изключително страхотно. NOTE Paragraph 00:01:48.000 --> 00:01:50.000 ЕЛА: Нека Ви кажа малко повече за това, откъде идват книгите. 00:01:50.000 --> 00:01:53.000 Имало е писатели още от време оно. 00:01:53.000 --> 00:01:56.000 Тези писатели са се опитвали всячески да пишат книги. 00:01:56.000 --> 00:01:58.000 И това станало доста по-лесно 00:01:58.000 --> 00:02:00.000 с изобретяването на печатната машина преди няколко века. 00:02:00.000 --> 00:02:03.000 Оттогава писателите са получили 00:02:03.000 --> 00:02:05.000 129 милиона различни възможности 00:02:05.000 --> 00:02:07.000 да публикуват книги. 00:02:07.000 --> 00:02:09.000 Ако тези книги не бъдат изгубени някъде в историята, 00:02:09.000 --> 00:02:11.000 то те ще бъдат някъде в библиотека 00:02:11.000 --> 00:02:14.000 и много от тези книги биват намирани в библиотеките 00:02:14.000 --> 00:02:16.000 и дигитализирани от Гугъл. 00:02:16.000 --> 00:02:18.000 Гугъл вече е сканирал над 15 милиона книги до този момент. NOTE Paragraph 00:02:18.000 --> 00:02:21.000 Когато Гугъл дигитализира една книга, те я правят в много добър формат. 00:02:21.000 --> 00:02:23.000 Сега имаме данните, освен това имаме метаданни. 00:02:23.000 --> 00:02:26.000 Имаме информация къде е публикувана, 00:02:26.000 --> 00:02:28.000 кой е авторът, кога е била публикувана. 00:02:28.000 --> 00:02:31.000 Какво направихме ние - прегледахме всички тези архиви 00:02:31.000 --> 00:02:35.000 и изхвърлихме всичко, което не е най-високо качество. 00:02:35.000 --> 00:02:37.000 Това, което получихме, 00:02:37.000 --> 00:02:40.000 е една колекция от 5 милиона книги, 00:02:40.000 --> 00:02:43.000 500 милиарда думи, 00:02:43.000 --> 00:02:45.000 наниз от знаци хиляда пъти по-дълъг 00:02:45.000 --> 00:02:48.000 от човешкия геном- 00:02:48.000 --> 00:02:50.000 текст, който ако бъде написан, 00:02:50.000 --> 00:02:52.000 ще е дълъг от тук до Луната и обратно, 00:02:52.000 --> 00:02:54.000 умножено по 10 пъти- 00:02:54.000 --> 00:02:58.000 истински къс от нашия културен геном. 00:02:58.000 --> 00:03:00.000 Разбира се, това, което направихме, 00:03:00.000 --> 00:03:03.000 изправени пред толкова голяма хипербола, 00:03:03.000 --> 00:03:05.000 (Смях) 00:03:05.000 --> 00:03:08.000 беше това, което всеки себеуважаващ се изследовател 00:03:08.000 --> 00:03:11.000 би направил. 00:03:11.000 --> 00:03:13.000 Взехме една страница от ХКСД 00:03:13.000 --> 00:03:15.000 и казахме: "Стойте назад! 00:03:15.000 --> 00:03:17.000 Ще изпробваваме наука." NOTE Paragraph 00:03:17.000 --> 00:03:19.000 (Смях) NOTE Paragraph 00:03:19.000 --> 00:03:21.000 ЖМ: Сега, разбира се, си мислим 00:03:21.000 --> 00:03:23.000 първо да направим данните свободни, 00:03:23.000 --> 00:03:25.000 за да могат хората да правят наука с тях. 00:03:25.000 --> 00:03:27.000 Мислим си какви данни можем да направим достъпни? 00:03:27.000 --> 00:03:29.000 Разбира се, че искате да вземете книгите 00:03:29.000 --> 00:03:31.000 и да пуснете пълните текстове на тези 5 милиона книги по нета. 00:03:31.000 --> 00:03:33.000 Гугъл и Джон Оруънт най-вече 00:03:33.000 --> 00:03:35.000 ни казаха едно малко уравнение, което трябва да научим. 00:03:35.000 --> 00:03:38.000 И така, имаш 5 милиона книги, което е 5 милиона автора, 00:03:38.000 --> 00:03:41.000 а 5 милиона ищци е един голям съдебен процес. 00:03:41.000 --> 00:03:43.000 И въпреки че това би било наистина много, много готино, 00:03:43.000 --> 00:03:46.000 отново, това е много, много непрактично. 00:03:46.000 --> 00:03:48.000 (Смях) NOTE Paragraph 00:03:48.000 --> 00:03:50.000 Отново ние леко отстъпихме 00:03:50.000 --> 00:03:53.000 и предприехме практичния подход, който беше по-малко готин. 00:03:53.000 --> 00:03:55.000 Казахме си: "Добре, вместо да пуснем пълния текст, 00:03:55.000 --> 00:03:57.000 ще пуснем в интернет пространството статистика за книгите. 00:03:57.000 --> 00:03:59.000 Така, вземете например "Лъч щастие". 00:03:59.000 --> 00:04:01.000 това са 4 думи, наричаме това 4-грама. 00:04:01.000 --> 00:04:03.000 Ще ви кажем колко пъти точно определена 4-грама 00:04:03.000 --> 00:04:05.000 се е появявал в книги от 1801, 1802, 1803, 00:04:05.000 --> 00:04:07.000 чак до 2008. 00:04:07.000 --> 00:04:09.000 Това ни дава времеви серии, 00:04:09.000 --> 00:04:11.000 посочващи колко пъти точно това изречение е било използвано във времето. 00:04:11.000 --> 00:04:14.000 Направихме това за всички думи и фрази, които се появяват в тези книги. 00:04:14.000 --> 00:04:17.000 Това ни дава една голяма таблица от 2 милиарда реда, 00:04:17.000 --> 00:04:19.000 която ни казва как културата ни се е променяла. NOTE Paragraph 00:04:19.000 --> 00:04:21.000 ЕЛА: Тези 2 милиарда реда 00:04:21.000 --> 00:04:23.000 наричаме 2 милиарда н-грами. 00:04:23.000 --> 00:04:25.000 Какво ни казват те? 00:04:25.000 --> 00:04:27.000 Индивидуалните н-грамови измерват културните тенденции. 00:04:27.000 --> 00:04:29.000 Нека ви дам един пример. 00:04:29.000 --> 00:04:31.000 Нека предположим, че аз преуспявам. 00:04:31.000 --> 00:04:33.000 Утре искам да ви кажа колко добре се справих. 00:04:33.000 --> 00:04:36.000 И така, може да кажа: "Вчера успях." 00:04:36.000 --> 00:04:39.000 Алтернативно мога да кажа: "Вчера преуспях." 00:04:39.000 --> 00:04:42.000 Добре, кое да използвам? 00:04:42.000 --> 00:04:44.000 Как да разбера? NOTE Paragraph 00:04:44.000 --> 00:04:46.000 От преди около 6 месеца 00:04:46.000 --> 00:04:48.000 състоянието на изкуството в тази сфера 00:04:48.000 --> 00:04:50.000 би било такова, например, 00:04:50.000 --> 00:04:52.000 че да ви накара да отидете при психолог с невероятна коса 00:04:52.000 --> 00:04:54.000 и да кажете: 00:04:54.000 --> 00:04:57.000 "Стийв, ти си експерт по неправилни глаголи. 00:04:57.000 --> 00:04:59.000 Какво да правя?" 00:04:59.000 --> 00:05:01.000 И той би ви казал: "Повечето хора казват успях, 00:05:01.000 --> 00:05:04.000 но някои хора казват преуспях." 00:05:04.000 --> 00:05:06.000 И ти знаеше малко или много, 00:05:06.000 --> 00:05:09.000 че ако се върнеш назад 200 години 00:05:09.000 --> 00:05:12.000 и попиташ същия човек със също толкова хубава коса, 00:05:12.000 --> 00:05:15.000 (Смях) 00:05:15.000 --> 00:05:17.000 "Том, какво би трябвало да кажа?" 00:05:17.000 --> 00:05:19.000 Той би ви отговорил: "По мое време повечето хора успяваха, 00:05:19.000 --> 00:05:22.000 но някои преуспяха." 00:05:22.000 --> 00:05:24.000 Сега ще ви покажа само сухи данни. 00:05:24.000 --> 00:05:28.000 Два реда от тази таблица с 2 милиарда реда. 00:05:28.000 --> 00:05:30.000 Това, което виждате, е година след година използване 00:05:30.000 --> 00:05:33.000 на "успял" и "преуспял" през времето. 00:05:34.000 --> 00:05:36.000 Това са само 2 00:05:36.000 --> 00:05:39.000 от 2 милиарда реда. 00:05:39.000 --> 00:05:41.000 Цялата база данни 00:05:41.000 --> 00:05:44.000 е един милиард пъти по-готина от този слайд. NOTE Paragraph 00:05:44.000 --> 00:05:46.000 (Смях) NOTE Paragraph 00:05:46.000 --> 00:05:50.000 (Аплодисменти) NOTE Paragraph 00:05:50.000 --> 00:05:52.000 ЖМ: Има много други картини, които струват 500 милиарда думи. 00:05:52.000 --> 00:05:54.000 Например, тази. 00:05:54.000 --> 00:05:56.000 Ако вземете инфлуенца, 00:05:56.000 --> 00:05:58.000 ще надникнете във времето, когато сте знаели, че 00:05:58.000 --> 00:06:01.000 големи епидемии са убивали хора по целия глобус. NOTE Paragraph 00:06:01.000 --> 00:06:04.000 ЕЛА: Ако още не сте убеден 00:06:04.000 --> 00:06:06.000 нивото на морското равнище се покачва, 00:06:06.000 --> 00:06:09.000 както и атмосферният въглероден двуокис и глобалната температура. NOTE Paragraph 00:06:09.000 --> 00:06:12.000 ЖМ: Може би искате да видите и точно тази н-грама 00:06:12.000 --> 00:06:15.000 и това е за да кажем на Ницше, че Господ не е мъртъв, 00:06:15.000 --> 00:06:18.000 въпреки че ще се съгласите, че ще се нуждае от по-добър публицист. NOTE Paragraph 00:06:18.000 --> 00:06:20.000 (Смях) NOTE Paragraph 00:06:20.000 --> 00:06:23.000 ЕЛА: Може да достигнете до някои доста абстрактни идеи с този начин на мислене. 00:06:23.000 --> 00:06:25.000 Например, нека ви кажа историята 00:06:25.000 --> 00:06:27.000 на 1950 година. 00:06:27.000 --> 00:06:29.000 Горе-долу за по-голямата част от историята 00:06:29.000 --> 00:06:31.000 на никой не му пукаше за 1950. 00:06:31.000 --> 00:06:33.000 През 1700, 1800, 1900 00:06:33.000 --> 00:06:36.000 никой не се интересуваше. 00:06:37.000 --> 00:06:39.000 През 30-те и 40-те години 00:06:39.000 --> 00:06:41.000 на никой не му пукаше. 00:06:41.000 --> 00:06:43.000 Изведнъж, по средата на 40-те 00:06:43.000 --> 00:06:45.000 започна едно шумене. 00:06:45.000 --> 00:06:47.000 Хората осъзнаха, че 1950 ще се случи 00:06:47.000 --> 00:06:49.000 и че може би ще е голямо. 00:06:49.000 --> 00:06:52.000 (Смях) 00:06:52.000 --> 00:06:55.000 Но нищо не заинтересова хората през 1950 00:06:55.000 --> 00:06:58.000 така, както годината 1950. 00:06:58.000 --> 00:07:01.000 (Смях) 00:07:01.000 --> 00:07:03.000 Хората ходеха наоколо обсебени. 00:07:03.000 --> 00:07:05.000 Не можеха да спрат да говорят 00:07:05.000 --> 00:07:08.000 за всичките неща, които са направили през тази година. 00:07:08.000 --> 00:07:11.000 за всичките неща, които са смятали да направят през 1950, 00:07:11.000 --> 00:07:16.000 за всичките мечти, които са искали да постигнат през 1950. 00:07:16.000 --> 00:07:18.000 Всъщност,1950 беше толкова пленителна, 00:07:18.000 --> 00:07:20.000 че за години напред 00:07:20.000 --> 00:07:23.000 хората продължаваха да говорят за всичките невероятни неща, които са се случили 00:07:23.000 --> 00:07:25.000 през 1951, 1952, 1953. 00:07:25.000 --> 00:07:27.000 Най-накрая през 1954 00:07:27.000 --> 00:07:29.000 някой се събуди и осъзна, че 00:07:29.000 --> 00:07:33.000 1950 е минала някакси пасивно, 00:07:33.000 --> 00:07:35.000 (Смях) 00:07:35.000 --> 00:07:37.000 И просто така балонът се спука. NOTE Paragraph 00:07:37.000 --> 00:07:39.000 (Смях) NOTE Paragraph 00:07:39.000 --> 00:07:41.000 А историята на 1950 00:07:41.000 --> 00:07:43.000 е историята на всяка година, която имаме в архив, 00:07:43.000 --> 00:07:46.000 с малък обрат, защото сега имаме тези хубави таблици. 00:07:46.000 --> 00:07:49.000 И защото имаме тези таблици, можем да измерваме неща. 00:07:49.000 --> 00:07:51.000 Можем да кажем: "Колко бързо се пука балонът?" 00:07:51.000 --> 00:07:54.000 И се оказва, че можем да измерим това доста бързо. 00:07:54.000 --> 00:07:57.000 Изведохме уравнения, направихме диаграми 00:07:57.000 --> 00:07:59.000 и чистият резултат 00:07:59.000 --> 00:08:02.000 е, че балонът се пука по-бързо и по-бързо 00:08:02.000 --> 00:08:04.000 с всяка следваща година. 00:08:04.000 --> 00:08:09.000 Загубваме интерес в миналото все по-бързо. NOTE Paragraph 00:08:09.000 --> 00:08:11.000 ЖМ: И сега един малък съвет относно кариерата. 00:08:11.000 --> 00:08:13.000 За тези от вас, които искат да станат известни, 00:08:13.000 --> 00:08:15.000 могат да се поучат от 25 от най-известните политици, 00:08:15.000 --> 00:08:17.000 писатели, актьори и т.н. 00:08:17.000 --> 00:08:20.000 Затова ако искате да станете известен на по-ранен етап, трябва да станете актьор, 00:08:20.000 --> 00:08:22.000 защото при тях славата расте от края на 20-те им години. 00:08:22.000 --> 00:08:24.000 Все още сте млад, невероятно е. 00:08:24.000 --> 00:08:26.000 Ако може да чакате, трябва да станете писател, 00:08:26.000 --> 00:08:28.000 защото тогава се изкачвате до големи висоти, 00:08:28.000 --> 00:08:30.000 като Марк Твен, например: изключително известен. 00:08:30.000 --> 00:08:32.000 Но ако искате да достигнете до самия връх, 00:08:32.000 --> 00:08:34.000 трябва да отложите овациите 00:08:34.000 --> 00:08:36.000 и, разбира се, да станете политик. 00:08:36.000 --> 00:08:38.000 Така ще станете известен към края на 50-те си години 00:08:38.000 --> 00:08:40.000 и ще станете много, много известен след това. 00:08:40.000 --> 00:08:43.000 Учените също стават популярни, когато остареят много. 00:08:43.000 --> 00:08:45.000 Например, биолози и физици 00:08:45.000 --> 00:08:47.000 стават почти толкова известни, колкото актьорите. 00:08:47.000 --> 00:08:50.000 Една грешка, която не трябва да допускте, е да станете математици. 00:08:50.000 --> 00:08:52.000 (Смях) 00:08:52.000 --> 00:08:54.000 Ако направите това, 00:08:54.000 --> 00:08:57.000 може да си помислите: "О, страхотно, ще създам най-добрия си труд, когато съм на 20." 00:08:57.000 --> 00:08:59.000 Но познайте какво, на никого няма да му пука. NOTE Paragraph 00:08:59.000 --> 00:09:02.000 (Смях) NOTE Paragraph 00:09:02.000 --> 00:09:04.000 ЕЛА: Има по-изтрезвяващи бележки 00:09:04.000 --> 00:09:06.000 сред н-грамите. 00:09:06.000 --> 00:09:08.000 Например, ето траекторията на Марк Шагал, 00:09:08.000 --> 00:09:10.000 артист, роден през 1887. 00:09:10.000 --> 00:09:13.000 И това изглежда като нормалната траектория на един известен човек. 00:09:13.000 --> 00:09:17.000 Той става по-известен, и по-известен, и по-известен 00:09:17.000 --> 00:09:19.000 освен ако не гледате в немския език. 00:09:19.000 --> 00:09:21.000 Ако гледате в немския език, ще забележите нещо много странно, 00:09:21.000 --> 00:09:23.000 нещо, което почти не се забелязва никъде, 00:09:23.000 --> 00:09:25.000 е това че той става много известен 00:09:25.000 --> 00:09:27.000 и изведнъж тръгва стремглаво надолу, 00:09:27.000 --> 00:09:30.000 и стига до най-ниската точка между 1933 и 1945, 00:09:30.000 --> 00:09:33.000 преди да се отблъсне отново. 00:09:33.000 --> 00:09:35.000 И разбира се, това, което наблюдаваме, 00:09:35.000 --> 00:09:38.000 е фактът, че Марк Шагал е бил еврейски артист 00:09:38.000 --> 00:09:40.000 в нацистка Германия. NOTE Paragraph 00:09:40.000 --> 00:09:42.000 Тези сигнали 00:09:42.000 --> 00:09:44.000 са толкова силни, 00:09:44.000 --> 00:09:47.000 че не ни трябва да знаем, че някой е бил цензуриран. 00:09:47.000 --> 00:09:49.000 Всъщност можем да достигнем до този извод, 00:09:49.000 --> 00:09:51.000 като използваме елементарно преработване на сигналите. 00:09:51.000 --> 00:09:53.000 Ето един лесен начин да го направите. 00:09:53.000 --> 00:09:55.000 Е, разумното очакване 00:09:55.000 --> 00:09:57.000 е, че славата на някого в даден период от време 00:09:57.000 --> 00:09:59.000 би трябвало да бъде грубо средното от тяхната слава преди 00:09:59.000 --> 00:10:01.000 и след. 00:10:01.000 --> 00:10:03.000 Та, това е горе-долу какво очакваме. 00:10:03.000 --> 00:10:06.000 И сравняваме това със славата, която наблюдаваме 00:10:06.000 --> 00:10:08.000 и просто разделяме едната на другата, 00:10:08.000 --> 00:10:10.000 за да получим нещо, което наричаме индекс на потискане. 00:10:10.000 --> 00:10:13.000 Ако този индекс е много, много, много малък, 00:10:13.000 --> 00:10:15.000 тогава може би сте потиснати. 00:10:15.000 --> 00:10:18.000 Ако е много голям, тогава най-вероятно се възползвате от пропаганда. NOTE Paragraph 00:10:19.000 --> 00:10:21.000 ЖМ: Сега може да наблюдавате 00:10:21.000 --> 00:10:24.000 разпределението на тези индекси сред цели народи. 00:10:24.000 --> 00:10:26.000 Например, тук- 00:10:26.000 --> 00:10:28.000 този индекс на потискане е за 5 000 души, 00:10:28.000 --> 00:10:30.000 избрани от английски книги, къдете няма познат натиск- 00:10:30.000 --> 00:10:32.000 би било така-силно концентриран върху един. 00:10:32.000 --> 00:10:34.000 Това, което очаквате, е горе-долу това, което наблюдавате. 00:10:34.000 --> 00:10:36.000 Това е разпределение, както в Германия- 00:10:36.000 --> 00:10:38.000 много различно, изместено вляво. 00:10:38.000 --> 00:10:41.000 Хората говореха за него 2 пъти по-малко, а и така е трябвало да бъде. 00:10:41.000 --> 00:10:43.000 Но много по-важно е, че разпространението е трябвало да бъде по-обширно. 00:10:43.000 --> 00:10:46.000 Има много хора, които попадат в крайно ляво при това разпределение. 00:10:46.000 --> 00:10:49.000 И за тях се е говорило 10 пъти по-малко, отколкото е трябвало. 00:10:49.000 --> 00:10:51.000 Но пък тогава много хора в крайно дясно 00:10:51.000 --> 00:10:53.000 изглежда имат полза от пропаганда. 00:10:53.000 --> 00:10:56.000 Тази картина е характерна черта за цензура в книгите. NOTE Paragraph 00:10:56.000 --> 00:10:58.000 ЕЛА: Наричаме културомикс 00:10:58.000 --> 00:11:00.000 този метод. 00:11:00.000 --> 00:11:02.000 Прилича на геномикс. 00:11:02.000 --> 00:11:04.000 Само че геномиксът е леща в биологията 00:11:04.000 --> 00:11:07.000 през прозорецът на редицата от бази в човешкия геном. 00:11:07.000 --> 00:11:09.000 Културомиксът е подобен. 00:11:09.000 --> 00:11:12.000 Това е приложението на огромна база данни анализи 00:11:12.000 --> 00:11:14.000 за изучаване на човешката култура. 00:11:14.000 --> 00:11:16.000 Тук, вместо през леща на геном, 00:11:16.000 --> 00:11:19.000 използваме леща на дигитализирани късове на човешката история. 00:11:19.000 --> 00:11:21.000 Невероятното нещо на културомиксА 00:11:21.000 --> 00:11:23.000 е това, че всеки може да го прави. 00:11:23.000 --> 00:11:25.000 А защо това е така? 00:11:25.000 --> 00:11:27.000 Всеки може да го прави, защото 3 момчета, 00:11:27.000 --> 00:11:30.000 Джон Оруънт, Мат Грей и Уил Брокман в Гугъл, 00:11:30.000 --> 00:11:32.000 видяха прототипа на Нграм Вюър, 00:11:32.000 --> 00:11:34.000 и казаха: "Това е толквоа забавно. 00:11:34.000 --> 00:11:37.000 Трябва да направим това достъпно за хората." 00:11:37.000 --> 00:11:39.000 И така за 2 седмици -2 седмици, преди да ни излезе докладът, 00:11:39.000 --> 00:11:42.000 те измислиха версия на програмата за широката публика. 00:11:42.000 --> 00:11:45.000 И така всеки може да напише думата, която го интересува, 00:11:45.000 --> 00:11:47.000 и да види нейната н-грама веднага. 00:11:47.000 --> 00:11:49.000 А също така и да търси примери на най-различни книги, 00:11:49.000 --> 00:11:51.000 в които се появява н-грамата. NOTE Paragraph 00:11:51.000 --> 00:11:53.000 ЖМ: Това беше изпробвано над милион пъти на първия ден 00:11:53.000 --> 00:11:55.000 и това е наистина най-хубавото от всички питания. 00:11:55.000 --> 00:11:58.000 Хората, които иската да бъдат най-добри, слагат най-добрия си крак напред. 00:11:58.000 --> 00:12:01.000 Но изглежда през 18 век на хората не им е пукало за това изобщо. 00:12:01.000 --> 00:12:04.000 Те не са искали да са най-добре, а са искали да са най-добрите. 00:12:04.000 --> 00:12:07.000 Излиза, че просто е станала грешка. 00:12:07.000 --> 00:12:09.000 Не е този стремеж за посредственост, 00:12:09.000 --> 00:12:12.000 а просто С се е изписвало различно, малко като Ф. 00:12:12.000 --> 00:12:15.000 Но разбира се, Гугъл не са знаели това на времето, 00:12:15.000 --> 00:12:18.000 затова отбелязахме това в научната статия, която написахме. 00:12:18.000 --> 00:12:20.000 Но изглежда това само напомня, 00:12:20.000 --> 00:12:22.000 че въпреки това да е много забавно, 00:12:22.000 --> 00:12:24.000 когато тълкувате тези графи, трябва да сте много внимателни, 00:12:24.000 --> 00:12:27.000 и трябва да усвоите основните стандарти в науките. NOTE Paragraph 00:12:27.000 --> 00:12:30.000 ЕЛА: Хората са използвали това за всякакви цели. 00:12:30.000 --> 00:12:37.000 (Смях) 00:12:37.000 --> 00:12:39.000 Всъщност, няма да приказваме, 00:12:39.000 --> 00:12:42.000 а просто ще ви покажем всичките слайдове и ще замълчим. 00:12:42.000 --> 00:12:45.000 Този човек се е интересувал от историята на раздразнението. 00:12:45.000 --> 00:12:48.000 Има различни видове раздразнение. 00:12:48.000 --> 00:12:51.000 Ако си прободеш пръста на крака, това е "Ауч" с едно A. 00:12:51.000 --> 00:12:53.000 Ако Земята бъде унищожена от Вогони, 00:12:53.000 --> 00:12:55.000 за да направят път за междузвезден път, 00:12:55.000 --> 00:12:57.000 това е "Aааааааргхх" с 8 А-та. 00:12:57.000 --> 00:12:59.000 Този човек изучава всички А-та, 00:12:59.000 --> 00:13:01.000 от едно до осем. 00:13:01.000 --> 00:13:03.000 Излиза, че 00:13:03.000 --> 00:13:05.000 по-малко използваното "аргх" 00:13:05.000 --> 00:13:08.000 са, разбира се, тези, които съответстват на неща, които са по-дразнещи, 00:13:08.000 --> 00:13:11.000 освен, странно, през 80-те. 00:13:11.000 --> 00:13:13.000 Мислим, че това има нещо общо с Рейгън. NOTE Paragraph 00:13:13.000 --> 00:13:15.000 (Смях) NOTE Paragraph 00:13:15.000 --> 00:13:18.000 ЖМ: Тези данни имат много приложения, 00:13:18.000 --> 00:13:21.000 но най-важното е, че историческте архиви се дигитализират. 00:13:21.000 --> 00:13:23.000 Гугъл е започнал да прави това с 15 милиона книги. 00:13:23.000 --> 00:13:25.000 Това са 12% от всички публикувани книги. 00:13:25.000 --> 00:13:28.000 Това е огромен къс от човешката култура. 00:13:28.000 --> 00:13:31.000 Има много повече в културата: ръкописи, вестници, 00:13:31.000 --> 00:13:33.000 неща, които не са текстове, като изкуството и картините. 00:13:33.000 --> 00:13:35.000 Всичко това е на нашите компютри, 00:13:35.000 --> 00:13:37.000 на компютри по целия свят. 00:13:37.000 --> 00:13:40.000 И когато това се случи, това ще промени начина ни на 00:13:40.000 --> 00:13:42.000 разбиране на нашето минало, настояще и бъдеще. NOTE Paragraph 00:13:42.000 --> 00:13:44.000 Благодаря ви много. NOTE Paragraph 00:13:44.000 --> 00:13:47.000 (Аплодисменти)