1 00:00:00,000 --> 00:00:02,000 Ерез Лийберман Айден: Всеки знае, 2 00:00:02,000 --> 00:00:05,000 че една картина струва хиляда думи. 3 00:00:07,000 --> 00:00:09,000 Но ние от Харвард 4 00:00:09,000 --> 00:00:12,000 се чудехме дали това наистина е вярно. 5 00:00:12,000 --> 00:00:14,000 (Смях) 6 00:00:14,000 --> 00:00:18,000 Затова събрахме екип от експерти, 7 00:00:18,000 --> 00:00:20,000 който включва Харвард, МИТ, 8 00:00:20,000 --> 00:00:23,000 Американския речник "Херитидж", енциклопедия "Британика" 9 00:00:23,000 --> 00:00:25,000 и дори гордите ни спонсори- 10 00:00:25,000 --> 00:00:28,000 Гугъл. 11 00:00:28,000 --> 00:00:30,000 Размишлявахме върху това 12 00:00:30,000 --> 00:00:32,000 около 4 години 13 00:00:32,000 --> 00:00:37,000 и стигнахме до стряскащ извод. 14 00:00:37,000 --> 00:00:40,000 Дами и господа, една картина не струва хиляда думи. 15 00:00:40,000 --> 00:00:42,000 Всъщност намерихме няколко картини, 16 00:00:42,000 --> 00:00:47,000 които струват 500 милиарда думи. 17 00:00:47,000 --> 00:00:49,000 Жан Батист Мишел: Как стигнахме до този извод? 18 00:00:49,000 --> 00:00:51,000 Ерез и аз търсихме начини 19 00:00:51,000 --> 00:00:53,000 да добием пълна представа за човешката култура 20 00:00:53,000 --> 00:00:56,000 и история-как се променят във времето. 21 00:00:56,000 --> 00:00:58,000 Много книги са били написани през вековете. 22 00:00:58,000 --> 00:01:00,000 Та си мислехме: "Добре, най-добрият начин да се научим от тях 23 00:01:00,000 --> 00:01:02,000 е да прочетем всички тези милиони книги" 24 00:01:02,000 --> 00:01:05,000 Разбира се, ако има степен колко невероятно е това, 25 00:01:05,000 --> 00:01:08,000 това трябва да е доста, доста голяма степен. 26 00:01:08,000 --> 00:01:10,000 Проблемът е, че има ос Х за това, 27 00:01:10,000 --> 00:01:12,000 която е практическата ос. 28 00:01:12,000 --> 00:01:14,000 Това е много, много ниско. 29 00:01:14,000 --> 00:01:17,000 (Аплодисменти) 30 00:01:17,000 --> 00:01:20,000 Сега хората използват алтернативен подход, 31 00:01:20,000 --> 00:01:22,000 който включва намирането на няколко източника и прочитането им много внимателно. 32 00:01:22,000 --> 00:01:24,000 Това е много практично, но не толкова невероятно. 33 00:01:24,000 --> 00:01:27,000 Това, което наистина искаш да направиш, 34 00:01:27,000 --> 00:01:30,000 е да стигнеш до невероятната, но практична част в тази област. 35 00:01:30,000 --> 00:01:33,000 Оказва се, че има компания отвъд реката на име Гугъл, 36 00:01:33,000 --> 00:01:35,000 която е била започнала преди няколко години проект по дигитизация, 37 00:01:35,000 --> 00:01:37,000 който може и да осъществи този подход. 38 00:01:37,000 --> 00:01:39,000 Те са направили електронен вариант на милиони книги. 39 00:01:39,000 --> 00:01:42,000 Това означава, че човек може да използва компютърни методи, 40 00:01:42,000 --> 00:01:44,000 за да чете всяка книга само с едно кликване. 41 00:01:44,000 --> 00:01:47,000 Това е много практично и изключително страхотно. 42 00:01:48,000 --> 00:01:50,000 ЕЛА: Нека Ви кажа малко повече за това, откъде идват книгите. 43 00:01:50,000 --> 00:01:53,000 Имало е писатели още от време оно. 44 00:01:53,000 --> 00:01:56,000 Тези писатели са се опитвали всячески да пишат книги. 45 00:01:56,000 --> 00:01:58,000 И това станало доста по-лесно 46 00:01:58,000 --> 00:02:00,000 с изобретяването на печатната машина преди няколко века. 47 00:02:00,000 --> 00:02:03,000 Оттогава писателите са получили 48 00:02:03,000 --> 00:02:05,000 129 милиона различни възможности 49 00:02:05,000 --> 00:02:07,000 да публикуват книги. 50 00:02:07,000 --> 00:02:09,000 Ако тези книги не бъдат изгубени някъде в историята, 51 00:02:09,000 --> 00:02:11,000 то те ще бъдат някъде в библиотека 52 00:02:11,000 --> 00:02:14,000 и много от тези книги биват намирани в библиотеките 53 00:02:14,000 --> 00:02:16,000 и дигитализирани от Гугъл. 54 00:02:16,000 --> 00:02:18,000 Гугъл вече е сканирал над 15 милиона книги до този момент. 55 00:02:18,000 --> 00:02:21,000 Когато Гугъл дигитализира една книга, те я правят в много добър формат. 56 00:02:21,000 --> 00:02:23,000 Сега имаме данните, освен това имаме метаданни. 57 00:02:23,000 --> 00:02:26,000 Имаме информация къде е публикувана, 58 00:02:26,000 --> 00:02:28,000 кой е авторът, кога е била публикувана. 59 00:02:28,000 --> 00:02:31,000 Какво направихме ние - прегледахме всички тези архиви 60 00:02:31,000 --> 00:02:35,000 и изхвърлихме всичко, което не е най-високо качество. 61 00:02:35,000 --> 00:02:37,000 Това, което получихме, 62 00:02:37,000 --> 00:02:40,000 е една колекция от 5 милиона книги, 63 00:02:40,000 --> 00:02:43,000 500 милиарда думи, 64 00:02:43,000 --> 00:02:45,000 наниз от знаци хиляда пъти по-дълъг 65 00:02:45,000 --> 00:02:48,000 от човешкия геном- 66 00:02:48,000 --> 00:02:50,000 текст, който ако бъде написан, 67 00:02:50,000 --> 00:02:52,000 ще е дълъг от тук до Луната и обратно, 68 00:02:52,000 --> 00:02:54,000 умножено по 10 пъти- 69 00:02:54,000 --> 00:02:58,000 истински къс от нашия културен геном. 70 00:02:58,000 --> 00:03:00,000 Разбира се, това, което направихме, 71 00:03:00,000 --> 00:03:03,000 изправени пред толкова голяма хипербола, 72 00:03:03,000 --> 00:03:05,000 (Смях) 73 00:03:05,000 --> 00:03:08,000 беше това, което всеки себеуважаващ се изследовател 74 00:03:08,000 --> 00:03:11,000 би направил. 75 00:03:11,000 --> 00:03:13,000 Взехме една страница от ХКСД 76 00:03:13,000 --> 00:03:15,000 и казахме: "Стойте назад! 77 00:03:15,000 --> 00:03:17,000 Ще изпробваваме наука." 78 00:03:17,000 --> 00:03:19,000 (Смях) 79 00:03:19,000 --> 00:03:21,000 ЖМ: Сега, разбира се, си мислим 80 00:03:21,000 --> 00:03:23,000 първо да направим данните свободни, 81 00:03:23,000 --> 00:03:25,000 за да могат хората да правят наука с тях. 82 00:03:25,000 --> 00:03:27,000 Мислим си какви данни можем да направим достъпни? 83 00:03:27,000 --> 00:03:29,000 Разбира се, че искате да вземете книгите 84 00:03:29,000 --> 00:03:31,000 и да пуснете пълните текстове на тези 5 милиона книги по нета. 85 00:03:31,000 --> 00:03:33,000 Гугъл и Джон Оруънт най-вече 86 00:03:33,000 --> 00:03:35,000 ни казаха едно малко уравнение, което трябва да научим. 87 00:03:35,000 --> 00:03:38,000 И така, имаш 5 милиона книги, което е 5 милиона автора, 88 00:03:38,000 --> 00:03:41,000 а 5 милиона ищци е един голям съдебен процес. 89 00:03:41,000 --> 00:03:43,000 И въпреки че това би било наистина много, много готино, 90 00:03:43,000 --> 00:03:46,000 отново, това е много, много непрактично. 91 00:03:46,000 --> 00:03:48,000 (Смях) 92 00:03:48,000 --> 00:03:50,000 Отново ние леко отстъпихме 93 00:03:50,000 --> 00:03:53,000 и предприехме практичния подход, който беше по-малко готин. 94 00:03:53,000 --> 00:03:55,000 Казахме си: "Добре, вместо да пуснем пълния текст, 95 00:03:55,000 --> 00:03:57,000 ще пуснем в интернет пространството статистика за книгите. 96 00:03:57,000 --> 00:03:59,000 Така, вземете например "Лъч щастие". 97 00:03:59,000 --> 00:04:01,000 това са 4 думи, наричаме това 4-грама. 98 00:04:01,000 --> 00:04:03,000 Ще ви кажем колко пъти точно определена 4-грама 99 00:04:03,000 --> 00:04:05,000 се е появявал в книги от 1801, 1802, 1803, 100 00:04:05,000 --> 00:04:07,000 чак до 2008. 101 00:04:07,000 --> 00:04:09,000 Това ни дава времеви серии, 102 00:04:09,000 --> 00:04:11,000 посочващи колко пъти точно това изречение е било използвано във времето. 103 00:04:11,000 --> 00:04:14,000 Направихме това за всички думи и фрази, които се появяват в тези книги. 104 00:04:14,000 --> 00:04:17,000 Това ни дава една голяма таблица от 2 милиарда реда, 105 00:04:17,000 --> 00:04:19,000 която ни казва как културата ни се е променяла. 106 00:04:19,000 --> 00:04:21,000 ЕЛА: Тези 2 милиарда реда 107 00:04:21,000 --> 00:04:23,000 наричаме 2 милиарда н-грами. 108 00:04:23,000 --> 00:04:25,000 Какво ни казват те? 109 00:04:25,000 --> 00:04:27,000 Индивидуалните н-грамови измерват културните тенденции. 110 00:04:27,000 --> 00:04:29,000 Нека ви дам един пример. 111 00:04:29,000 --> 00:04:31,000 Нека предположим, че аз преуспявам. 112 00:04:31,000 --> 00:04:33,000 Утре искам да ви кажа колко добре се справих. 113 00:04:33,000 --> 00:04:36,000 И така, може да кажа: "Вчера успях." 114 00:04:36,000 --> 00:04:39,000 Алтернативно мога да кажа: "Вчера преуспях." 115 00:04:39,000 --> 00:04:42,000 Добре, кое да използвам? 116 00:04:42,000 --> 00:04:44,000 Как да разбера? 117 00:04:44,000 --> 00:04:46,000 От преди около 6 месеца 118 00:04:46,000 --> 00:04:48,000 състоянието на изкуството в тази сфера 119 00:04:48,000 --> 00:04:50,000 би било такова, например, 120 00:04:50,000 --> 00:04:52,000 че да ви накара да отидете при психолог с невероятна коса 121 00:04:52,000 --> 00:04:54,000 и да кажете: 122 00:04:54,000 --> 00:04:57,000 "Стийв, ти си експерт по неправилни глаголи. 123 00:04:57,000 --> 00:04:59,000 Какво да правя?" 124 00:04:59,000 --> 00:05:01,000 И той би ви казал: "Повечето хора казват успях, 125 00:05:01,000 --> 00:05:04,000 но някои хора казват преуспях." 126 00:05:04,000 --> 00:05:06,000 И ти знаеше малко или много, 127 00:05:06,000 --> 00:05:09,000 че ако се върнеш назад 200 години 128 00:05:09,000 --> 00:05:12,000 и попиташ същия човек със също толкова хубава коса, 129 00:05:12,000 --> 00:05:15,000 (Смях) 130 00:05:15,000 --> 00:05:17,000 "Том, какво би трябвало да кажа?" 131 00:05:17,000 --> 00:05:19,000 Той би ви отговорил: "По мое време повечето хора успяваха, 132 00:05:19,000 --> 00:05:22,000 но някои преуспяха." 133 00:05:22,000 --> 00:05:24,000 Сега ще ви покажа само сухи данни. 134 00:05:24,000 --> 00:05:28,000 Два реда от тази таблица с 2 милиарда реда. 135 00:05:28,000 --> 00:05:30,000 Това, което виждате, е година след година използване 136 00:05:30,000 --> 00:05:33,000 на "успял" и "преуспял" през времето. 137 00:05:34,000 --> 00:05:36,000 Това са само 2 138 00:05:36,000 --> 00:05:39,000 от 2 милиарда реда. 139 00:05:39,000 --> 00:05:41,000 Цялата база данни 140 00:05:41,000 --> 00:05:44,000 е един милиард пъти по-готина от този слайд. 141 00:05:44,000 --> 00:05:46,000 (Смях) 142 00:05:46,000 --> 00:05:50,000 (Аплодисменти) 143 00:05:50,000 --> 00:05:52,000 ЖМ: Има много други картини, които струват 500 милиарда думи. 144 00:05:52,000 --> 00:05:54,000 Например, тази. 145 00:05:54,000 --> 00:05:56,000 Ако вземете инфлуенца, 146 00:05:56,000 --> 00:05:58,000 ще надникнете във времето, когато сте знаели, че 147 00:05:58,000 --> 00:06:01,000 големи епидемии са убивали хора по целия глобус. 148 00:06:01,000 --> 00:06:04,000 ЕЛА: Ако още не сте убеден 149 00:06:04,000 --> 00:06:06,000 нивото на морското равнище се покачва, 150 00:06:06,000 --> 00:06:09,000 както и атмосферният въглероден двуокис и глобалната температура. 151 00:06:09,000 --> 00:06:12,000 ЖМ: Може би искате да видите и точно тази н-грама 152 00:06:12,000 --> 00:06:15,000 и това е за да кажем на Ницше, че Господ не е мъртъв, 153 00:06:15,000 --> 00:06:18,000 въпреки че ще се съгласите, че ще се нуждае от по-добър публицист. 154 00:06:18,000 --> 00:06:20,000 (Смях) 155 00:06:20,000 --> 00:06:23,000 ЕЛА: Може да достигнете до някои доста абстрактни идеи с този начин на мислене. 156 00:06:23,000 --> 00:06:25,000 Например, нека ви кажа историята 157 00:06:25,000 --> 00:06:27,000 на 1950 година. 158 00:06:27,000 --> 00:06:29,000 Горе-долу за по-голямата част от историята 159 00:06:29,000 --> 00:06:31,000 на никой не му пукаше за 1950. 160 00:06:31,000 --> 00:06:33,000 През 1700, 1800, 1900 161 00:06:33,000 --> 00:06:36,000 никой не се интересуваше. 162 00:06:37,000 --> 00:06:39,000 През 30-те и 40-те години 163 00:06:39,000 --> 00:06:41,000 на никой не му пукаше. 164 00:06:41,000 --> 00:06:43,000 Изведнъж, по средата на 40-те 165 00:06:43,000 --> 00:06:45,000 започна едно шумене. 166 00:06:45,000 --> 00:06:47,000 Хората осъзнаха, че 1950 ще се случи 167 00:06:47,000 --> 00:06:49,000 и че може би ще е голямо. 168 00:06:49,000 --> 00:06:52,000 (Смях) 169 00:06:52,000 --> 00:06:55,000 Но нищо не заинтересова хората през 1950 170 00:06:55,000 --> 00:06:58,000 така, както годината 1950. 171 00:06:58,000 --> 00:07:01,000 (Смях) 172 00:07:01,000 --> 00:07:03,000 Хората ходеха наоколо обсебени. 173 00:07:03,000 --> 00:07:05,000 Не можеха да спрат да говорят 174 00:07:05,000 --> 00:07:08,000 за всичките неща, които са направили през тази година. 175 00:07:08,000 --> 00:07:11,000 за всичките неща, които са смятали да направят през 1950, 176 00:07:11,000 --> 00:07:16,000 за всичките мечти, които са искали да постигнат през 1950. 177 00:07:16,000 --> 00:07:18,000 Всъщност,1950 беше толкова пленителна, 178 00:07:18,000 --> 00:07:20,000 че за години напред 179 00:07:20,000 --> 00:07:23,000 хората продължаваха да говорят за всичките невероятни неща, които са се случили 180 00:07:23,000 --> 00:07:25,000 през 1951, 1952, 1953. 181 00:07:25,000 --> 00:07:27,000 Най-накрая през 1954 182 00:07:27,000 --> 00:07:29,000 някой се събуди и осъзна, че 183 00:07:29,000 --> 00:07:33,000 1950 е минала някакси пасивно, 184 00:07:33,000 --> 00:07:35,000 (Смях) 185 00:07:35,000 --> 00:07:37,000 И просто така балонът се спука. 186 00:07:37,000 --> 00:07:39,000 (Смях) 187 00:07:39,000 --> 00:07:41,000 А историята на 1950 188 00:07:41,000 --> 00:07:43,000 е историята на всяка година, която имаме в архив, 189 00:07:43,000 --> 00:07:46,000 с малък обрат, защото сега имаме тези хубави таблици. 190 00:07:46,000 --> 00:07:49,000 И защото имаме тези таблици, можем да измерваме неща. 191 00:07:49,000 --> 00:07:51,000 Можем да кажем: "Колко бързо се пука балонът?" 192 00:07:51,000 --> 00:07:54,000 И се оказва, че можем да измерим това доста бързо. 193 00:07:54,000 --> 00:07:57,000 Изведохме уравнения, направихме диаграми 194 00:07:57,000 --> 00:07:59,000 и чистият резултат 195 00:07:59,000 --> 00:08:02,000 е, че балонът се пука по-бързо и по-бързо 196 00:08:02,000 --> 00:08:04,000 с всяка следваща година. 197 00:08:04,000 --> 00:08:09,000 Загубваме интерес в миналото все по-бързо. 198 00:08:09,000 --> 00:08:11,000 ЖМ: И сега един малък съвет относно кариерата. 199 00:08:11,000 --> 00:08:13,000 За тези от вас, които искат да станат известни, 200 00:08:13,000 --> 00:08:15,000 могат да се поучат от 25 от най-известните политици, 201 00:08:15,000 --> 00:08:17,000 писатели, актьори и т.н. 202 00:08:17,000 --> 00:08:20,000 Затова ако искате да станете известен на по-ранен етап, трябва да станете актьор, 203 00:08:20,000 --> 00:08:22,000 защото при тях славата расте от края на 20-те им години. 204 00:08:22,000 --> 00:08:24,000 Все още сте млад, невероятно е. 205 00:08:24,000 --> 00:08:26,000 Ако може да чакате, трябва да станете писател, 206 00:08:26,000 --> 00:08:28,000 защото тогава се изкачвате до големи висоти, 207 00:08:28,000 --> 00:08:30,000 като Марк Твен, например: изключително известен. 208 00:08:30,000 --> 00:08:32,000 Но ако искате да достигнете до самия връх, 209 00:08:32,000 --> 00:08:34,000 трябва да отложите овациите 210 00:08:34,000 --> 00:08:36,000 и, разбира се, да станете политик. 211 00:08:36,000 --> 00:08:38,000 Така ще станете известен към края на 50-те си години 212 00:08:38,000 --> 00:08:40,000 и ще станете много, много известен след това. 213 00:08:40,000 --> 00:08:43,000 Учените също стават популярни, когато остареят много. 214 00:08:43,000 --> 00:08:45,000 Например, биолози и физици 215 00:08:45,000 --> 00:08:47,000 стават почти толкова известни, колкото актьорите. 216 00:08:47,000 --> 00:08:50,000 Една грешка, която не трябва да допускте, е да станете математици. 217 00:08:50,000 --> 00:08:52,000 (Смях) 218 00:08:52,000 --> 00:08:54,000 Ако направите това, 219 00:08:54,000 --> 00:08:57,000 може да си помислите: "О, страхотно, ще създам най-добрия си труд, когато съм на 20." 220 00:08:57,000 --> 00:08:59,000 Но познайте какво, на никого няма да му пука. 221 00:08:59,000 --> 00:09:02,000 (Смях) 222 00:09:02,000 --> 00:09:04,000 ЕЛА: Има по-изтрезвяващи бележки 223 00:09:04,000 --> 00:09:06,000 сред н-грамите. 224 00:09:06,000 --> 00:09:08,000 Например, ето траекторията на Марк Шагал, 225 00:09:08,000 --> 00:09:10,000 артист, роден през 1887. 226 00:09:10,000 --> 00:09:13,000 И това изглежда като нормалната траектория на един известен човек. 227 00:09:13,000 --> 00:09:17,000 Той става по-известен, и по-известен, и по-известен 228 00:09:17,000 --> 00:09:19,000 освен ако не гледате в немския език. 229 00:09:19,000 --> 00:09:21,000 Ако гледате в немския език, ще забележите нещо много странно, 230 00:09:21,000 --> 00:09:23,000 нещо, което почти не се забелязва никъде, 231 00:09:23,000 --> 00:09:25,000 е това че той става много известен 232 00:09:25,000 --> 00:09:27,000 и изведнъж тръгва стремглаво надолу, 233 00:09:27,000 --> 00:09:30,000 и стига до най-ниската точка между 1933 и 1945, 234 00:09:30,000 --> 00:09:33,000 преди да се отблъсне отново. 235 00:09:33,000 --> 00:09:35,000 И разбира се, това, което наблюдаваме, 236 00:09:35,000 --> 00:09:38,000 е фактът, че Марк Шагал е бил еврейски артист 237 00:09:38,000 --> 00:09:40,000 в нацистка Германия. 238 00:09:40,000 --> 00:09:42,000 Тези сигнали 239 00:09:42,000 --> 00:09:44,000 са толкова силни, 240 00:09:44,000 --> 00:09:47,000 че не ни трябва да знаем, че някой е бил цензуриран. 241 00:09:47,000 --> 00:09:49,000 Всъщност можем да достигнем до този извод, 242 00:09:49,000 --> 00:09:51,000 като използваме елементарно преработване на сигналите. 243 00:09:51,000 --> 00:09:53,000 Ето един лесен начин да го направите. 244 00:09:53,000 --> 00:09:55,000 Е, разумното очакване 245 00:09:55,000 --> 00:09:57,000 е, че славата на някого в даден период от време 246 00:09:57,000 --> 00:09:59,000 би трябвало да бъде грубо средното от тяхната слава преди 247 00:09:59,000 --> 00:10:01,000 и след. 248 00:10:01,000 --> 00:10:03,000 Та, това е горе-долу какво очакваме. 249 00:10:03,000 --> 00:10:06,000 И сравняваме това със славата, която наблюдаваме 250 00:10:06,000 --> 00:10:08,000 и просто разделяме едната на другата, 251 00:10:08,000 --> 00:10:10,000 за да получим нещо, което наричаме индекс на потискане. 252 00:10:10,000 --> 00:10:13,000 Ако този индекс е много, много, много малък, 253 00:10:13,000 --> 00:10:15,000 тогава може би сте потиснати. 254 00:10:15,000 --> 00:10:18,000 Ако е много голям, тогава най-вероятно се възползвате от пропаганда. 255 00:10:19,000 --> 00:10:21,000 ЖМ: Сега може да наблюдавате 256 00:10:21,000 --> 00:10:24,000 разпределението на тези индекси сред цели народи. 257 00:10:24,000 --> 00:10:26,000 Например, тук- 258 00:10:26,000 --> 00:10:28,000 този индекс на потискане е за 5 000 души, 259 00:10:28,000 --> 00:10:30,000 избрани от английски книги, къдете няма познат натиск- 260 00:10:30,000 --> 00:10:32,000 би било така-силно концентриран върху един. 261 00:10:32,000 --> 00:10:34,000 Това, което очаквате, е горе-долу това, което наблюдавате. 262 00:10:34,000 --> 00:10:36,000 Това е разпределение, както в Германия- 263 00:10:36,000 --> 00:10:38,000 много различно, изместено вляво. 264 00:10:38,000 --> 00:10:41,000 Хората говореха за него 2 пъти по-малко, а и така е трябвало да бъде. 265 00:10:41,000 --> 00:10:43,000 Но много по-важно е, че разпространението е трябвало да бъде по-обширно. 266 00:10:43,000 --> 00:10:46,000 Има много хора, които попадат в крайно ляво при това разпределение. 267 00:10:46,000 --> 00:10:49,000 И за тях се е говорило 10 пъти по-малко, отколкото е трябвало. 268 00:10:49,000 --> 00:10:51,000 Но пък тогава много хора в крайно дясно 269 00:10:51,000 --> 00:10:53,000 изглежда имат полза от пропаганда. 270 00:10:53,000 --> 00:10:56,000 Тази картина е характерна черта за цензура в книгите. 271 00:10:56,000 --> 00:10:58,000 ЕЛА: Наричаме културомикс 272 00:10:58,000 --> 00:11:00,000 този метод. 273 00:11:00,000 --> 00:11:02,000 Прилича на геномикс. 274 00:11:02,000 --> 00:11:04,000 Само че геномиксът е леща в биологията 275 00:11:04,000 --> 00:11:07,000 през прозорецът на редицата от бази в човешкия геном. 276 00:11:07,000 --> 00:11:09,000 Културомиксът е подобен. 277 00:11:09,000 --> 00:11:12,000 Това е приложението на огромна база данни анализи 278 00:11:12,000 --> 00:11:14,000 за изучаване на човешката култура. 279 00:11:14,000 --> 00:11:16,000 Тук, вместо през леща на геном, 280 00:11:16,000 --> 00:11:19,000 използваме леща на дигитализирани късове на човешката история. 281 00:11:19,000 --> 00:11:21,000 Невероятното нещо на културомиксА 282 00:11:21,000 --> 00:11:23,000 е това, че всеки може да го прави. 283 00:11:23,000 --> 00:11:25,000 А защо това е така? 284 00:11:25,000 --> 00:11:27,000 Всеки може да го прави, защото 3 момчета, 285 00:11:27,000 --> 00:11:30,000 Джон Оруънт, Мат Грей и Уил Брокман в Гугъл, 286 00:11:30,000 --> 00:11:32,000 видяха прототипа на Нграм Вюър, 287 00:11:32,000 --> 00:11:34,000 и казаха: "Това е толквоа забавно. 288 00:11:34,000 --> 00:11:37,000 Трябва да направим това достъпно за хората." 289 00:11:37,000 --> 00:11:39,000 И така за 2 седмици -2 седмици, преди да ни излезе докладът, 290 00:11:39,000 --> 00:11:42,000 те измислиха версия на програмата за широката публика. 291 00:11:42,000 --> 00:11:45,000 И така всеки може да напише думата, която го интересува, 292 00:11:45,000 --> 00:11:47,000 и да види нейната н-грама веднага. 293 00:11:47,000 --> 00:11:49,000 А също така и да търси примери на най-различни книги, 294 00:11:49,000 --> 00:11:51,000 в които се появява н-грамата. 295 00:11:51,000 --> 00:11:53,000 ЖМ: Това беше изпробвано над милион пъти на първия ден 296 00:11:53,000 --> 00:11:55,000 и това е наистина най-хубавото от всички питания. 297 00:11:55,000 --> 00:11:58,000 Хората, които иската да бъдат най-добри, слагат най-добрия си крак напред. 298 00:11:58,000 --> 00:12:01,000 Но изглежда през 18 век на хората не им е пукало за това изобщо. 299 00:12:01,000 --> 00:12:04,000 Те не са искали да са най-добре, а са искали да са най-добрите. 300 00:12:04,000 --> 00:12:07,000 Излиза, че просто е станала грешка. 301 00:12:07,000 --> 00:12:09,000 Не е този стремеж за посредственост, 302 00:12:09,000 --> 00:12:12,000 а просто С се е изписвало различно, малко като Ф. 303 00:12:12,000 --> 00:12:15,000 Но разбира се, Гугъл не са знаели това на времето, 304 00:12:15,000 --> 00:12:18,000 затова отбелязахме това в научната статия, която написахме. 305 00:12:18,000 --> 00:12:20,000 Но изглежда това само напомня, 306 00:12:20,000 --> 00:12:22,000 че въпреки това да е много забавно, 307 00:12:22,000 --> 00:12:24,000 когато тълкувате тези графи, трябва да сте много внимателни, 308 00:12:24,000 --> 00:12:27,000 и трябва да усвоите основните стандарти в науките. 309 00:12:27,000 --> 00:12:30,000 ЕЛА: Хората са използвали това за всякакви цели. 310 00:12:30,000 --> 00:12:37,000 (Смях) 311 00:12:37,000 --> 00:12:39,000 Всъщност, няма да приказваме, 312 00:12:39,000 --> 00:12:42,000 а просто ще ви покажем всичките слайдове и ще замълчим. 313 00:12:42,000 --> 00:12:45,000 Този човек се е интересувал от историята на раздразнението. 314 00:12:45,000 --> 00:12:48,000 Има различни видове раздразнение. 315 00:12:48,000 --> 00:12:51,000 Ако си прободеш пръста на крака, това е "Ауч" с едно A. 316 00:12:51,000 --> 00:12:53,000 Ако Земята бъде унищожена от Вогони, 317 00:12:53,000 --> 00:12:55,000 за да направят път за междузвезден път, 318 00:12:55,000 --> 00:12:57,000 това е "Aааааааргхх" с 8 А-та. 319 00:12:57,000 --> 00:12:59,000 Този човек изучава всички А-та, 320 00:12:59,000 --> 00:13:01,000 от едно до осем. 321 00:13:01,000 --> 00:13:03,000 Излиза, че 322 00:13:03,000 --> 00:13:05,000 по-малко използваното "аргх" 323 00:13:05,000 --> 00:13:08,000 са, разбира се, тези, които съответстват на неща, които са по-дразнещи, 324 00:13:08,000 --> 00:13:11,000 освен, странно, през 80-те. 325 00:13:11,000 --> 00:13:13,000 Мислим, че това има нещо общо с Рейгън. 326 00:13:13,000 --> 00:13:15,000 (Смях) 327 00:13:15,000 --> 00:13:18,000 ЖМ: Тези данни имат много приложения, 328 00:13:18,000 --> 00:13:21,000 но най-важното е, че историческте архиви се дигитализират. 329 00:13:21,000 --> 00:13:23,000 Гугъл е започнал да прави това с 15 милиона книги. 330 00:13:23,000 --> 00:13:25,000 Това са 12% от всички публикувани книги. 331 00:13:25,000 --> 00:13:28,000 Това е огромен къс от човешката култура. 332 00:13:28,000 --> 00:13:31,000 Има много повече в културата: ръкописи, вестници, 333 00:13:31,000 --> 00:13:33,000 неща, които не са текстове, като изкуството и картините. 334 00:13:33,000 --> 00:13:35,000 Всичко това е на нашите компютри, 335 00:13:35,000 --> 00:13:37,000 на компютри по целия свят. 336 00:13:37,000 --> 00:13:40,000 И когато това се случи, това ще промени начина ни на 337 00:13:40,000 --> 00:13:42,000 разбиране на нашето минало, настояще и бъдеще. 338 00:13:42,000 --> 00:13:44,000 Благодаря ви много. 339 00:13:44,000 --> 00:13:47,000 (Аплодисменти)