1 00:00:00,000 --> 00:00:02,000 Ерез Либерман Ејден: Сите знаат 2 00:00:02,000 --> 00:00:05,000 дека една слика вреди илјада зборови. 3 00:00:07,000 --> 00:00:09,000 Но, ние од Харвард 4 00:00:09,000 --> 00:00:12,000 се прашувавме дали ова навистина е така. 5 00:00:12,000 --> 00:00:14,000 (смеа) 6 00:00:14,000 --> 00:00:18,000 Па, составивме тим од експерти 7 00:00:18,000 --> 00:00:20,000 од Харвард, МИТ, 8 00:00:20,000 --> 00:00:23,000 Американскиот речник на зборови, Енциклопедија Британика, 9 00:00:23,000 --> 00:00:25,000 па дури и од нашиот горд спонзор 10 00:00:25,000 --> 00:00:28,000 Гугл. 11 00:00:28,000 --> 00:00:30,000 Внимателно работевме на ова 12 00:00:30,000 --> 00:00:32,000 околу четири години. 13 00:00:32,000 --> 00:00:37,000 И дојдовме до неверојатен заклучок. 14 00:00:37,000 --> 00:00:40,000 Дами и господа, сликата не вреди илјада зборови. 15 00:00:40,000 --> 00:00:42,000 Всушност, најдовме некои слики 16 00:00:42,000 --> 00:00:47,000 кои вредат 500 милијарди зборови. 17 00:00:47,000 --> 00:00:49,000 Жан-Батист Мишел: Како дојдовме до овој заклучок? 18 00:00:49,000 --> 00:00:51,000 Јас и Ерез размислувавме како 19 00:00:51,000 --> 00:00:53,000 да добиеме голема слика за човечката култура 20 00:00:53,000 --> 00:00:56,000 и човечката историја, за промените низ времето. 21 00:00:56,000 --> 00:00:58,000 Досега се напишани многу книги 22 00:00:58,000 --> 00:01:00,000 и си рековме дека најдобриот начин да учиме од нив 23 00:01:00,000 --> 00:01:02,000 е да ги прочитаме сите тие милиони книги. 24 00:01:02,000 --> 00:01:05,000 Се разбира, доколку постои скала на луди нешта, 25 00:01:05,000 --> 00:01:08,000 ова мора да се рангира екстремно високо. 26 00:01:08,000 --> 00:01:10,000 Проблемот е што истовремено постои и Х оска, 27 00:01:10,000 --> 00:01:12,000 која е многу практична оска. 28 00:01:12,000 --> 00:01:14,000 На неа сме многу ниско. 29 00:01:14,000 --> 00:01:17,000 (аплауз) 30 00:01:17,000 --> 00:01:20,000 Луѓето често користат алтернативен пристап, 31 00:01:20,000 --> 00:01:22,000 т.е. земаат неколку извори и ги читаат многу внимателно. 32 00:01:22,000 --> 00:01:24,000 Ова е многу практично, но не и многу луда работа. 33 00:01:24,000 --> 00:01:27,000 Она што навистина сакате да го направите 34 00:01:27,000 --> 00:01:30,000 е да дојдете до лудиот, но и практичен дел од овој простор. 35 00:01:30,000 --> 00:01:33,000 Излезе дека има една компанија преку реката што се вика Гугл, 36 00:01:33,000 --> 00:01:35,000 која неколку години претходно започнала проект за дигитализација, 37 00:01:35,000 --> 00:01:37,000 кој би можел да го овозможи овој пристап. 38 00:01:37,000 --> 00:01:39,000 Тие имаат дигитализирано милиони книги. 39 00:01:39,000 --> 00:01:42,000 Тоа значи дека можат да се користат методи за пресметка 40 00:01:42,000 --> 00:01:44,000 кои ќе овозможат читање на сите книги со еден клик. 41 00:01:44,000 --> 00:01:47,000 Тоа е многу практично и ептен лудо. 42 00:01:48,000 --> 00:01:50,000 Да ви кажам малку за тоа од каде доаѓаат книгите. 43 00:01:50,000 --> 00:01:53,000 Уште од памтивек постоеле автори, 44 00:01:53,000 --> 00:01:56,000 кои настојувале да пишуваат книги, 45 00:01:56,000 --> 00:01:58,000 што станало значително полесно 46 00:01:58,000 --> 00:02:00,000 со развојот на машината за печатење пред неколку века. 47 00:02:00,000 --> 00:02:03,000 Оттогаш, авторите успеале 48 00:02:03,000 --> 00:02:05,000 во 129 милиони поединечни случаи 49 00:02:05,000 --> 00:02:07,000 да објават книги. 50 00:02:07,000 --> 00:02:09,000 Доколку овие книги не се изгубени, 51 00:02:09,000 --> 00:02:11,000 тогаш се наоѓаат некаде во некоја библиотека. 52 00:02:11,000 --> 00:02:14,000 Многу од овие книги 53 00:02:14,000 --> 00:02:16,000 се дигитализирани од страна на Гугл, 54 00:02:16,000 --> 00:02:18,000 кој досега има скенирано 15 милиони книги. 55 00:02:18,000 --> 00:02:21,000 Кога Гугл дигитализира книга, ја става во навистина убав формат. 56 00:02:21,000 --> 00:02:23,000 Сега ги имаме податоците, плус имаме и метаподатоци, 57 00:02:23,000 --> 00:02:26,000 т.е. каде била објавена книгата, 58 00:02:26,000 --> 00:02:28,000 кој е авторот, кога била објавена. 59 00:02:28,000 --> 00:02:31,000 Потоа, ги прегледавме сите овие податоци 60 00:02:31,000 --> 00:02:35,000 и елиминиравме сè што не е со највисок квалитет. 61 00:02:35,000 --> 00:02:37,000 Она што ни останува 62 00:02:37,000 --> 00:02:40,000 е колекција од пет милиони книги. 63 00:02:40,000 --> 00:02:43,000 500 милијарди зборови. 64 00:02:43,000 --> 00:02:45,000 Низа од знаци илјада пати подолга 65 00:02:45,000 --> 00:02:48,000 од човечкиот геном - 66 00:02:48,000 --> 00:02:50,000 текст кој, кога би бил испишан, 67 00:02:50,000 --> 00:02:52,000 би се протегал од овде до Месечината и назад 68 00:02:52,000 --> 00:02:54,000 10 пати последователно - 69 00:02:54,000 --> 00:02:58,000 вистински сведок на нашиот културолошки геном. 70 00:02:58,000 --> 00:03:00,000 Се разбира, она што тогаш го направивме, 71 00:03:00,000 --> 00:03:03,000 соочени со една ваква безгранична хипербола... 72 00:03:03,000 --> 00:03:05,000 (смеа) 73 00:03:05,000 --> 00:03:08,000 е она што секои истражувачи со самопочит 74 00:03:08,000 --> 00:03:11,000 би го направиле. 75 00:03:11,000 --> 00:03:13,000 Како и во XKCD стриповите, 76 00:03:13,000 --> 00:03:15,000 рековме „Настрана, ве молиме. 77 00:03:15,000 --> 00:03:17,000 Одиме со наука.“ 78 00:03:17,000 --> 00:03:19,000 (смеа) 79 00:03:19,000 --> 00:03:21,000 Се разбира, си рековме 80 00:03:21,000 --> 00:03:23,000 „Ајде, прво да ги објавиме податоците, 81 00:03:23,000 --> 00:03:25,000 за луѓето да можат научно да ги обработат“. 82 00:03:25,000 --> 00:03:27,000 Се прашавме кои податоци да ги објавиме. 83 00:03:27,000 --> 00:03:29,000 Секако, би сакале 84 00:03:29,000 --> 00:03:31,000 да го објавите целиот текст од овие пет милиони книги. 85 00:03:31,000 --> 00:03:33,000 Гугл, а особено Џон Орвант, 86 00:03:33,000 --> 00:03:35,000 ни кажа една мала равенка што требаше да ја научиме. 87 00:03:35,000 --> 00:03:38,000 Значи, имате пет милиони. Тоа се пет милиони автори. 88 00:03:38,000 --> 00:03:41,000 А, тоа се пет милиони тужители. 89 00:03:41,000 --> 00:03:43,000 И макар што тоа би било навистина супер, 90 00:03:43,000 --> 00:03:46,000 сепак е многу непрактично. 91 00:03:46,000 --> 00:03:48,000 (смеа) 92 00:03:48,000 --> 00:03:50,000 Повторно се предомисливме 93 00:03:50,000 --> 00:03:53,000 и се насочивме кон попрактичниот пристап, кој не е толку луд. 94 00:03:53,000 --> 00:03:55,000 Па, наместо да го објавиме целиот текст, 95 00:03:55,000 --> 00:03:57,000 решивме да ја објавиме статистиката за книгите. 96 00:03:57,000 --> 00:03:59,000 Земете, на пример, „Блесок на среќа“. 97 00:03:59,000 --> 00:04:01,000 Тоа се три збора. Ние го викаме три-грам. 98 00:04:01,000 --> 00:04:03,000 Ќе ви покажеме колку пати одреден три-грам 99 00:04:03,000 --> 00:04:05,000 се појавил во книгите од 1801, 1802, 1803, 100 00:04:05,000 --> 00:04:07,000 сè до 2008 година. 101 00:04:07,000 --> 00:04:09,000 Тоа ни дава временска низа 102 00:04:09,000 --> 00:04:11,000 за тоа колку често оваа реченица била користена низ времето. 103 00:04:11,000 --> 00:04:14,000 Тоа го повторивме со сите зборови и фрази што се појавуваат во овие книги, 104 00:04:14,000 --> 00:04:17,000 и така добивме голема табела од две милијарди низи 105 00:04:17,000 --> 00:04:19,000 кои ни кажуваат како се менувала културата низ времето. 106 00:04:19,000 --> 00:04:21,000 Значи, имаме две милијарди низи, 107 00:04:21,000 --> 00:04:23,000 или, како што ние ги викаме, два милијарди ен-грами. 108 00:04:23,000 --> 00:04:25,000 Што ни кажуваат тие? 109 00:04:25,000 --> 00:04:27,000 Поединечните ен-грами ги мерат културолошките трендови. 110 00:04:27,000 --> 00:04:29,000 Да ви дадам еден пример. 111 00:04:29,000 --> 00:04:31,000 Да претпоставиме дека просперирам 112 00:04:31,000 --> 00:04:33,000 и утре сакам да ви кажам колку добро ми одело. 113 00:04:33,000 --> 00:04:36,000 Можам да речам „Вчера, напредував“. 114 00:04:36,000 --> 00:04:39,000 Или, можам да кажам „Вчера, просперирав“. 115 00:04:39,000 --> 00:04:42,000 Кој збор да го употребам? 116 00:04:42,000 --> 00:04:44,000 Од каде да знам? 117 00:04:44,000 --> 00:04:46,000 Од пред околу шест месеци, 118 00:04:46,000 --> 00:04:48,000 со најмодерните алатки можете, 119 00:04:48,000 --> 00:04:50,000 на пример, 120 00:04:50,000 --> 00:04:52,000 да му се обратите на овој психолог со неверојатна фризура 121 00:04:52,000 --> 00:04:54,000 и да го прашате 122 00:04:54,000 --> 00:04:57,000 „Стив, ти си експерт за неправилни глаголи. 123 00:04:57,000 --> 00:04:59,000 Што да правам?“. 124 00:04:59,000 --> 00:05:01,000 А, тој ќе ви рече „Па, повеќето луѓе велат просперирав, 125 00:05:01,000 --> 00:05:04,000 но некои луѓе велат напредував.“ 126 00:05:04,000 --> 00:05:06,000 Исто така знаете, повеќе или помалку, 127 00:05:06,000 --> 00:05:09,000 дека ако се вратите за 200 години назад во времето 128 00:05:09,000 --> 00:05:12,000 и го прашате овој државник со еднакво неверојатна фризура... 129 00:05:12,000 --> 00:05:15,000 (смеа) 130 00:05:15,000 --> 00:05:17,000 „Том, што да правам?“, 131 00:05:17,000 --> 00:05:19,000 тој ќе ви каже „Па, во мое време, повеќето луѓе напредуваа, 132 00:05:19,000 --> 00:05:22,000 но некои просперираа“. 133 00:05:22,000 --> 00:05:24,000 Сега ќе ви ги покажам необработените податоци. 134 00:05:24,000 --> 00:05:28,000 Два реда од оваа табела со две милијарди записи. 135 00:05:28,000 --> 00:05:30,000 Ја гледате фреквенцијата по години 136 00:05:30,000 --> 00:05:33,000 на „просперира“ и „напредува“ низ времето. 137 00:05:34,000 --> 00:05:36,000 Ова се само два реда 138 00:05:36,000 --> 00:05:39,000 од две милијарди редови. 139 00:05:39,000 --> 00:05:41,000 Значи, вкупниот сет на податоци 140 00:05:41,000 --> 00:05:44,000 е милијарди пати поневеројатен од овој слајд. 141 00:05:44,000 --> 00:05:46,000 (смеа) 142 00:05:46,000 --> 00:05:50,000 (аплауз) 143 00:05:50,000 --> 00:05:52,000 Постојат многу други слики кои вредат 500 милијарди зборови. 144 00:05:52,000 --> 00:05:54,000 На пример, оваа. 145 00:05:54,000 --> 00:05:56,000 Да го земеме грипот. 146 00:05:56,000 --> 00:05:58,000 Ќе видите скокови во времето кога знаете дека 147 00:05:58,000 --> 00:06:01,000 големи епидемии на грип убивале многу луѓе низ светот. 148 00:06:01,000 --> 00:06:04,000 Ако сè уште не сте убедени, 149 00:06:04,000 --> 00:06:06,000 нивото на морињата расте, 150 00:06:06,000 --> 00:06:09,000 како и атмосферскиот јаглерод диоксид и глобалната температура. 151 00:06:09,000 --> 00:06:12,000 Можеби ќе сакате да го погледнете и овој ен-грам, 152 00:06:12,000 --> 00:06:15,000 за да му кажете на Ниче дека Бог не е мртов, 153 00:06:15,000 --> 00:06:18,000 иако можеби ќе се согласите дека му треба подобра реклама. 154 00:06:18,000 --> 00:06:20,000 (смеа) 155 00:06:20,000 --> 00:06:23,000 Можете да налетате на некои прилично апстрактни концепти. 156 00:06:23,000 --> 00:06:25,000 На пример, да ви ја кажам историјата 157 00:06:25,000 --> 00:06:27,000 за 1950-тата година. 158 00:06:27,000 --> 00:06:29,000 Претежно во минатото 159 00:06:29,000 --> 00:06:31,000 на никого не му било гајле за 1950. 160 00:06:31,000 --> 00:06:33,000 Во 1700, во 1800, во 1900... 161 00:06:33,000 --> 00:06:36,000 на никого не му било гајле. 162 00:06:37,000 --> 00:06:39,000 Низ 30-тите и 40-тите 163 00:06:39,000 --> 00:06:41,000 на никого не му било гајле. 164 00:06:41,000 --> 00:06:43,000 Наеднаш, во средината на 40-тите, 165 00:06:43,000 --> 00:06:45,000 почнало нешто да се шушка. 166 00:06:45,000 --> 00:06:47,000 Луѓето сфатиле дека ќе се случи 1950 година 167 00:06:47,000 --> 00:06:49,000 и дека тоа може да биде доста важно. 168 00:06:49,000 --> 00:06:52,000 (смеа) 169 00:06:52,000 --> 00:06:55,000 Но, ништо не ги заинтересирало луѓето за 1950 година 170 00:06:55,000 --> 00:06:58,000 како годината 1950. 171 00:06:58,000 --> 00:07:01,000 (смеа) 172 00:07:01,000 --> 00:07:03,000 Луѓето шетале наоколу преокупирани. 173 00:07:03,000 --> 00:07:05,000 Не можеле да престанат да зборуваат 174 00:07:05,000 --> 00:07:08,000 за сите работи кои ги направиле во 1950, 175 00:07:08,000 --> 00:07:11,000 за сите работи што планирале да ги направат во 1950, 176 00:07:11,000 --> 00:07:16,000 сите соништа за она што сакале да го постигнат во 1950. 177 00:07:16,000 --> 00:07:18,000 Всушност, 1950 била толку фасцинантна 178 00:07:18,000 --> 00:07:20,000 што со години подоцна 179 00:07:20,000 --> 00:07:23,000 луѓето продолжиле да зборуваат за сите неверојатни нешта што се случиле тогаш. 180 00:07:23,000 --> 00:07:25,000 Во '51, '52, '53... 181 00:07:25,000 --> 00:07:27,000 Конечно во 1954, 182 00:07:27,000 --> 00:07:29,000 некој се разбудил и сфатил 183 00:07:29,000 --> 00:07:33,000 дека 1950 одамна поминала. 184 00:07:33,000 --> 00:07:35,000 (смеа) 185 00:07:35,000 --> 00:07:37,000 И така, одеднаш, целата работа спласнала. 186 00:07:37,000 --> 00:07:39,000 (смеа) 187 00:07:39,000 --> 00:07:41,000 Приказната за 1950 година 188 00:07:41,000 --> 00:07:43,000 е приказната за секоја година што ја имаме евидентирано, 189 00:07:43,000 --> 00:07:46,000 со мала промена, бидејќи сега ги имаме овие убави табели. 190 00:07:46,000 --> 00:07:49,000 Па, така, можеме да ги мериме нештата. 191 00:07:49,000 --> 00:07:51,000 Може да речеме „Колку брзо спласнала работата?“. 192 00:07:51,000 --> 00:07:54,000 Излезе дека многу прецизно можеме да го измериме тоа. 193 00:07:54,000 --> 00:07:57,000 Беа изведени равенки, беа направени графикони, 194 00:07:57,000 --> 00:07:59,000 и крајниот резултат 195 00:07:59,000 --> 00:08:02,000 ни говори дека работите спласнуваат сè побрзо и побрзо 196 00:08:02,000 --> 00:08:04,000 со секоја измината година. 197 00:08:04,000 --> 00:08:09,000 Сега побрзо губиме интерес за минатото. 198 00:08:09,000 --> 00:08:11,000 Еден мал професионален совет. 199 00:08:11,000 --> 00:08:13,000 Оние од вас кои сакаат да бидат славни 200 00:08:13,000 --> 00:08:15,000 може да учат од 25-те најславни политички фигури, 201 00:08:15,000 --> 00:08:17,000 автори, актери и така натаму. 202 00:08:17,000 --> 00:08:20,000 Ако сакате да станете славни кога сте помлади, треба да бидете актер, 203 00:08:20,000 --> 00:08:22,000 бидејќи кај нив славата врвот го достигнува кон крајот на 20-тите години од животот. 204 00:08:22,000 --> 00:08:24,000 Сè уште сте млади, баш супер. 205 00:08:24,000 --> 00:08:26,000 Ако можете да почекате малку, тогаш треба да бидете автор, 206 00:08:26,000 --> 00:08:28,000 бидејќи тогаш ќе ги достигнете најголемите височини, 207 00:08:28,000 --> 00:08:30,000 како Марк Твен, на пример. Тој е екстремно славен. 208 00:08:30,000 --> 00:08:32,000 Но, ако сакате да дојдете до самиот врв, 209 00:08:32,000 --> 00:08:34,000 тогаш треба да го одложите задоволството 210 00:08:34,000 --> 00:08:36,000 и, се разбира, да станете политичар. 211 00:08:36,000 --> 00:08:38,000 Тогаш ќе станете славни кон крајот од вашите 50-ти, 212 00:08:38,000 --> 00:08:40,000 а потоа ќе станувате уште пославни. 213 00:08:40,000 --> 00:08:43,000 Научниците, исто така, стануваат славни кога се многу постари. 214 00:08:43,000 --> 00:08:45,000 Како на пример, биолозите и физичарите 215 00:08:45,000 --> 00:08:47,000 можат да бидат славни речиси како актерите. 216 00:08:47,000 --> 00:08:50,000 Но, никако не смеете да станете математичар. 217 00:08:50,000 --> 00:08:52,000 (смеа) 218 00:08:52,000 --> 00:08:54,000 Ако го направите тоа, 219 00:08:54,000 --> 00:08:57,000 ќе си мислите „Супер. Најголемите резултати ќе ги постигнам во моите 20-ти.“ 220 00:08:57,000 --> 00:08:59,000 Но, никому нема да му е гајле. 221 00:08:59,000 --> 00:09:02,000 (смеа) 222 00:09:02,000 --> 00:09:04,000 Има и потрезвени податоци 223 00:09:04,000 --> 00:09:06,000 помеѓу ен-грамите. 224 00:09:06,000 --> 00:09:08,000 На пример, еве ја траекторијата за Марк Шагал, 225 00:09:08,000 --> 00:09:10,000 уметник роден во 1887. 226 00:09:10,000 --> 00:09:13,000 Ова изгледа како нормална траекторија за една славна личност. 227 00:09:13,000 --> 00:09:17,000 Тој станува сè пославен. 228 00:09:17,000 --> 00:09:19,000 Но, не ако барате на германски. 229 00:09:19,000 --> 00:09:21,000 Ако барате на германски, ќе видите нешто сосема бизарно, 230 00:09:21,000 --> 00:09:23,000 нешто што ретко се гледа. 231 00:09:23,000 --> 00:09:25,000 Тој станува екстремно славен, 232 00:09:25,000 --> 00:09:27,000 потоа наеднаш славата му паѓа, 233 00:09:27,000 --> 00:09:30,000 достигнувајќи најниска точка од 1933 до 1945, 234 00:09:30,000 --> 00:09:33,000 пред пак да се врати. 235 00:09:33,000 --> 00:09:35,000 Се разбира, од ова гледаме 236 00:09:35,000 --> 00:09:38,000 дека Марк Шагал бил еврејски уметник 237 00:09:38,000 --> 00:09:40,000 во нацистичка Германија. 238 00:09:40,000 --> 00:09:42,000 Овие показатели 239 00:09:42,000 --> 00:09:44,000 се толку силни, 240 00:09:44,000 --> 00:09:47,000 што не мора да знаеме дали некој бил цензуриран. 241 00:09:47,000 --> 00:09:49,000 Самите може да го откриеме тоа 242 00:09:49,000 --> 00:09:51,000 преку просто анализирање на показателот. 243 00:09:51,000 --> 00:09:53,000 Еве едноставен начин како да се направи тоа. 244 00:09:53,000 --> 00:09:55,000 Разумно очекување 245 00:09:55,000 --> 00:09:57,000 е дека нечија слава во еден даден временски период 246 00:09:57,000 --> 00:09:59,000 треба да биде приближно колку и просекот од нивната слава 247 00:09:59,000 --> 00:10:01,000 пред и по тој период. 248 00:10:01,000 --> 00:10:03,000 Тоа би го очекувале. 249 00:10:03,000 --> 00:10:06,000 Тоа ќе го споредиме со фактичката слава. 250 00:10:06,000 --> 00:10:08,000 Едното го делиме со другото 251 00:10:08,000 --> 00:10:10,000 и добиваме т.н. индекс на супресија (потиснување). 252 00:10:10,000 --> 00:10:13,000 Доколку овој индекс е многу, многу мал, 253 00:10:13,000 --> 00:10:15,000 тогаш веројатно сте биле потиснати. 254 00:10:15,000 --> 00:10:18,000 Доколку е многу голем, тогаш можеби користите пропаганда. 255 00:10:19,000 --> 00:10:21,000 Можете да ја погледнете 256 00:10:21,000 --> 00:10:24,000 дистрибуцијата на индексите на супресија низ цели популации. 257 00:10:24,000 --> 00:10:26,000 На пример, овде... 258 00:10:26,000 --> 00:10:28,000 ова е индекс на супресија за 5.000 луѓе 259 00:10:28,000 --> 00:10:30,000 добиен од англиските книги за кои нема супресија. 260 00:10:30,000 --> 00:10:32,000 Тој изгледа вака. Во основа, цврсто е центриран на еден. 261 00:10:32,000 --> 00:10:34,000 Го гледате тоа и што би го очекувале. 262 00:10:34,000 --> 00:10:36,000 Оваа дистрибуција е од Германија. 263 00:10:36,000 --> 00:10:38,000 Многу е различна. Поместена е на лево. 264 00:10:38,000 --> 00:10:41,000 Луѓето за нив зборувале два пати помалку отколку што би требало. 265 00:10:41,000 --> 00:10:43,000 Но, што е уште поважно, дистрибуцијата е многу поширока. 266 00:10:43,000 --> 00:10:46,000 Има многу луѓе на самиот лев крај од дистрибуцијата, 267 00:10:46,000 --> 00:10:49,000 за кои е зборувано десет пати помалку одошто е нормално. 268 00:10:49,000 --> 00:10:51,000 Но, има и многу луѓе на десниот крај, 269 00:10:51,000 --> 00:10:53,000 на кои изгледа им помогнала пропаганда. 270 00:10:53,000 --> 00:10:56,000 Оваа слика е показател за цензурата на книгите. 271 00:10:56,000 --> 00:10:58,000 Овој метод 272 00:10:58,000 --> 00:11:00,000 го нарекуваме културомика. 273 00:11:00,000 --> 00:11:02,000 Сличен е на геномиката, 274 00:11:02,000 --> 00:11:04,000 со таа разлика што со геномиката ја разбираме билогијата, 275 00:11:04,000 --> 00:11:07,000 преку базните секвенци во човечкиот геном. 276 00:11:07,000 --> 00:11:09,000 Културомиката е слична. 277 00:11:09,000 --> 00:11:12,000 Тоа е применета анализа врз податоци од голем размер 278 00:11:12,000 --> 00:11:14,000 со цел да се проучи човечката култура. 279 00:11:14,000 --> 00:11:16,000 Наместо да гледаме низ призмата на геномот, 280 00:11:16,000 --> 00:11:19,000 овде гледаме низ призмата на дигитализираните историски податоци. 281 00:11:19,000 --> 00:11:21,000 Она што е супер кај културомиката 282 00:11:21,000 --> 00:11:23,000 е што секој може да ја примени. 283 00:11:23,000 --> 00:11:25,000 Зошто? 284 00:11:25,000 --> 00:11:27,000 Затоа што тројца момци, 285 00:11:27,000 --> 00:11:30,000 Џон Орвант, Мет Греј и Вил Брокман од Гугл, 286 00:11:30,000 --> 00:11:32,000 го видоа прототипот за „Ngram Viewer“ 287 00:11:32,000 --> 00:11:34,000 и рекоа „Ова е баш забавно. 288 00:11:34,000 --> 00:11:37,000 Мора да го направиме достапно за луѓето.“ 289 00:11:37,000 --> 00:11:39,000 Во период од две недели, пред да излезе нашата статија, 290 00:11:39,000 --> 00:11:42,000 тие направија верзија на „Ngram Viewer“ наменета за широката јавност. 291 00:11:42,000 --> 00:11:45,000 Па, така и вие може да напишете збор или фраза што ве интересираат 292 00:11:45,000 --> 00:11:47,000 и веднаш да го видите ен-грамот за нив. 293 00:11:47,000 --> 00:11:49,000 Исто така, можете да ги пребарате и книгите 294 00:11:49,000 --> 00:11:51,000 во кои се појавува вашиот ен-грам. 295 00:11:51,000 --> 00:11:53,000 Во само првиот ден оваа алатка беше искористена преку милион пати. 296 00:11:53,000 --> 00:11:55,000 Тоа е најдоброто од сите пребарувања. 297 00:11:55,000 --> 00:11:58,000 Луѓето сакаат да бидат најдобри што можат, да дадат сè од себе. 298 00:11:58,000 --> 00:12:01,000 Но, изгледа дека во 18-тиот век на луѓето воопшто не им било гајле за тоа. 299 00:12:01,000 --> 00:12:04,000 Не сакале да бидат најдобри (beSt), туку најдобли (beFt). 300 00:12:04,000 --> 00:12:07,000 Се разбира ова е само грешка. 301 00:12:07,000 --> 00:12:09,000 Не се работи за стремеж кон медиокритет, 302 00:12:09,000 --> 00:12:12,000 туку тогаш буквата S се пишувала поинаку, слично на F. 303 00:12:12,000 --> 00:12:15,000 Гугл го немаше забележано ова 304 00:12:15,000 --> 00:12:18,000 и затоа ние го спомнавме во трудот што го објавивме. 305 00:12:18,000 --> 00:12:20,000 Ова треба да биде само потсетник 306 00:12:20,000 --> 00:12:22,000 дека, иако ова е многу забавно, 307 00:12:22,000 --> 00:12:24,000 кога ги интерпретирате графконите мора да бидете многу внимателни 308 00:12:24,000 --> 00:12:27,000 и мора да ги примените основните стандарди на науката. 309 00:12:27,000 --> 00:12:30,000 Луѓето го користат ова за разни забавни цели. 310 00:12:30,000 --> 00:12:37,000 (смеа) 311 00:12:37,000 --> 00:12:39,000 Нема потреба да зборуваме. 312 00:12:39,000 --> 00:12:42,000 Само ќе ви ги покажеме слајдовите и ќе молчиме. 313 00:12:42,000 --> 00:12:45,000 Овде некој бил заинтересиран за историјата на фрустрацијата. 314 00:12:45,000 --> 00:12:48,000 Има разни видови на фрустрација. 315 00:12:48,000 --> 00:12:51,000 Ако си го удрите палецот, тоа е „уф“ со едно у. 316 00:12:51,000 --> 00:12:53,000 Доколку Земјата е уништена од страна на Вогоните 317 00:12:53,000 --> 00:12:55,000 за да се изгради меѓуѕвездена обиколница, 318 00:12:55,000 --> 00:12:57,000 тоа е „уф“ со осум у. 319 00:12:57,000 --> 00:12:59,000 Оваа личност ги проучувала сите видови на „уф“, 320 00:12:59,000 --> 00:13:01,000 со од една до осум букви у. 321 00:13:01,000 --> 00:13:03,000 Се покажало дека 322 00:13:03,000 --> 00:13:05,000 поретко се користат оние „уф“ 323 00:13:05,000 --> 00:13:08,000 кои кореспондираат на нештата што се пофрустрирачки, 324 00:13:08,000 --> 00:13:11,000 освен, за чудо, во раните 80-ти. 325 00:13:11,000 --> 00:13:13,000 Мислиме дека тоа некако е поврзано со Реган. 326 00:13:13,000 --> 00:13:15,000 (смеа) 327 00:13:15,000 --> 00:13:18,000 Овие податоци може да се користат на разни начини, 328 00:13:18,000 --> 00:13:21,000 но она што е најважно е дека историските записи се дигитализираат. 329 00:13:21,000 --> 00:13:23,000 Гугл започна со дигитализација на 15 милиони книги. 330 00:13:23,000 --> 00:13:25,000 Тоа се 12 проценти од сите книги што некогаш биле објавени, 331 00:13:25,000 --> 00:13:28,000 што е значаен дел од човечката култура. 332 00:13:28,000 --> 00:13:31,000 Но, културата е многу повеќе: имаме ракописи, весници, 333 00:13:31,000 --> 00:13:33,000 податоци кои не се текстуални, како уметноста и сликите. 334 00:13:33,000 --> 00:13:35,000 Сите тие треба да се најдат на нашите компјутери, 335 00:13:35,000 --> 00:13:37,000 на компјутерите низ целиот свет. 336 00:13:37,000 --> 00:13:40,000 Тоа ќе го смени начинот на кој 337 00:13:40,000 --> 00:13:42,000 ги разбираме нашето минато, нашата сегашност и човечката култура. 338 00:13:42,000 --> 00:13:44,000 Ви благодарам многу. 339 00:13:44,000 --> 00:13:47,000 (аплауз)