1 00:00:00,000 --> 00:00:02,000 Erez Lieberman Aiden: Herkes bilir ki 2 00:00:02,000 --> 00:00:05,000 bir resim 1000 kelimeye değerdir. 3 00:00:07,000 --> 00:00:09,000 Ama Harvard'daki bizler 4 00:00:09,000 --> 00:00:12,000 bunun gerçekten doğru olup olmadığını merak ediyorduk. 5 00:00:12,000 --> 00:00:14,000 (Gülüşmeler) 6 00:00:14,000 --> 00:00:18,000 Böylece, Harvard, MIT, 7 00:00:18,000 --> 00:00:20,000 American Heritage Sözlüğü, Britannica Ansiklopedisi, 8 00:00:20,000 --> 00:00:23,000 ve gururlu sponsorlarımız Google'ın da arasında bulunduğu 9 00:00:23,000 --> 00:00:25,000 uzmanlardan oluşan 10 00:00:25,000 --> 00:00:28,000 bir ekip hazırladık. 11 00:00:28,000 --> 00:00:30,000 ve 4 yıl kadar 12 00:00:30,000 --> 00:00:32,000 bunun üzerinde düşündük. 13 00:00:32,000 --> 00:00:37,000 Ve şaşırtıcı bir sonuca vardık. 14 00:00:37,000 --> 00:00:40,000 Bayanlar baylar, bir resim 1000 kelimeye değer değil. 15 00:00:40,000 --> 00:00:42,000 Hatta, biz 500 milyar kelimeye değer 16 00:00:42,000 --> 00:00:47,000 resimler bulduk. 17 00:00:47,000 --> 00:00:49,000 Jean-Baptiste Michel: peki bu sonuca nasıl vardık? 18 00:00:49,000 --> 00:00:51,000 Erez ve ben, insan kültürünün ve insanlık tarihinin 19 00:00:51,000 --> 00:00:53,000 zamanla değişiminin 20 00:00:53,000 --> 00:00:56,000 genel bir tablosunu oluşturmak istiyorduk. 21 00:00:56,000 --> 00:00:58,000 Yıllar içinde o kadar çok kitap yazılmış ki. 22 00:00:58,000 --> 00:01:00,000 Biz de düşündük ki. onlardan öğrenmenin en iyi yolu 23 00:01:00,000 --> 00:01:02,000 tüm bu milyonlarca kitapları okumak. 24 00:01:02,000 --> 00:01:05,000 Tabiki eğer bunun ne kadar süper bir şey olduğunu gösteren bir grafik varsa, 25 00:01:05,000 --> 00:01:08,000 bu çok çok yüksek bir sıralamaya sahip olmalı. 26 00:01:08,000 --> 00:01:10,000 Problem şu ki, bir de X ekseni var, 27 00:01:10,000 --> 00:01:12,000 ki o da kullanışlılık ekseni. 28 00:01:12,000 --> 00:01:14,000 Bu da çok çok düşük bir seviyede. 29 00:01:14,000 --> 00:01:17,000 (Alkışlar) 30 00:01:17,000 --> 00:01:20,000 Şimdi insanlar alternatif bir yaklaşım kullanmaya meyilli, 31 00:01:20,000 --> 00:01:22,000 bu da bir kaç kaynağı almak ve onlar dikkatlice okumak. 32 00:01:22,000 --> 00:01:24,000 Bu inanılmaz kullanışlı, ama o kadar süper değil. 33 00:01:24,000 --> 00:01:27,000 Gerçekte yapmak istediğiniz şey 34 00:01:27,000 --> 00:01:30,000 süper ama kullanışlı olan bu alana gelmek. 35 00:01:30,000 --> 00:01:33,000 Öğrendik ki bir kaç sene önce bir dijitalizasyon projesi başlatan 36 00:01:33,000 --> 00:01:35,000 bu yaklaşımı mümkün kılabilecek 37 00:01:35,000 --> 00:01:37,000 nehrin ötesinde Google adında bir şirket varmış. 38 00:01:37,000 --> 00:01:39,000 Mİlyonlarca kitabı dijitalize hale getirdiler. 39 00:01:39,000 --> 00:01:42,000 Yani bu şu anlama geliyor: biri bu kitapların hepsini okumak için 40 00:01:42,000 --> 00:01:44,000 bir klikle bilgisayarlı methodları kullanabilir. 41 00:01:44,000 --> 00:01:47,000 Bu çok kullanışlı ve inanılmaz süper. 42 00:01:48,000 --> 00:01:50,000 ELA: Sizlere biraz kitapların nereden geldiğinden bahsedeyim. 43 00:01:50,000 --> 00:01:53,000 Zamanın başlangıcından beri, yazarlar vardı. 44 00:01:53,000 --> 00:01:56,000 Bu yazarlar kitap yazmak için çabalayıp durdular. 45 00:01:56,000 --> 00:01:58,000 Bir kaç yüzyıl önce matbaa makinesinin geliştirilmesiyle 46 00:01:58,000 --> 00:02:00,000 bu gittikçe kolaylaştı. 47 00:02:00,000 --> 00:02:03,000 O zamandan beri, 129 milyon farklı vesilelerle 48 00:02:03,000 --> 00:02:05,000 kitaplar yayınlayarak, 49 00:02:05,000 --> 00:02:07,000 yazarlar kazandı. 50 00:02:07,000 --> 00:02:09,000 Şimdi ise bu kitaplar tarih arasında kaybolup gitmediyse 51 00:02:09,000 --> 00:02:11,000 bir kütüphanenin tekinde 52 00:02:11,000 --> 00:02:14,000 ve bu kitapların çoğu kütüphanelerden getirtiliyor, 53 00:02:14,000 --> 00:02:16,000 ve günümüze kadar 15 milyon kitabı taramış olan, 54 00:02:16,000 --> 00:02:18,000 Google tarafından dijitalize hale getiriliyorlar. 55 00:02:18,000 --> 00:02:21,000 Şimdi Google bir kitabı dijitalize hale getirdiğinde, onu çok güzel bir formatla sunuyorlar. 56 00:02:21,000 --> 00:02:23,000 Şimdi elimizde veri var ve meta veri var. 57 00:02:23,000 --> 00:02:26,000 Kitabın nerede basıldığı, yazarın kim olduğu 58 00:02:26,000 --> 00:02:28,000 ne zaman basıldığı gibi şeyler hakkında bilgimiz var. 59 00:02:28,000 --> 00:02:31,000 Yaptığımız ise bütün bu bilgileri taramak 60 00:02:31,000 --> 00:02:35,000 ve yüksek kaliteli olmayan tüm verileri ayıklamak. 61 00:02:35,000 --> 00:02:37,000 Elimizde kalan şey ise 62 00:02:37,000 --> 00:02:40,000 5 milyon kitabın 63 00:02:40,000 --> 00:02:43,000 500 milyar kelimenin toplamı, 64 00:02:43,000 --> 00:02:45,000 kültürel genomumuzun gerçek bir parçası, 65 00:02:45,000 --> 00:02:48,000 açık açık yazıldığında, 66 00:02:48,000 --> 00:02:50,000 buradan aya kadar, 67 00:02:50,000 --> 00:02:52,000 10 kez gidip gelebilecek, 68 00:02:52,000 --> 00:02:54,000 insan genomundan 1000 kere daha uzun olan 69 00:02:54,000 --> 00:02:58,000 bir karakterler dizisi. 70 00:02:58,000 --> 00:03:00,000 Böyle aşırı abartılı bir durumla karşı karşıya kaldığımızda 71 00:03:00,000 --> 00:03:03,000 yaptığımız şey 72 00:03:03,000 --> 00:03:05,000 (Gülüşmeler) 73 00:03:05,000 --> 00:03:08,000 kendine saygısı olan her araştırmacının 74 00:03:08,000 --> 00:03:11,000 yapacağı şeydi. 75 00:03:11,000 --> 00:03:13,000 XKDC'den bir sayfayı aldık, 76 00:03:13,000 --> 00:03:15,000 ve "Sıkı durun, bilim yapmayı deneyeceğiz" 77 00:03:15,000 --> 00:03:17,000 dedik. 78 00:03:17,000 --> 00:03:19,000 (Gülüşmeler) 79 00:03:19,000 --> 00:03:21,000 JM: Tabii ki, şöyle düşündük, 80 00:03:21,000 --> 00:03:23,000 bilimle ilgilenen insanlar için 81 00:03:23,000 --> 00:03:25,000 elimizdeki datayı ortaya koyalım. 82 00:03:25,000 --> 00:03:27,000 Düşünmeye başladık, hangi datayı yayınlayabiliriz? 83 00:03:27,000 --> 00:03:29,000 Tabii ki, bu kitapları alıp 84 00:03:29,000 --> 00:03:31,000 bu 5 milyon kitabın tam metinlerini yayınlamak istiyorsunuz. 85 00:03:31,000 --> 00:03:33,000 Google'dakiler, özellikle Jon Orwant, 86 00:03:33,000 --> 00:03:35,000 bize öğrenmemiz gereken bir denklemden bahsettiler. 87 00:03:35,000 --> 00:03:38,000 Şimdi elinizde 5 milyon yazar var 88 00:03:38,000 --> 00:03:41,000 ve 5 milyon davacı devasa bir toplu dava demek. 89 00:03:41,000 --> 00:03:43,000 Yani bu her ne kadar çok çok süper bir şey olsa da, 90 00:03:43,000 --> 00:03:46,000 tekrar edelim, çok ama çok kullanışsız. 91 00:03:46,000 --> 00:03:48,000 (Gülüşmeler) 92 00:03:48,000 --> 00:03:50,000 Ve tekrardan, boyun eğdik, 93 00:03:50,000 --> 00:03:53,000 ve o kadar süper olmayan kullanışlı yaklaşımı kullandık. 94 00:03:53,000 --> 00:03:55,000 Tam metini yayınlamak yerine, 95 00:03:55,000 --> 00:03:57,000 kitaplar hakkında istatistikleri yayınlayalım dedik. 96 00:03:57,000 --> 00:03:59,000 "Bir Pırıltı Mutluluk" 'u ele alalım. 97 00:03:59,000 --> 00:04:01,000 3 kelime; biz buna üç-gram dedik. 98 00:04:01,000 --> 00:04:03,000 Size bu üç-gram'ın 1801, 1802, 1803 ten baslayip 99 00:04:03,000 --> 00:04:05,000 2008'e kadar olan kitaplarda kaç defa 100 00:04:05,000 --> 00:04:07,000 geçtiğini söyleyeceğiz. 101 00:04:07,000 --> 00:04:09,000 Bu, bize bu cümlenin zaman içinde 102 00:04:09,000 --> 00:04:11,000 kaç defa tekrarladığını gösteren bir zaman dizini sunacak. 103 00:04:11,000 --> 00:04:14,000 Bu yöntemi, bu kitaplardaki tüm kelime ve deyimlere uygularsak 104 00:04:14,000 --> 00:04:17,000 sonunda elimizde kültürümüzün ne şekilde değistigini gösteren 105 00:04:17,000 --> 00:04:19,000 iki milyar satırlık bir tablo ortaya çıkacak. 106 00:04:19,000 --> 00:04:21,000 ELA: Peki, bu iki milyar satır, 107 00:04:21,000 --> 00:04:23,000 bunlara iki milyar n-gram diyelim. 108 00:04:23,000 --> 00:04:25,000 Bize ne söylüyorlar? 109 00:04:25,000 --> 00:04:27,000 Yalın n-gramlar, kültürel trendleri ölçmeye yarıyor. 110 00:04:27,000 --> 00:04:29,000 Bir örnek vermeme izin verin. 111 00:04:29,000 --> 00:04:31,000 Diyelim ki ben çok başarılı oldum. 112 00:04:31,000 --> 00:04:33,000 ve ertesi gün size ne kadar başarılı olduğumu söylemek istedim. 113 00:04:33,000 --> 00:04:36,000 Diyebilirim ki, ben dün "başardım." (throve) 114 00:04:36,000 --> 00:04:39,000 Ya da diyebilirim ki "başardım". (thrived) 115 00:04:39,000 --> 00:04:42,000 Hangisini kullanmalıyım? 116 00:04:42,000 --> 00:04:44,000 Nasıl bileceğiz? 117 00:04:44,000 --> 00:04:46,000 Bundan yaklaşık altı ay önce 118 00:04:46,000 --> 00:04:48,000 bu sorunun yanıtını öğrenmek için 119 00:04:48,000 --> 00:04:50,000 mesela bu muhteşem saçlara sahip 120 00:04:50,000 --> 00:04:52,000 psikoloğa gider ve derdiniz ki, 121 00:04:52,000 --> 00:04:54,000 "Steve, sen düzensiz fiil çekimi konusunda 122 00:04:54,000 --> 00:04:57,000 tam bir uzmansın. Hangisini ( throve veya thrived) 123 00:04:57,000 --> 00:04:59,000 kullanmam gerekir?" 124 00:04:59,000 --> 00:05:01,000 O da size derdi ki "Bak insanların çoğu 'thrived' diyor, 125 00:05:01,000 --> 00:05:04,000 ama bazıları 'thrıve' da diyorlar." 126 00:05:04,000 --> 00:05:06,000 Ve şunu da biliyorsunuz ki, 127 00:05:06,000 --> 00:05:09,000 eğer bundan 200 yıl önceye gidebiliyor olsanız 128 00:05:09,000 --> 00:05:12,000 ve aynı derece müthiş saçlara sahip bu devlet adamına aynı soruyu sorsanız, 129 00:05:12,000 --> 00:05:15,000 (Gülüşmeler) 130 00:05:15,000 --> 00:05:17,000 "Tom, hangisini kullanmalıyım?" deseniz 131 00:05:17,000 --> 00:05:19,000 O size " Bak, benim zamanımda çoğu insan 'throve' diyordu, 132 00:05:19,000 --> 00:05:22,000 ama bazıları 'thrived' da der." diyecektir. 133 00:05:22,000 --> 00:05:24,000 Öylese şimdi sizle ham veriyi paylaşacağım. 134 00:05:24,000 --> 00:05:28,000 Bu tablodaki iki sıra, iki milyar kayıt demek. 135 00:05:28,000 --> 00:05:30,000 Burada gördüğünüz zaman içinde "thrived" ve "throve" 136 00:05:30,000 --> 00:05:33,000 kelimelerinin yıllık frekansı. 137 00:05:34,000 --> 00:05:36,000 Burada gördüğünüz, iki milyar satırdan 138 00:05:36,000 --> 00:05:39,000 sadece iki tanesi. 139 00:05:39,000 --> 00:05:41,000 Yani aslında veri setinin tamamı 140 00:05:41,000 --> 00:05:44,000 bu slaytta gördüşünüzden milyar kez daha müthiş. 141 00:05:44,000 --> 00:05:46,000 (Gülüşmeler) 142 00:05:46,000 --> 00:05:50,000 (Alkışlar) 143 00:05:50,000 --> 00:05:52,000 JM: Şimdi, 500 milyar kelime eden çok farklı başka resimler de var. 144 00:05:52,000 --> 00:05:54,000 mesela bu gördüğünüz. 145 00:05:54,000 --> 00:05:56,000 Eğer sadece grip virüsünü alırsanız, 146 00:05:56,000 --> 00:05:58,000 dünyada insanların ölümüne neden olan bir grip salgını 147 00:05:58,000 --> 00:06:01,000 olduğu zamanlarda pik yaptığını görürsünüz. 148 00:06:01,000 --> 00:06:04,000 ELA: Eğer hala deniz seviyesinin 149 00:06:04,000 --> 00:06:06,000 yükseldiğine ve atmosferik CO2 ve 150 00:06:06,000 --> 00:06:09,000 yerkürenin ısısının arttığına ikna olmadıysanız buna bakabilirsiniz. 151 00:06:09,000 --> 00:06:12,000 JM: Ya da bu diğer n-grama bakarsanız, 152 00:06:12,000 --> 00:06:15,000 Nietzsche'ye Tanrıinın ölmediğini söyleyebilirsiniz, 153 00:06:15,000 --> 00:06:18,000 ama siz de kabul edeceksiniz ki daha iyi bir halkla ilişkiler uzmanına ihtiyacı var. 154 00:06:18,000 --> 00:06:20,000 (Gülüşmeler) 155 00:06:20,000 --> 00:06:23,000 ELA: Bu tip birşeyi kullanarak epey soyut kavramlara varabilirsiniz. 156 00:06:23,000 --> 00:06:25,000 mesela izin verin size 1950 yılının hikayesini 157 00:06:25,000 --> 00:06:27,000 anlatayım. 158 00:06:27,000 --> 00:06:29,000 Tarih boyunca 1950 yılı 159 00:06:29,000 --> 00:06:31,000 kimsenin pek de umrunda olmadı. 160 00:06:31,000 --> 00:06:33,000 1700'ler, 1800'ler veya 1900'lerde 161 00:06:33,000 --> 00:06:36,000 kimsenin umrunda değildi. 162 00:06:37,000 --> 00:06:39,000 30'lar ve 40'larda da öyle. 163 00:06:39,000 --> 00:06:41,000 Kimse takmadı. 164 00:06:41,000 --> 00:06:43,000 Birden, 40'lı yılların ortasında, 165 00:06:43,000 --> 00:06:45,000 bir uğultu ortaya çıkmaya başladı. 166 00:06:45,000 --> 00:06:47,000 İnsanlar 1950'nin yaklaştığını fark ettiler, 167 00:06:47,000 --> 00:06:49,000 ve bu büyük bir olaydı. 168 00:06:49,000 --> 00:06:52,000 (Gülüşmeler) 169 00:06:52,000 --> 00:06:55,000 Ama 1950'lerde hiçbir şey insanları 1950 yılı 170 00:06:55,000 --> 00:06:58,000 kadar çok ilgilendirmedi. 171 00:06:58,000 --> 00:07:01,000 (Gülüşmeler) 172 00:07:01,000 --> 00:07:03,000 İnsanlar kafayı yemişlerdi, 1950'de yaptıkları 173 00:07:03,000 --> 00:07:05,000 şeykeri anlatmaktan başka hiçbir şey yapmadan 174 00:07:05,000 --> 00:07:08,000 ortalıkta dolanıyorladı, 175 00:07:08,000 --> 00:07:11,000 1950'de yapmayı planladıkları şeyler, 176 00:07:11,000 --> 00:07:16,000 1950'de kavuşmayı umdukları bütün hayalleri. 177 00:07:16,000 --> 00:07:18,000 Aslında, 1950 öylesine inanılmazdı ki, 178 00:07:18,000 --> 00:07:20,000 geçtikten yıllarca sonra bile, 179 00:07:20,000 --> 00:07:23,000 bu müthiş yıl ve onda olup bitenlerden bahsettiler. 180 00:07:23,000 --> 00:07:25,000 1951, 52, 53 yıllarında. 181 00:07:25,000 --> 00:07:27,000 Sonunda 1954 yılında biri uyandı ve 182 00:07:27,000 --> 00:07:29,000 nihayet insanlar 1950'nin 183 00:07:29,000 --> 00:07:33,000 geçip gitmiş olduğunu fark ettiler. 184 00:07:33,000 --> 00:07:35,000 (Gülüşmeler) 185 00:07:35,000 --> 00:07:37,000 Birdenbire, patlayan bir balon gibi. 186 00:07:37,000 --> 00:07:39,000 (Gülüşmeler) 187 00:07:39,000 --> 00:07:41,000 Ve 1950 yılının hikayesi aslında 188 00:07:41,000 --> 00:07:43,000 yaşadığımız her yılın hikayesi. 189 00:07:43,000 --> 00:07:46,000 Ufak tefek farklılıklar, çünkü artık bu güzel grafiklere sahibiz. 190 00:07:46,000 --> 00:07:49,000 Bunlara sahip olduğumuz için bazı şeyleri ölçümleyebiliyoruz. 191 00:07:49,000 --> 00:07:51,000 Böylece şunu sorabiliyoruz, "Balonun patlaması ne kadar sürer?" 192 00:07:51,000 --> 00:07:54,000 ve görünen o ki artık bunu oldukça hassas şekilde ölçebiliyoruz. 193 00:07:54,000 --> 00:07:57,000 Formüller yazıyor, grafikler çiziyoruz, 194 00:07:57,000 --> 00:07:59,000 ve net sonuç şu ki 195 00:07:59,000 --> 00:08:02,000 her geçen yıl bu baloncuklar daha kolay sönüyor. 196 00:08:02,000 --> 00:08:04,000 Her geçen yıl geçmişe olan ilgimizi 197 00:08:04,000 --> 00:08:09,000 daha büyük bir hızla kaybediyoruz. 198 00:08:09,000 --> 00:08:11,000 JM: Siz ufak bir kariyer önerisi. 199 00:08:11,000 --> 00:08:13,000 Eğer aranızda ünlü olmayı planlayanlar varsa, 200 00:08:13,000 --> 00:08:15,000 bu 25 ünlü politik figürden, yazardan ve aktörden 201 00:08:15,000 --> 00:08:17,000 birşeyler öğrenebilirsiniz. 202 00:08:17,000 --> 00:08:20,000 Eğer genç yaşta ünlü olmak isterseniz, aktör olmalısınız, 203 00:08:20,000 --> 00:08:22,000 çünkü onlar 20'li yaşların sonunda ünlü olmaya başlıyorlar -- 204 00:08:22,000 --> 00:08:24,000 hala genç bir yaş, süper. 205 00:08:24,000 --> 00:08:26,000 Eğer biraz daha bekleyecek olursanız, o zaman yazar olmalısınız, 206 00:08:26,000 --> 00:08:28,000 çünkü o zaman çok ama çok ünlü olabilirsiniz. 207 00:08:28,000 --> 00:08:30,000 Mark Twain gibi mesela: çok çok ünlü. 208 00:08:30,000 --> 00:08:32,000 Ama en tepeye ulaşmak istiyorsanız, 209 00:08:32,000 --> 00:08:34,000 o zaman ünlü olmak için daha beklemeli ve 210 00:08:34,000 --> 00:08:36,000 elbette ki poitikacı olmalısınız. 211 00:08:36,000 --> 00:08:38,000 Böylece 50 yaş civarında ünlü olabilir, ve hayatınızın 212 00:08:38,000 --> 00:08:40,000 sonrasını çok ama çok ünlü geçirebilirsiniz. 213 00:08:40,000 --> 00:08:43,000 Bilimadamlar çok daha geç yaşlarda ünlü oluyorlar. 214 00:08:43,000 --> 00:08:45,000 Mesela biyologlar ve fizikçiler neredeyse 215 00:08:45,000 --> 00:08:47,000 aktörler kadar ünlü olabilirler. 216 00:08:47,000 --> 00:08:50,000 Ama yapacağınız en büyük hata Matematikçi olmak olacaktır. 217 00:08:50,000 --> 00:08:52,000 (Gülüşmeler) 218 00:08:52,000 --> 00:08:54,000 Eğer bunu yaparsanız, 219 00:08:54,000 --> 00:08:57,000 şöyle düşünebilirsiniz, " Şahane, 20'li yaşlarda en önemli çalışmalarımı yapacağım." 220 00:08:57,000 --> 00:08:59,000 Ama bilin bakalım ne olacak: kimse sizi umursamayacak. 221 00:08:59,000 --> 00:09:02,000 (Gülüşmeler) 222 00:09:02,000 --> 00:09:04,000 ELA: n-gramlardan elde edebileceğiniz 223 00:09:04,000 --> 00:09:06,000 daha fena veriler de var. 224 00:09:06,000 --> 00:09:08,000 Mesela, Marc Chagall'ın trajedisini ele alalım. 225 00:09:08,000 --> 00:09:10,000 1887 yılında doğmuş bir sanatçı. 226 00:09:10,000 --> 00:09:13,000 Bu gördüğünüz ünlü bir insanın normal grafiğini gösteriyor. 227 00:09:13,000 --> 00:09:17,000 her geçen gün daha ünlü oluyor, 228 00:09:17,000 --> 00:09:19,000 ama eğer Almanca kayıtlara bakarsanız, 229 00:09:19,000 --> 00:09:21,000 Almanca kayıtlarda çok acaip birşey göreceksiniz, 230 00:09:21,000 --> 00:09:23,000 daha önce pek görmediğiniz birşey. 231 00:09:23,000 --> 00:09:25,000 Çok çok ünlü olurken, birden bire 232 00:09:25,000 --> 00:09:27,000 adeta yok oluyor. 233 00:09:27,000 --> 00:09:30,000 1933-1945 yılları arasında birden bire düşüyor, 234 00:09:30,000 --> 00:09:33,000 daha sonra da tekrar yükseliyor. 235 00:09:33,000 --> 00:09:35,000 Ve burada gördüğümz şeyin açıklaması da 236 00:09:35,000 --> 00:09:38,000 Marc Chagall'ın Nazi Almanyası'nda Yahudi bir 237 00:09:38,000 --> 00:09:40,000 sanatçı olmaından kaynaklanıyor. 238 00:09:40,000 --> 00:09:42,000 Bu işaretler 239 00:09:42,000 --> 00:09:44,000 öylesine güçlü ki 240 00:09:44,000 --> 00:09:47,000 birinin sansürlendiğini önceden bilmenize gerek yok. 241 00:09:47,000 --> 00:09:49,000 Bunu basit veri işleme yolu ile 242 00:09:49,000 --> 00:09:51,000 kendiniz bulabilirsiniz. 243 00:09:51,000 --> 00:09:53,000 İşte bunu yapmanın basit bir yolu. 244 00:09:53,000 --> 00:09:55,000 Bir kimsenin herhangi bir zamandaki 245 00:09:55,000 --> 00:09:57,000 ün miktarı, kabaca ünlü olmadan önceki ve 246 00:09:57,000 --> 00:09:59,000 ünlü olduktan sonraki ün miktarlarının 247 00:09:59,000 --> 00:10:01,000 ortalaması olmalıdır. 248 00:10:01,000 --> 00:10:03,000 Görmeyi beklediğimiz şey budur. 249 00:10:03,000 --> 00:10:06,000 Ve bu veriyi gözlemlediğimiz ünle karşılaştırırız. 250 00:10:06,000 --> 00:10:08,000 Sonra bunları birbirine bölerek 251 00:10:08,000 --> 00:10:10,000 baskılama indeksi dediğimiz bir rakam buluruz. 252 00:10:10,000 --> 00:10:13,000 Eğer baskılama indeksi çok çok küçük bir rakamsa, 253 00:10:13,000 --> 00:10:15,000 baskılanmış olma ihtimaliniz çok yüksektir. 254 00:10:15,000 --> 00:10:18,000 Eğer çok büyükse o zaman da propogandayla pomplanmış olma ihtimaliniz vardır. 255 00:10:19,000 --> 00:10:21,000 JM: Şimdi, eğer toplumların genel baskılanma indekslerinin 256 00:10:21,000 --> 00:10:24,000 dağılımına bakacak olursanız, 257 00:10:24,000 --> 00:10:26,000 mesela burada -- 258 00:10:26,000 --> 00:10:28,000 5000 kişinin baskılama indeksleri var, 259 00:10:28,000 --> 00:10:30,000 bilinen bir baskılama olmayan İngilizce kitaplar bunlar -- 260 00:10:30,000 --> 00:10:32,000 buna benzer birşey olacaktır, ortada yoğunlaşıyor. 261 00:10:32,000 --> 00:10:34,000 Kısaca görmeyi beklediğiniz şey ile gördüşünüz aynıdır. 262 00:10:34,000 --> 00:10:36,000 Almanya'da gördüğümüz dağılım ise bu -- 263 00:10:36,000 --> 00:10:38,000 çok farklı, sola doğru kaymış durumda. 264 00:10:38,000 --> 00:10:41,000 İnsanlar bunlar hakkında konuşmuş olmaları gerekenin yarısı kadar konuşmuşlar, 265 00:10:41,000 --> 00:10:43,000 daha da önemlisi, dağılım çok daha geniş. 266 00:10:43,000 --> 00:10:46,000 Dağılımın en solunda yer alan pek çok insan var, 267 00:10:46,000 --> 00:10:49,000 bunlar haklarında beklenenden 10 kat daha az konuşulmuş olan insanlar. 268 00:10:49,000 --> 00:10:51,000 Ama en sağda da başkaları var. 269 00:10:51,000 --> 00:10:53,000 Bunlar da propoganda'dan faydalanmış kimseler. 270 00:10:53,000 --> 00:10:56,000 Bu şekil, kitaplardaki sansürün fotoğrafı. 271 00:10:56,000 --> 00:10:58,000 ELA: Biz bu yönteme Kültüromik 272 00:10:58,000 --> 00:11:00,000 adını verdik. 273 00:11:00,000 --> 00:11:02,000 Biraz Genomik gibi. 274 00:11:02,000 --> 00:11:04,000 Ancak genomik insan genomundaki baz dizilimi 275 00:11:04,000 --> 00:11:07,000 aracılığı ile biyoloji bilimine bir pencere açıyor. 276 00:11:07,000 --> 00:11:09,000 Kültüromik de buna benziyor. 277 00:11:09,000 --> 00:11:12,000 İnsan kültrünü incelemek için yapılan çok yoğun bir 278 00:11:12,000 --> 00:11:14,000 veri toplama analizi uygulaması. 279 00:11:14,000 --> 00:11:16,000 Burada, genomdaki pencere yerine 280 00:11:16,000 --> 00:11:19,000 dijital hale getirilmiş tarihsel verilerin penceresinden bakıyoruz. 281 00:11:19,000 --> 00:11:21,000 Kültüromik ile ilgili müthiş olan şey 282 00:11:21,000 --> 00:11:23,000 bunu herkesin yapabiliyor olması. 283 00:11:23,000 --> 00:11:25,000 Nasıl herkes yapabilir? 284 00:11:25,000 --> 00:11:27,000 herkes yapabilir, çünkü üç kişi 285 00:11:27,000 --> 00:11:30,000 Google'da çalışan Jon Orwant, Matt Gray ve Wıll Brockman, 286 00:11:30,000 --> 00:11:32,000 Ngram prototipine baktılar ve dediler ki, 287 00:11:32,000 --> 00:11:34,000 " Bu çok eğlenceli birşey. 288 00:11:34,000 --> 00:11:37,000 Bunu herkesin ulaşabileceği hale getirmemiz lazım." 289 00:11:37,000 --> 00:11:39,000 Ve iki hafta içinde -- bizim makalemiz yayınlanmadan iki hafta önce -- 290 00:11:39,000 --> 00:11:42,000 herkesin kullanımına açık bir Ngram versiyonu programladılar. 291 00:11:42,000 --> 00:11:45,000 ve artık siz de ilginizi çeken bir kelime ya da deyim yazarak 292 00:11:45,000 --> 00:11:47,000 ona ait n-gramı hemen görebilirsiniz -- 293 00:11:47,000 --> 00:11:49,000 ve sizin n-gramınızın yer aldığı kitapları 294 00:11:49,000 --> 00:11:51,000 tarayabilirsiniz. 295 00:11:51,000 --> 00:11:53,000 JM: Bu uygulama, hayata geçtiği ilk gün ir milyonda defadan fazla kullanıldı, 296 00:11:53,000 --> 00:11:55,000 ve bu bence en güzel sorgulardan biri. 297 00:11:55,000 --> 00:11:58,000 İnsanlar iyi bir şey yapmak istediklerinde "ellerinden geleni yaptılar" 298 00:11:58,000 --> 00:12:01,000 ama görünen o ki, 18. yüzyılda bunu pek umursamıyorlardı. 299 00:12:01,000 --> 00:12:04,000 O zaman "ellerinden geleni" değil, "evlerinden geleni" yapmak istediler. 300 00:12:04,000 --> 00:12:07,000 Aslında olan şu, be elbette bir hata. 301 00:12:07,000 --> 00:12:09,000 Gayret etmeyi bırakmadılar, sadece 302 00:12:09,000 --> 00:12:12,000 o dönemde L harfi daha farklı yazılıyordu, V'ye beziyordu biraz. 303 00:12:12,000 --> 00:12:15,000 Elbette, Google bunu o zaman yakalayamadı, 304 00:12:15,000 --> 00:12:18,000 bu nedenle bunu yazdığımız makaleye ekledik. 305 00:12:18,000 --> 00:12:20,000 Ama görünen o ki, bu her ne kadar eğlenceli birşey 306 00:12:20,000 --> 00:12:22,000 olsa da, bize şunu anımsattı 307 00:12:22,000 --> 00:12:24,000 bu grafikleri anlamlandırırken çok dikkatli olmanız gerekiyor. 308 00:12:24,000 --> 00:12:27,000 ve mutlaka bilimsel yöntemdeki temel standartları gözetmelisiniz. 309 00:12:27,000 --> 00:12:30,000 ELA: İnsanlar bunu her türlü eğlenceli şey için kullanıyorlar. 310 00:12:30,000 --> 00:12:37,000 (Gülüşmeler) 311 00:12:37,000 --> 00:12:39,000 Aslında bundan sonra konuşmamız gereksiz, 312 00:12:39,000 --> 00:12:42,000 size sadece bazı slaytları üzerinde konuşmaksızın göstereceğiz. 313 00:12:42,000 --> 00:12:45,000 Bu kişi, düşkırıklığının, sıkıntının tarihçesi ile ilgileniyormuş. 314 00:12:45,000 --> 00:12:48,000 Düşkırıklığının birkaç çeşidi vardır. 315 00:12:48,000 --> 00:12:51,000 Eğer ayak parmağınızı bir yere çarpacak olursanız bu tek A harfli bir "Ah" demek. 316 00:12:51,000 --> 00:12:53,000 Eğer gezegenimiz dünya gezegenler arası otoyol yapmak isteyen 317 00:12:53,000 --> 00:12:55,000 Vogonlar tarafından işgal edilecek olursa, 318 00:12:55,000 --> 00:12:57,000 bu sekiz A değerinde bir "Aaaaaaaah" eder. 319 00:12:57,000 --> 00:12:59,000 Bu kişi bütün "Ahéları incelemiş. 320 00:12:59,000 --> 00:13:01,000 Tek A'lıdan sekiz A'lısına dek. 321 00:13:01,000 --> 00:13:03,000 Ve görmüş ki, 322 00:13:03,000 --> 00:13:05,000 daha can sıkıcı şeylere ait "Ah"lar 323 00:13:05,000 --> 00:13:08,000 daha az sıklıkla ortaya çıkıyor, 324 00:13:08,000 --> 00:13:11,000 ama 80'li yılların başları hariç. 325 00:13:11,000 --> 00:13:13,000 Biz bu durumun Reagan ile ilgili olduğunu düşünüyoruz. 326 00:13:13,000 --> 00:13:15,000 (Gülüşmeler( 327 00:13:15,000 --> 00:13:18,000 JM: Bu verilerin pek çok kullanım alanı var 328 00:13:18,000 --> 00:13:21,000 ama nihayetinde, bunlar tarihsel kayıtların dijital veriler hakine çevrilmesi. 329 00:13:21,000 --> 00:13:23,000 Google, 15 milyon kitabı dijital hale getirdi. 330 00:13:23,000 --> 00:13:25,000 Bu, bugüne dek basılmış kitapların %12'si demek. 331 00:13:25,000 --> 00:13:28,000 İnsanlığa ait kültür birikimin kayda değer bir kısmı. 332 00:13:28,000 --> 00:13:31,000 Kültüre ait daha pek çok veri var: yazmalar, gazeteler, 333 00:13:31,000 --> 00:13:33,000 yazılı olmayan şeyler, sanat ve tablolar gibi. 334 00:13:33,000 --> 00:13:35,000 Bunların hepsi dünyanın dört bir yanındaki 335 00:13:35,000 --> 00:13:37,000 bilgisayarlarımıza geçebilir. 336 00:13:37,000 --> 00:13:40,000 Ve bu olduğunda, insanlığın geçmişi, bu günü ve 337 00:13:40,000 --> 00:13:42,000 tüm yarattığı kültüre bakış açımız tamamen değişecek. 338 00:13:42,000 --> 00:13:44,000 Çok teşekkürler. 339 00:13:44,000 --> 00:13:47,000 (Alkışlar)