< Return to Video

5 Milyon Kitaptan Ne Öğrendik?

  • 0:00 - 0:02
    Erez Lieberman Aiden: Herkes bilir ki
  • 0:02 - 0:05
    bir resim 1000 kelimeye değerdir.
  • 0:07 - 0:09
    Ama Harvard'daki bizler
  • 0:09 - 0:12
    bunun gerçekten doğru olup olmadığını merak ediyorduk.
  • 0:12 - 0:14
    (Gülüşmeler)
  • 0:14 - 0:18
    Böylece, Harvard, MIT,
  • 0:18 - 0:20
    American Heritage Sözlüğü, Britannica Ansiklopedisi,
  • 0:20 - 0:23
    ve gururlu sponsorlarımız Google'ın da arasında bulunduğu
  • 0:23 - 0:25
    uzmanlardan oluşan
  • 0:25 - 0:28
    bir ekip hazırladık.
  • 0:28 - 0:30
    ve 4 yıl kadar
  • 0:30 - 0:32
    bunun üzerinde düşündük.
  • 0:32 - 0:37
    Ve şaşırtıcı bir sonuca vardık.
  • 0:37 - 0:40
    Bayanlar baylar, bir resim 1000 kelimeye değer değil.
  • 0:40 - 0:42
    Hatta, biz 500 milyar kelimeye değer
  • 0:42 - 0:47
    resimler bulduk.
  • 0:47 - 0:49
    Jean-Baptiste Michel: peki bu sonuca nasıl vardık?
  • 0:49 - 0:51
    Erez ve ben, insan kültürünün ve insanlık tarihinin
  • 0:51 - 0:53
    zamanla değişiminin
  • 0:53 - 0:56
    genel bir tablosunu oluşturmak istiyorduk.
  • 0:56 - 0:58
    Yıllar içinde o kadar çok kitap yazılmış ki.
  • 0:58 - 1:00
    Biz de düşündük ki. onlardan öğrenmenin en iyi yolu
  • 1:00 - 1:02
    tüm bu milyonlarca kitapları okumak.
  • 1:02 - 1:05
    Tabiki eğer bunun ne kadar süper bir şey olduğunu gösteren bir grafik varsa,
  • 1:05 - 1:08
    bu çok çok yüksek bir sıralamaya sahip olmalı.
  • 1:08 - 1:10
    Problem şu ki, bir de X ekseni var,
  • 1:10 - 1:12
    ki o da kullanışlılık ekseni.
  • 1:12 - 1:14
    Bu da çok çok düşük bir seviyede.
  • 1:14 - 1:17
    (Alkışlar)
  • 1:17 - 1:20
    Şimdi insanlar alternatif bir yaklaşım kullanmaya meyilli,
  • 1:20 - 1:22
    bu da bir kaç kaynağı almak ve onlar dikkatlice okumak.
  • 1:22 - 1:24
    Bu inanılmaz kullanışlı, ama o kadar süper değil.
  • 1:24 - 1:27
    Gerçekte yapmak istediğiniz şey
  • 1:27 - 1:30
    süper ama kullanışlı olan bu alana gelmek.
  • 1:30 - 1:33
    Öğrendik ki bir kaç sene önce bir dijitalizasyon projesi başlatan
  • 1:33 - 1:35
    bu yaklaşımı mümkün kılabilecek
  • 1:35 - 1:37
    nehrin ötesinde Google adında bir şirket varmış.
  • 1:37 - 1:39
    Mİlyonlarca kitabı dijitalize hale getirdiler.
  • 1:39 - 1:42
    Yani bu şu anlama geliyor: biri bu kitapların hepsini okumak için
  • 1:42 - 1:44
    bir klikle bilgisayarlı methodları kullanabilir.
  • 1:44 - 1:47
    Bu çok kullanışlı ve inanılmaz süper.
  • 1:48 - 1:50
    ELA: Sizlere biraz kitapların nereden geldiğinden bahsedeyim.
  • 1:50 - 1:53
    Zamanın başlangıcından beri, yazarlar vardı.
  • 1:53 - 1:56
    Bu yazarlar kitap yazmak için çabalayıp durdular.
  • 1:56 - 1:58
    Bir kaç yüzyıl önce matbaa makinesinin geliştirilmesiyle
  • 1:58 - 2:00
    bu gittikçe kolaylaştı.
  • 2:00 - 2:03
    O zamandan beri, 129 milyon farklı vesilelerle
  • 2:03 - 2:05
    kitaplar yayınlayarak,
  • 2:05 - 2:07
    yazarlar kazandı.
  • 2:07 - 2:09
    Şimdi ise bu kitaplar tarih arasında kaybolup gitmediyse
  • 2:09 - 2:11
    bir kütüphanenin tekinde
  • 2:11 - 2:14
    ve bu kitapların çoğu kütüphanelerden getirtiliyor,
  • 2:14 - 2:16
    ve günümüze kadar 15 milyon kitabı taramış olan,
  • 2:16 - 2:18
    Google tarafından dijitalize hale getiriliyorlar.
  • 2:18 - 2:21
    Şimdi Google bir kitabı dijitalize hale getirdiğinde, onu çok güzel bir formatla sunuyorlar.
  • 2:21 - 2:23
    Şimdi elimizde veri var ve meta veri var.
  • 2:23 - 2:26
    Kitabın nerede basıldığı, yazarın kim olduğu
  • 2:26 - 2:28
    ne zaman basıldığı gibi şeyler hakkında bilgimiz var.
  • 2:28 - 2:31
    Yaptığımız ise bütün bu bilgileri taramak
  • 2:31 - 2:35
    ve yüksek kaliteli olmayan tüm verileri ayıklamak.
  • 2:35 - 2:37
    Elimizde kalan şey ise
  • 2:37 - 2:40
    5 milyon kitabın
  • 2:40 - 2:43
    500 milyar kelimenin toplamı,
  • 2:43 - 2:45
    kültürel genomumuzun gerçek bir parçası,
  • 2:45 - 2:48
    açık açık yazıldığında,
  • 2:48 - 2:50
    buradan aya kadar,
  • 2:50 - 2:52
    10 kez gidip gelebilecek,
  • 2:52 - 2:54
    insan genomundan 1000 kere daha uzun olan
  • 2:54 - 2:58
    bir karakterler dizisi.
  • 2:58 - 3:00
    Böyle aşırı abartılı bir durumla karşı karşıya kaldığımızda
  • 3:00 - 3:03
    yaptığımız şey
  • 3:03 - 3:05
    (Gülüşmeler)
  • 3:05 - 3:08
    kendine saygısı olan her araştırmacının
  • 3:08 - 3:11
    yapacağı şeydi.
  • 3:11 - 3:13
    XKDC'den bir sayfayı aldık,
  • 3:13 - 3:15
    ve "Sıkı durun, bilim yapmayı deneyeceğiz"
  • 3:15 - 3:17
    dedik.
  • 3:17 - 3:19
    (Gülüşmeler)
  • 3:19 - 3:21
    JM: Tabii ki, şöyle düşündük,
  • 3:21 - 3:23
    bilimle ilgilenen insanlar için
  • 3:23 - 3:25
    elimizdeki datayı ortaya koyalım.
  • 3:25 - 3:27
    Düşünmeye başladık, hangi datayı yayınlayabiliriz?
  • 3:27 - 3:29
    Tabii ki, bu kitapları alıp
  • 3:29 - 3:31
    bu 5 milyon kitabın tam metinlerini yayınlamak istiyorsunuz.
  • 3:31 - 3:33
    Google'dakiler, özellikle Jon Orwant,
  • 3:33 - 3:35
    bize öğrenmemiz gereken bir denklemden bahsettiler.
  • 3:35 - 3:38
    Şimdi elinizde 5 milyon yazar var
  • 3:38 - 3:41
    ve 5 milyon davacı devasa bir toplu dava demek.
  • 3:41 - 3:43
    Yani bu her ne kadar çok çok süper bir şey olsa da,
  • 3:43 - 3:46
    tekrar edelim, çok ama çok kullanışsız.
  • 3:46 - 3:48
    (Gülüşmeler)
  • 3:48 - 3:50
    Ve tekrardan, boyun eğdik,
  • 3:50 - 3:53
    ve o kadar süper olmayan kullanışlı yaklaşımı kullandık.
  • 3:53 - 3:55
    Tam metini yayınlamak yerine,
  • 3:55 - 3:57
    kitaplar hakkında istatistikleri yayınlayalım dedik.
  • 3:57 - 3:59
    "Bir Pırıltı Mutluluk" 'u ele alalım.
  • 3:59 - 4:01
    3 kelime; biz buna üç-gram dedik.
  • 4:01 - 4:03
    Size bu üç-gram'ın 1801, 1802, 1803 ten baslayip
  • 4:03 - 4:05
    2008'e kadar olan kitaplarda kaç defa
  • 4:05 - 4:07
    geçtiğini söyleyeceğiz.
  • 4:07 - 4:09
    Bu, bize bu cümlenin zaman içinde
  • 4:09 - 4:11
    kaç defa tekrarladığını gösteren bir zaman dizini sunacak.
  • 4:11 - 4:14
    Bu yöntemi, bu kitaplardaki tüm kelime ve deyimlere uygularsak
  • 4:14 - 4:17
    sonunda elimizde kültürümüzün ne şekilde değistigini gösteren
  • 4:17 - 4:19
    iki milyar satırlık bir tablo ortaya çıkacak.
  • 4:19 - 4:21
    ELA: Peki, bu iki milyar satır,
  • 4:21 - 4:23
    bunlara iki milyar n-gram diyelim.
  • 4:23 - 4:25
    Bize ne söylüyorlar?
  • 4:25 - 4:27
    Yalın n-gramlar, kültürel trendleri ölçmeye yarıyor.
  • 4:27 - 4:29
    Bir örnek vermeme izin verin.
  • 4:29 - 4:31
    Diyelim ki ben çok başarılı oldum.
  • 4:31 - 4:33
    ve ertesi gün size ne kadar başarılı olduğumu söylemek istedim.
  • 4:33 - 4:36
    Diyebilirim ki, ben dün "başardım." (throve)
  • 4:36 - 4:39
    Ya da diyebilirim ki "başardım". (thrived)
  • 4:39 - 4:42
    Hangisini kullanmalıyım?
  • 4:42 - 4:44
    Nasıl bileceğiz?
  • 4:44 - 4:46
    Bundan yaklaşık altı ay önce
  • 4:46 - 4:48
    bu sorunun yanıtını öğrenmek için
  • 4:48 - 4:50
    mesela bu muhteşem saçlara sahip
  • 4:50 - 4:52
    psikoloğa gider ve derdiniz ki,
  • 4:52 - 4:54
    "Steve, sen düzensiz fiil çekimi konusunda
  • 4:54 - 4:57
    tam bir uzmansın. Hangisini ( throve veya thrived)
  • 4:57 - 4:59
    kullanmam gerekir?"
  • 4:59 - 5:01
    O da size derdi ki "Bak insanların çoğu 'thrived' diyor,
  • 5:01 - 5:04
    ama bazıları 'thrıve' da diyorlar."
  • 5:04 - 5:06
    Ve şunu da biliyorsunuz ki,
  • 5:06 - 5:09
    eğer bundan 200 yıl önceye gidebiliyor olsanız
  • 5:09 - 5:12
    ve aynı derece müthiş saçlara sahip bu devlet adamına aynı soruyu sorsanız,
  • 5:12 - 5:15
    (Gülüşmeler)
  • 5:15 - 5:17
    "Tom, hangisini kullanmalıyım?" deseniz
  • 5:17 - 5:19
    O size " Bak, benim zamanımda çoğu insan 'throve' diyordu,
  • 5:19 - 5:22
    ama bazıları 'thrived' da der." diyecektir.
  • 5:22 - 5:24
    Öylese şimdi sizle ham veriyi paylaşacağım.
  • 5:24 - 5:28
    Bu tablodaki iki sıra, iki milyar kayıt demek.
  • 5:28 - 5:30
    Burada gördüğünüz zaman içinde "thrived" ve "throve"
  • 5:30 - 5:33
    kelimelerinin yıllık frekansı.
  • 5:34 - 5:36
    Burada gördüğünüz, iki milyar satırdan
  • 5:36 - 5:39
    sadece iki tanesi.
  • 5:39 - 5:41
    Yani aslında veri setinin tamamı
  • 5:41 - 5:44
    bu slaytta gördüşünüzden milyar kez daha müthiş.
  • 5:44 - 5:46
    (Gülüşmeler)
  • 5:46 - 5:50
    (Alkışlar)
  • 5:50 - 5:52
    JM: Şimdi, 500 milyar kelime eden çok farklı başka resimler de var.
  • 5:52 - 5:54
    mesela bu gördüğünüz.
  • 5:54 - 5:56
    Eğer sadece grip virüsünü alırsanız,
  • 5:56 - 5:58
    dünyada insanların ölümüne neden olan bir grip salgını
  • 5:58 - 6:01
    olduğu zamanlarda pik yaptığını görürsünüz.
  • 6:01 - 6:04
    ELA: Eğer hala deniz seviyesinin
  • 6:04 - 6:06
    yükseldiğine ve atmosferik CO2 ve
  • 6:06 - 6:09
    yerkürenin ısısının arttığına ikna olmadıysanız buna bakabilirsiniz.
  • 6:09 - 6:12
    JM: Ya da bu diğer n-grama bakarsanız,
  • 6:12 - 6:15
    Nietzsche'ye Tanrıinın ölmediğini söyleyebilirsiniz,
  • 6:15 - 6:18
    ama siz de kabul edeceksiniz ki daha iyi bir halkla ilişkiler uzmanına ihtiyacı var.
  • 6:18 - 6:20
    (Gülüşmeler)
  • 6:20 - 6:23
    ELA: Bu tip birşeyi kullanarak epey soyut kavramlara varabilirsiniz.
  • 6:23 - 6:25
    mesela izin verin size 1950 yılının hikayesini
  • 6:25 - 6:27
    anlatayım.
  • 6:27 - 6:29
    Tarih boyunca 1950 yılı
  • 6:29 - 6:31
    kimsenin pek de umrunda olmadı.
  • 6:31 - 6:33
    1700'ler, 1800'ler veya 1900'lerde
  • 6:33 - 6:36
    kimsenin umrunda değildi.
  • 6:37 - 6:39
    30'lar ve 40'larda da öyle.
  • 6:39 - 6:41
    Kimse takmadı.
  • 6:41 - 6:43
    Birden, 40'lı yılların ortasında,
  • 6:43 - 6:45
    bir uğultu ortaya çıkmaya başladı.
  • 6:45 - 6:47
    İnsanlar 1950'nin yaklaştığını fark ettiler,
  • 6:47 - 6:49
    ve bu büyük bir olaydı.
  • 6:49 - 6:52
    (Gülüşmeler)
  • 6:52 - 6:55
    Ama 1950'lerde hiçbir şey insanları 1950 yılı
  • 6:55 - 6:58
    kadar çok ilgilendirmedi.
  • 6:58 - 7:01
    (Gülüşmeler)
  • 7:01 - 7:03
    İnsanlar kafayı yemişlerdi, 1950'de yaptıkları
  • 7:03 - 7:05
    şeykeri anlatmaktan başka hiçbir şey yapmadan
  • 7:05 - 7:08
    ortalıkta dolanıyorladı,
  • 7:08 - 7:11
    1950'de yapmayı planladıkları şeyler,
  • 7:11 - 7:16
    1950'de kavuşmayı umdukları bütün hayalleri.
  • 7:16 - 7:18
    Aslında, 1950 öylesine inanılmazdı ki,
  • 7:18 - 7:20
    geçtikten yıllarca sonra bile,
  • 7:20 - 7:23
    bu müthiş yıl ve onda olup bitenlerden bahsettiler.
  • 7:23 - 7:25
    1951, 52, 53 yıllarında.
  • 7:25 - 7:27
    Sonunda 1954 yılında biri uyandı ve
  • 7:27 - 7:29
    nihayet insanlar 1950'nin
  • 7:29 - 7:33
    geçip gitmiş olduğunu fark ettiler.
  • 7:33 - 7:35
    (Gülüşmeler)
  • 7:35 - 7:37
    Birdenbire, patlayan bir balon gibi.
  • 7:37 - 7:39
    (Gülüşmeler)
  • 7:39 - 7:41
    Ve 1950 yılının hikayesi aslında
  • 7:41 - 7:43
    yaşadığımız her yılın hikayesi.
  • 7:43 - 7:46
    Ufak tefek farklılıklar, çünkü artık bu güzel grafiklere sahibiz.
  • 7:46 - 7:49
    Bunlara sahip olduğumuz için bazı şeyleri ölçümleyebiliyoruz.
  • 7:49 - 7:51
    Böylece şunu sorabiliyoruz, "Balonun patlaması ne kadar sürer?"
  • 7:51 - 7:54
    ve görünen o ki artık bunu oldukça hassas şekilde ölçebiliyoruz.
  • 7:54 - 7:57
    Formüller yazıyor, grafikler çiziyoruz,
  • 7:57 - 7:59
    ve net sonuç şu ki
  • 7:59 - 8:02
    her geçen yıl bu baloncuklar daha kolay sönüyor.
  • 8:02 - 8:04
    Her geçen yıl geçmişe olan ilgimizi
  • 8:04 - 8:09
    daha büyük bir hızla kaybediyoruz.
  • 8:09 - 8:11
    JM: Siz ufak bir kariyer önerisi.
  • 8:11 - 8:13
    Eğer aranızda ünlü olmayı planlayanlar varsa,
  • 8:13 - 8:15
    bu 25 ünlü politik figürden, yazardan ve aktörden
  • 8:15 - 8:17
    birşeyler öğrenebilirsiniz.
  • 8:17 - 8:20
    Eğer genç yaşta ünlü olmak isterseniz, aktör olmalısınız,
  • 8:20 - 8:22
    çünkü onlar 20'li yaşların sonunda ünlü olmaya başlıyorlar --
  • 8:22 - 8:24
    hala genç bir yaş, süper.
  • 8:24 - 8:26
    Eğer biraz daha bekleyecek olursanız, o zaman yazar olmalısınız,
  • 8:26 - 8:28
    çünkü o zaman çok ama çok ünlü olabilirsiniz.
  • 8:28 - 8:30
    Mark Twain gibi mesela: çok çok ünlü.
  • 8:30 - 8:32
    Ama en tepeye ulaşmak istiyorsanız,
  • 8:32 - 8:34
    o zaman ünlü olmak için daha beklemeli ve
  • 8:34 - 8:36
    elbette ki poitikacı olmalısınız.
  • 8:36 - 8:38
    Böylece 50 yaş civarında ünlü olabilir, ve hayatınızın
  • 8:38 - 8:40
    sonrasını çok ama çok ünlü geçirebilirsiniz.
  • 8:40 - 8:43
    Bilimadamlar çok daha geç yaşlarda ünlü oluyorlar.
  • 8:43 - 8:45
    Mesela biyologlar ve fizikçiler neredeyse
  • 8:45 - 8:47
    aktörler kadar ünlü olabilirler.
  • 8:47 - 8:50
    Ama yapacağınız en büyük hata Matematikçi olmak olacaktır.
  • 8:50 - 8:52
    (Gülüşmeler)
  • 8:52 - 8:54
    Eğer bunu yaparsanız,
  • 8:54 - 8:57
    şöyle düşünebilirsiniz, " Şahane, 20'li yaşlarda en önemli çalışmalarımı yapacağım."
  • 8:57 - 8:59
    Ama bilin bakalım ne olacak: kimse sizi umursamayacak.
  • 8:59 - 9:02
    (Gülüşmeler)
  • 9:02 - 9:04
    ELA: n-gramlardan elde edebileceğiniz
  • 9:04 - 9:06
    daha fena veriler de var.
  • 9:06 - 9:08
    Mesela, Marc Chagall'ın trajedisini ele alalım.
  • 9:08 - 9:10
    1887 yılında doğmuş bir sanatçı.
  • 9:10 - 9:13
    Bu gördüğünüz ünlü bir insanın normal grafiğini gösteriyor.
  • 9:13 - 9:17
    her geçen gün daha ünlü oluyor,
  • 9:17 - 9:19
    ama eğer Almanca kayıtlara bakarsanız,
  • 9:19 - 9:21
    Almanca kayıtlarda çok acaip birşey göreceksiniz,
  • 9:21 - 9:23
    daha önce pek görmediğiniz birşey.
  • 9:23 - 9:25
    Çok çok ünlü olurken, birden bire
  • 9:25 - 9:27
    adeta yok oluyor.
  • 9:27 - 9:30
    1933-1945 yılları arasında birden bire düşüyor,
  • 9:30 - 9:33
    daha sonra da tekrar yükseliyor.
  • 9:33 - 9:35
    Ve burada gördüğümz şeyin açıklaması da
  • 9:35 - 9:38
    Marc Chagall'ın Nazi Almanyası'nda Yahudi bir
  • 9:38 - 9:40
    sanatçı olmaından kaynaklanıyor.
  • 9:40 - 9:42
    Bu işaretler
  • 9:42 - 9:44
    öylesine güçlü ki
  • 9:44 - 9:47
    birinin sansürlendiğini önceden bilmenize gerek yok.
  • 9:47 - 9:49
    Bunu basit veri işleme yolu ile
  • 9:49 - 9:51
    kendiniz bulabilirsiniz.
  • 9:51 - 9:53
    İşte bunu yapmanın basit bir yolu.
  • 9:53 - 9:55
    Bir kimsenin herhangi bir zamandaki
  • 9:55 - 9:57
    ün miktarı, kabaca ünlü olmadan önceki ve
  • 9:57 - 9:59
    ünlü olduktan sonraki ün miktarlarının
  • 9:59 - 10:01
    ortalaması olmalıdır.
  • 10:01 - 10:03
    Görmeyi beklediğimiz şey budur.
  • 10:03 - 10:06
    Ve bu veriyi gözlemlediğimiz ünle karşılaştırırız.
  • 10:06 - 10:08
    Sonra bunları birbirine bölerek
  • 10:08 - 10:10
    baskılama indeksi dediğimiz bir rakam buluruz.
  • 10:10 - 10:13
    Eğer baskılama indeksi çok çok küçük bir rakamsa,
  • 10:13 - 10:15
    baskılanmış olma ihtimaliniz çok yüksektir.
  • 10:15 - 10:18
    Eğer çok büyükse o zaman da propogandayla pomplanmış olma ihtimaliniz vardır.
  • 10:19 - 10:21
    JM: Şimdi, eğer toplumların genel baskılanma indekslerinin
  • 10:21 - 10:24
    dağılımına bakacak olursanız,
  • 10:24 - 10:26
    mesela burada --
  • 10:26 - 10:28
    5000 kişinin baskılama indeksleri var,
  • 10:28 - 10:30
    bilinen bir baskılama olmayan İngilizce kitaplar bunlar --
  • 10:30 - 10:32
    buna benzer birşey olacaktır, ortada yoğunlaşıyor.
  • 10:32 - 10:34
    Kısaca görmeyi beklediğiniz şey ile gördüşünüz aynıdır.
  • 10:34 - 10:36
    Almanya'da gördüğümüz dağılım ise bu --
  • 10:36 - 10:38
    çok farklı, sola doğru kaymış durumda.
  • 10:38 - 10:41
    İnsanlar bunlar hakkında konuşmuş olmaları gerekenin yarısı kadar konuşmuşlar,
  • 10:41 - 10:43
    daha da önemlisi, dağılım çok daha geniş.
  • 10:43 - 10:46
    Dağılımın en solunda yer alan pek çok insan var,
  • 10:46 - 10:49
    bunlar haklarında beklenenden 10 kat daha az konuşulmuş olan insanlar.
  • 10:49 - 10:51
    Ama en sağda da başkaları var.
  • 10:51 - 10:53
    Bunlar da propoganda'dan faydalanmış kimseler.
  • 10:53 - 10:56
    Bu şekil, kitaplardaki sansürün fotoğrafı.
  • 10:56 - 10:58
    ELA: Biz bu yönteme Kültüromik
  • 10:58 - 11:00
    adını verdik.
  • 11:00 - 11:02
    Biraz Genomik gibi.
  • 11:02 - 11:04
    Ancak genomik insan genomundaki baz dizilimi
  • 11:04 - 11:07
    aracılığı ile biyoloji bilimine bir pencere açıyor.
  • 11:07 - 11:09
    Kültüromik de buna benziyor.
  • 11:09 - 11:12
    İnsan kültrünü incelemek için yapılan çok yoğun bir
  • 11:12 - 11:14
    veri toplama analizi uygulaması.
  • 11:14 - 11:16
    Burada, genomdaki pencere yerine
  • 11:16 - 11:19
    dijital hale getirilmiş tarihsel verilerin penceresinden bakıyoruz.
  • 11:19 - 11:21
    Kültüromik ile ilgili müthiş olan şey
  • 11:21 - 11:23
    bunu herkesin yapabiliyor olması.
  • 11:23 - 11:25
    Nasıl herkes yapabilir?
  • 11:25 - 11:27
    herkes yapabilir, çünkü üç kişi
  • 11:27 - 11:30
    Google'da çalışan Jon Orwant, Matt Gray ve Wıll Brockman,
  • 11:30 - 11:32
    Ngram prototipine baktılar ve dediler ki,
  • 11:32 - 11:34
    " Bu çok eğlenceli birşey.
  • 11:34 - 11:37
    Bunu herkesin ulaşabileceği hale getirmemiz lazım."
  • 11:37 - 11:39
    Ve iki hafta içinde -- bizim makalemiz yayınlanmadan iki hafta önce --
  • 11:39 - 11:42
    herkesin kullanımına açık bir Ngram versiyonu programladılar.
  • 11:42 - 11:45
    ve artık siz de ilginizi çeken bir kelime ya da deyim yazarak
  • 11:45 - 11:47
    ona ait n-gramı hemen görebilirsiniz --
  • 11:47 - 11:49
    ve sizin n-gramınızın yer aldığı kitapları
  • 11:49 - 11:51
    tarayabilirsiniz.
  • 11:51 - 11:53
    JM: Bu uygulama, hayata geçtiği ilk gün ir milyonda defadan fazla kullanıldı,
  • 11:53 - 11:55
    ve bu bence en güzel sorgulardan biri.
  • 11:55 - 11:58
    İnsanlar iyi bir şey yapmak istediklerinde "ellerinden geleni yaptılar"
  • 11:58 - 12:01
    ama görünen o ki, 18. yüzyılda bunu pek umursamıyorlardı.
  • 12:01 - 12:04
    O zaman "ellerinden geleni" değil, "evlerinden geleni" yapmak istediler.
  • 12:04 - 12:07
    Aslında olan şu, be elbette bir hata.
  • 12:07 - 12:09
    Gayret etmeyi bırakmadılar, sadece
  • 12:09 - 12:12
    o dönemde L harfi daha farklı yazılıyordu, V'ye beziyordu biraz.
  • 12:12 - 12:15
    Elbette, Google bunu o zaman yakalayamadı,
  • 12:15 - 12:18
    bu nedenle bunu yazdığımız makaleye ekledik.
  • 12:18 - 12:20
    Ama görünen o ki, bu her ne kadar eğlenceli birşey
  • 12:20 - 12:22
    olsa da, bize şunu anımsattı
  • 12:22 - 12:24
    bu grafikleri anlamlandırırken çok dikkatli olmanız gerekiyor.
  • 12:24 - 12:27
    ve mutlaka bilimsel yöntemdeki temel standartları gözetmelisiniz.
  • 12:27 - 12:30
    ELA: İnsanlar bunu her türlü eğlenceli şey için kullanıyorlar.
  • 12:30 - 12:37
    (Gülüşmeler)
  • 12:37 - 12:39
    Aslında bundan sonra konuşmamız gereksiz,
  • 12:39 - 12:42
    size sadece bazı slaytları üzerinde konuşmaksızın göstereceğiz.
  • 12:42 - 12:45
    Bu kişi, düşkırıklığının, sıkıntının tarihçesi ile ilgileniyormuş.
  • 12:45 - 12:48
    Düşkırıklığının birkaç çeşidi vardır.
  • 12:48 - 12:51
    Eğer ayak parmağınızı bir yere çarpacak olursanız bu tek A harfli bir "Ah" demek.
  • 12:51 - 12:53
    Eğer gezegenimiz dünya gezegenler arası otoyol yapmak isteyen
  • 12:53 - 12:55
    Vogonlar tarafından işgal edilecek olursa,
  • 12:55 - 12:57
    bu sekiz A değerinde bir "Aaaaaaaah" eder.
  • 12:57 - 12:59
    Bu kişi bütün "Ahéları incelemiş.
  • 12:59 - 13:01
    Tek A'lıdan sekiz A'lısına dek.
  • 13:01 - 13:03
    Ve görmüş ki,
  • 13:03 - 13:05
    daha can sıkıcı şeylere ait "Ah"lar
  • 13:05 - 13:08
    daha az sıklıkla ortaya çıkıyor,
  • 13:08 - 13:11
    ama 80'li yılların başları hariç.
  • 13:11 - 13:13
    Biz bu durumun Reagan ile ilgili olduğunu düşünüyoruz.
  • 13:13 - 13:15
    (Gülüşmeler(
  • 13:15 - 13:18
    JM: Bu verilerin pek çok kullanım alanı var
  • 13:18 - 13:21
    ama nihayetinde, bunlar tarihsel kayıtların dijital veriler hakine çevrilmesi.
  • 13:21 - 13:23
    Google, 15 milyon kitabı dijital hale getirdi.
  • 13:23 - 13:25
    Bu, bugüne dek basılmış kitapların %12'si demek.
  • 13:25 - 13:28
    İnsanlığa ait kültür birikimin kayda değer bir kısmı.
  • 13:28 - 13:31
    Kültüre ait daha pek çok veri var: yazmalar, gazeteler,
  • 13:31 - 13:33
    yazılı olmayan şeyler, sanat ve tablolar gibi.
  • 13:33 - 13:35
    Bunların hepsi dünyanın dört bir yanındaki
  • 13:35 - 13:37
    bilgisayarlarımıza geçebilir.
  • 13:37 - 13:40
    Ve bu olduğunda, insanlığın geçmişi, bu günü ve
  • 13:40 - 13:42
    tüm yarattığı kültüre bakış açımız tamamen değişecek.
  • 13:42 - 13:44
    Çok teşekkürler.
  • 13:44 - 13:47
    (Alkışlar)
Title:
5 Milyon Kitaptan Ne Öğrendik?
Speaker:
Jean-Baptiste Michel + Erez Lieberman Aiden
Description:

Google Labs'ın Ngram Görüntüleyicisini hiç denediniz mi? Size yüzyıllara yayılmış 5 milyon kitabın arasından kelimeleri ve fikirleri aramanızı sağlayan bağımlılık yaratan bir araç. Erez Lieberman Aiden ve Jean-Baptiste Michel bizlere nasıl çalıştığını ve 500 milyar kelimeden öğrenebileceğimiz bazı ilginç şeyleri gösteriyorlar.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
13:48
Isil Arican added a translation

Turkish subtitles

Revisions