Eskiden bilgisayarınıza yeni bir şeyler yaptırmak isteseniz programlamanız gerekirdi. Şimdi, programlama; burada hiç yapmayanlar için söylüyorum, her adımı, her detayı bilgisayarın yapmasını istediğin her şeyi amacına ulaşman için tasarlaman gerekir. Nasıl yapacağını bilmediğin bir şeyi yapmak istiyorsan bu çok zorlu olacak. Arthur Samuel de bunu yaptı. 1956'da bilgisayarının onu damada yenebilmesini istiyordu. Her detayıyla nasıl bir program tasarlayarak damada senden daha iyi olmasını sağlayabilirsin? Bu soruna bir çözüm buldu: Binlerce kez bilgisayarıyla dama oynayacak ve böylece bilgisayara damayı öğrenecekti. Bu işe yaradı ve 1962'de bilgisayar Connecticut eyaleti şampiyonunu yendi. Bu şekilde Arthur Samuel, makine öğrenmenin fikir öncüsüydü ve ona borçluyum, çünkü bir makine öğrenimi uygulayıcısıyım. 200 bini aşkın uygulayıcıyı biraraya getiren Kaggle'ın başkanıydım. Kaggle yarışmalar düzenleyip çözülememiş problemleri çözmeye çalışıyordu ve yüzlerce kez başarılı oldular. Bu açıdan bakıldığında, makine öğreniminin geçmişte, günümüzde ve gelecekte planlanan çalışmaları hakkında çok şey öğrendim. Ticari anlamda belki de makine öğreniminin ilk başarısı Google'dır. Google bilgisayar algoritması ile bilgilere erişmeyi mümkün kılar ve bu algoritma makine öğrenimini temel alır. Bugüne kadar birçok ticari olarak başarılı uygulaması oldu. Amazon, Netflix gibi bir çok başarılı şirket makine öğrenimini ürünlerini ve filmlerini satmak için kullanmışlardır. Bu bazen ürkütücü olabilir. LinkedIn ve Facebook gibi şirketler bazen size tanıyor olabileceğiniz kişileri gösterir ve siz bunu nasıl yaptığını bilemezsiniz; işte bu makine öğreniminin eseridir. Bu sistem, programlanmak yerine datadan öğrenen algoritmalardan oluşur. Bu IBM'in Watson ile Jeopardy yarışmasında oldukça zor ve karışık soruları doğru cevaplayarak nasıl iki dünya şampiyonunu yenmeyi başardığını açıklar. İnsansız arabalar da bu sistem ile çalışır. Yaya ile ağaç arasındaki farkı söylemek isterseniz buyrun, söyleyin bu çok önemli. Bu programların elle nasıl yazıldığını bilmiyoruz ama makine öğrenimi ile mümkün. Ve bu arabalar bir düz yolda kaza yapmadan 1 milyon mili aştı. Böylece bilgisayarların, öğrenebildiğini ve bazen bizim yapmayı bilmediğimiz şeyleri yapmayı öğrenebildiklerini veya bizden bunları bizden daha iyi yapabileceklerini görüyoruz. Makine öğreniminin en iyi örneklerini Kaggle'da yürüttüğümüz bir projede gördüm: Toronto Üniversitesi'nden Geoffrey Hinton ve ekibi otomatik uyuşturucu tespiti alanında yarışmayı kazandı. Burada ilginç olansa; Merck veya uluslararası akademik çevrenin geliştirdiği bütün algoritmaları kimya ve biyoloji gibi alanlarda geçmişi olmayan kişilerin algoritmayı çözmeleri değil bunu 2 haftada yapmış olmaları. Peki bunu nasıl başardılar? Derin Öğrenme denilen olağanüstü bir algoritma kullandılar. Bu o kadar önemli bir başarıydı ki birkaç hafta sonra New York Times'ın kapağında yer aldı. Sol kenarda Geoffrey Hinton vardı. Derin Öğrenme, insan beyninin çalışmasından ilham alınarak oluşturulmuş bir algoritmadır ve kapasitesi konusunda teorik kısıtlamalar içermez. Ona ne kadar çok veri ve zaman verirseniz o kadar iyi sonuçlar elde edersiniz. New York Times'ın haberinde derin öğrenme ile elde edilen bir sonuç daha vardı; onu da şimdi göstereceğim: Sonuca göre: Bilgisayarlar dinleyebilir ve anlayabilir. Richard Rashid:"Bu yöntemde son aşamada gelebilmek istediğim nokta sizinle Çince konuşmak. Olay şu ki; bir çok Çinliden çok miktarda bilgi alma imkanımız oldu ve Çince bir metni alan ve Çin diline çeviren yani yazıyı konuşmaya dönüştüren bir sistem oluşturduk. Sonra konuşmamın bir saatlik kısmını aldık ve standart metni konuşma sistemine modüle ettik sonuç olarak benim konuşmam gibi olmalıydı. Sonuç mükemmel olmadı elbette. Hatta bir çok hata vardı. (Çince) (Alkışlar) Bu alanda daha çok çalışılması gerekiyor. (Çince) (Alkışlar) Bu, Çinde makine öğrenimi konferansıydı. Genelde akademik konferanslarda spontane alkışlamalar olmaz ancak TEDx konferanslarında rastlanabilir. Burada gördüğünüz her şey derin öğrenme ile gerçekleşiyor. (Alkışlar) Teşekkürler. İngilizce uyarlama derin öğrenme ile yapıldı. Çince çeviri ve sağ üstteki metin derin öğrenmeyle, ve yine sesin entegre edilmesi de derin öğrenme ile yapıldı. Derin öğrenme alışılmışın dışında bir şey. Tek bir algoritma neredeyse her şeyi yapabilecek gibi duruyor ve geçen sene öğrendim ki görmeyi de öğrenmiş. Almanya'da Alman Trafik İşaretleri Karşılaştırması olarak adlandırılan yarışmada derin öğrenme bu gibi işaretleri algılamayı öğrendi. Diğer algoritmalardan daha iyi algılamakla kalmayıp, yarışmanın sıralamasına bakıldığında insanlardan da daha iyi tanıdı; hatta iki katı daha fazla. 2011 yılında, bilgisayarların insanlardan daha iyi görebildiğini anladık. O zamandan beri sayısız çalışma yapıldı. 2012'de Google; Youtube videolarını izleyen ve aylık 16.000 bilgisayardaki veriyi sıkıştırabilen derin öğrenme algoritmaları olduğunu açıkladı. Ayrıca bilgisayarlar ayrı ayrı insan ve kedi gibi konseptleri izleyerek öğrendi. Bu insanların öğrenmesine benziyor. İnsanlar gördüklerinin anlatılmasıyla değil kendileri başlarına öğrenirler. Yine 2012'de az önce gördüğümüz Geoffrey Hinton 1.5 milyon fotoğrafa bakarak neyin fotoğrafları olduğunu çözmeye çalışarak popüler olan ImageNet yarışmasını kazandı. 2014 yılında görüntü tanımada %6 lık hata payına düştük. Bu da insanlardan daha iyi. Makinalar gerçekten bu alanda harika işler yapıyor ve artık endüstride de kullanılıyor. Mesela Google, geçen yıl Fransa'daki her bir konumu 2 saatte haritada işaretlediğini duyurdu ve cadde numaralarını okumak ve tanımlamak için cadde görüntülerini bir derin öğrenme algoritmasında kullandılar. Bunun önceleri ne kadar sürdüğünü düşünün: binlerce insan, bir çok yıl. Bu Çin'de de oldu. Baidu bir çeşit Çin'in Google'ı, sanırım, sol üst köşede gördüğünüz Baidu'nun derin öğrenme sistemine yüklediğim görüntünün örneği ve arkaplanda ise sistemin görüntüyü tanımlayıp benzerlerini bulduğunu görebilirsiniz. Benzer resimler gerçekten de benzer arka planlara, benzer yüz açılarına sahip hatta bazılarında dilleri dışarıda. Tam olarak web sayfasının metnine bakmak gibi değil. Tek yaptığım resim yüklemekti. O halde gördüklerini anlayabilen ve bu sayede gerçek zamanlı olarak yüz milyonlarca görüntüyü veritabanlarında arayabilen bilgisayarlar var. Peki bilgisayarların görmesi ne anlama geliyor? Sadece görebilmesini sağlamak değil aslında derin öğrenme bundan daha fazlasını yaptı. Bu gibi karmaşık ve incelikli cümleler artık derin öğrenme algoritmalarıyla anlaşılabilir. Gördüğünüz üzere; Stanford-tabanlı sistem, üstteki kırmızı noktanın negatif bir his ifade ettiğini anlıyor. Derin öğrenme hatta cümlelerin ne hakkında olduğunu ve anlamlarını anlamada insan performansına yaklaşmış durumda. Aynı zamanda derin öğrenme Çin anadil seviyesinde Çince okumada da kullanıldı. Bu algoritma Çince konuşamayan ve anlamayan insanlar tarafından İsviçre'de geliştirildi. Bahsettiğim gibi derin öğrenme kullanma bu işte dünyadaki en iyi sistem yerel insanların anlama performansına göre bile. Bu sistem şirketimde oluşturuldu ve bu tarz şeyleri bir arada toplamayı gösteriyor. Bu resimlere eklenmiş metin yok ve ben buraya cümle yazarken gerçek zamanlı olarak resimleri algılıyor, ne hakkında olduklarını çözüyor ve yazdığım metne benzer resimleri buluyor. Görüyorsunuz, bu aslında cümlelerimi anlama ve bu resimleri anlama. Benzerini Google'da gördüğünüzü düşünüyorum; bir şeyleri yazarken size resimler gösterir ama asıl yaptığı web sayfalarında yazdıklarınızı aramaktır. Bu aslında resimleri anlamaktan oldukça farklı. Bu son bir kaç ayda ilk kez bilgisayarların yapabildiği bir şey. O halde görüyoruz ki bilgisayarlar görebilmekle kalmıyor aynı zamanda okuyabiliyor ve zaten duyduklarını anlayabildiklerini de göstermiştik. Belki yazabildiklerini söylesem artık şaşırtıcı gelmez. İşte burada dün derin öğrenme algoritmasıyla oluşturduğum metin. Ve burada algoritma tarafından geliştirilen metinler var. Bu cümlelerin her biri resimleri tanımlamak için derin öğrenme algoritmasıyla geliştirildi . Algoritma daha önce siyah tişörtlü gitar çalan birini hiç görmemişti. Önceden adamı görmüştü, siyahi görmüştü, gitarı görmüştü ama bu resmin roman tasvirini ayrı olarak yaptı. Hala tam olarak insan performansında değiliz ama yakınız. Testlerde 1/4 oranında insanlar, bilgisayar tarafından oluşturulan yazıları seçiyor. Bu sistem şuan sadece 2 haftalık ama muhtemelen gelecek yıl içerisinde bu oranlarda devam ederse algoritma insan performansını hayli geçmiş olacak. Yani bilgisayarlar yazabiliyor da. Tüm bunları birleştirdik ve durum heyecan verici fırsatlar yarattı. Örneğin; sağlık alanında Boston'da bir takım, doktorların kanser teşhisine yardımcı düzinelerce kliniksel olarak ilişkili tümör özellikleri keşfettiklerini duyurdu. Benzer olarak Stanford' da büyüme altındaki dokulara bakan bir grup; kanser hastalarının sağkalım oranlarını ölçmede patoloji uzmanlarından daha iyi olan, makine öğrenmesine dayalı bir sistem geliştirdi. Bu iki durumda da tahminlerin daha hatasız olmasının yanı sıra kavrama açısından güçlü yeni bir bilim geliştirdiler. Radyoloji vakasındakiler insanların anlayabileceği yeni kliniksel indikatörlerdi. Patoloji vakasında ise bilgisayar, tanı yapılırken kanser etrafındaki hücrelerin kanser hücreleri kadar önemli olduğunu keşfetti. Bu patoloji uzmanlarına onlarca yıldır öğretilenlerin tam tersi. Bu iki vakada da tıp uzmanları ve makine öğrenmesi uzmanlarının birleşip geliştirdiği bir sistemdi ancak geçen yıl bunu da geçtik. Bu örnek mikroskop altındaki insan dokusunun kanserli bölgelerini tanımlamak üzerine. Burada gösterilen sistem bu alanları daha isabetli olarak belirleyebiliyor, ya da en az patoloji uzmanı kadar ama tümüyle derin öğrenme kullanılarak ve herhangi bir tıp geçmişi olmayan insanlar tarafından geliştirildi. Benzer olarak nöron segmentasyonu da. Şu an nöronları insanlar kadar isabetli segmentleyebiliyoruz ki bu sistem derin öğrenme kullanılarak hiç bir tıbbi geçmişi olmayan kişiler tarafından geliştirildi. Aynı şekilde ben de, hiç bir tıbbi geçmişim olmadığı halde medikal alanında yeni bir şirket açabilirim ki açtım da. Şirketi açma konusunda biraz korkmuştum ama teoride bu veri analiz tekniklerini kullanarak yararlı ilaçlar yapmak mümkün görünüyordu. Neyse ki geri dönüşler harikaydı sadece medya değil tıp çevresinde de ki aynı zamanda çok da destekleyicilerdi. Teoride, medikal sürecin orta bölümünü alıp mümkün olduğunca veri analizine çevirerek doktorları en iyi oldukları alana yoğunlaştırabiliriz. Bir örnek vermek istiyorum. Yeni bir tıbbi teşhis testini üretmek 15 dakikamızı alır ve gerçek zamanlı olarak da göstereceğim ama bazı parçalarını keserek süreci 3 dakikaya indirdim. Tıbbi teşhis testini oluşturmayı göstermek yerine daha anlaşılır olduğu için araba görüntülerini tanımlama testini göstereceğim. Yaklaşık 1.5 milyon araba resmiyle başlıyoruz ve çekildikleri açılara göre onları ayırabilecek bir şey yaratmak istiyorum. Bütün resimler etiketsiz bu yüzden sıfırdan başlamak zorundayım. Derin öğrenme algoritmamızla resimlerdeki yapıların alanlarını otomatik olarak algılayabilir. Güzel olan, şu andan itibaren insan ile bilgisayar artık ortak çalışabilir. Gördüğünüz gibi insan burada bilgisayara; daha sonra deneyip, algoritmasını geliştirmede kullanması için ilgi alanlarını söylüyor. Bu derin öğrenme sistemleri aslında 16.000 boyutlu uzay ve gördüğünüz gibi bilgisayar burada uzay boyunca döndürüp yeni yapı alanları bulmaya çalışıyor. Başarıyla yapınca da daha sonra bunu süren kişi ilgi çekici olan alanları gösteriyor. Ve burada bilgisayar başarılı bir şekilde alanları buldu. Örneğin: Açılar. Bu süreç devam ederken, bilgisayara aradığımız yapı türlerini adım adım söylüyoruz. Teşhis testinde pataloji uzmanının patoz alanlarını tanımlaması gibi düşünebilirsin ya da örneğin radyolojistin sıkıntı yaratabilecek nodülleri göstermesi gibi. Bazen algoritma için sıkıntılı olabilir. Bu vaka da biraz kafası karışmış. Arabaların önleri ve arkaları karmakarışık. Burada biraz daha dikkatli olmalıyız, arkalara karşılık önleri elle seçmekte ve daha sonra bunun ilgilendiğimiz tipte bir grup olduğunu söylemekte. Bunu biraz yapıyoruz, biraz atlıyoruz bunu, sonra makine öğrenmesi algoritmasını bu yüzlerce kadar olan şeylere dayanarak eğitiyoruz ve daha iyi olmasını ümit ediyoruz. Bazı resimlerin solmaya başladığını görebilirsiniz ve bize bazılarını kendisinin önceden nasıl anlaması gerektiğini farkettiğini gösteriyor. Bu benzer resimler konseptini kullanabiliriz ve benzer resimleri kullanarak bilgisayarın bu noktada arabaların sadece önlerini bulabildiğini görebilirsiniz. Bu aşamada bilgisayar insana: "Tamam, peki, iyi iş çıkardın." diyebilir. Bazen, elbette, bu noktada bile grupların arasından seçmek zor. Bu durumda, bilgisayarın biraz çevirmesine izin verdikten sonra bile sağ ve sol taraftaki resimlerin karmakarışık olarak bulabiliriz. Yine bilgisayara bir takım ipuçları verebiliriz, ve diyebiliriz ki :"Tamam, derin öğrenme algoritmasını kullanarak sağ ve sol tarafları mümkün olduğunca ayırabilecek bir projeksiyon bulmaya çalış. " Ve ipucunu verince başarılı oldu. Objeleri birbirinden ayırabilmek için gereken düşünme şeklini birlikte bulabildiler. Yani buradaki fikri anladınız. Buradaki durum; insanın yerine bilgisayarın geçmesi değil birlikte çalışmaları. Burada yaptığımız ise; 6 ya da 7 kişilik bir takımın yaklaşık 7 senede yapacağı bir şeyi, bir kişinin yaklaşık 15 dakikada yapacağı bir şeyle değiştirmek. Bu süreç yaklaşık 4 ya da 5 yineleme içeriyor. Gördüğünüz gibi şuan 1.5 milyon resmimizin %62 si doğru bir şekilde sınıflandırıldı. Gelinen noktada, oldukça kolay bir şekilde büyük bölümleri alıp hata olmadığına emin olmak için kontrol edebiliriz. Hata olan yerlerde ise bilgisayara bildirebiliriz. Her farklı grup için bu tür bir süreç kullanarak 1.5 milyon görüntüyü sınıflandırmada %80 başarı yüzdesine çıktık. Bu noktada konu sadece doğru sınıflandırılmamış olan küçük numarayı bulmak ve sebebini anlamaya çalışmak üzerine. Bu yaklaşımı kullanarak; 15 dakikada %97' lik sınıflandırma oranına ulaştık. Bu tarz bir teknik bize çok önemli bir problemi çözmeye izin verebilir; dünyada tıbbi uzmanlığın olmadığı yerlerde. Dünya Ekonomik Forumu'na göre; gelişen dünyada doktor kıtlığı 10 ile 20 katı arasında ve 300 yıl alacaktır bu problemi çözmek için yeterli insan yetiştirmek. Düşünün ki derin öğrenme yaklaşımını kullanarak verimliliklerini artırmaya yardım edebilsek? Fırsatlar konusunda oldukça heycanlıyım. Aynı zamanda problemlerle de ilgileniyorum. Buradaki problem ise; haritadaki her mavi alanda servisler istihdamın %80 den fazla. Servisler nedir? İşte servisler. Bunlar aynı zamanda bilgisayarın yapılma şeklini öğrendiği şeyler. Yani gelişen dünyadaki istihdamın %80 'inin yaptığı şeyler aynı zamanda bilgisayarın nasıl yapılacağını öğrendiği şeyler. Bu ne anlama geliyor? Tamam, bir şey olmayacak. Başka işlerle yer değiştirilcekler. Örneğin; Veri bilimciler için daha fazla iş olacak. Aslında öyle değil. Veri bilimcilerin bunları yapmaları çok zamanlarını almaz. Örneğin; bu 4 algoritma da aynı adam tarafından geliştirildi. Yani eğer; daha önceden de olmuştu, yeni işlerin gelip yer değiştirdiği zamanların sonuçlarını gördük. Bu yeni işlere ne olacak? Bunu kestirmek bizim için oldukça zor çünkü insan performansı bu şekilde kademeli olarak artıyor ama artık biz bir sisteme, derin öğrenmeye sahibiz yani katlanarak büyüme kapasitesine sahip olduğunu biliyoruz. Ve burdayız. Şu anda, etrafımızdaki şeyleri görüyoruz ve: "Bilgisayarlar hala aptal." değil mi? Ama 5 yıllık süre içinde bilgisayarlar bu çizelgenin dışında olacak. Yani bu kabiliyeti hemen düşünmeye başlamalıyız. Bunu daha önceden görmüştük, elbette. Sanayi devriminde, motorlar sayesinde kapasitede kademe atlamayı gördük. Mesele şu ki, yine de bir süre sonra işler düzeliyor. Sosyal bozulma vardı ama bir kez motorlar güç üretmek için kullanıldı ve tüm durumlar, her şey düzene oturdu. Makine Öğrenmesi Devrimi Sanayi devriminden çok daha farklı olacak çünkü Makine Öğrenmesi Devrimi asla durulmayacak. Bilgisayarlar entelektüel aktiviteler de iyiye gittikçe, entelektüel kapasitede daha iyi olan bilgisayarlar üretilecek. Yani bu dünyanın daha önce tanık olmadığı türde bir değişim olacak bu yüzden neyin mümkün olduğu konusunda ki önceki anlayışınız farklı. Şimdiden bizi etkiliyor. Son 25 yılda, kapital üretim arttıkça işçi verimliliği sabitti hatta biraz inişteydi. Bu yüzden bu konuyu tartışmaya başlamamızı istiyorum. İnsanlara bu durum hakkında çoğu kez bahsettiğimde, insanlar oldukça ilgisiz olabiliyor. Bilgisayarlar gerçek anlamda düşünemez, duygusal davranmaz, şiirden anlamaz, nasıl çalıştıklarını tam olarak anlamıyoruz. Ne fark eder? Bilgisayarlar şu an insanların ücret alarak zamanlarının çoğunu harcadıkları şeyleri yapabiliyor. O zaman sosyal ve ekonomik yapımızı nasıl uyduracağımızı düşünmeye başlamamızın ve bu yeni gerçekliğin farkında olmamızın tam zamanı. Teşekkürler. (Alkışlar)