Eskiden bilgisayarınıza
yeni bir şeyler yaptırmak isteseniz
programlamanız gerekirdi.
Şimdi, programlama; burada hiç yapmayanlar
için söylüyorum, her adımı, her detayı
bilgisayarın yapmasını istediğin
her şeyi amacına
ulaşman için tasarlaman gerekir.
Nasıl yapacağını bilmediğin bir şeyi
yapmak istiyorsan bu çok zorlu olacak.
Arthur Samuel de bunu yaptı.
1956'da bilgisayarının onu
damada yenebilmesini istiyordu.
Her detayıyla nasıl bir
program tasarlayarak
damada senden daha iyi
olmasını sağlayabilirsin?
Bu soruna bir çözüm buldu:
Binlerce kez bilgisayarıyla dama oynayacak
ve böylece bilgisayara damayı öğrenecekti.
Bu işe yaradı ve 1962'de bilgisayar
Connecticut eyaleti şampiyonunu yendi.
Bu şekilde Arthur Samuel,
makine öğrenmenin
fikir öncüsüydü ve ona borçluyum,
çünkü bir makine öğrenimi uygulayıcısıyım.
200 bini aşkın uygulayıcıyı
biraraya getiren Kaggle'ın başkanıydım.
Kaggle yarışmalar düzenleyip çözülememiş
problemleri çözmeye çalışıyordu ve
yüzlerce kez başarılı oldular.
Bu açıdan bakıldığında, makine öğreniminin
geçmişte, günümüzde ve gelecekte planlanan
çalışmaları hakkında çok şey öğrendim.
Ticari anlamda belki de
makine öğreniminin
ilk başarısı Google'dır.
Google bilgisayar algoritması ile
bilgilere erişmeyi mümkün kılar ve
bu algoritma makine öğrenimini temel alır.
Bugüne kadar birçok ticari
olarak başarılı uygulaması oldu.
Amazon, Netflix gibi bir çok
başarılı şirket makine öğrenimini
ürünlerini ve filmlerini
satmak için kullanmışlardır.
Bu bazen ürkütücü olabilir.
LinkedIn ve Facebook gibi
şirketler bazen size
tanıyor olabileceğiniz kişileri
gösterir ve siz
bunu nasıl yaptığını bilemezsiniz; işte
bu makine öğreniminin eseridir.
Bu sistem, programlanmak yerine datadan
öğrenen algoritmalardan oluşur.
Bu IBM'in Watson ile Jeopardy yarışmasında
oldukça zor ve karışık soruları doğru
cevaplayarak nasıl iki dünya şampiyonunu
yenmeyi başardığını açıklar.
İnsansız arabalar da
bu sistem ile çalışır.
Yaya ile ağaç arasındaki farkı söylemek
isterseniz buyrun, söyleyin bu çok önemli.
Bu programların elle nasıl yazıldığını
bilmiyoruz ama makine öğrenimi ile mümkün.
Ve bu arabalar bir düz yolda
kaza yapmadan 1 milyon mili aştı.
Böylece bilgisayarların,
öğrenebildiğini
ve bazen bizim yapmayı bilmediğimiz
şeyleri yapmayı öğrenebildiklerini
veya bizden bunları bizden daha
iyi yapabileceklerini görüyoruz.
Makine öğreniminin en iyi örneklerini
Kaggle'da yürüttüğümüz bir projede gördüm:
Toronto Üniversitesi'nden Geoffrey Hinton
ve ekibi otomatik uyuşturucu tespiti
alanında yarışmayı kazandı.
Burada ilginç olansa;
Merck veya uluslararası akademik çevrenin
geliştirdiği bütün algoritmaları kimya
ve biyoloji gibi alanlarda geçmişi
olmayan kişilerin algoritmayı
çözmeleri değil bunu
2 haftada yapmış olmaları.
Peki bunu nasıl başardılar?
Derin Öğrenme denilen olağanüstü
bir algoritma kullandılar.
Bu o kadar önemli bir başarıydı ki birkaç
hafta sonra New York Times'ın
kapağında yer aldı.
Sol kenarda Geoffrey Hinton vardı.
Derin Öğrenme, insan beyninin
çalışmasından
ilham alınarak
oluşturulmuş bir algoritmadır
ve kapasitesi konusunda
teorik kısıtlamalar içermez.
Ona ne kadar çok veri ve zaman verirseniz
o kadar iyi sonuçlar
elde edersiniz.
New York Times'ın haberinde derin öğrenme
ile elde edilen
bir sonuç daha vardı;
onu da şimdi göstereceğim:
Sonuca göre:
Bilgisayarlar dinleyebilir
ve anlayabilir.
Richard Rashid:"Bu yöntemde
son aşamada gelebilmek
istediğim nokta
sizinle Çince konuşmak.
Olay şu ki;
bir çok Çinliden çok miktarda
bilgi alma imkanımız oldu
ve Çince bir metni alan ve
Çin diline çeviren yani yazıyı
konuşmaya dönüştüren
bir sistem oluşturduk.
Sonra konuşmamın bir saatlik kısmını aldık
ve standart metni konuşma sistemine
modüle ettik sonuç olarak
benim konuşmam gibi olmalıydı.
Sonuç mükemmel olmadı elbette.
Hatta bir çok hata vardı.
(Çince)
(Alkışlar)
Bu alanda daha çok çalışılması gerekiyor.
(Çince)
(Alkışlar)
Bu, Çinde makine öğrenimi konferansıydı.
Genelde akademik konferanslarda
spontane alkışlamalar olmaz ancak
TEDx konferanslarında rastlanabilir.
Burada gördüğünüz her şey
derin öğrenme ile gerçekleşiyor.
(Alkışlar)
Teşekkürler.
İngilizce uyarlama derin
öğrenme ile yapıldı.
Çince çeviri ve sağ üstteki
metin derin öğrenmeyle,
ve yine sesin entegre edilmesi
de derin öğrenme ile yapıldı.
Derin öğrenme alışılmışın dışında bir şey.
Tek bir algoritma
neredeyse
her şeyi yapabilecek gibi duruyor
ve geçen sene öğrendim ki
görmeyi de öğrenmiş.
Almanya'da Alman Trafik
İşaretleri Karşılaştırması
olarak adlandırılan yarışmada
derin öğrenme bu gibi
işaretleri algılamayı öğrendi.
Diğer algoritmalardan daha iyi algılamakla
kalmayıp, yarışmanın
sıralamasına bakıldığında
insanlardan da daha iyi tanıdı;
hatta iki katı daha fazla.
2011 yılında, bilgisayarların insanlardan
daha iyi görebildiğini anladık.
O zamandan beri sayısız çalışma yapıldı.
2012'de Google; Youtube
videolarını izleyen
ve aylık 16.000 bilgisayardaki
veriyi sıkıştırabilen
derin öğrenme algoritmaları
olduğunu açıkladı.
Ayrıca bilgisayarlar
ayrı ayrı insan ve kedi
gibi konseptleri izleyerek öğrendi.
Bu insanların öğrenmesine benziyor.
İnsanlar gördüklerinin
anlatılmasıyla değil
kendileri başlarına öğrenirler.
Yine 2012'de az önce
gördüğümüz Geoffrey Hinton
1.5 milyon fotoğrafa
bakarak neyin fotoğrafları
olduğunu çözmeye çalışarak
popüler olan ImageNet yarışmasını kazandı.
2014 yılında görüntü tanımada
%6 lık hata payına düştük.
Bu da insanlardan daha iyi.
Makinalar gerçekten bu alanda
harika işler yapıyor
ve artık endüstride de kullanılıyor.
Mesela Google, geçen yıl Fransa'daki
her bir konumu 2 saatte haritada
işaretlediğini duyurdu ve
cadde numaralarını okumak ve tanımlamak
için cadde görüntülerini
bir derin öğrenme
algoritmasında kullandılar.
Bunun önceleri ne kadar sürdüğünü düşünün:
binlerce insan, bir çok yıl.
Bu Çin'de de oldu.
Baidu bir çeşit Çin'in Google'ı, sanırım,
sol üst köşede gördüğünüz Baidu'nun
derin öğrenme sistemine
yüklediğim görüntünün örneği
ve arkaplanda ise sistemin görüntüyü
tanımlayıp benzerlerini
bulduğunu görebilirsiniz.
Benzer resimler gerçekten de
benzer arka planlara,
benzer yüz açılarına sahip
hatta bazılarında dilleri dışarıda.
Tam olarak web sayfasının
metnine bakmak gibi değil.
Tek yaptığım resim yüklemekti.
O halde gördüklerini anlayabilen ve
bu sayede gerçek zamanlı olarak yüz
milyonlarca görüntüyü veritabanlarında
arayabilen bilgisayarlar var.
Peki bilgisayarların görmesi
ne anlama geliyor?
Sadece görebilmesini sağlamak değil
aslında derin öğrenme
bundan daha fazlasını yaptı.
Bu gibi karmaşık ve incelikli cümleler
artık derin öğrenme
algoritmalarıyla anlaşılabilir.
Gördüğünüz üzere;
Stanford-tabanlı sistem, üstteki kırmızı
noktanın negatif bir
his ifade ettiğini anlıyor.
Derin öğrenme hatta
cümlelerin ne hakkında olduğunu
ve anlamlarını anlamada insan
performansına yaklaşmış durumda.
Aynı zamanda derin öğrenme Çin
anadil seviyesinde Çince
okumada da kullanıldı.
Bu algoritma Çince konuşamayan ve
anlamayan insanlar
tarafından İsviçre'de geliştirildi.
Bahsettiğim gibi derin
öğrenme kullanma bu işte
dünyadaki en iyi sistem yerel insanların
anlama performansına göre bile.
Bu sistem şirketimde oluşturuldu
ve bu tarz şeyleri bir arada
toplamayı gösteriyor.
Bu resimlere eklenmiş metin yok ve
ben buraya cümle yazarken gerçek
zamanlı olarak resimleri algılıyor,
ne hakkında olduklarını çözüyor ve
yazdığım metne benzer resimleri buluyor.
Görüyorsunuz, bu aslında
cümlelerimi anlama
ve bu resimleri anlama.
Benzerini Google'da
gördüğünüzü düşünüyorum;
bir şeyleri yazarken size
resimler gösterir ama
asıl yaptığı web sayfalarında
yazdıklarınızı aramaktır.
Bu aslında resimleri anlamaktan
oldukça farklı.
Bu son bir kaç ayda ilk kez
bilgisayarların yapabildiği bir şey.
O halde görüyoruz ki bilgisayarlar
görebilmekle kalmıyor aynı zamanda
okuyabiliyor ve zaten duyduklarını
anlayabildiklerini de göstermiştik.
Belki yazabildiklerini söylesem
artık şaşırtıcı gelmez.
İşte burada dün derin
öğrenme algoritmasıyla
oluşturduğum metin.
Ve burada algoritma tarafından
geliştirilen metinler var.
Bu cümlelerin her biri
resimleri tanımlamak
için derin öğrenme
algoritmasıyla geliştirildi .
Algoritma daha önce siyah tişörtlü
gitar çalan birini hiç görmemişti.
Önceden adamı görmüştü, siyahi görmüştü,
gitarı görmüştü ama bu resmin roman
tasvirini ayrı olarak yaptı.
Hala tam olarak insan performansında
değiliz ama yakınız.
Testlerde 1/4 oranında
insanlar, bilgisayar
tarafından oluşturulan yazıları seçiyor.
Bu sistem şuan sadece 2 haftalık
ama muhtemelen gelecek yıl içerisinde
bu oranlarda devam ederse
algoritma insan performansını
hayli geçmiş olacak.
Yani bilgisayarlar yazabiliyor da.
Tüm bunları birleştirdik
ve durum heyecan verici fırsatlar yarattı.
Örneğin; sağlık alanında
Boston'da bir takım,
doktorların kanser teşhisine yardımcı
düzinelerce kliniksel
olarak ilişkili tümör
özellikleri keşfettiklerini duyurdu.
Benzer olarak Stanford' da
büyüme altındaki dokulara bakan bir grup;
kanser hastalarının sağkalım
oranlarını ölçmede
patoloji uzmanlarından daha iyi olan,
makine öğrenmesine dayalı
bir sistem geliştirdi.
Bu iki durumda da tahminlerin daha
hatasız olmasının yanı sıra kavrama
açısından güçlü yeni
bir bilim geliştirdiler.
Radyoloji vakasındakiler insanların
anlayabileceği yeni
kliniksel indikatörlerdi.
Patoloji vakasında ise bilgisayar,
tanı yapılırken kanser
etrafındaki hücrelerin kanser
hücreleri kadar önemli olduğunu keşfetti.
Bu patoloji uzmanlarına onlarca
yıldır öğretilenlerin tam tersi.
Bu iki vakada da tıp uzmanları ve
makine öğrenmesi uzmanlarının
birleşip geliştirdiği bir sistemdi
ancak geçen yıl bunu da geçtik.
Bu örnek mikroskop altındaki insan
dokusunun kanserli bölgelerini
tanımlamak üzerine.
Burada gösterilen sistem bu alanları daha
isabetli olarak belirleyebiliyor,
ya da en az patoloji uzmanı kadar
ama tümüyle derin öğrenme kullanılarak ve
herhangi bir tıp geçmişi olmayan
insanlar tarafından geliştirildi.
Benzer olarak nöron segmentasyonu da.
Şu an nöronları insanlar kadar
isabetli segmentleyebiliyoruz
ki bu sistem derin öğrenme
kullanılarak hiç bir tıbbi geçmişi
olmayan kişiler tarafından geliştirildi.
Aynı şekilde ben de, hiç bir tıbbi geçmişim
olmadığı halde medikal alanında
yeni bir şirket açabilirim ki açtım da.
Şirketi açma konusunda
biraz korkmuştum ama
teoride bu veri analiz
tekniklerini kullanarak
yararlı ilaçlar yapmak mümkün görünüyordu.
Neyse ki geri dönüşler harikaydı
sadece medya değil tıp çevresinde de
ki aynı zamanda çok da destekleyicilerdi.
Teoride, medikal sürecin
orta bölümünü alıp
mümkün olduğunca veri analizine çevirerek
doktorları en iyi oldukları
alana yoğunlaştırabiliriz.
Bir örnek vermek istiyorum.
Yeni bir tıbbi teşhis testini
üretmek 15 dakikamızı alır
ve gerçek zamanlı olarak da göstereceğim
ama bazı parçalarını keserek
süreci 3 dakikaya indirdim.
Tıbbi teşhis testini oluşturmayı
göstermek yerine
daha anlaşılır olduğu için
araba görüntülerini tanımlama
testini göstereceğim.
Yaklaşık 1.5 milyon araba
resmiyle başlıyoruz ve
çekildikleri açılara göre onları
ayırabilecek bir şey yaratmak istiyorum.
Bütün resimler etiketsiz bu yüzden
sıfırdan başlamak zorundayım.
Derin öğrenme algoritmamızla resimlerdeki
yapıların alanlarını otomatik
olarak algılayabilir.
Güzel olan, şu andan itibaren
insan ile bilgisayar
artık ortak çalışabilir.
Gördüğünüz gibi insan burada bilgisayara;
daha sonra deneyip, algoritmasını
geliştirmede kullanması için
ilgi alanlarını söylüyor.
Bu derin öğrenme sistemleri
aslında 16.000 boyutlu uzay
ve gördüğünüz gibi
bilgisayar burada
uzay boyunca döndürüp yeni yapı
alanları bulmaya çalışıyor.
Başarıyla yapınca da daha sonra bunu süren
kişi ilgi çekici olan alanları gösteriyor.
Ve burada bilgisayar başarılı
bir şekilde alanları buldu.
Örneğin: Açılar.
Bu süreç devam ederken,
bilgisayara aradığımız yapı türlerini
adım adım söylüyoruz.
Teşhis testinde pataloji uzmanının
patoz alanlarını tanımlaması
gibi düşünebilirsin
ya da örneğin radyolojistin sıkıntı
yaratabilecek nodülleri göstermesi gibi.
Bazen algoritma için sıkıntılı olabilir.
Bu vaka da biraz kafası karışmış.
Arabaların önleri ve
arkaları karmakarışık.
Burada biraz daha dikkatli olmalıyız,
arkalara karşılık önleri elle seçmekte ve
daha sonra bunun ilgilendiğimiz tipte
bir grup olduğunu söylemekte.
Bunu biraz yapıyoruz,
biraz atlıyoruz bunu,
sonra makine öğrenmesi algoritmasını
bu yüzlerce kadar olan
şeylere dayanarak eğitiyoruz
ve daha iyi olmasını ümit ediyoruz.
Bazı resimlerin solmaya
başladığını görebilirsiniz
ve bize bazılarını kendisinin önceden
nasıl anlaması gerektiğini
farkettiğini gösteriyor.
Bu benzer resimler
konseptini kullanabiliriz
ve benzer resimleri
kullanarak bilgisayarın
bu noktada arabaların sadece
önlerini bulabildiğini görebilirsiniz.
Bu aşamada bilgisayar insana:
"Tamam, peki, iyi iş çıkardın." diyebilir.
Bazen, elbette, bu noktada bile
grupların arasından seçmek zor.
Bu durumda, bilgisayarın
biraz çevirmesine izin
verdikten sonra bile sağ ve sol taraftaki
resimlerin karmakarışık
olarak bulabiliriz.
Yine bilgisayara bir takım
ipuçları verebiliriz,
ve diyebiliriz ki :"Tamam, derin
öğrenme algoritmasını
kullanarak sağ ve sol tarafları mümkün
olduğunca ayırabilecek
bir projeksiyon bulmaya çalış. "
Ve ipucunu verince başarılı oldu.
Objeleri birbirinden
ayırabilmek için gereken
düşünme şeklini birlikte bulabildiler.
Yani buradaki fikri anladınız.
Buradaki durum; insanın
yerine bilgisayarın geçmesi
değil birlikte çalışmaları.
Burada yaptığımız ise; 6 ya da 7 kişilik
bir takımın yaklaşık 7
senede yapacağı bir şeyi,
bir kişinin yaklaşık 15 dakikada
yapacağı bir şeyle değiştirmek.
Bu süreç yaklaşık 4 ya da
5 yineleme içeriyor.
Gördüğünüz gibi şuan 1.5 milyon resmimizin
%62 si doğru bir şekilde sınıflandırıldı.
Gelinen noktada, oldukça kolay bir şekilde
büyük bölümleri alıp hata olmadığına
emin olmak için kontrol edebiliriz.
Hata olan yerlerde ise
bilgisayara bildirebiliriz.
Her farklı grup için bu tür
bir süreç kullanarak
1.5 milyon görüntüyü sınıflandırmada
%80 başarı yüzdesine çıktık.
Bu noktada konu sadece
doğru sınıflandırılmamış olan
küçük numarayı bulmak ve
sebebini anlamaya çalışmak üzerine.
Bu yaklaşımı kullanarak; 15 dakikada
%97' lik sınıflandırma oranına ulaştık.
Bu tarz bir teknik bize çok önemli
bir problemi çözmeye izin verebilir;
dünyada tıbbi uzmanlığın
olmadığı yerlerde.
Dünya Ekonomik Forumu'na göre;
gelişen dünyada doktor
kıtlığı 10 ile 20 katı
arasında ve 300 yıl alacaktır bu problemi
çözmek için yeterli insan yetiştirmek.
Düşünün ki derin öğrenme
yaklaşımını kullanarak
verimliliklerini artırmaya
yardım edebilsek?
Fırsatlar konusunda oldukça heycanlıyım.
Aynı zamanda
problemlerle de ilgileniyorum.
Buradaki problem ise; haritadaki
her mavi alanda servisler
istihdamın %80 den fazla.
Servisler nedir?
İşte servisler.
Bunlar aynı zamanda bilgisayarın
yapılma şeklini öğrendiği şeyler.
Yani gelişen dünyadaki
istihdamın %80 'inin
yaptığı şeyler aynı zamanda bilgisayarın
nasıl yapılacağını öğrendiği şeyler.
Bu ne anlama geliyor?
Tamam, bir şey olmayacak.
Başka işlerle yer değiştirilcekler.
Örneğin; Veri bilimciler
için daha fazla iş olacak.
Aslında öyle değil.
Veri bilimcilerin bunları yapmaları
çok zamanlarını almaz.
Örneğin; bu 4 algoritma da aynı
adam tarafından geliştirildi.
Yani eğer; daha önceden de olmuştu,
yeni işlerin gelip yer değiştirdiği
zamanların sonuçlarını gördük.
Bu yeni işlere ne olacak?
Bunu kestirmek bizim için oldukça zor
çünkü insan performansı
bu şekilde kademeli olarak
artıyor ama artık biz bir sisteme,
derin öğrenmeye
sahibiz yani katlanarak
büyüme kapasitesine
sahip olduğunu biliyoruz.
Ve burdayız.
Şu anda, etrafımızdaki
şeyleri görüyoruz ve:
"Bilgisayarlar hala aptal." değil mi?
Ama 5 yıllık süre içinde bilgisayarlar
bu çizelgenin dışında olacak.
Yani bu kabiliyeti hemen
düşünmeye başlamalıyız.
Bunu daha önceden görmüştük, elbette.
Sanayi devriminde, motorlar sayesinde
kapasitede kademe atlamayı gördük.
Mesele şu ki, yine de bir süre sonra
işler düzeliyor.
Sosyal bozulma vardı ama bir kez
motorlar güç üretmek için kullanıldı
ve tüm durumlar, her şey düzene oturdu.
Makine Öğrenmesi Devrimi
Sanayi devriminden
çok daha farklı olacak çünkü
Makine Öğrenmesi Devrimi
asla durulmayacak.
Bilgisayarlar entelektüel
aktiviteler de iyiye gittikçe,
entelektüel kapasitede daha
iyi olan bilgisayarlar üretilecek.
Yani bu dünyanın daha önce tanık olmadığı
türde bir değişim olacak bu yüzden
neyin mümkün olduğu konusunda ki
önceki anlayışınız farklı.
Şimdiden bizi etkiliyor.
Son 25 yılda, kapital üretim arttıkça
işçi verimliliği sabitti
hatta biraz inişteydi.
Bu yüzden bu konuyu tartışmaya
başlamamızı istiyorum.
İnsanlara bu durum hakkında çoğu kez
bahsettiğimde, insanlar
oldukça ilgisiz olabiliyor.
Bilgisayarlar gerçek anlamda düşünemez,
duygusal davranmaz, şiirden anlamaz,
nasıl çalıştıklarını tam
olarak anlamıyoruz.
Ne fark eder?
Bilgisayarlar şu an
insanların ücret alarak
zamanlarının çoğunu
harcadıkları şeyleri yapabiliyor.
O zaman sosyal ve ekonomik
yapımızı nasıl uyduracağımızı
düşünmeye başlamamızın
ve bu yeni gerçekliğin
farkında olmamızın tam zamanı.
Teşekkürler.
(Alkışlar)