Eskiden bilgisayarınıza

yeni bir şeyler yaptırmak isteseniz

programlamanız gerekirdi.

Şimdi, programlama; burada hiç yapmayanlar

için söylüyorum, her adımı, her detayı

bilgisayarın yapmasını istediğin 
her şeyi amacına

ulaşman için tasarlaman gerekir.

Nasıl yapacağını bilmediğin bir şeyi

yapmak istiyorsan bu çok zorlu olacak.

Arthur Samuel de bunu yaptı.

1956'da bilgisayarının onu

damada yenebilmesini istiyordu.

Her detayıyla nasıl bir 
program tasarlayarak

damada senden daha iyi 
olmasını sağlayabilirsin?

Bu soruna bir çözüm buldu:

Binlerce kez bilgisayarıyla dama oynayacak

ve böylece bilgisayara damayı öğrenecekti.

Bu işe yaradı ve 1962'de bilgisayar

Connecticut eyaleti şampiyonunu yendi.

Bu şekilde Arthur Samuel, 
makine öğrenmenin

fikir öncüsüydü ve ona borçluyum,

çünkü bir makine öğrenimi uygulayıcısıyım.

200 bini aşkın uygulayıcıyı

biraraya getiren Kaggle'ın başkanıydım.

Kaggle yarışmalar düzenleyip çözülememiş

problemleri çözmeye çalışıyordu ve

yüzlerce kez başarılı oldular.

Bu açıdan bakıldığında, makine öğreniminin

geçmişte, günümüzde ve gelecekte planlanan

çalışmaları hakkında çok şey öğrendim.

Ticari anlamda belki de

makine öğreniminin

ilk başarısı Google'dır.

Google bilgisayar algoritması ile

bilgilere erişmeyi mümkün kılar ve

bu algoritma makine öğrenimini temel alır.

Bugüne kadar birçok ticari 
olarak başarılı uygulaması oldu.

Amazon, Netflix gibi bir çok

başarılı şirket makine öğrenimini

ürünlerini ve filmlerini

satmak için kullanmışlardır.

Bu bazen ürkütücü olabilir.

LinkedIn ve Facebook gibi
şirketler bazen size

tanıyor olabileceğiniz kişileri 
gösterir ve siz

bunu nasıl yaptığını bilemezsiniz; işte

bu makine öğreniminin eseridir.

Bu sistem, programlanmak yerine datadan

öğrenen algoritmalardan oluşur.

Bu IBM'in Watson ile Jeopardy yarışmasında

oldukça zor ve karışık soruları doğru

cevaplayarak nasıl iki dünya şampiyonunu

yenmeyi başardığını açıklar.

İnsansız arabalar da 
bu sistem ile çalışır.

Yaya ile ağaç arasındaki farkı söylemek

isterseniz buyrun, söyleyin bu çok önemli.

Bu programların elle nasıl yazıldığını

bilmiyoruz ama makine öğrenimi ile mümkün.

Ve bu arabalar bir düz yolda

kaza yapmadan 1 milyon mili aştı.

Böylece bilgisayarların, 
öğrenebildiğini

ve bazen bizim yapmayı bilmediğimiz

şeyleri yapmayı öğrenebildiklerini

veya bizden bunları bizden daha

iyi yapabileceklerini görüyoruz.

Makine öğreniminin en iyi örneklerini

Kaggle'da yürüttüğümüz bir projede gördüm:

Toronto Üniversitesi'nden Geoffrey Hinton

ve ekibi otomatik uyuşturucu tespiti

alanında yarışmayı kazandı.

Burada ilginç olansa;

Merck veya uluslararası akademik çevrenin

geliştirdiği bütün algoritmaları kimya

ve biyoloji gibi alanlarda geçmişi

olmayan kişilerin algoritmayı 
çözmeleri değil bunu

2 haftada yapmış olmaları.

Peki bunu nasıl başardılar?

Derin Öğrenme denilen olağanüstü
bir algoritma kullandılar.

Bu o kadar önemli bir başarıydı ki birkaç

hafta sonra New York Times'ın 
kapağında yer aldı.

Sol kenarda Geoffrey Hinton vardı.

Derin Öğrenme, insan beyninin 
çalışmasından

ilham alınarak
oluşturulmuş bir algoritmadır

ve kapasitesi konusunda
teorik kısıtlamalar içermez.

Ona ne kadar çok veri ve zaman verirseniz

o kadar iyi sonuçlar 
elde edersiniz.

New York Times'ın haberinde derin öğrenme

ile elde edilen

bir sonuç daha vardı;

onu da şimdi göstereceğim:

Sonuca göre:

Bilgisayarlar dinleyebilir

ve anlayabilir.

Richard Rashid:"Bu yöntemde

son aşamada gelebilmek

istediğim nokta

sizinle Çince konuşmak.

Olay şu ki;

bir çok Çinliden çok miktarda

bilgi alma imkanımız oldu

ve Çince bir metni alan ve

Çin diline çeviren yani yazıyı

konuşmaya dönüştüren
bir sistem oluşturduk.

Sonra konuşmamın bir saatlik kısmını aldık

ve standart metni konuşma sistemine

modüle ettik sonuç olarak

benim konuşmam gibi olmalıydı.

Sonuç mükemmel olmadı elbette.

Hatta bir çok hata vardı.

(Çince)

(Alkışlar)

Bu alanda daha çok çalışılması gerekiyor.

(Çince)

(Alkışlar)

Bu, Çinde makine öğrenimi konferansıydı.

Genelde akademik konferanslarda

spontane alkışlamalar olmaz ancak

TEDx konferanslarında rastlanabilir.

Burada gördüğünüz her şey

derin öğrenme ile gerçekleşiyor.

(Alkışlar) 
Teşekkürler.

İngilizce uyarlama derin
öğrenme ile yapıldı.

Çince çeviri ve sağ üstteki 
metin derin öğrenmeyle,

ve yine sesin entegre edilmesi 
de derin öğrenme ile yapıldı.

Derin öğrenme alışılmışın dışında bir şey.

Tek bir algoritma
neredeyse

her şeyi yapabilecek gibi duruyor

ve geçen sene öğrendim ki 
görmeyi de öğrenmiş.

Almanya'da Alman Trafik
İşaretleri Karşılaştırması

olarak adlandırılan yarışmada

derin öğrenme bu gibi
işaretleri algılamayı öğrendi.

Diğer algoritmalardan daha iyi algılamakla

kalmayıp, yarışmanın 
sıralamasına bakıldığında

insanlardan da daha iyi tanıdı;

hatta iki katı daha fazla.

2011 yılında, bilgisayarların insanlardan

daha iyi görebildiğini anladık.

O zamandan beri sayısız çalışma yapıldı.

2012'de Google; Youtube 
videolarını izleyen

ve aylık 16.000 bilgisayardaki
veriyi sıkıştırabilen

derin öğrenme algoritmaları
olduğunu açıkladı.

Ayrıca bilgisayarlar
ayrı ayrı insan ve kedi

gibi konseptleri izleyerek öğrendi.

Bu insanların öğrenmesine benziyor.

İnsanlar gördüklerinin
anlatılmasıyla değil

kendileri başlarına öğrenirler.

Yine 2012'de az önce 
gördüğümüz Geoffrey Hinton

1.5 milyon fotoğrafa 
bakarak neyin fotoğrafları

olduğunu çözmeye çalışarak

popüler olan ImageNet yarışmasını kazandı.

2014 yılında görüntü tanımada

%6 lık hata payına düştük.

Bu da insanlardan daha iyi.

Makinalar gerçekten bu alanda
harika işler yapıyor

ve artık endüstride de kullanılıyor.

Mesela Google, geçen yıl Fransa'daki

her bir konumu 2 saatte haritada

işaretlediğini duyurdu ve

cadde numaralarını okumak ve tanımlamak

için cadde görüntülerini

bir derin öğrenme
algoritmasında kullandılar.

Bunun önceleri ne kadar sürdüğünü düşünün:

binlerce insan, bir çok yıl.

Bu Çin'de de oldu.

Baidu bir çeşit Çin'in Google'ı, sanırım,

sol üst köşede gördüğünüz Baidu'nun

derin öğrenme sistemine

yüklediğim görüntünün örneği

ve arkaplanda ise sistemin görüntüyü

tanımlayıp benzerlerini
bulduğunu görebilirsiniz.

Benzer resimler gerçekten de
benzer arka planlara,

benzer yüz açılarına sahip

hatta bazılarında dilleri dışarıda.

Tam olarak web sayfasının 
metnine bakmak gibi değil.

Tek yaptığım resim yüklemekti.

O halde gördüklerini anlayabilen ve

bu sayede gerçek zamanlı olarak yüz

milyonlarca görüntüyü veritabanlarında

arayabilen bilgisayarlar var.

Peki bilgisayarların görmesi 
ne anlama geliyor?

Sadece görebilmesini sağlamak değil

aslında derin öğrenme
bundan daha fazlasını yaptı.

Bu gibi karmaşık ve incelikli cümleler

artık derin öğrenme
algoritmalarıyla anlaşılabilir.

Gördüğünüz üzere;

Stanford-tabanlı sistem, üstteki kırmızı

noktanın negatif bir
his ifade ettiğini anlıyor.

Derin öğrenme hatta

cümlelerin ne hakkında olduğunu

ve anlamlarını anlamada insan

performansına yaklaşmış durumda.

Aynı zamanda derin öğrenme Çin

anadil seviyesinde Çince
okumada da kullanıldı.

Bu algoritma Çince konuşamayan ve

anlamayan insanlar
tarafından İsviçre'de geliştirildi.

Bahsettiğim gibi derin
öğrenme kullanma bu işte

dünyadaki en iyi sistem yerel insanların

anlama performansına göre bile.

Bu sistem şirketimde oluşturuldu

ve bu tarz şeyleri bir arada
toplamayı gösteriyor.

Bu resimlere eklenmiş metin yok ve

ben buraya cümle yazarken gerçek

zamanlı olarak resimleri algılıyor,

ne hakkında olduklarını çözüyor ve

yazdığım metne benzer resimleri buluyor.

Görüyorsunuz, bu aslında
cümlelerimi anlama

ve bu resimleri anlama.

Benzerini Google'da
gördüğünüzü düşünüyorum;

bir şeyleri yazarken size
resimler gösterir ama

asıl yaptığı web sayfalarında
yazdıklarınızı aramaktır.

Bu aslında resimleri anlamaktan
oldukça farklı.

Bu son bir kaç ayda ilk kez

bilgisayarların yapabildiği bir şey.

O halde görüyoruz ki bilgisayarlar

görebilmekle kalmıyor aynı zamanda

okuyabiliyor ve zaten duyduklarını

anlayabildiklerini de göstermiştik.

Belki yazabildiklerini söylesem

artık şaşırtıcı gelmez.

İşte burada dün derin
öğrenme algoritmasıyla

oluşturduğum metin.

Ve burada algoritma tarafından
geliştirilen metinler var.

Bu cümlelerin her biri
resimleri tanımlamak

için derin öğrenme
algoritmasıyla geliştirildi .

Algoritma daha önce siyah tişörtlü

gitar çalan birini hiç görmemişti.

Önceden adamı görmüştü, siyahi görmüştü,

gitarı görmüştü ama bu resmin roman

tasvirini ayrı olarak yaptı.

Hala tam olarak insan performansında

değiliz ama yakınız.

Testlerde 1/4 oranında
insanlar, bilgisayar

tarafından oluşturulan yazıları seçiyor.

Bu sistem şuan sadece 2 haftalık

ama muhtemelen gelecek yıl içerisinde

bu oranlarda devam ederse

algoritma insan performansını

hayli geçmiş olacak.

Yani bilgisayarlar yazabiliyor da.

Tüm bunları birleştirdik

ve durum heyecan verici fırsatlar yarattı.

Örneğin; sağlık alanında
Boston'da bir takım,

doktorların kanser teşhisine yardımcı

düzinelerce kliniksel
olarak ilişkili tümör

özellikleri keşfettiklerini duyurdu.

Benzer olarak Stanford' da

büyüme altındaki dokulara bakan bir grup;

kanser hastalarının sağkalım
oranlarını ölçmede

patoloji uzmanlarından daha iyi olan,

makine öğrenmesine dayalı
bir sistem geliştirdi.

Bu iki durumda da tahminlerin daha

hatasız olmasının yanı sıra kavrama

açısından güçlü yeni
bir bilim geliştirdiler.

Radyoloji vakasındakiler insanların

anlayabileceği yeni
kliniksel indikatörlerdi.

Patoloji vakasında ise bilgisayar,

tanı yapılırken kanser
etrafındaki hücrelerin kanser

hücreleri kadar önemli olduğunu keşfetti.

Bu patoloji uzmanlarına onlarca

yıldır öğretilenlerin tam tersi.

Bu iki vakada da tıp uzmanları ve

makine öğrenmesi uzmanlarının

birleşip geliştirdiği bir sistemdi

ancak geçen yıl bunu da geçtik.

Bu örnek mikroskop altındaki insan

dokusunun kanserli bölgelerini
tanımlamak üzerine.

Burada gösterilen sistem bu alanları daha

isabetli olarak belirleyebiliyor,

ya da en az patoloji uzmanı kadar

ama tümüyle derin öğrenme kullanılarak ve

herhangi bir tıp geçmişi olmayan

insanlar tarafından geliştirildi.

Benzer olarak nöron segmentasyonu da.

Şu an nöronları insanlar kadar

isabetli segmentleyebiliyoruz

ki bu sistem derin öğrenme

kullanılarak hiç bir tıbbi geçmişi

olmayan kişiler tarafından geliştirildi.

Aynı şekilde ben de, hiç bir tıbbi geçmişim

olmadığı halde medikal alanında

yeni bir şirket açabilirim ki açtım da.

Şirketi açma konusunda
biraz korkmuştum ama

teoride bu veri analiz 
tekniklerini kullanarak

yararlı ilaçlar yapmak mümkün görünüyordu.

Neyse ki geri dönüşler harikaydı

sadece medya değil tıp çevresinde de

ki aynı zamanda çok da destekleyicilerdi.

Teoride, medikal sürecin 
orta bölümünü alıp

mümkün olduğunca veri analizine çevirerek

doktorları en iyi oldukları
alana yoğunlaştırabiliriz.

Bir örnek vermek istiyorum.

Yeni bir tıbbi teşhis testini

üretmek 15 dakikamızı alır

ve gerçek zamanlı olarak da göstereceğim

ama bazı parçalarını keserek

süreci 3 dakikaya indirdim.

Tıbbi teşhis testini oluşturmayı
göstermek yerine

daha anlaşılır olduğu için

araba görüntülerini tanımlama
testini göstereceğim.

Yaklaşık 1.5 milyon araba
resmiyle başlıyoruz ve

çekildikleri açılara göre onları

ayırabilecek bir şey yaratmak istiyorum.

Bütün resimler etiketsiz bu yüzden

sıfırdan başlamak zorundayım.

Derin öğrenme algoritmamızla resimlerdeki

yapıların alanlarını otomatik
olarak algılayabilir.

Güzel olan, şu andan itibaren

insan ile bilgisayar 
artık ortak çalışabilir.

Gördüğünüz gibi insan burada bilgisayara;

daha sonra deneyip, algoritmasını

geliştirmede kullanması için

ilgi alanlarını söylüyor.

Bu derin öğrenme sistemleri

aslında 16.000 boyutlu uzay

ve gördüğünüz gibi
bilgisayar burada

uzay boyunca döndürüp yeni yapı

alanları bulmaya çalışıyor.

Başarıyla yapınca da daha sonra bunu süren

kişi ilgi çekici olan alanları gösteriyor.

Ve burada bilgisayar başarılı
bir şekilde alanları buldu.

Örneğin: Açılar.

Bu süreç devam ederken,

bilgisayara aradığımız yapı türlerini

adım adım söylüyoruz.

Teşhis testinde pataloji uzmanının

patoz alanlarını tanımlaması
gibi düşünebilirsin

ya da örneğin radyolojistin sıkıntı

yaratabilecek nodülleri göstermesi gibi.

Bazen algoritma için sıkıntılı olabilir.

Bu vaka da biraz kafası karışmış.

Arabaların önleri ve 
arkaları karmakarışık.

Burada biraz daha dikkatli olmalıyız,

arkalara karşılık önleri elle seçmekte ve

daha sonra bunun ilgilendiğimiz tipte

bir grup olduğunu söylemekte.

Bunu biraz yapıyoruz, 
biraz atlıyoruz bunu,

sonra makine öğrenmesi algoritmasını

bu yüzlerce kadar olan

şeylere dayanarak eğitiyoruz

ve daha iyi olmasını ümit ediyoruz.

Bazı resimlerin solmaya
başladığını görebilirsiniz

ve bize bazılarını kendisinin önceden

nasıl anlaması gerektiğini
farkettiğini gösteriyor.

Bu benzer resimler 
konseptini kullanabiliriz

ve benzer resimleri 
kullanarak bilgisayarın

bu noktada arabaların sadece

önlerini bulabildiğini görebilirsiniz.

Bu aşamada bilgisayar insana:

"Tamam, peki, iyi iş çıkardın." diyebilir.

Bazen, elbette, bu noktada bile

grupların arasından seçmek zor.

Bu durumda, bilgisayarın
biraz çevirmesine izin

verdikten sonra bile sağ ve sol taraftaki

resimlerin karmakarışık
olarak bulabiliriz.

Yine bilgisayara bir takım
ipuçları verebiliriz,

ve diyebiliriz ki :"Tamam, derin 
öğrenme algoritmasını

kullanarak sağ ve sol tarafları mümkün

olduğunca ayırabilecek 
bir projeksiyon bulmaya çalış. "

Ve ipucunu verince başarılı oldu.

Objeleri birbirinden 
ayırabilmek için gereken

düşünme şeklini birlikte bulabildiler.

Yani buradaki fikri anladınız.

Buradaki durum; insanın
yerine bilgisayarın geçmesi

değil birlikte çalışmaları.

Burada yaptığımız ise; 6 ya da 7 kişilik

bir takımın yaklaşık 7 
senede yapacağı bir şeyi,

bir kişinin yaklaşık 15 dakikada

yapacağı bir şeyle değiştirmek.

Bu süreç yaklaşık 4 ya da
5 yineleme içeriyor.

Gördüğünüz gibi şuan 1.5 milyon resmimizin

%62 si doğru bir şekilde sınıflandırıldı.

Gelinen noktada, oldukça kolay bir şekilde

büyük bölümleri alıp hata olmadığına

emin olmak için kontrol edebiliriz.

Hata olan yerlerde ise
bilgisayara bildirebiliriz.

Her farklı grup için bu tür
bir süreç kullanarak

1.5 milyon görüntüyü sınıflandırmada

%80 başarı yüzdesine çıktık.

Bu noktada konu sadece

doğru sınıflandırılmamış olan

küçük numarayı bulmak ve

sebebini anlamaya çalışmak üzerine.

Bu yaklaşımı kullanarak; 15 dakikada

%97' lik sınıflandırma oranına ulaştık.

Bu tarz bir teknik bize çok önemli

bir problemi çözmeye izin verebilir;

dünyada tıbbi uzmanlığın
olmadığı yerlerde.

Dünya Ekonomik Forumu'na göre;

gelişen dünyada doktor
kıtlığı 10 ile 20 katı

arasında ve 300 yıl alacaktır bu problemi

çözmek için yeterli insan yetiştirmek.

Düşünün ki derin öğrenme
yaklaşımını kullanarak

verimliliklerini artırmaya
yardım edebilsek?

Fırsatlar konusunda oldukça heycanlıyım.

Aynı zamanda
problemlerle de ilgileniyorum.

Buradaki problem ise; haritadaki

her mavi alanda servisler

istihdamın %80 den fazla.

Servisler nedir?

İşte servisler.

Bunlar aynı zamanda bilgisayarın

yapılma şeklini öğrendiği şeyler.

Yani gelişen dünyadaki
istihdamın %80 'inin

yaptığı şeyler aynı zamanda bilgisayarın

nasıl yapılacağını öğrendiği şeyler.

Bu ne anlama geliyor? 
Tamam, bir şey olmayacak.

Başka işlerle yer değiştirilcekler.

Örneğin; Veri bilimciler 
için daha fazla iş olacak.

Aslında öyle değil.

Veri bilimcilerin bunları yapmaları

çok zamanlarını almaz.

Örneğin; bu 4 algoritma da aynı

adam tarafından geliştirildi.

Yani eğer; daha önceden de olmuştu,

yeni işlerin gelip yer değiştirdiği

zamanların sonuçlarını gördük.

Bu yeni işlere ne olacak?

Bunu kestirmek bizim için oldukça zor

çünkü insan performansı 
bu şekilde kademeli olarak

artıyor ama artık biz bir sisteme,
derin öğrenmeye

sahibiz yani katlanarak
büyüme kapasitesine

sahip olduğunu biliyoruz.

Ve burdayız.

Şu anda, etrafımızdaki
şeyleri görüyoruz ve:

"Bilgisayarlar hala aptal." değil mi?

Ama 5 yıllık süre içinde bilgisayarlar

bu çizelgenin dışında olacak.

Yani bu kabiliyeti hemen
düşünmeye başlamalıyız.

Bunu daha önceden görmüştük, elbette.

Sanayi devriminde, motorlar sayesinde

kapasitede kademe atlamayı gördük.

Mesele şu ki, yine de bir süre sonra

işler düzeliyor.

Sosyal bozulma vardı ama bir kez

motorlar güç üretmek için kullanıldı

ve tüm durumlar, her şey düzene oturdu.

Makine Öğrenmesi Devrimi
Sanayi devriminden

çok daha farklı olacak çünkü

Makine Öğrenmesi Devrimi 
asla durulmayacak.

Bilgisayarlar entelektüel 
aktiviteler de iyiye gittikçe,

entelektüel kapasitede daha

iyi olan bilgisayarlar üretilecek.

Yani bu dünyanın daha önce tanık olmadığı

türde bir değişim olacak bu yüzden

neyin mümkün olduğu konusunda ki

önceki anlayışınız farklı.

Şimdiden bizi etkiliyor.

Son 25 yılda, kapital üretim arttıkça

işçi verimliliği sabitti
hatta biraz inişteydi.

Bu yüzden bu konuyu tartışmaya

başlamamızı istiyorum.

İnsanlara bu durum hakkında çoğu kez

bahsettiğimde, insanlar 
oldukça ilgisiz olabiliyor.

Bilgisayarlar gerçek anlamda düşünemez,

duygusal davranmaz, şiirden anlamaz,

nasıl çalıştıklarını tam
olarak anlamıyoruz.

Ne fark eder?

Bilgisayarlar şu an 
insanların ücret alarak

zamanlarının çoğunu
harcadıkları şeyleri yapabiliyor.

O zaman sosyal ve ekonomik
yapımızı nasıl uyduracağımızı

düşünmeye başlamamızın
ve bu yeni gerçekliğin

farkında olmamızın tam zamanı.

Teşekkürler.

(Alkışlar)