WEBVTT

00:00:00.350 --> 00:00:01.880
Eskiden bilgisayarınıza

00:00:01.880 --> 00:00:04.453
yeni bir şeyler yaptırmak isteseniz

00:00:04.453 --> 00:00:06.257
programlamanız gerekirdi.

00:00:06.257 --> 00:00:08.898
Şimdi, programlama; burada hiç yapmayanlar

00:00:08.898 --> 00:00:11.950
için söylüyorum, her adımı, her detayı

00:00:11.950 --> 00:00:15.317
bilgisayarın yapmasını istediğin 
her şeyi amacına

00:00:15.317 --> 00:00:18.869
ulaşman için tasarlaman gerekir.

00:00:18.869 --> 00:00:21.595
Nasıl yapacağını bilmediğin bir şeyi

00:00:21.595 --> 00:00:24.648
yapmak istiyorsan bu çok zorlu olacak.

NOTE Paragraph

00:00:24.648 --> 00:00:28.131
Arthur Samuel de bunu yaptı.

00:00:28.131 --> 00:00:31.548
1956'da bilgisayarının onu

00:00:31.548 --> 00:00:34.548
damada yenebilmesini istiyordu.

00:00:34.548 --> 00:00:37.108
Her detayıyla nasıl bir 
program tasarlayarak

00:00:37.108 --> 00:00:40.594
damada senden daha iyi 
olmasını sağlayabilirsin?

00:00:40.594 --> 00:00:42.116
Bu soruna bir çözüm buldu:

00:00:42.116 --> 00:00:45.840
Binlerce kez bilgisayarıyla dama oynayacak

00:00:45.840 --> 00:00:48.364
ve böylece bilgisayara damayı öğrenecekti.

00:00:48.364 --> 00:00:51.544
Bu işe yaradı ve 1962'de bilgisayar

00:00:51.544 --> 00:00:55.561
Connecticut eyaleti şampiyonunu yendi.

NOTE Paragraph

00:00:55.561 --> 00:00:58.534
Bu şekilde Arthur Samuel, 
makine öğrenmenin

00:00:58.534 --> 00:01:00.251
fikir öncüsüydü ve ona borçluyum,

00:01:00.251 --> 00:01:03.014
çünkü bir makine öğrenimi uygulayıcısıyım.

00:01:03.014 --> 00:01:04.479
200 bini aşkın uygulayıcıyı

00:01:04.479 --> 00:01:07.867
biraraya getiren Kaggle'ın başkanıydım.

00:01:07.867 --> 00:01:09.925
Kaggle yarışmalar düzenleyip çözülememiş

00:01:09.925 --> 00:01:13.633
problemleri çözmeye çalışıyordu ve

00:01:13.633 --> 00:01:17.470
yüzlerce kez başarılı oldular.

00:01:17.470 --> 00:01:19.940
Bu açıdan bakıldığında, makine öğreniminin

00:01:19.940 --> 00:01:23.890
geçmişte, günümüzde ve gelecekte planlanan

00:01:23.890 --> 00:01:26.252
çalışmaları hakkında çok şey öğrendim.

00:01:26.252 --> 00:01:27.726
Ticari anlamda belki de

00:01:27.726 --> 00:01:29.200
makine öğreniminin

00:01:29.200 --> 00:01:30.675
ilk başarısı Google'dır.

00:01:30.675 --> 00:01:33.494
Google bilgisayar algoritması ile

00:01:33.494 --> 00:01:35.536
bilgilere erişmeyi mümkün kılar ve

00:01:35.536 --> 00:01:38.437
bu algoritma makine öğrenimini temel alır.

00:01:38.437 --> 00:01:42.317
Bugüne kadar birçok ticari 
olarak başarılı uygulaması oldu.

00:01:42.317 --> 00:01:44.773
Amazon, Netflix gibi bir çok

00:01:44.773 --> 00:01:46.570
başarılı şirket makine öğrenimini

00:01:46.570 --> 00:01:47.876
ürünlerini ve filmlerini

00:01:47.876 --> 00:01:49.896
satmak için kullanmışlardır.

00:01:49.896 --> 00:01:51.703
Bu bazen ürkütücü olabilir.

00:01:51.703 --> 00:01:53.917
LinkedIn ve Facebook gibi
şirketler bazen size

00:01:53.917 --> 00:01:56.251
tanıyor olabileceğiniz kişileri 
gösterir ve siz

00:01:56.251 --> 00:01:58.228
bunu nasıl yaptığını bilemezsiniz; işte

00:01:58.228 --> 00:02:01.195
bu makine öğreniminin eseridir.

00:02:01.195 --> 00:02:04.152
Bu sistem, programlanmak yerine datadan

00:02:04.152 --> 00:02:07.399
öğrenen algoritmalardan oluşur.

NOTE Paragraph

00:02:07.399 --> 00:02:09.877
Bu IBM'in Watson ile Jeopardy yarışmasında

00:02:09.877 --> 00:02:13.739
oldukça zor ve karışık soruları doğru

00:02:13.739 --> 00:02:16.964
cevaplayarak nasıl iki dünya şampiyonunu

00:02:16.964 --> 00:02:19.799
yenmeyi başardığını açıklar.

00:02:19.799 --> 00:02:23.034
İnsansız arabalar da 
bu sistem ile çalışır.

00:02:23.034 --> 00:02:25.856
Yaya ile ağaç arasındaki farkı söylemek

00:02:25.856 --> 00:02:28.488
isterseniz buyrun, söyleyin bu çok önemli.

00:02:28.488 --> 00:02:31.075
Bu programların elle nasıl yazıldığını

00:02:31.075 --> 00:02:34.072
bilmiyoruz ama makine öğrenimi ile mümkün.

00:02:34.072 --> 00:02:36.110
Ve bu arabalar bir düz yolda

00:02:36.110 --> 00:02:39.178
kaza yapmadan 1 milyon mili aştı.

00:02:40.798 --> 00:02:42.326
Böylece bilgisayarların, 
öğrenebildiğini

NOTE Paragraph

00:02:42.326 --> 00:02:44.110
ve bazen bizim yapmayı bilmediğimiz

00:02:44.110 --> 00:02:46.010
şeyleri yapmayı öğrenebildiklerini

00:02:46.010 --> 00:02:48.848
veya bizden bunları bizden daha

00:02:48.848 --> 00:02:51.733
iyi yapabileceklerini görüyoruz.

00:02:51.733 --> 00:02:54.478
Makine öğreniminin en iyi örneklerini

00:02:54.478 --> 00:02:57.650
Kaggle'da yürüttüğümüz bir projede gördüm:

00:02:57.940 --> 00:03:01.911
Toronto Üniversitesi'nden Geoffrey Hinton

00:03:01.911 --> 00:03:03.840
ve ekibi otomatik uyuşturucu tespiti

00:03:03.840 --> 00:03:06.130
alanında yarışmayı kazandı.

00:03:06.140 --> 00:03:07.140
Burada ilginç olansa;

00:03:07.140 --> 00:03:10.277
Merck veya uluslararası akademik çevrenin

00:03:10.277 --> 00:03:12.540
geliştirdiği bütün algoritmaları kimya

00:03:12.540 --> 00:03:15.061
ve biyoloji gibi alanlarda geçmişi

00:03:15.061 --> 00:03:18.061
olmayan kişilerin algoritmayı 
çözmeleri değil bunu

00:03:18.061 --> 00:03:20.230
2 haftada yapmış olmaları.

00:03:20.230 --> 00:03:21.611
Peki bunu nasıl başardılar?

00:03:22.421 --> 00:03:25.342
Derin Öğrenme denilen olağanüstü
bir algoritma kullandılar.

00:03:25.342 --> 00:03:28.291
Bu o kadar önemli bir başarıydı ki birkaç

00:03:28.291 --> 00:03:31.412
hafta sonra New York Times'ın 
kapağında yer aldı.

00:03:31.412 --> 00:03:34.147
Sol kenarda Geoffrey Hinton vardı.

00:03:34.147 --> 00:03:37.558
Derin Öğrenme, insan beyninin 
çalışmasından

00:03:37.558 --> 00:03:39.960
ilham alınarak
oluşturulmuş bir algoritmadır

00:03:39.960 --> 00:03:43.971
ve kapasitesi konusunda
teorik kısıtlamalar içermez.

00:03:43.971 --> 00:03:46.474
Ona ne kadar çok veri ve zaman verirseniz

00:03:46.474 --> 00:03:48.276
o kadar iyi sonuçlar 
elde edersiniz.

NOTE Paragraph

00:03:48.276 --> 00:03:50.615
New York Times'ın haberinde derin öğrenme

00:03:50.615 --> 00:03:51.615
ile elde edilen

00:03:51.615 --> 00:03:52.857
bir sonuç daha vardı;

00:03:52.857 --> 00:03:54.147
onu da şimdi göstereceğim:

00:03:54.977 --> 00:03:56.189
Sonuca göre:

00:03:56.189 --> 00:03:58.500
Bilgisayarlar dinleyebilir

00:03:58.500 --> 00:04:00.510
ve anlayabilir.

NOTE Paragraph

00:04:00.820 --> 00:04:03.400
Richard Rashid:"Bu yöntemde

00:04:03.400 --> 00:04:05.047
son aşamada gelebilmek

00:04:05.047 --> 00:04:06.913
istediğim nokta

00:04:06.913 --> 00:04:09.913
sizinle Çince konuşmak.

00:04:10.961 --> 00:04:12.306
Olay şu ki;

00:04:12.306 --> 00:04:15.058
bir çok Çinliden çok miktarda

00:04:15.058 --> 00:04:18.378
bilgi alma imkanımız oldu

00:04:18.378 --> 00:04:21.408
ve Çince bir metni alan ve

00:04:21.408 --> 00:04:24.908
Çin diline çeviren yani yazıyı

00:04:24.908 --> 00:04:27.881
konuşmaya dönüştüren
bir sistem oluşturduk.

00:04:27.881 --> 00:04:31.509
Sonra konuşmamın bir saatlik kısmını aldık

00:04:31.509 --> 00:04:33.720
ve standart metni konuşma sistemine

00:04:33.720 --> 00:04:35.070
modüle ettik sonuç olarak

00:04:35.070 --> 00:04:37.314
benim konuşmam gibi olmalıydı.

00:04:37.314 --> 00:04:38.904
Sonuç mükemmel olmadı elbette.

00:04:38.904 --> 00:04:41.552
Hatta bir çok hata vardı.

00:04:41.552 --> 00:04:44.036
(Çince)

00:04:44.036 --> 00:04:48.153
(Alkışlar)

00:04:49.446 --> 00:04:53.022
Bu alanda daha çok çalışılması gerekiyor.

00:04:53.022 --> 00:04:56.667
(Çince)

00:04:56.667 --> 00:05:00.100
(Alkışlar)

NOTE Paragraph

00:05:01.345 --> 00:05:04.744
Bu, Çinde makine öğrenimi konferansıydı.

00:05:04.744 --> 00:05:07.114
Genelde akademik konferanslarda

00:05:07.114 --> 00:05:09.011
spontane alkışlamalar olmaz ancak

00:05:09.011 --> 00:05:12.407
TEDx konferanslarında rastlanabilir.

00:05:12.407 --> 00:05:13.892
Burada gördüğünüz her şey

00:05:13.892 --> 00:05:15.862
derin öğrenme ile gerçekleşiyor.

00:05:15.862 --> 00:05:17.007
(Alkışlar) 
Teşekkürler.

00:05:17.007 --> 00:05:19.289
İngilizce uyarlama derin
öğrenme ile yapıldı.

00:05:19.289 --> 00:05:22.701
Çince çeviri ve sağ üstteki 
metin derin öğrenmeyle,

00:05:22.701 --> 00:05:26.008
ve yine sesin entegre edilmesi 
de derin öğrenme ile yapıldı.

NOTE Paragraph

00:05:26.008 --> 00:05:28.972
Derin öğrenme alışılmışın dışında bir şey.

00:05:28.972 --> 00:05:30.242
Tek bir algoritma
neredeyse

00:05:30.242 --> 00:05:32.341
her şeyi yapabilecek gibi duruyor

00:05:32.341 --> 00:05:35.242
ve geçen sene öğrendim ki 
görmeyi de öğrenmiş.

00:05:35.242 --> 00:05:37.628
Almanya'da Alman Trafik
İşaretleri Karşılaştırması

00:05:37.628 --> 00:05:40.225
olarak adlandırılan yarışmada

00:05:40.225 --> 00:05:43.618
derin öğrenme bu gibi
işaretleri algılamayı öğrendi.

00:05:43.618 --> 00:05:45.712
Diğer algoritmalardan daha iyi algılamakla

00:05:45.712 --> 00:05:48.170
kalmayıp, yarışmanın 
sıralamasına bakıldığında

00:05:48.170 --> 00:05:50.189
insanlardan da daha iyi tanıdı;

00:05:50.189 --> 00:05:52.041
hatta iki katı daha fazla.

00:05:52.041 --> 00:05:54.037
2011 yılında, bilgisayarların insanlardan

00:05:54.037 --> 00:05:57.442
daha iyi görebildiğini anladık.

00:05:57.442 --> 00:05:59.491
O zamandan beri sayısız çalışma yapıldı.

00:05:59.491 --> 00:06:02.505
2012'de Google; Youtube 
videolarını izleyen

00:06:02.505 --> 00:06:05.270
ve aylık 16.000 bilgisayardaki
veriyi sıkıştırabilen

00:06:05.270 --> 00:06:08.187
derin öğrenme algoritmaları
olduğunu açıkladı.

00:06:08.187 --> 00:06:11.028
Ayrıca bilgisayarlar
ayrı ayrı insan ve kedi

00:06:11.028 --> 00:06:14.027
gibi konseptleri izleyerek öğrendi.

00:06:14.027 --> 00:06:16.379
Bu insanların öğrenmesine benziyor.

00:06:16.379 --> 00:06:19.119
İnsanlar gördüklerinin
anlatılmasıyla değil

00:06:19.119 --> 00:06:22.300
kendileri başlarına öğrenirler.

00:06:22.460 --> 00:06:25.949
Yine 2012'de az önce 
gördüğümüz Geoffrey Hinton

00:06:25.949 --> 00:06:30.397
1.5 milyon fotoğrafa 
bakarak neyin fotoğrafları

00:06:30.397 --> 00:06:32.368
olduğunu çözmeye çalışarak

00:06:32.368 --> 00:06:35.126
popüler olan ImageNet yarışmasını kazandı.

00:06:35.126 --> 00:06:37.259
2014 yılında görüntü tanımada

00:06:37.259 --> 00:06:38.789
%6 lık hata payına düştük.

00:06:38.789 --> 00:06:41.268
Bu da insanlardan daha iyi.

NOTE Paragraph

00:06:41.268 --> 00:06:44.436
Makinalar gerçekten bu alanda
harika işler yapıyor

00:06:44.436 --> 00:06:47.206
ve artık endüstride de kullanılıyor.

00:06:47.206 --> 00:06:49.824
Mesela Google, geçen yıl Fransa'daki

00:06:49.824 --> 00:06:52.390
her bir konumu 2 saatte haritada

00:06:52.390 --> 00:06:54.100
işaretlediğini duyurdu ve

00:06:54.100 --> 00:06:57.089
cadde numaralarını okumak ve tanımlamak

00:06:57.089 --> 00:06:58.979
için cadde görüntülerini

00:06:58.979 --> 00:07:02.039
bir derin öğrenme
algoritmasında kullandılar.

00:07:02.039 --> 00:07:04.849
Bunun önceleri ne kadar sürdüğünü düşünün:

00:07:04.849 --> 00:07:07.029
binlerce insan, bir çok yıl.

00:07:08.759 --> 00:07:10.144
Bu Çin'de de oldu.

00:07:10.144 --> 00:07:14.426
Baidu bir çeşit Çin'in Google'ı, sanırım,

00:07:14.426 --> 00:07:16.708
sol üst köşede gördüğünüz Baidu'nun

00:07:16.708 --> 00:07:18.322
derin öğrenme sistemine

00:07:18.322 --> 00:07:20.794
yüklediğim görüntünün örneği

00:07:20.794 --> 00:07:23.548
ve arkaplanda ise sistemin görüntüyü

00:07:23.548 --> 00:07:26.637
tanımlayıp benzerlerini
bulduğunu görebilirsiniz.

00:07:26.637 --> 00:07:29.213
Benzer resimler gerçekten de
benzer arka planlara,

00:07:29.213 --> 00:07:31.059
benzer yüz açılarına sahip

00:07:31.059 --> 00:07:32.777
hatta bazılarında dilleri dışarıda.

00:07:32.777 --> 00:07:35.985
Tam olarak web sayfasının 
metnine bakmak gibi değil.

00:07:35.985 --> 00:07:38.235
Tek yaptığım resim yüklemekti.

00:07:38.235 --> 00:07:40.027
O halde gördüklerini anlayabilen ve

00:07:40.027 --> 00:07:42.368
bu sayede gerçek zamanlı olarak yüz

00:07:42.368 --> 00:07:44.432
milyonlarca görüntüyü veritabanlarında

00:07:44.432 --> 00:07:46.306
arayabilen bilgisayarlar var.

NOTE Paragraph

00:07:46.306 --> 00:07:49.436
Peki bilgisayarların görmesi 
ne anlama geliyor?

00:07:49.436 --> 00:07:51.453
Sadece görebilmesini sağlamak değil

00:07:51.453 --> 00:07:53.852
aslında derin öğrenme
bundan daha fazlasını yaptı.

00:07:53.852 --> 00:07:56.570
Bu gibi karmaşık ve incelikli cümleler

00:07:56.570 --> 00:07:59.394
artık derin öğrenme
algoritmalarıyla anlaşılabilir.

00:07:59.394 --> 00:08:00.697
Gördüğünüz üzere;

00:08:00.697 --> 00:08:03.465
Stanford-tabanlı sistem, üstteki kırmızı

00:08:03.465 --> 00:08:07.384
noktanın negatif bir
his ifade ettiğini anlıyor.

00:08:07.384 --> 00:08:09.072
Derin öğrenme hatta

00:08:09.072 --> 00:08:11.283
cümlelerin ne hakkında olduğunu

00:08:11.283 --> 00:08:13.041
ve anlamlarını anlamada insan

00:08:13.041 --> 00:08:15.437
performansına yaklaşmış durumda.

00:08:15.777 --> 00:08:18.425
Aynı zamanda derin öğrenme Çin

00:08:18.425 --> 00:08:22.131
anadil seviyesinde Çince
okumada da kullanıldı.

NOTE Paragraph

00:08:22.131 --> 00:08:24.652
Bu algoritma Çince konuşamayan ve

00:08:24.652 --> 00:08:27.701
anlamayan insanlar
tarafından İsviçre'de geliştirildi.

00:08:27.701 --> 00:08:30.568
Bahsettiğim gibi derin
öğrenme kullanma bu işte

00:08:30.568 --> 00:08:33.788
dünyadaki en iyi sistem yerel insanların

00:08:33.788 --> 00:08:36.718
anlama performansına göre bile.

NOTE Paragraph

00:08:36.718 --> 00:08:39.682
Bu sistem şirketimde oluşturuldu

00:08:39.682 --> 00:08:42.448
ve bu tarz şeyleri bir arada
toplamayı gösteriyor.

NOTE Paragraph

00:08:42.448 --> 00:08:44.699
Bu resimlere eklenmiş metin yok ve

00:08:44.699 --> 00:08:47.031
ben buraya cümle yazarken gerçek

00:08:47.031 --> 00:08:49.510
zamanlı olarak resimleri algılıyor,

00:08:49.510 --> 00:08:51.789
ne hakkında olduklarını çözüyor ve

00:08:51.789 --> 00:08:54.352
yazdığım metne benzer resimleri buluyor.

00:08:54.352 --> 00:08:57.108
Görüyorsunuz, bu aslında
cümlelerimi anlama

00:08:57.108 --> 00:08:59.332
ve bu resimleri anlama.

00:08:59.332 --> 00:09:01.891
Benzerini Google'da
gördüğünüzü düşünüyorum;

00:09:01.891 --> 00:09:04.666
bir şeyleri yazarken size
resimler gösterir ama

00:09:04.666 --> 00:09:08.090
asıl yaptığı web sayfalarında
yazdıklarınızı aramaktır.

00:09:08.090 --> 00:09:11.091
Bu aslında resimleri anlamaktan
oldukça farklı.

00:09:11.091 --> 00:09:13.843
Bu son bir kaç ayda ilk kez

00:09:13.843 --> 00:09:16.543
bilgisayarların yapabildiği bir şey.

NOTE Paragraph

00:09:17.091 --> 00:09:19.192
O halde görüyoruz ki bilgisayarlar

00:09:19.192 --> 00:09:21.182
görebilmekle kalmıyor aynı zamanda

00:09:21.182 --> 00:09:22.832
okuyabiliyor ve zaten duyduklarını

00:09:22.832 --> 00:09:24.947
anlayabildiklerini de göstermiştik.

00:09:24.947 --> 00:09:26.707
Belki yazabildiklerini söylesem

00:09:26.707 --> 00:09:28.537
artık şaşırtıcı gelmez.

00:09:28.537 --> 00:09:30.927
İşte burada dün derin
öğrenme algoritmasıyla

00:09:30.927 --> 00:09:33.607
oluşturduğum metin.

00:09:33.607 --> 00:09:37.159
Ve burada algoritma tarafından
geliştirilen metinler var.

00:09:37.159 --> 00:09:40.102
Bu cümlelerin her biri
resimleri tanımlamak

00:09:40.102 --> 00:09:42.892
için derin öğrenme
algoritmasıyla geliştirildi .

00:09:42.892 --> 00:09:45.202
Algoritma daha önce siyah tişörtlü

00:09:45.202 --> 00:09:47.356
gitar çalan birini hiç görmemişti.

00:09:47.356 --> 00:09:50.170
Önceden adamı görmüştü, siyahi görmüştü,

00:09:50.170 --> 00:09:52.709
gitarı görmüştü ama bu resmin roman

00:09:52.709 --> 00:09:55.111
tasvirini ayrı olarak yaptı.

00:09:56.231 --> 00:09:58.541
Hala tam olarak insan performansında

00:09:58.541 --> 00:09:59.701
değiliz ama yakınız.

00:09:59.701 --> 00:10:02.260
Testlerde 1/4 oranında
insanlar, bilgisayar

00:10:02.260 --> 00:10:04.714
tarafından oluşturulan yazıları seçiyor.

00:10:04.714 --> 00:10:06.826
Bu sistem şuan sadece 2 haftalık

00:10:06.826 --> 00:10:08.855
ama muhtemelen gelecek yıl içerisinde

00:10:08.855 --> 00:10:10.651
bu oranlarda devam ederse

00:10:10.651 --> 00:10:12.321
algoritma insan performansını

00:10:12.321 --> 00:10:14.172
hayli geçmiş olacak.

00:10:14.172 --> 00:10:16.534
Yani bilgisayarlar yazabiliyor da.

00:10:16.534 --> 00:10:18.073
Tüm bunları birleştirdik

NOTE Paragraph

00:10:18.073 --> 00:10:20.088
ve durum heyecan verici fırsatlar yarattı.

00:10:20.088 --> 00:10:23.170
Örneğin; sağlık alanında
Boston'da bir takım,

00:10:23.170 --> 00:10:25.675
doktorların kanser teşhisine yardımcı

00:10:25.675 --> 00:10:28.614
düzinelerce kliniksel
olarak ilişkili tümör

00:10:28.614 --> 00:10:31.540
özellikleri keşfettiklerini duyurdu.

00:10:31.810 --> 00:10:33.906
Benzer olarak Stanford' da

00:10:33.906 --> 00:10:36.889
büyüme altındaki dokulara bakan bir grup;

00:10:36.889 --> 00:10:40.350
kanser hastalarının sağkalım
oranlarını ölçmede

00:10:40.350 --> 00:10:42.772
patoloji uzmanlarından daha iyi olan,

00:10:42.772 --> 00:10:46.829
makine öğrenmesine dayalı
bir sistem geliştirdi.

00:10:46.829 --> 00:10:49.224
Bu iki durumda da tahminlerin daha

00:10:49.224 --> 00:10:51.296
hatasız olmasının yanı sıra kavrama

00:10:51.296 --> 00:10:53.701
açısından güçlü yeni
bir bilim geliştirdiler.

00:10:53.701 --> 00:10:55.876
Radyoloji vakasındakiler insanların

00:10:55.876 --> 00:10:58.258
anlayabileceği yeni
kliniksel indikatörlerdi.

00:10:58.258 --> 00:11:00.318
Patoloji vakasında ise bilgisayar,

00:11:00.318 --> 00:11:03.888
tanı yapılırken kanser
etrafındaki hücrelerin kanser

00:11:03.888 --> 00:11:09.260
hücreleri kadar önemli olduğunu keşfetti.

00:11:09.260 --> 00:11:11.851
Bu patoloji uzmanlarına onlarca

00:11:11.851 --> 00:11:14.413
yıldır öğretilenlerin tam tersi.

00:11:15.423 --> 00:11:17.754
Bu iki vakada da tıp uzmanları ve

00:11:17.754 --> 00:11:20.075
makine öğrenmesi uzmanlarının

00:11:20.075 --> 00:11:22.184
birleşip geliştirdiği bir sistemdi

00:11:22.184 --> 00:11:24.364
ancak geçen yıl bunu da geçtik.

00:11:24.364 --> 00:11:26.587
Bu örnek mikroskop altındaki insan

00:11:26.587 --> 00:11:30.412
dokusunun kanserli bölgelerini
tanımlamak üzerine.

00:11:30.412 --> 00:11:33.314
Burada gösterilen sistem bu alanları daha

00:11:33.314 --> 00:11:35.860
isabetli olarak belirleyebiliyor,

00:11:35.860 --> 00:11:38.135
ya da en az patoloji uzmanı kadar

00:11:38.135 --> 00:11:40.583
ama tümüyle derin öğrenme kullanılarak ve

00:11:40.583 --> 00:11:42.830
herhangi bir tıp geçmişi olmayan

00:11:42.830 --> 00:11:44.651
insanlar tarafından geliştirildi.

NOTE Paragraph

00:11:44.651 --> 00:11:47.578
Benzer olarak nöron segmentasyonu da.

00:11:47.578 --> 00:11:49.298
Şu an nöronları insanlar kadar

00:11:49.298 --> 00:11:50.948
isabetli segmentleyebiliyoruz

00:11:50.948 --> 00:11:52.355
ki bu sistem derin öğrenme

00:11:52.355 --> 00:11:53.985
kullanılarak hiç bir tıbbi geçmişi

00:11:53.985 --> 00:11:55.901
olmayan kişiler tarafından geliştirildi.

00:11:57.381 --> 00:11:59.941
Aynı şekilde ben de, hiç bir tıbbi geçmişim

00:11:59.941 --> 00:12:02.070
olmadığı halde medikal alanında

00:12:02.070 --> 00:12:04.830
yeni bir şirket açabilirim ki açtım da.

00:12:05.660 --> 00:12:08.982
Şirketi açma konusunda
biraz korkmuştum ama

00:12:08.982 --> 00:12:12.442
teoride bu veri analiz 
tekniklerini kullanarak

00:12:12.442 --> 00:12:15.742
yararlı ilaçlar yapmak mümkün görünüyordu.

00:12:15.752 --> 00:12:17.942
Neyse ki geri dönüşler harikaydı

00:12:17.942 --> 00:12:20.292
sadece medya değil tıp çevresinde de

00:12:20.292 --> 00:12:22.862
ki aynı zamanda çok da destekleyicilerdi.

00:12:22.862 --> 00:12:25.718
Teoride, medikal sürecin 
orta bölümünü alıp

00:12:25.718 --> 00:12:29.172
mümkün olduğunca veri analizine çevirerek

00:12:29.172 --> 00:12:32.171
doktorları en iyi oldukları
alana yoğunlaştırabiliriz.

00:12:33.071 --> 00:12:34.874
Bir örnek vermek istiyorum.

00:12:34.874 --> 00:12:36.989
Yeni bir tıbbi teşhis testini

00:12:36.989 --> 00:12:40.139
üretmek 15 dakikamızı alır

00:12:40.139 --> 00:12:42.341
ve gerçek zamanlı olarak da göstereceğim

00:12:42.341 --> 00:12:44.105
ama bazı parçalarını keserek

00:12:44.105 --> 00:12:45.715
süreci 3 dakikaya indirdim.

00:12:45.715 --> 00:12:48.629
Tıbbi teşhis testini oluşturmayı
göstermek yerine

00:12:48.629 --> 00:12:50.206
daha anlaşılır olduğu için

00:12:50.206 --> 00:12:53.867
araba görüntülerini tanımlama
testini göstereceğim.

00:12:53.867 --> 00:12:57.146
Yaklaşık 1.5 milyon araba
resmiyle başlıyoruz ve

00:12:57.146 --> 00:12:59.228
çekildikleri açılara göre onları

NOTE Paragraph

00:12:59.228 --> 00:13:02.519
ayırabilecek bir şey yaratmak istiyorum.

00:13:02.519 --> 00:13:04.705
Bütün resimler etiketsiz bu yüzden

00:13:04.705 --> 00:13:06.328
sıfırdan başlamak zorundayım.

00:13:07.028 --> 00:13:09.626
Derin öğrenme algoritmamızla resimlerdeki

00:13:09.626 --> 00:13:12.471
yapıların alanlarını otomatik
olarak algılayabilir.

00:13:12.471 --> 00:13:14.198
Güzel olan, şu andan itibaren

00:13:14.198 --> 00:13:15.988
insan ile bilgisayar 
artık ortak çalışabilir.

00:13:15.988 --> 00:13:18.616
Gördüğünüz gibi insan burada bilgisayara;

00:13:18.616 --> 00:13:20.811
daha sonra deneyip, algoritmasını

00:13:20.811 --> 00:13:22.881
geliştirmede kullanması için

00:13:22.881 --> 00:13:25.131
ilgi alanlarını söylüyor.

00:13:25.131 --> 00:13:27.121
Bu derin öğrenme sistemleri

00:13:27.121 --> 00:13:28.961
aslında 16.000 boyutlu uzay

00:13:28.961 --> 00:13:30.797
ve gördüğünüz gibi
bilgisayar burada

00:13:30.797 --> 00:13:33.009
uzay boyunca döndürüp yeni yapı

00:13:33.009 --> 00:13:35.001
alanları bulmaya çalışıyor.

00:13:35.001 --> 00:13:38.052
Başarıyla yapınca da daha sonra bunu süren

00:13:38.052 --> 00:13:40.786
kişi ilgi çekici olan alanları gösteriyor.

00:13:40.786 --> 00:13:44.298
Ve burada bilgisayar başarılı
bir şekilde alanları buldu.

00:13:44.298 --> 00:13:45.770
Örneğin: Açılar.

00:13:45.770 --> 00:13:47.776
Bu süreç devam ederken,

00:13:47.776 --> 00:13:50.106
bilgisayara aradığımız yapı türlerini

00:13:50.106 --> 00:13:51.844
adım adım söylüyoruz.

00:13:51.844 --> 00:13:54.116
Teşhis testinde pataloji uzmanının

00:13:54.116 --> 00:13:57.266
patoz alanlarını tanımlaması
gibi düşünebilirsin

00:13:57.266 --> 00:13:59.302
ya da örneğin radyolojistin sıkıntı

00:13:59.302 --> 00:14:02.151
yaratabilecek nodülleri göstermesi gibi.

00:14:02.151 --> 00:14:05.075
Bazen algoritma için sıkıntılı olabilir.

00:14:05.075 --> 00:14:07.095
Bu vaka da biraz kafası karışmış.

00:14:07.095 --> 00:14:09.507
Arabaların önleri ve 
arkaları karmakarışık.

00:14:09.507 --> 00:14:11.809
Burada biraz daha dikkatli olmalıyız,

00:14:11.809 --> 00:14:14.115
arkalara karşılık önleri elle seçmekte ve

00:14:14.115 --> 00:14:16.653
daha sonra bunun ilgilendiğimiz tipte

NOTE Paragraph

00:14:16.653 --> 00:14:20.310
bir grup olduğunu söylemekte.

00:14:21.570 --> 00:14:23.986
Bunu biraz yapıyoruz, 
biraz atlıyoruz bunu,

00:14:23.986 --> 00:14:26.270
sonra makine öğrenmesi algoritmasını

00:14:26.270 --> 00:14:27.500
bu yüzlerce kadar olan

00:14:27.500 --> 00:14:29.295
şeylere dayanarak eğitiyoruz

00:14:29.295 --> 00:14:31.198
ve daha iyi olmasını ümit ediyoruz.

00:14:31.198 --> 00:14:34.096
Bazı resimlerin solmaya
başladığını görebilirsiniz

00:14:34.096 --> 00:14:36.288
ve bize bazılarını kendisinin önceden

00:14:36.288 --> 00:14:38.712
nasıl anlaması gerektiğini
farkettiğini gösteriyor.

00:14:38.712 --> 00:14:41.341
Bu benzer resimler 
konseptini kullanabiliriz

00:14:41.341 --> 00:14:43.839
ve benzer resimleri 
kullanarak bilgisayarın

00:14:43.839 --> 00:14:45.612
bu noktada arabaların sadece

NOTE Paragraph

00:14:45.612 --> 00:14:47.547
önlerini bulabildiğini görebilirsiniz.

00:14:47.547 --> 00:14:50.011
Bu aşamada bilgisayar insana:

00:14:50.011 --> 00:14:52.245
"Tamam, peki, iyi iş çıkardın." diyebilir.

00:14:52.245 --> 00:14:55.550
Bazen, elbette, bu noktada bile

00:14:55.550 --> 00:14:58.560
grupların arasından seçmek zor.

00:14:58.930 --> 00:15:01.898
Bu durumda, bilgisayarın
biraz çevirmesine izin

00:15:01.898 --> 00:15:04.808
verdikten sonra bile sağ ve sol taraftaki

00:15:04.808 --> 00:15:07.854
resimlerin karmakarışık
olarak bulabiliriz.

00:15:07.854 --> 00:15:10.395
Yine bilgisayara bir takım
ipuçları verebiliriz,

00:15:10.395 --> 00:15:13.347
ve diyebiliriz ki :"Tamam, derin 
öğrenme algoritmasını

00:15:13.347 --> 00:15:15.569
kullanarak sağ ve sol tarafları mümkün

00:15:15.569 --> 00:15:18.201
olduğunca ayırabilecek 
bir projeksiyon bulmaya çalış. "

00:15:18.201 --> 00:15:20.481
Ve ipucunu verince başarılı oldu.

NOTE Paragraph

00:15:20.481 --> 00:15:23.139
Objeleri birbirinden 
ayırabilmek için gereken

00:15:23.139 --> 00:15:25.316
düşünme şeklini birlikte bulabildiler.

NOTE Paragraph

00:15:26.096 --> 00:15:28.206
Yani buradaki fikri anladınız.

00:15:29.646 --> 00:15:33.896
Buradaki durum; insanın
yerine bilgisayarın geçmesi

00:15:36.286 --> 00:15:39.068
değil birlikte çalışmaları.

00:15:39.068 --> 00:15:41.623
Burada yaptığımız ise; 6 ya da 7 kişilik

00:15:41.623 --> 00:15:45.068
bir takımın yaklaşık 7 
senede yapacağı bir şeyi,

NOTE Paragraph

00:15:45.068 --> 00:15:47.208
bir kişinin yaklaşık 15 dakikada

00:15:47.208 --> 00:15:49.718
yapacağı bir şeyle değiştirmek.

00:15:49.718 --> 00:15:53.547
Bu süreç yaklaşık 4 ya da
5 yineleme içeriyor.

00:15:53.547 --> 00:15:56.696
Gördüğünüz gibi şuan 1.5 milyon resmimizin

00:15:56.696 --> 00:15:58.718
%62 si doğru bir şekilde sınıflandırıldı.

00:15:58.718 --> 00:16:00.985
Gelinen noktada, oldukça kolay bir şekilde

00:16:00.985 --> 00:16:03.234
büyük bölümleri alıp hata olmadığına

00:16:03.234 --> 00:16:05.246
emin olmak için kontrol edebiliriz.

00:16:05.246 --> 00:16:08.121
Hata olan yerlerde ise
bilgisayara bildirebiliriz.

00:16:08.741 --> 00:16:12.128
Her farklı grup için bu tür
bir süreç kullanarak

00:16:12.128 --> 00:16:14.683
1.5 milyon görüntüyü sınıflandırmada

00:16:14.683 --> 00:16:16.861
%80 başarı yüzdesine çıktık.

00:16:17.611 --> 00:16:19.620
Bu noktada konu sadece

00:16:19.620 --> 00:16:21.250
doğru sınıflandırılmamış olan

00:16:21.250 --> 00:16:23.038
küçük numarayı bulmak ve

00:16:23.038 --> 00:16:25.691
sebebini anlamaya çalışmak üzerine.

00:16:25.811 --> 00:16:28.922
Bu yaklaşımı kullanarak; 15 dakikada

NOTE Paragraph

00:16:28.922 --> 00:16:31.928
%97' lik sınıflandırma oranına ulaştık.

00:16:31.928 --> 00:16:34.094
Bu tarz bir teknik bize çok önemli

00:16:34.094 --> 00:16:36.343
bir problemi çözmeye izin verebilir;

00:16:36.343 --> 00:16:39.087
dünyada tıbbi uzmanlığın
olmadığı yerlerde.

00:16:39.087 --> 00:16:41.290
Dünya Ekonomik Forumu'na göre;

00:16:41.290 --> 00:16:44.124
gelişen dünyada doktor
kıtlığı 10 ile 20 katı

00:16:44.124 --> 00:16:47.189
arasında ve 300 yıl alacaktır bu problemi

00:16:47.189 --> 00:16:50.448
çözmek için yeterli insan yetiştirmek.

NOTE Paragraph

00:16:50.448 --> 00:16:53.420
Düşünün ki derin öğrenme
yaklaşımını kullanarak

00:16:53.420 --> 00:16:56.539
verimliliklerini artırmaya
yardım edebilsek?

00:16:56.539 --> 00:16:58.983
Fırsatlar konusunda oldukça heycanlıyım.

00:16:58.983 --> 00:17:01.452
Aynı zamanda
problemlerle de ilgileniyorum.

00:17:01.452 --> 00:17:03.569
Buradaki problem ise; haritadaki

00:17:03.569 --> 00:17:05.563
her mavi alanda servisler

00:17:05.563 --> 00:17:07.757
istihdamın %80 den fazla.

00:17:07.757 --> 00:17:09.761
Servisler nedir?

00:17:09.761 --> 00:17:11.113
İşte servisler.

00:17:11.113 --> 00:17:13.453
Bunlar aynı zamanda bilgisayarın

00:17:13.453 --> 00:17:15.446
yapılma şeklini öğrendiği şeyler.

00:17:15.446 --> 00:17:17.983
Yani gelişen dünyadaki
istihdamın %80 'inin

00:17:17.983 --> 00:17:20.140
yaptığı şeyler aynı zamanda bilgisayarın

00:17:20.140 --> 00:17:22.138
nasıl yapılacağını öğrendiği şeyler.

00:17:22.138 --> 00:17:24.860
Bu ne anlama geliyor? 
Tamam, bir şey olmayacak.

00:17:24.860 --> 00:17:26.708
Başka işlerle yer değiştirilcekler.

00:17:26.708 --> 00:17:29.146
Örneğin; Veri bilimciler 
için daha fazla iş olacak.

00:17:29.146 --> 00:17:30.458
Aslında öyle değil.

00:17:30.458 --> 00:17:32.238
Veri bilimcilerin bunları yapmaları

00:17:32.238 --> 00:17:33.544
çok zamanlarını almaz.

00:17:33.544 --> 00:17:35.025
Örneğin; bu 4 algoritma da aynı

00:17:35.025 --> 00:17:36.594
adam tarafından geliştirildi.

00:17:36.594 --> 00:17:39.206
Yani eğer; daha önceden de olmuştu,

00:17:39.206 --> 00:17:41.753
yeni işlerin gelip yer değiştirdiği

00:17:41.753 --> 00:17:43.948
zamanların sonuçlarını gördük.

00:17:43.948 --> 00:17:45.879
Bu yeni işlere ne olacak?

00:17:45.879 --> 00:17:48.205
Bunu kestirmek bizim için oldukça zor

00:17:48.205 --> 00:17:51.094
çünkü insan performansı 
bu şekilde kademeli olarak

00:17:51.094 --> 00:17:53.499
artıyor ama artık biz bir sisteme,
derin öğrenmeye

NOTE Paragraph

00:17:53.499 --> 00:17:55.999
sahibiz yani katlanarak
büyüme kapasitesine

00:17:55.999 --> 00:17:57.586
sahip olduğunu biliyoruz.

00:17:57.586 --> 00:17:58.536
Ve burdayız.

00:17:58.536 --> 00:18:01.027
Şu anda, etrafımızdaki
şeyleri görüyoruz ve:

00:18:01.027 --> 00:18:03.135
"Bilgisayarlar hala aptal." değil mi?

00:18:03.135 --> 00:18:05.037
Ama 5 yıllık süre içinde bilgisayarlar

00:18:05.037 --> 00:18:06.786
bu çizelgenin dışında olacak.

00:18:06.786 --> 00:18:10.100
Yani bu kabiliyeti hemen
düşünmeye başlamalıyız.

00:18:10.100 --> 00:18:12.403
Bunu daha önceden görmüştük, elbette.

00:18:12.403 --> 00:18:14.782
Sanayi devriminde, motorlar sayesinde

00:18:14.782 --> 00:18:17.292
kapasitede kademe atlamayı gördük.

00:18:17.292 --> 00:18:19.594
Mesele şu ki, yine de bir süre sonra

00:18:19.594 --> 00:18:20.632
işler düzeliyor.

00:18:20.632 --> 00:18:22.770
Sosyal bozulma vardı ama bir kez

00:18:22.770 --> 00:18:24.838
motorlar güç üretmek için kullanıldı

00:18:24.838 --> 00:18:28.024
ve tüm durumlar, her şey düzene oturdu.

NOTE Paragraph

00:18:28.024 --> 00:18:31.067
Makine Öğrenmesi Devrimi
Sanayi devriminden

00:18:31.067 --> 00:18:32.830
çok daha farklı olacak çünkü

00:18:32.830 --> 00:18:35.570
Makine Öğrenmesi Devrimi 
asla durulmayacak.

00:18:35.570 --> 00:18:38.490
Bilgisayarlar entelektüel 
aktiviteler de iyiye gittikçe,

NOTE Paragraph

00:18:38.490 --> 00:18:40.189
entelektüel kapasitede daha

00:18:40.189 --> 00:18:42.249
iyi olan bilgisayarlar üretilecek.

00:18:42.249 --> 00:18:45.146
Yani bu dünyanın daha önce tanık olmadığı

00:18:45.146 --> 00:18:47.496
türde bir değişim olacak bu yüzden

00:18:47.496 --> 00:18:49.869
neyin mümkün olduğu konusunda ki

00:18:49.869 --> 00:18:51.297
önceki anlayışınız farklı.

00:18:51.297 --> 00:18:52.848
Şimdiden bizi etkiliyor.

00:18:52.848 --> 00:18:56.304
Son 25 yılda, kapital üretim arttıkça

00:18:56.304 --> 00:19:00.608
işçi verimliliği sabitti
hatta biraz inişteydi.

00:19:01.298 --> 00:19:03.357
Bu yüzden bu konuyu tartışmaya

00:19:03.357 --> 00:19:04.908
başlamamızı istiyorum.

00:19:04.908 --> 00:19:06.895
İnsanlara bu durum hakkında çoğu kez

00:19:06.895 --> 00:19:09.485
bahsettiğimde, insanlar 
oldukça ilgisiz olabiliyor.

00:19:09.485 --> 00:19:12.028
Bilgisayarlar gerçek anlamda düşünemez,

00:19:12.028 --> 00:19:14.290
duygusal davranmaz, şiirden anlamaz,

00:19:14.290 --> 00:19:16.400
nasıl çalıştıklarını tam
olarak anlamıyoruz.

00:19:16.400 --> 00:19:17.330
Ne fark eder?

00:19:17.330 --> 00:19:19.560
Bilgisayarlar şu an 
insanların ücret alarak

00:19:19.560 --> 00:19:22.440
zamanlarının çoğunu
harcadıkları şeyleri yapabiliyor.

00:19:22.440 --> 00:19:25.930
O zaman sosyal ve ekonomik
yapımızı nasıl uyduracağımızı

00:19:25.930 --> 00:19:28.180
düşünmeye başlamamızın
ve bu yeni gerçekliğin

00:19:28.180 --> 00:19:30.460
farkında olmamızın tam zamanı.

00:19:30.460 --> 00:19:31.400
Teşekkürler.

00:19:31.400 --> 00:19:32.190
(Alkışlar)