1
00:00:00,350 --> 00:00:01,880
Eskiden bilgisayarınıza

2
00:00:01,880 --> 00:00:04,453
yeni bir şeyler yaptırmak isteseniz

3
00:00:04,453 --> 00:00:06,257
programlamanız gerekirdi.

4
00:00:06,257 --> 00:00:08,898
Şimdi, programlama; burada hiç yapmayanlar

5
00:00:08,898 --> 00:00:11,950
için söylüyorum, her adımı, her detayı

6
00:00:11,950 --> 00:00:15,317
bilgisayarın yapmasını istediğin 
her şeyi amacına

7
00:00:15,317 --> 00:00:18,869
ulaşman için tasarlaman gerekir.

8
00:00:18,869 --> 00:00:21,595
Nasıl yapacağını bilmediğin bir şeyi

9
00:00:21,595 --> 00:00:24,648
yapmak istiyorsan bu çok zorlu olacak.

10
00:00:24,648 --> 00:00:28,131
Arthur Samuel de bunu yaptı.

11
00:00:28,131 --> 00:00:31,548
1956'da bilgisayarının onu

12
00:00:31,548 --> 00:00:34,548
damada yenebilmesini istiyordu.

13
00:00:34,548 --> 00:00:37,108
Her detayıyla nasıl bir 
program tasarlayarak

14
00:00:37,108 --> 00:00:40,594
damada senden daha iyi 
olmasını sağlayabilirsin?

15
00:00:40,594 --> 00:00:42,116
Bu soruna bir çözüm buldu:

16
00:00:42,116 --> 00:00:45,840
Binlerce kez bilgisayarıyla dama oynayacak

17
00:00:45,840 --> 00:00:48,364
ve böylece bilgisayara damayı öğrenecekti.

18
00:00:48,364 --> 00:00:51,544
Bu işe yaradı ve 1962'de bilgisayar

19
00:00:51,544 --> 00:00:55,561
Connecticut eyaleti şampiyonunu yendi.

20
00:00:55,561 --> 00:00:58,534
Bu şekilde Arthur Samuel, 
makine öğrenmenin

21
00:00:58,534 --> 00:01:00,251
fikir öncüsüydü ve ona borçluyum,

22
00:01:00,251 --> 00:01:03,014
çünkü bir makine öğrenimi uygulayıcısıyım.

23
00:01:03,014 --> 00:01:04,479
200 bini aşkın uygulayıcıyı

24
00:01:04,479 --> 00:01:07,867
biraraya getiren Kaggle'ın başkanıydım.

25
00:01:07,867 --> 00:01:09,925
Kaggle yarışmalar düzenleyip çözülememiş

26
00:01:09,925 --> 00:01:13,633
problemleri çözmeye çalışıyordu ve

27
00:01:13,633 --> 00:01:17,470
yüzlerce kez başarılı oldular.

28
00:01:17,470 --> 00:01:19,940
Bu açıdan bakıldığında, makine öğreniminin

29
00:01:19,940 --> 00:01:23,890
geçmişte, günümüzde ve gelecekte planlanan

30
00:01:23,890 --> 00:01:26,252
çalışmaları hakkında çok şey öğrendim.

31
00:01:26,252 --> 00:01:27,726
Ticari anlamda belki de

32
00:01:27,726 --> 00:01:29,200
makine öğreniminin

33
00:01:29,200 --> 00:01:30,675
ilk başarısı Google'dır.

34
00:01:30,675 --> 00:01:33,494
Google bilgisayar algoritması ile

35
00:01:33,494 --> 00:01:35,536
bilgilere erişmeyi mümkün kılar ve

36
00:01:35,536 --> 00:01:38,437
bu algoritma makine öğrenimini temel alır.

37
00:01:38,437 --> 00:01:42,317
Bugüne kadar birçok ticari 
olarak başarılı uygulaması oldu.

38
00:01:42,317 --> 00:01:44,773
Amazon, Netflix gibi bir çok

39
00:01:44,773 --> 00:01:46,570
başarılı şirket makine öğrenimini

40
00:01:46,570 --> 00:01:47,876
ürünlerini ve filmlerini

41
00:01:47,876 --> 00:01:49,896
satmak için kullanmışlardır.

42
00:01:49,896 --> 00:01:51,703
Bu bazen ürkütücü olabilir.

43
00:01:51,703 --> 00:01:53,917
LinkedIn ve Facebook gibi
şirketler bazen size

44
00:01:53,917 --> 00:01:56,251
tanıyor olabileceğiniz kişileri 
gösterir ve siz

45
00:01:56,251 --> 00:01:58,228
bunu nasıl yaptığını bilemezsiniz; işte

46
00:01:58,228 --> 00:02:01,195
bu makine öğreniminin eseridir.

47
00:02:01,195 --> 00:02:04,152
Bu sistem, programlanmak yerine datadan

48
00:02:04,152 --> 00:02:07,399
öğrenen algoritmalardan oluşur.

49
00:02:07,399 --> 00:02:09,877
Bu IBM'in Watson ile Jeopardy yarışmasında

50
00:02:09,877 --> 00:02:13,739
oldukça zor ve karışık soruları doğru

51
00:02:13,739 --> 00:02:16,964
cevaplayarak nasıl iki dünya şampiyonunu

52
00:02:16,964 --> 00:02:19,799
yenmeyi başardığını açıklar.

53
00:02:19,799 --> 00:02:23,034
İnsansız arabalar da 
bu sistem ile çalışır.

54
00:02:23,034 --> 00:02:25,856
Yaya ile ağaç arasındaki farkı söylemek

55
00:02:25,856 --> 00:02:28,488
isterseniz buyrun, söyleyin bu çok önemli.

56
00:02:28,488 --> 00:02:31,075
Bu programların elle nasıl yazıldığını

57
00:02:31,075 --> 00:02:34,072
bilmiyoruz ama makine öğrenimi ile mümkün.

58
00:02:34,072 --> 00:02:36,110
Ve bu arabalar bir düz yolda

59
00:02:36,110 --> 00:02:39,178
kaza yapmadan 1 milyon mili aştı.

60
00:02:40,798 --> 00:02:42,326
Böylece bilgisayarların, 
öğrenebildiğini

61
00:02:42,326 --> 00:02:44,110
ve bazen bizim yapmayı bilmediğimiz

62
00:02:44,110 --> 00:02:46,010
şeyleri yapmayı öğrenebildiklerini

63
00:02:46,010 --> 00:02:48,848
veya bizden bunları bizden daha

64
00:02:48,848 --> 00:02:51,733
iyi yapabileceklerini görüyoruz.

65
00:02:51,733 --> 00:02:54,478
Makine öğreniminin en iyi örneklerini

66
00:02:54,478 --> 00:02:57,650
Kaggle'da yürüttüğümüz bir projede gördüm:

67
00:02:57,940 --> 00:03:01,911
Toronto Üniversitesi'nden Geoffrey Hinton

68
00:03:01,911 --> 00:03:03,840
ve ekibi otomatik uyuşturucu tespiti

69
00:03:03,840 --> 00:03:06,130
alanında yarışmayı kazandı.

70
00:03:06,140 --> 00:03:07,140
Burada ilginç olansa;

71
00:03:07,140 --> 00:03:10,277
Merck veya uluslararası akademik çevrenin

72
00:03:10,277 --> 00:03:12,540
geliştirdiği bütün algoritmaları kimya

73
00:03:12,540 --> 00:03:15,061
ve biyoloji gibi alanlarda geçmişi

74
00:03:15,061 --> 00:03:18,061
olmayan kişilerin algoritmayı 
çözmeleri değil bunu

75
00:03:18,061 --> 00:03:20,230
2 haftada yapmış olmaları.

76
00:03:20,230 --> 00:03:21,611
Peki bunu nasıl başardılar?

77
00:03:22,421 --> 00:03:25,342
Derin Öğrenme denilen olağanüstü
bir algoritma kullandılar.

78
00:03:25,342 --> 00:03:28,291
Bu o kadar önemli bir başarıydı ki birkaç

79
00:03:28,291 --> 00:03:31,412
hafta sonra New York Times'ın 
kapağında yer aldı.

80
00:03:31,412 --> 00:03:34,147
Sol kenarda Geoffrey Hinton vardı.

81
00:03:34,147 --> 00:03:37,558
Derin Öğrenme, insan beyninin 
çalışmasından

82
00:03:37,558 --> 00:03:39,960
ilham alınarak
oluşturulmuş bir algoritmadır

83
00:03:39,960 --> 00:03:43,971
ve kapasitesi konusunda
teorik kısıtlamalar içermez.

84
00:03:43,971 --> 00:03:46,474
Ona ne kadar çok veri ve zaman verirseniz

85
00:03:46,474 --> 00:03:48,276
o kadar iyi sonuçlar 
elde edersiniz.

86
00:03:48,276 --> 00:03:50,615
New York Times'ın haberinde derin öğrenme

87
00:03:50,615 --> 00:03:51,615
ile elde edilen

88
00:03:51,615 --> 00:03:52,857
bir sonuç daha vardı;

89
00:03:52,857 --> 00:03:54,147
onu da şimdi göstereceğim:

90
00:03:54,977 --> 00:03:56,189
Sonuca göre:

91
00:03:56,189 --> 00:03:58,500
Bilgisayarlar dinleyebilir

92
00:03:58,500 --> 00:04:00,510
ve anlayabilir.

93
00:04:00,820 --> 00:04:03,400
Richard Rashid:"Bu yöntemde

94
00:04:03,400 --> 00:04:05,047
son aşamada gelebilmek

95
00:04:05,047 --> 00:04:06,913
istediğim nokta

96
00:04:06,913 --> 00:04:09,913
sizinle Çince konuşmak.

97
00:04:10,961 --> 00:04:12,306
Olay şu ki;

98
00:04:12,306 --> 00:04:15,058
bir çok Çinliden çok miktarda

99
00:04:15,058 --> 00:04:18,378
bilgi alma imkanımız oldu

100
00:04:18,378 --> 00:04:21,408
ve Çince bir metni alan ve

101
00:04:21,408 --> 00:04:24,908
Çin diline çeviren yani yazıyı

102
00:04:24,908 --> 00:04:27,881
konuşmaya dönüştüren
bir sistem oluşturduk.

103
00:04:27,881 --> 00:04:31,509
Sonra konuşmamın bir saatlik kısmını aldık

104
00:04:31,509 --> 00:04:33,720
ve standart metni konuşma sistemine

105
00:04:33,720 --> 00:04:35,070
modüle ettik sonuç olarak

106
00:04:35,070 --> 00:04:37,314
benim konuşmam gibi olmalıydı.

107
00:04:37,314 --> 00:04:38,904
Sonuç mükemmel olmadı elbette.

108
00:04:38,904 --> 00:04:41,552
Hatta bir çok hata vardı.

109
00:04:41,552 --> 00:04:44,036
(Çince)

110
00:04:44,036 --> 00:04:48,153
(Alkışlar)

111
00:04:49,446 --> 00:04:53,022
Bu alanda daha çok çalışılması gerekiyor.

112
00:04:53,022 --> 00:04:56,667
(Çince)

113
00:04:56,667 --> 00:05:00,100
(Alkışlar)

114
00:05:01,345 --> 00:05:04,744
Bu, Çinde makine öğrenimi konferansıydı.

115
00:05:04,744 --> 00:05:07,114
Genelde akademik konferanslarda

116
00:05:07,114 --> 00:05:09,011
spontane alkışlamalar olmaz ancak

117
00:05:09,011 --> 00:05:12,407
TEDx konferanslarında rastlanabilir.

118
00:05:12,407 --> 00:05:13,892
Burada gördüğünüz her şey

119
00:05:13,892 --> 00:05:15,862
derin öğrenme ile gerçekleşiyor.

120
00:05:15,862 --> 00:05:17,007
(Alkışlar) 
Teşekkürler.

121
00:05:17,007 --> 00:05:19,289
İngilizce uyarlama derin
öğrenme ile yapıldı.

122
00:05:19,289 --> 00:05:22,701
Çince çeviri ve sağ üstteki 
metin derin öğrenmeyle,

123
00:05:22,701 --> 00:05:26,008
ve yine sesin entegre edilmesi 
de derin öğrenme ile yapıldı.

124
00:05:26,008 --> 00:05:28,972
Derin öğrenme alışılmışın dışında bir şey.

125
00:05:28,972 --> 00:05:30,242
Tek bir algoritma
neredeyse

126
00:05:30,242 --> 00:05:32,341
her şeyi yapabilecek gibi duruyor

127
00:05:32,341 --> 00:05:35,242
ve geçen sene öğrendim ki 
görmeyi de öğrenmiş.

128
00:05:35,242 --> 00:05:37,628
Almanya'da Alman Trafik
İşaretleri Karşılaştırması

129
00:05:37,628 --> 00:05:40,225
olarak adlandırılan yarışmada

130
00:05:40,225 --> 00:05:43,618
derin öğrenme bu gibi
işaretleri algılamayı öğrendi.

131
00:05:43,618 --> 00:05:45,712
Diğer algoritmalardan daha iyi algılamakla

132
00:05:45,712 --> 00:05:48,170
kalmayıp, yarışmanın 
sıralamasına bakıldığında

133
00:05:48,170 --> 00:05:50,189
insanlardan da daha iyi tanıdı;

134
00:05:50,189 --> 00:05:52,041
hatta iki katı daha fazla.

135
00:05:52,041 --> 00:05:54,037
2011 yılında, bilgisayarların insanlardan

136
00:05:54,037 --> 00:05:57,442
daha iyi görebildiğini anladık.

137
00:05:57,442 --> 00:05:59,491
O zamandan beri sayısız çalışma yapıldı.

138
00:05:59,491 --> 00:06:02,505
2012'de Google; Youtube 
videolarını izleyen

139
00:06:02,505 --> 00:06:05,270
ve aylık 16.000 bilgisayardaki
veriyi sıkıştırabilen

140
00:06:05,270 --> 00:06:08,187
derin öğrenme algoritmaları
olduğunu açıkladı.

141
00:06:08,187 --> 00:06:11,028
Ayrıca bilgisayarlar
ayrı ayrı insan ve kedi

142
00:06:11,028 --> 00:06:14,027
gibi konseptleri izleyerek öğrendi.

143
00:06:14,027 --> 00:06:16,379
Bu insanların öğrenmesine benziyor.

144
00:06:16,379 --> 00:06:19,119
İnsanlar gördüklerinin
anlatılmasıyla değil

145
00:06:19,119 --> 00:06:22,300
kendileri başlarına öğrenirler.

146
00:06:22,460 --> 00:06:25,949
Yine 2012'de az önce 
gördüğümüz Geoffrey Hinton

147
00:06:25,949 --> 00:06:30,397
1.5 milyon fotoğrafa 
bakarak neyin fotoğrafları

148
00:06:30,397 --> 00:06:32,368
olduğunu çözmeye çalışarak

149
00:06:32,368 --> 00:06:35,126
popüler olan ImageNet yarışmasını kazandı.

150
00:06:35,126 --> 00:06:37,259
2014 yılında görüntü tanımada

151
00:06:37,259 --> 00:06:38,789
%6 lık hata payına düştük.

152
00:06:38,789 --> 00:06:41,268
Bu da insanlardan daha iyi.

153
00:06:41,268 --> 00:06:44,436
Makinalar gerçekten bu alanda
harika işler yapıyor

154
00:06:44,436 --> 00:06:47,206
ve artık endüstride de kullanılıyor.

155
00:06:47,206 --> 00:06:49,824
Mesela Google, geçen yıl Fransa'daki

156
00:06:49,824 --> 00:06:52,390
her bir konumu 2 saatte haritada

157
00:06:52,390 --> 00:06:54,100
işaretlediğini duyurdu ve

158
00:06:54,100 --> 00:06:57,089
cadde numaralarını okumak ve tanımlamak

159
00:06:57,089 --> 00:06:58,979
için cadde görüntülerini

160
00:06:58,979 --> 00:07:02,039
bir derin öğrenme
algoritmasında kullandılar.

161
00:07:02,039 --> 00:07:04,849
Bunun önceleri ne kadar sürdüğünü düşünün:

162
00:07:04,849 --> 00:07:07,029
binlerce insan, bir çok yıl.

163
00:07:08,759 --> 00:07:10,144
Bu Çin'de de oldu.

164
00:07:10,144 --> 00:07:14,426
Baidu bir çeşit Çin'in Google'ı, sanırım,

165
00:07:14,426 --> 00:07:16,708
sol üst köşede gördüğünüz Baidu'nun

166
00:07:16,708 --> 00:07:18,322
derin öğrenme sistemine

167
00:07:18,322 --> 00:07:20,794
yüklediğim görüntünün örneği

168
00:07:20,794 --> 00:07:23,548
ve arkaplanda ise sistemin görüntüyü

169
00:07:23,548 --> 00:07:26,637
tanımlayıp benzerlerini
bulduğunu görebilirsiniz.

170
00:07:26,637 --> 00:07:29,213
Benzer resimler gerçekten de
benzer arka planlara,

171
00:07:29,213 --> 00:07:31,059
benzer yüz açılarına sahip

172
00:07:31,059 --> 00:07:32,777
hatta bazılarında dilleri dışarıda.

173
00:07:32,777 --> 00:07:35,985
Tam olarak web sayfasının 
metnine bakmak gibi değil.

174
00:07:35,985 --> 00:07:38,235
Tek yaptığım resim yüklemekti.

175
00:07:38,235 --> 00:07:40,027
O halde gördüklerini anlayabilen ve

176
00:07:40,027 --> 00:07:42,368
bu sayede gerçek zamanlı olarak yüz

177
00:07:42,368 --> 00:07:44,432
milyonlarca görüntüyü veritabanlarında

178
00:07:44,432 --> 00:07:46,306
arayabilen bilgisayarlar var.

179
00:07:46,306 --> 00:07:49,436
Peki bilgisayarların görmesi 
ne anlama geliyor?

180
00:07:49,436 --> 00:07:51,453
Sadece görebilmesini sağlamak değil

181
00:07:51,453 --> 00:07:53,852
aslında derin öğrenme
bundan daha fazlasını yaptı.

182
00:07:53,852 --> 00:07:56,570
Bu gibi karmaşık ve incelikli cümleler

183
00:07:56,570 --> 00:07:59,394
artık derin öğrenme
algoritmalarıyla anlaşılabilir.

184
00:07:59,394 --> 00:08:00,697
Gördüğünüz üzere;

185
00:08:00,697 --> 00:08:03,465
Stanford-tabanlı sistem, üstteki kırmızı

186
00:08:03,465 --> 00:08:07,384
noktanın negatif bir
his ifade ettiğini anlıyor.

187
00:08:07,384 --> 00:08:09,072
Derin öğrenme hatta

188
00:08:09,072 --> 00:08:11,283
cümlelerin ne hakkında olduğunu

189
00:08:11,283 --> 00:08:13,041
ve anlamlarını anlamada insan

190
00:08:13,041 --> 00:08:15,437
performansına yaklaşmış durumda.

191
00:08:15,777 --> 00:08:18,425
Aynı zamanda derin öğrenme Çin

192
00:08:18,425 --> 00:08:22,131
anadil seviyesinde Çince
okumada da kullanıldı.

193
00:08:22,131 --> 00:08:24,652
Bu algoritma Çince konuşamayan ve

194
00:08:24,652 --> 00:08:27,701
anlamayan insanlar
tarafından İsviçre'de geliştirildi.

195
00:08:27,701 --> 00:08:30,568
Bahsettiğim gibi derin
öğrenme kullanma bu işte

196
00:08:30,568 --> 00:08:33,788
dünyadaki en iyi sistem yerel insanların

197
00:08:33,788 --> 00:08:36,718
anlama performansına göre bile.

198
00:08:36,718 --> 00:08:39,682
Bu sistem şirketimde oluşturuldu

199
00:08:39,682 --> 00:08:42,448
ve bu tarz şeyleri bir arada
toplamayı gösteriyor.

200
00:08:42,448 --> 00:08:44,699
Bu resimlere eklenmiş metin yok ve

201
00:08:44,699 --> 00:08:47,031
ben buraya cümle yazarken gerçek

202
00:08:47,031 --> 00:08:49,510
zamanlı olarak resimleri algılıyor,

203
00:08:49,510 --> 00:08:51,789
ne hakkında olduklarını çözüyor ve

204
00:08:51,789 --> 00:08:54,352
yazdığım metne benzer resimleri buluyor.

205
00:08:54,352 --> 00:08:57,108
Görüyorsunuz, bu aslında
cümlelerimi anlama

206
00:08:57,108 --> 00:08:59,332
ve bu resimleri anlama.

207
00:08:59,332 --> 00:09:01,891
Benzerini Google'da
gördüğünüzü düşünüyorum;

208
00:09:01,891 --> 00:09:04,666
bir şeyleri yazarken size
resimler gösterir ama

209
00:09:04,666 --> 00:09:08,090
asıl yaptığı web sayfalarında
yazdıklarınızı aramaktır.

210
00:09:08,090 --> 00:09:11,091
Bu aslında resimleri anlamaktan
oldukça farklı.

211
00:09:11,091 --> 00:09:13,843
Bu son bir kaç ayda ilk kez

212
00:09:13,843 --> 00:09:16,543
bilgisayarların yapabildiği bir şey.

213
00:09:17,091 --> 00:09:19,192
O halde görüyoruz ki bilgisayarlar

214
00:09:19,192 --> 00:09:21,182
görebilmekle kalmıyor aynı zamanda

215
00:09:21,182 --> 00:09:22,832
okuyabiliyor ve zaten duyduklarını

216
00:09:22,832 --> 00:09:24,947
anlayabildiklerini de göstermiştik.

217
00:09:24,947 --> 00:09:26,707
Belki yazabildiklerini söylesem

218
00:09:26,707 --> 00:09:28,537
artık şaşırtıcı gelmez.

219
00:09:28,537 --> 00:09:30,927
İşte burada dün derin
öğrenme algoritmasıyla

220
00:09:30,927 --> 00:09:33,607
oluşturduğum metin.

221
00:09:33,607 --> 00:09:37,159
Ve burada algoritma tarafından
geliştirilen metinler var.

222
00:09:37,159 --> 00:09:40,102
Bu cümlelerin her biri
resimleri tanımlamak

223
00:09:40,102 --> 00:09:42,892
için derin öğrenme
algoritmasıyla geliştirildi .

224
00:09:42,892 --> 00:09:45,202
Algoritma daha önce siyah tişörtlü

225
00:09:45,202 --> 00:09:47,356
gitar çalan birini hiç görmemişti.

226
00:09:47,356 --> 00:09:50,170
Önceden adamı görmüştü, siyahi görmüştü,

227
00:09:50,170 --> 00:09:52,709
gitarı görmüştü ama bu resmin roman

228
00:09:52,709 --> 00:09:55,111
tasvirini ayrı olarak yaptı.

229
00:09:56,231 --> 00:09:58,541
Hala tam olarak insan performansında

230
00:09:58,541 --> 00:09:59,701
değiliz ama yakınız.

231
00:09:59,701 --> 00:10:02,260
Testlerde 1/4 oranında
insanlar, bilgisayar

232
00:10:02,260 --> 00:10:04,714
tarafından oluşturulan yazıları seçiyor.

233
00:10:04,714 --> 00:10:06,826
Bu sistem şuan sadece 2 haftalık

234
00:10:06,826 --> 00:10:08,855
ama muhtemelen gelecek yıl içerisinde

235
00:10:08,855 --> 00:10:10,651
bu oranlarda devam ederse

236
00:10:10,651 --> 00:10:12,321
algoritma insan performansını

237
00:10:12,321 --> 00:10:14,172
hayli geçmiş olacak.

238
00:10:14,172 --> 00:10:16,534
Yani bilgisayarlar yazabiliyor da.

239
00:10:16,534 --> 00:10:18,073
Tüm bunları birleştirdik

240
00:10:18,073 --> 00:10:20,088
ve durum heyecan verici fırsatlar yarattı.

241
00:10:20,088 --> 00:10:23,170
Örneğin; sağlık alanında
Boston'da bir takım,

242
00:10:23,170 --> 00:10:25,675
doktorların kanser teşhisine yardımcı

243
00:10:25,675 --> 00:10:28,614
düzinelerce kliniksel
olarak ilişkili tümör

244
00:10:28,614 --> 00:10:31,540
özellikleri keşfettiklerini duyurdu.

245
00:10:31,810 --> 00:10:33,906
Benzer olarak Stanford' da

246
00:10:33,906 --> 00:10:36,889
büyüme altındaki dokulara bakan bir grup;

247
00:10:36,889 --> 00:10:40,350
kanser hastalarının sağkalım
oranlarını ölçmede

248
00:10:40,350 --> 00:10:42,772
patoloji uzmanlarından daha iyi olan,

249
00:10:42,772 --> 00:10:46,829
makine öğrenmesine dayalı
bir sistem geliştirdi.

250
00:10:46,829 --> 00:10:49,224
Bu iki durumda da tahminlerin daha

251
00:10:49,224 --> 00:10:51,296
hatasız olmasının yanı sıra kavrama

252
00:10:51,296 --> 00:10:53,701
açısından güçlü yeni
bir bilim geliştirdiler.

253
00:10:53,701 --> 00:10:55,876
Radyoloji vakasındakiler insanların

254
00:10:55,876 --> 00:10:58,258
anlayabileceği yeni
kliniksel indikatörlerdi.

255
00:10:58,258 --> 00:11:00,318
Patoloji vakasında ise bilgisayar,

256
00:11:00,318 --> 00:11:03,888
tanı yapılırken kanser
etrafındaki hücrelerin kanser

257
00:11:03,888 --> 00:11:09,260
hücreleri kadar önemli olduğunu keşfetti.

258
00:11:09,260 --> 00:11:11,851
Bu patoloji uzmanlarına onlarca

259
00:11:11,851 --> 00:11:14,413
yıldır öğretilenlerin tam tersi.

260
00:11:15,423 --> 00:11:17,754
Bu iki vakada da tıp uzmanları ve

261
00:11:17,754 --> 00:11:20,075
makine öğrenmesi uzmanlarının

262
00:11:20,075 --> 00:11:22,184
birleşip geliştirdiği bir sistemdi

263
00:11:22,184 --> 00:11:24,364
ancak geçen yıl bunu da geçtik.

264
00:11:24,364 --> 00:11:26,587
Bu örnek mikroskop altındaki insan

265
00:11:26,587 --> 00:11:30,412
dokusunun kanserli bölgelerini
tanımlamak üzerine.

266
00:11:30,412 --> 00:11:33,314
Burada gösterilen sistem bu alanları daha

267
00:11:33,314 --> 00:11:35,860
isabetli olarak belirleyebiliyor,

268
00:11:35,860 --> 00:11:38,135
ya da en az patoloji uzmanı kadar

269
00:11:38,135 --> 00:11:40,583
ama tümüyle derin öğrenme kullanılarak ve

270
00:11:40,583 --> 00:11:42,830
herhangi bir tıp geçmişi olmayan

271
00:11:42,830 --> 00:11:44,651
insanlar tarafından geliştirildi.

272
00:11:44,651 --> 00:11:47,578
Benzer olarak nöron segmentasyonu da.

273
00:11:47,578 --> 00:11:49,298
Şu an nöronları insanlar kadar

274
00:11:49,298 --> 00:11:50,948
isabetli segmentleyebiliyoruz

275
00:11:50,948 --> 00:11:52,355
ki bu sistem derin öğrenme

276
00:11:52,355 --> 00:11:53,985
kullanılarak hiç bir tıbbi geçmişi

277
00:11:53,985 --> 00:11:55,901
olmayan kişiler tarafından geliştirildi.

278
00:11:57,381 --> 00:11:59,941
Aynı şekilde ben de, hiç bir tıbbi geçmişim

279
00:11:59,941 --> 00:12:02,070
olmadığı halde medikal alanında

280
00:12:02,070 --> 00:12:04,830
yeni bir şirket açabilirim ki açtım da.

281
00:12:05,660 --> 00:12:08,982
Şirketi açma konusunda
biraz korkmuştum ama

282
00:12:08,982 --> 00:12:12,442
teoride bu veri analiz 
tekniklerini kullanarak

283
00:12:12,442 --> 00:12:15,742
yararlı ilaçlar yapmak mümkün görünüyordu.

284
00:12:15,752 --> 00:12:17,942
Neyse ki geri dönüşler harikaydı

285
00:12:17,942 --> 00:12:20,292
sadece medya değil tıp çevresinde de

286
00:12:20,292 --> 00:12:22,862
ki aynı zamanda çok da destekleyicilerdi.

287
00:12:22,862 --> 00:12:25,718
Teoride, medikal sürecin 
orta bölümünü alıp

288
00:12:25,718 --> 00:12:29,172
mümkün olduğunca veri analizine çevirerek

289
00:12:29,172 --> 00:12:32,171
doktorları en iyi oldukları
alana yoğunlaştırabiliriz.

290
00:12:33,071 --> 00:12:34,874
Bir örnek vermek istiyorum.

291
00:12:34,874 --> 00:12:36,989
Yeni bir tıbbi teşhis testini

292
00:12:36,989 --> 00:12:40,139
üretmek 15 dakikamızı alır

293
00:12:40,139 --> 00:12:42,341
ve gerçek zamanlı olarak da göstereceğim

294
00:12:42,341 --> 00:12:44,105
ama bazı parçalarını keserek

295
00:12:44,105 --> 00:12:45,715
süreci 3 dakikaya indirdim.

296
00:12:45,715 --> 00:12:48,629
Tıbbi teşhis testini oluşturmayı
göstermek yerine

297
00:12:48,629 --> 00:12:50,206
daha anlaşılır olduğu için

298
00:12:50,206 --> 00:12:53,867
araba görüntülerini tanımlama
testini göstereceğim.

299
00:12:53,867 --> 00:12:57,146
Yaklaşık 1.5 milyon araba
resmiyle başlıyoruz ve

300
00:12:57,146 --> 00:12:59,228
çekildikleri açılara göre onları

301
00:12:59,228 --> 00:13:02,519
ayırabilecek bir şey yaratmak istiyorum.

302
00:13:02,519 --> 00:13:04,705
Bütün resimler etiketsiz bu yüzden

303
00:13:04,705 --> 00:13:06,328
sıfırdan başlamak zorundayım.

304
00:13:07,028 --> 00:13:09,626
Derin öğrenme algoritmamızla resimlerdeki

305
00:13:09,626 --> 00:13:12,471
yapıların alanlarını otomatik
olarak algılayabilir.

306
00:13:12,471 --> 00:13:14,198
Güzel olan, şu andan itibaren

307
00:13:14,198 --> 00:13:15,988
insan ile bilgisayar 
artık ortak çalışabilir.

308
00:13:15,988 --> 00:13:18,616
Gördüğünüz gibi insan burada bilgisayara;

309
00:13:18,616 --> 00:13:20,811
daha sonra deneyip, algoritmasını

310
00:13:20,811 --> 00:13:22,881
geliştirmede kullanması için

311
00:13:22,881 --> 00:13:25,131
ilgi alanlarını söylüyor.

312
00:13:25,131 --> 00:13:27,121
Bu derin öğrenme sistemleri

313
00:13:27,121 --> 00:13:28,961
aslında 16.000 boyutlu uzay

314
00:13:28,961 --> 00:13:30,797
ve gördüğünüz gibi
bilgisayar burada

315
00:13:30,797 --> 00:13:33,009
uzay boyunca döndürüp yeni yapı

316
00:13:33,009 --> 00:13:35,001
alanları bulmaya çalışıyor.

317
00:13:35,001 --> 00:13:38,052
Başarıyla yapınca da daha sonra bunu süren

318
00:13:38,052 --> 00:13:40,786
kişi ilgi çekici olan alanları gösteriyor.

319
00:13:40,786 --> 00:13:44,298
Ve burada bilgisayar başarılı
bir şekilde alanları buldu.

320
00:13:44,298 --> 00:13:45,770
Örneğin: Açılar.

321
00:13:45,770 --> 00:13:47,776
Bu süreç devam ederken,

322
00:13:47,776 --> 00:13:50,106
bilgisayara aradığımız yapı türlerini

323
00:13:50,106 --> 00:13:51,844
adım adım söylüyoruz.

324
00:13:51,844 --> 00:13:54,116
Teşhis testinde pataloji uzmanının

325
00:13:54,116 --> 00:13:57,266
patoz alanlarını tanımlaması
gibi düşünebilirsin

326
00:13:57,266 --> 00:13:59,302
ya da örneğin radyolojistin sıkıntı

327
00:13:59,302 --> 00:14:02,151
yaratabilecek nodülleri göstermesi gibi.

328
00:14:02,151 --> 00:14:05,075
Bazen algoritma için sıkıntılı olabilir.

329
00:14:05,075 --> 00:14:07,095
Bu vaka da biraz kafası karışmış.

330
00:14:07,095 --> 00:14:09,507
Arabaların önleri ve 
arkaları karmakarışık.

331
00:14:09,507 --> 00:14:11,809
Burada biraz daha dikkatli olmalıyız,

332
00:14:11,809 --> 00:14:14,115
arkalara karşılık önleri elle seçmekte ve

333
00:14:14,115 --> 00:14:16,653
daha sonra bunun ilgilendiğimiz tipte

334
00:14:16,653 --> 00:14:20,310
bir grup olduğunu söylemekte.

335
00:14:21,570 --> 00:14:23,986
Bunu biraz yapıyoruz, 
biraz atlıyoruz bunu,

336
00:14:23,986 --> 00:14:26,270
sonra makine öğrenmesi algoritmasını

337
00:14:26,270 --> 00:14:27,500
bu yüzlerce kadar olan

338
00:14:27,500 --> 00:14:29,295
şeylere dayanarak eğitiyoruz

339
00:14:29,295 --> 00:14:31,198
ve daha iyi olmasını ümit ediyoruz.

340
00:14:31,198 --> 00:14:34,096
Bazı resimlerin solmaya
başladığını görebilirsiniz

341
00:14:34,096 --> 00:14:36,288
ve bize bazılarını kendisinin önceden

342
00:14:36,288 --> 00:14:38,712
nasıl anlaması gerektiğini
farkettiğini gösteriyor.

343
00:14:38,712 --> 00:14:41,341
Bu benzer resimler 
konseptini kullanabiliriz

344
00:14:41,341 --> 00:14:43,839
ve benzer resimleri 
kullanarak bilgisayarın

345
00:14:43,839 --> 00:14:45,612
bu noktada arabaların sadece

346
00:14:45,612 --> 00:14:47,547
önlerini bulabildiğini görebilirsiniz.

347
00:14:47,547 --> 00:14:50,011
Bu aşamada bilgisayar insana:

348
00:14:50,011 --> 00:14:52,245
"Tamam, peki, iyi iş çıkardın." diyebilir.

349
00:14:52,245 --> 00:14:55,550
Bazen, elbette, bu noktada bile

350
00:14:55,550 --> 00:14:58,560
grupların arasından seçmek zor.

351
00:14:58,930 --> 00:15:01,898
Bu durumda, bilgisayarın
biraz çevirmesine izin

352
00:15:01,898 --> 00:15:04,808
verdikten sonra bile sağ ve sol taraftaki

353
00:15:04,808 --> 00:15:07,854
resimlerin karmakarışık
olarak bulabiliriz.

354
00:15:07,854 --> 00:15:10,395
Yine bilgisayara bir takım
ipuçları verebiliriz,

355
00:15:10,395 --> 00:15:13,347
ve diyebiliriz ki :"Tamam, derin 
öğrenme algoritmasını

356
00:15:13,347 --> 00:15:15,569
kullanarak sağ ve sol tarafları mümkün

357
00:15:15,569 --> 00:15:18,201
olduğunca ayırabilecek 
bir projeksiyon bulmaya çalış. "

358
00:15:18,201 --> 00:15:20,481
Ve ipucunu verince başarılı oldu.

359
00:15:20,481 --> 00:15:23,139
Objeleri birbirinden 
ayırabilmek için gereken

360
00:15:23,139 --> 00:15:25,316
düşünme şeklini birlikte bulabildiler.

361
00:15:26,096 --> 00:15:28,206
Yani buradaki fikri anladınız.

362
00:15:29,646 --> 00:15:33,896
Buradaki durum; insanın
yerine bilgisayarın geçmesi

363
00:15:36,286 --> 00:15:39,068
değil birlikte çalışmaları.

364
00:15:39,068 --> 00:15:41,623
Burada yaptığımız ise; 6 ya da 7 kişilik

365
00:15:41,623 --> 00:15:45,068
bir takımın yaklaşık 7 
senede yapacağı bir şeyi,

366
00:15:45,068 --> 00:15:47,208
bir kişinin yaklaşık 15 dakikada

367
00:15:47,208 --> 00:15:49,718
yapacağı bir şeyle değiştirmek.

368
00:15:49,718 --> 00:15:53,547
Bu süreç yaklaşık 4 ya da
5 yineleme içeriyor.

369
00:15:53,547 --> 00:15:56,696
Gördüğünüz gibi şuan 1.5 milyon resmimizin

370
00:15:56,696 --> 00:15:58,718
%62 si doğru bir şekilde sınıflandırıldı.

371
00:15:58,718 --> 00:16:00,985
Gelinen noktada, oldukça kolay bir şekilde

372
00:16:00,985 --> 00:16:03,234
büyük bölümleri alıp hata olmadığına

373
00:16:03,234 --> 00:16:05,246
emin olmak için kontrol edebiliriz.

374
00:16:05,246 --> 00:16:08,121
Hata olan yerlerde ise
bilgisayara bildirebiliriz.

375
00:16:08,741 --> 00:16:12,128
Her farklı grup için bu tür
bir süreç kullanarak

376
00:16:12,128 --> 00:16:14,683
1.5 milyon görüntüyü sınıflandırmada

377
00:16:14,683 --> 00:16:16,861
%80 başarı yüzdesine çıktık.

378
00:16:17,611 --> 00:16:19,620
Bu noktada konu sadece

379
00:16:19,620 --> 00:16:21,250
doğru sınıflandırılmamış olan

380
00:16:21,250 --> 00:16:23,038
küçük numarayı bulmak ve

381
00:16:23,038 --> 00:16:25,691
sebebini anlamaya çalışmak üzerine.

382
00:16:25,811 --> 00:16:28,922
Bu yaklaşımı kullanarak; 15 dakikada

383
00:16:28,922 --> 00:16:31,928
%97' lik sınıflandırma oranına ulaştık.

384
00:16:31,928 --> 00:16:34,094
Bu tarz bir teknik bize çok önemli

385
00:16:34,094 --> 00:16:36,343
bir problemi çözmeye izin verebilir;

386
00:16:36,343 --> 00:16:39,087
dünyada tıbbi uzmanlığın
olmadığı yerlerde.

387
00:16:39,087 --> 00:16:41,290
Dünya Ekonomik Forumu'na göre;

388
00:16:41,290 --> 00:16:44,124
gelişen dünyada doktor
kıtlığı 10 ile 20 katı

389
00:16:44,124 --> 00:16:47,189
arasında ve 300 yıl alacaktır bu problemi

390
00:16:47,189 --> 00:16:50,448
çözmek için yeterli insan yetiştirmek.

391
00:16:50,448 --> 00:16:53,420
Düşünün ki derin öğrenme
yaklaşımını kullanarak

392
00:16:53,420 --> 00:16:56,539
verimliliklerini artırmaya
yardım edebilsek?

393
00:16:56,539 --> 00:16:58,983
Fırsatlar konusunda oldukça heycanlıyım.

394
00:16:58,983 --> 00:17:01,452
Aynı zamanda
problemlerle de ilgileniyorum.

395
00:17:01,452 --> 00:17:03,569
Buradaki problem ise; haritadaki

396
00:17:03,569 --> 00:17:05,563
her mavi alanda servisler

397
00:17:05,563 --> 00:17:07,757
istihdamın %80 den fazla.

398
00:17:07,757 --> 00:17:09,761
Servisler nedir?

399
00:17:09,761 --> 00:17:11,113
İşte servisler.

400
00:17:11,113 --> 00:17:13,453
Bunlar aynı zamanda bilgisayarın

401
00:17:13,453 --> 00:17:15,446
yapılma şeklini öğrendiği şeyler.

402
00:17:15,446 --> 00:17:17,983
Yani gelişen dünyadaki
istihdamın %80 'inin

403
00:17:17,983 --> 00:17:20,140
yaptığı şeyler aynı zamanda bilgisayarın

404
00:17:20,140 --> 00:17:22,138
nasıl yapılacağını öğrendiği şeyler.

405
00:17:22,138 --> 00:17:24,860
Bu ne anlama geliyor? 
Tamam, bir şey olmayacak.

406
00:17:24,860 --> 00:17:26,708
Başka işlerle yer değiştirilcekler.

407
00:17:26,708 --> 00:17:29,146
Örneğin; Veri bilimciler 
için daha fazla iş olacak.

408
00:17:29,146 --> 00:17:30,458
Aslında öyle değil.

409
00:17:30,458 --> 00:17:32,238
Veri bilimcilerin bunları yapmaları

410
00:17:32,238 --> 00:17:33,544
çok zamanlarını almaz.

411
00:17:33,544 --> 00:17:35,025
Örneğin; bu 4 algoritma da aynı

412
00:17:35,025 --> 00:17:36,594
adam tarafından geliştirildi.

413
00:17:36,594 --> 00:17:39,206
Yani eğer; daha önceden de olmuştu,

414
00:17:39,206 --> 00:17:41,753
yeni işlerin gelip yer değiştirdiği

415
00:17:41,753 --> 00:17:43,948
zamanların sonuçlarını gördük.

416
00:17:43,948 --> 00:17:45,879
Bu yeni işlere ne olacak?

417
00:17:45,879 --> 00:17:48,205
Bunu kestirmek bizim için oldukça zor

418
00:17:48,205 --> 00:17:51,094
çünkü insan performansı 
bu şekilde kademeli olarak

419
00:17:51,094 --> 00:17:53,499
artıyor ama artık biz bir sisteme,
derin öğrenmeye

420
00:17:53,499 --> 00:17:55,999
sahibiz yani katlanarak
büyüme kapasitesine

421
00:17:55,999 --> 00:17:57,586
sahip olduğunu biliyoruz.

422
00:17:57,586 --> 00:17:58,536
Ve burdayız.

423
00:17:58,536 --> 00:18:01,027
Şu anda, etrafımızdaki
şeyleri görüyoruz ve:

424
00:18:01,027 --> 00:18:03,135
"Bilgisayarlar hala aptal." değil mi?

425
00:18:03,135 --> 00:18:05,037
Ama 5 yıllık süre içinde bilgisayarlar

426
00:18:05,037 --> 00:18:06,786
bu çizelgenin dışında olacak.

427
00:18:06,786 --> 00:18:10,100
Yani bu kabiliyeti hemen
düşünmeye başlamalıyız.

428
00:18:10,100 --> 00:18:12,403
Bunu daha önceden görmüştük, elbette.

429
00:18:12,403 --> 00:18:14,782
Sanayi devriminde, motorlar sayesinde

430
00:18:14,782 --> 00:18:17,292
kapasitede kademe atlamayı gördük.

431
00:18:17,292 --> 00:18:19,594
Mesele şu ki, yine de bir süre sonra

432
00:18:19,594 --> 00:18:20,632
işler düzeliyor.

433
00:18:20,632 --> 00:18:22,770
Sosyal bozulma vardı ama bir kez

434
00:18:22,770 --> 00:18:24,838
motorlar güç üretmek için kullanıldı

435
00:18:24,838 --> 00:18:28,024
ve tüm durumlar, her şey düzene oturdu.

436
00:18:28,024 --> 00:18:31,067
Makine Öğrenmesi Devrimi
Sanayi devriminden

437
00:18:31,067 --> 00:18:32,830
çok daha farklı olacak çünkü

438
00:18:32,830 --> 00:18:35,570
Makine Öğrenmesi Devrimi 
asla durulmayacak.

439
00:18:35,570 --> 00:18:38,490
Bilgisayarlar entelektüel 
aktiviteler de iyiye gittikçe,

440
00:18:38,490 --> 00:18:40,189
entelektüel kapasitede daha

441
00:18:40,189 --> 00:18:42,249
iyi olan bilgisayarlar üretilecek.

442
00:18:42,249 --> 00:18:45,146
Yani bu dünyanın daha önce tanık olmadığı

443
00:18:45,146 --> 00:18:47,496
türde bir değişim olacak bu yüzden

444
00:18:47,496 --> 00:18:49,869
neyin mümkün olduğu konusunda ki

445
00:18:49,869 --> 00:18:51,297
önceki anlayışınız farklı.

446
00:18:51,297 --> 00:18:52,848
Şimdiden bizi etkiliyor.

447
00:18:52,848 --> 00:18:56,304
Son 25 yılda, kapital üretim arttıkça

448
00:18:56,304 --> 00:19:00,608
işçi verimliliği sabitti
hatta biraz inişteydi.

449
00:19:01,298 --> 00:19:03,357
Bu yüzden bu konuyu tartışmaya

450
00:19:03,357 --> 00:19:04,908
başlamamızı istiyorum.

451
00:19:04,908 --> 00:19:06,895
İnsanlara bu durum hakkında çoğu kez

452
00:19:06,895 --> 00:19:09,485
bahsettiğimde, insanlar 
oldukça ilgisiz olabiliyor.

453
00:19:09,485 --> 00:19:12,028
Bilgisayarlar gerçek anlamda düşünemez,

454
00:19:12,028 --> 00:19:14,290
duygusal davranmaz, şiirden anlamaz,

455
00:19:14,290 --> 00:19:16,400
nasıl çalıştıklarını tam
olarak anlamıyoruz.

456
00:19:16,400 --> 00:19:17,330
Ne fark eder?

457
00:19:17,330 --> 00:19:19,560
Bilgisayarlar şu an 
insanların ücret alarak

458
00:19:19,560 --> 00:19:22,440
zamanlarının çoğunu
harcadıkları şeyleri yapabiliyor.

459
00:19:22,440 --> 00:19:25,930
O zaman sosyal ve ekonomik
yapımızı nasıl uyduracağımızı

460
00:19:25,930 --> 00:19:28,180
düşünmeye başlamamızın
ve bu yeni gerçekliğin

461
00:19:28,180 --> 00:19:30,460
farkında olmamızın tam zamanı.

462
00:19:30,460 --> 00:19:31,400
Teşekkürler.

463
00:19:31,400 --> 00:19:32,190
(Alkışlar)