1 00:00:00,350 --> 00:00:01,880 Eskiden bilgisayarınıza 2 00:00:01,880 --> 00:00:04,453 yeni bir şeyler yaptırmak isteseniz 3 00:00:04,453 --> 00:00:06,257 programlamanız gerekirdi. 4 00:00:06,257 --> 00:00:08,898 Şimdi, programlama; burada hiç yapmayanlar 5 00:00:08,898 --> 00:00:11,950 için söylüyorum, her adımı, her detayı 6 00:00:11,950 --> 00:00:15,317 bilgisayarın yapmasını istediğin her şeyi amacına 7 00:00:15,317 --> 00:00:18,869 ulaşman için tasarlaman gerekir. 8 00:00:18,869 --> 00:00:21,595 Nasıl yapacağını bilmediğin bir şeyi 9 00:00:21,595 --> 00:00:24,648 yapmak istiyorsan bu çok zorlu olacak. 10 00:00:24,648 --> 00:00:28,131 Arthur Samuel de bunu yaptı. 11 00:00:28,131 --> 00:00:31,548 1956'da bilgisayarının onu 12 00:00:31,548 --> 00:00:34,548 damada yenebilmesini istiyordu. 13 00:00:34,548 --> 00:00:37,108 Her detayıyla nasıl bir program tasarlayarak 14 00:00:37,108 --> 00:00:40,594 damada senden daha iyi olmasını sağlayabilirsin? 15 00:00:40,594 --> 00:00:42,116 Bu soruna bir çözüm buldu: 16 00:00:42,116 --> 00:00:45,840 Binlerce kez bilgisayarıyla dama oynayacak 17 00:00:45,840 --> 00:00:48,364 ve böylece bilgisayara damayı öğrenecekti. 18 00:00:48,364 --> 00:00:51,544 Bu işe yaradı ve 1962'de bilgisayar 19 00:00:51,544 --> 00:00:55,561 Connecticut eyaleti şampiyonunu yendi. 20 00:00:55,561 --> 00:00:58,534 Bu şekilde Arthur Samuel, makine öğrenmenin 21 00:00:58,534 --> 00:01:00,251 fikir öncüsüydü ve ona borçluyum, 22 00:01:00,251 --> 00:01:03,014 çünkü bir makine öğrenimi uygulayıcısıyım. 23 00:01:03,014 --> 00:01:04,479 200 bini aşkın uygulayıcıyı 24 00:01:04,479 --> 00:01:07,867 biraraya getiren Kaggle'ın başkanıydım. 25 00:01:07,867 --> 00:01:09,925 Kaggle yarışmalar düzenleyip çözülememiş 26 00:01:09,925 --> 00:01:13,633 problemleri çözmeye çalışıyordu ve 27 00:01:13,633 --> 00:01:17,470 yüzlerce kez başarılı oldular. 28 00:01:17,470 --> 00:01:19,940 Bu açıdan bakıldığında, makine öğreniminin 29 00:01:19,940 --> 00:01:23,890 geçmişte, günümüzde ve gelecekte planlanan 30 00:01:23,890 --> 00:01:26,252 çalışmaları hakkında çok şey öğrendim. 31 00:01:26,252 --> 00:01:27,726 Ticari anlamda belki de 32 00:01:27,726 --> 00:01:29,200 makine öğreniminin 33 00:01:29,200 --> 00:01:30,675 ilk başarısı Google'dır. 34 00:01:30,675 --> 00:01:33,494 Google bilgisayar algoritması ile 35 00:01:33,494 --> 00:01:35,536 bilgilere erişmeyi mümkün kılar ve 36 00:01:35,536 --> 00:01:38,437 bu algoritma makine öğrenimini temel alır. 37 00:01:38,437 --> 00:01:42,317 Bugüne kadar birçok ticari olarak başarılı uygulaması oldu. 38 00:01:42,317 --> 00:01:44,773 Amazon, Netflix gibi bir çok 39 00:01:44,773 --> 00:01:46,570 başarılı şirket makine öğrenimini 40 00:01:46,570 --> 00:01:47,876 ürünlerini ve filmlerini 41 00:01:47,876 --> 00:01:49,896 satmak için kullanmışlardır. 42 00:01:49,896 --> 00:01:51,703 Bu bazen ürkütücü olabilir. 43 00:01:51,703 --> 00:01:53,917 LinkedIn ve Facebook gibi şirketler bazen size 44 00:01:53,917 --> 00:01:56,251 tanıyor olabileceğiniz kişileri gösterir ve siz 45 00:01:56,251 --> 00:01:58,228 bunu nasıl yaptığını bilemezsiniz; işte 46 00:01:58,228 --> 00:02:01,195 bu makine öğreniminin eseridir. 47 00:02:01,195 --> 00:02:04,152 Bu sistem, programlanmak yerine datadan 48 00:02:04,152 --> 00:02:07,399 öğrenen algoritmalardan oluşur. 49 00:02:07,399 --> 00:02:09,877 Bu IBM'in Watson ile Jeopardy yarışmasında 50 00:02:09,877 --> 00:02:13,739 oldukça zor ve karışık soruları doğru 51 00:02:13,739 --> 00:02:16,964 cevaplayarak nasıl iki dünya şampiyonunu 52 00:02:16,964 --> 00:02:19,799 yenmeyi başardığını açıklar. 53 00:02:19,799 --> 00:02:23,034 İnsansız arabalar da bu sistem ile çalışır. 54 00:02:23,034 --> 00:02:25,856 Yaya ile ağaç arasındaki farkı söylemek 55 00:02:25,856 --> 00:02:28,488 isterseniz buyrun, söyleyin bu çok önemli. 56 00:02:28,488 --> 00:02:31,075 Bu programların elle nasıl yazıldığını 57 00:02:31,075 --> 00:02:34,072 bilmiyoruz ama makine öğrenimi ile mümkün. 58 00:02:34,072 --> 00:02:36,110 Ve bu arabalar bir düz yolda 59 00:02:36,110 --> 00:02:39,178 kaza yapmadan 1 milyon mili aştı. 60 00:02:40,798 --> 00:02:42,326 Böylece bilgisayarların, öğrenebildiğini 61 00:02:42,326 --> 00:02:44,110 ve bazen bizim yapmayı bilmediğimiz 62 00:02:44,110 --> 00:02:46,010 şeyleri yapmayı öğrenebildiklerini 63 00:02:46,010 --> 00:02:48,848 veya bizden bunları bizden daha 64 00:02:48,848 --> 00:02:51,733 iyi yapabileceklerini görüyoruz. 65 00:02:51,733 --> 00:02:54,478 Makine öğreniminin en iyi örneklerini 66 00:02:54,478 --> 00:02:57,650 Kaggle'da yürüttüğümüz bir projede gördüm: 67 00:02:57,940 --> 00:03:01,911 Toronto Üniversitesi'nden Geoffrey Hinton 68 00:03:01,911 --> 00:03:03,840 ve ekibi otomatik uyuşturucu tespiti 69 00:03:03,840 --> 00:03:06,130 alanında yarışmayı kazandı. 70 00:03:06,140 --> 00:03:07,140 Burada ilginç olansa; 71 00:03:07,140 --> 00:03:10,277 Merck veya uluslararası akademik çevrenin 72 00:03:10,277 --> 00:03:12,540 geliştirdiği bütün algoritmaları kimya 73 00:03:12,540 --> 00:03:15,061 ve biyoloji gibi alanlarda geçmişi 74 00:03:15,061 --> 00:03:18,061 olmayan kişilerin algoritmayı çözmeleri değil bunu 75 00:03:18,061 --> 00:03:20,230 2 haftada yapmış olmaları. 76 00:03:20,230 --> 00:03:21,611 Peki bunu nasıl başardılar? 77 00:03:22,421 --> 00:03:25,342 Derin Öğrenme denilen olağanüstü bir algoritma kullandılar. 78 00:03:25,342 --> 00:03:28,291 Bu o kadar önemli bir başarıydı ki birkaç 79 00:03:28,291 --> 00:03:31,412 hafta sonra New York Times'ın kapağında yer aldı. 80 00:03:31,412 --> 00:03:34,147 Sol kenarda Geoffrey Hinton vardı. 81 00:03:34,147 --> 00:03:37,558 Derin Öğrenme, insan beyninin çalışmasından 82 00:03:37,558 --> 00:03:39,960 ilham alınarak oluşturulmuş bir algoritmadır 83 00:03:39,960 --> 00:03:43,971 ve kapasitesi konusunda teorik kısıtlamalar içermez. 84 00:03:43,971 --> 00:03:46,474 Ona ne kadar çok veri ve zaman verirseniz 85 00:03:46,474 --> 00:03:48,276 o kadar iyi sonuçlar elde edersiniz. 86 00:03:48,276 --> 00:03:50,615 New York Times'ın haberinde derin öğrenme 87 00:03:50,615 --> 00:03:51,615 ile elde edilen 88 00:03:51,615 --> 00:03:52,857 bir sonuç daha vardı; 89 00:03:52,857 --> 00:03:54,147 onu da şimdi göstereceğim: 90 00:03:54,977 --> 00:03:56,189 Sonuca göre: 91 00:03:56,189 --> 00:03:58,500 Bilgisayarlar dinleyebilir 92 00:03:58,500 --> 00:04:00,510 ve anlayabilir. 93 00:04:00,820 --> 00:04:03,400 Richard Rashid:"Bu yöntemde 94 00:04:03,400 --> 00:04:05,047 son aşamada gelebilmek 95 00:04:05,047 --> 00:04:06,913 istediğim nokta 96 00:04:06,913 --> 00:04:09,913 sizinle Çince konuşmak. 97 00:04:10,961 --> 00:04:12,306 Olay şu ki; 98 00:04:12,306 --> 00:04:15,058 bir çok Çinliden çok miktarda 99 00:04:15,058 --> 00:04:18,378 bilgi alma imkanımız oldu 100 00:04:18,378 --> 00:04:21,408 ve Çince bir metni alan ve 101 00:04:21,408 --> 00:04:24,908 Çin diline çeviren yani yazıyı 102 00:04:24,908 --> 00:04:27,881 konuşmaya dönüştüren bir sistem oluşturduk. 103 00:04:27,881 --> 00:04:31,509 Sonra konuşmamın bir saatlik kısmını aldık 104 00:04:31,509 --> 00:04:33,720 ve standart metni konuşma sistemine 105 00:04:33,720 --> 00:04:35,070 modüle ettik sonuç olarak 106 00:04:35,070 --> 00:04:37,314 benim konuşmam gibi olmalıydı. 107 00:04:37,314 --> 00:04:38,904 Sonuç mükemmel olmadı elbette. 108 00:04:38,904 --> 00:04:41,552 Hatta bir çok hata vardı. 109 00:04:41,552 --> 00:04:44,036 (Çince) 110 00:04:44,036 --> 00:04:48,153 (Alkışlar) 111 00:04:49,446 --> 00:04:53,022 Bu alanda daha çok çalışılması gerekiyor. 112 00:04:53,022 --> 00:04:56,667 (Çince) 113 00:04:56,667 --> 00:05:00,100 (Alkışlar) 114 00:05:01,345 --> 00:05:04,744 Bu, Çinde makine öğrenimi konferansıydı. 115 00:05:04,744 --> 00:05:07,114 Genelde akademik konferanslarda 116 00:05:07,114 --> 00:05:09,011 spontane alkışlamalar olmaz ancak 117 00:05:09,011 --> 00:05:12,407 TEDx konferanslarında rastlanabilir. 118 00:05:12,407 --> 00:05:13,892 Burada gördüğünüz her şey 119 00:05:13,892 --> 00:05:15,862 derin öğrenme ile gerçekleşiyor. 120 00:05:15,862 --> 00:05:17,007 (Alkışlar) Teşekkürler. 121 00:05:17,007 --> 00:05:19,289 İngilizce uyarlama derin öğrenme ile yapıldı. 122 00:05:19,289 --> 00:05:22,701 Çince çeviri ve sağ üstteki metin derin öğrenmeyle, 123 00:05:22,701 --> 00:05:26,008 ve yine sesin entegre edilmesi de derin öğrenme ile yapıldı. 124 00:05:26,008 --> 00:05:28,972 Derin öğrenme alışılmışın dışında bir şey. 125 00:05:28,972 --> 00:05:30,242 Tek bir algoritma neredeyse 126 00:05:30,242 --> 00:05:32,341 her şeyi yapabilecek gibi duruyor 127 00:05:32,341 --> 00:05:35,242 ve geçen sene öğrendim ki görmeyi de öğrenmiş. 128 00:05:35,242 --> 00:05:37,628 Almanya'da Alman Trafik İşaretleri Karşılaştırması 129 00:05:37,628 --> 00:05:40,225 olarak adlandırılan yarışmada 130 00:05:40,225 --> 00:05:43,618 derin öğrenme bu gibi işaretleri algılamayı öğrendi. 131 00:05:43,618 --> 00:05:45,712 Diğer algoritmalardan daha iyi algılamakla 132 00:05:45,712 --> 00:05:48,170 kalmayıp, yarışmanın sıralamasına bakıldığında 133 00:05:48,170 --> 00:05:50,189 insanlardan da daha iyi tanıdı; 134 00:05:50,189 --> 00:05:52,041 hatta iki katı daha fazla. 135 00:05:52,041 --> 00:05:54,037 2011 yılında, bilgisayarların insanlardan 136 00:05:54,037 --> 00:05:57,442 daha iyi görebildiğini anladık. 137 00:05:57,442 --> 00:05:59,491 O zamandan beri sayısız çalışma yapıldı. 138 00:05:59,491 --> 00:06:02,505 2012'de Google; Youtube videolarını izleyen 139 00:06:02,505 --> 00:06:05,270 ve aylık 16.000 bilgisayardaki veriyi sıkıştırabilen 140 00:06:05,270 --> 00:06:08,187 derin öğrenme algoritmaları olduğunu açıkladı. 141 00:06:08,187 --> 00:06:11,028 Ayrıca bilgisayarlar ayrı ayrı insan ve kedi 142 00:06:11,028 --> 00:06:14,027 gibi konseptleri izleyerek öğrendi. 143 00:06:14,027 --> 00:06:16,379 Bu insanların öğrenmesine benziyor. 144 00:06:16,379 --> 00:06:19,119 İnsanlar gördüklerinin anlatılmasıyla değil 145 00:06:19,119 --> 00:06:22,300 kendileri başlarına öğrenirler. 146 00:06:22,460 --> 00:06:25,949 Yine 2012'de az önce gördüğümüz Geoffrey Hinton 147 00:06:25,949 --> 00:06:30,397 1.5 milyon fotoğrafa bakarak neyin fotoğrafları 148 00:06:30,397 --> 00:06:32,368 olduğunu çözmeye çalışarak 149 00:06:32,368 --> 00:06:35,126 popüler olan ImageNet yarışmasını kazandı. 150 00:06:35,126 --> 00:06:37,259 2014 yılında görüntü tanımada 151 00:06:37,259 --> 00:06:38,789 %6 lık hata payına düştük. 152 00:06:38,789 --> 00:06:41,268 Bu da insanlardan daha iyi. 153 00:06:41,268 --> 00:06:44,436 Makinalar gerçekten bu alanda harika işler yapıyor 154 00:06:44,436 --> 00:06:47,206 ve artık endüstride de kullanılıyor. 155 00:06:47,206 --> 00:06:49,824 Mesela Google, geçen yıl Fransa'daki 156 00:06:49,824 --> 00:06:52,390 her bir konumu 2 saatte haritada 157 00:06:52,390 --> 00:06:54,100 işaretlediğini duyurdu ve 158 00:06:54,100 --> 00:06:57,089 cadde numaralarını okumak ve tanımlamak 159 00:06:57,089 --> 00:06:58,979 için cadde görüntülerini 160 00:06:58,979 --> 00:07:02,039 bir derin öğrenme algoritmasında kullandılar. 161 00:07:02,039 --> 00:07:04,849 Bunun önceleri ne kadar sürdüğünü düşünün: 162 00:07:04,849 --> 00:07:07,029 binlerce insan, bir çok yıl. 163 00:07:08,759 --> 00:07:10,144 Bu Çin'de de oldu. 164 00:07:10,144 --> 00:07:14,426 Baidu bir çeşit Çin'in Google'ı, sanırım, 165 00:07:14,426 --> 00:07:16,708 sol üst köşede gördüğünüz Baidu'nun 166 00:07:16,708 --> 00:07:18,322 derin öğrenme sistemine 167 00:07:18,322 --> 00:07:20,794 yüklediğim görüntünün örneği 168 00:07:20,794 --> 00:07:23,548 ve arkaplanda ise sistemin görüntüyü 169 00:07:23,548 --> 00:07:26,637 tanımlayıp benzerlerini bulduğunu görebilirsiniz. 170 00:07:26,637 --> 00:07:29,213 Benzer resimler gerçekten de benzer arka planlara, 171 00:07:29,213 --> 00:07:31,059 benzer yüz açılarına sahip 172 00:07:31,059 --> 00:07:32,777 hatta bazılarında dilleri dışarıda. 173 00:07:32,777 --> 00:07:35,985 Tam olarak web sayfasının metnine bakmak gibi değil. 174 00:07:35,985 --> 00:07:38,235 Tek yaptığım resim yüklemekti. 175 00:07:38,235 --> 00:07:40,027 O halde gördüklerini anlayabilen ve 176 00:07:40,027 --> 00:07:42,368 bu sayede gerçek zamanlı olarak yüz 177 00:07:42,368 --> 00:07:44,432 milyonlarca görüntüyü veritabanlarında 178 00:07:44,432 --> 00:07:46,306 arayabilen bilgisayarlar var. 179 00:07:46,306 --> 00:07:49,436 Peki bilgisayarların görmesi ne anlama geliyor? 180 00:07:49,436 --> 00:07:51,453 Sadece görebilmesini sağlamak değil 181 00:07:51,453 --> 00:07:53,852 aslında derin öğrenme bundan daha fazlasını yaptı. 182 00:07:53,852 --> 00:07:56,570 Bu gibi karmaşık ve incelikli cümleler 183 00:07:56,570 --> 00:07:59,394 artık derin öğrenme algoritmalarıyla anlaşılabilir. 184 00:07:59,394 --> 00:08:00,697 Gördüğünüz üzere; 185 00:08:00,697 --> 00:08:03,465 Stanford-tabanlı sistem, üstteki kırmızı 186 00:08:03,465 --> 00:08:07,384 noktanın negatif bir his ifade ettiğini anlıyor. 187 00:08:07,384 --> 00:08:09,072 Derin öğrenme hatta 188 00:08:09,072 --> 00:08:11,283 cümlelerin ne hakkında olduğunu 189 00:08:11,283 --> 00:08:13,041 ve anlamlarını anlamada insan 190 00:08:13,041 --> 00:08:15,437 performansına yaklaşmış durumda. 191 00:08:15,777 --> 00:08:18,425 Aynı zamanda derin öğrenme Çin 192 00:08:18,425 --> 00:08:22,131 anadil seviyesinde Çince okumada da kullanıldı. 193 00:08:22,131 --> 00:08:24,652 Bu algoritma Çince konuşamayan ve 194 00:08:24,652 --> 00:08:27,701 anlamayan insanlar tarafından İsviçre'de geliştirildi. 195 00:08:27,701 --> 00:08:30,568 Bahsettiğim gibi derin öğrenme kullanma bu işte 196 00:08:30,568 --> 00:08:33,788 dünyadaki en iyi sistem yerel insanların 197 00:08:33,788 --> 00:08:36,718 anlama performansına göre bile. 198 00:08:36,718 --> 00:08:39,682 Bu sistem şirketimde oluşturuldu 199 00:08:39,682 --> 00:08:42,448 ve bu tarz şeyleri bir arada toplamayı gösteriyor. 200 00:08:42,448 --> 00:08:44,699 Bu resimlere eklenmiş metin yok ve 201 00:08:44,699 --> 00:08:47,031 ben buraya cümle yazarken gerçek 202 00:08:47,031 --> 00:08:49,510 zamanlı olarak resimleri algılıyor, 203 00:08:49,510 --> 00:08:51,789 ne hakkında olduklarını çözüyor ve 204 00:08:51,789 --> 00:08:54,352 yazdığım metne benzer resimleri buluyor. 205 00:08:54,352 --> 00:08:57,108 Görüyorsunuz, bu aslında cümlelerimi anlama 206 00:08:57,108 --> 00:08:59,332 ve bu resimleri anlama. 207 00:08:59,332 --> 00:09:01,891 Benzerini Google'da gördüğünüzü düşünüyorum; 208 00:09:01,891 --> 00:09:04,666 bir şeyleri yazarken size resimler gösterir ama 209 00:09:04,666 --> 00:09:08,090 asıl yaptığı web sayfalarında yazdıklarınızı aramaktır. 210 00:09:08,090 --> 00:09:11,091 Bu aslında resimleri anlamaktan oldukça farklı. 211 00:09:11,091 --> 00:09:13,843 Bu son bir kaç ayda ilk kez 212 00:09:13,843 --> 00:09:16,543 bilgisayarların yapabildiği bir şey. 213 00:09:17,091 --> 00:09:19,192 O halde görüyoruz ki bilgisayarlar 214 00:09:19,192 --> 00:09:21,182 görebilmekle kalmıyor aynı zamanda 215 00:09:21,182 --> 00:09:22,832 okuyabiliyor ve zaten duyduklarını 216 00:09:22,832 --> 00:09:24,947 anlayabildiklerini de göstermiştik. 217 00:09:24,947 --> 00:09:26,707 Belki yazabildiklerini söylesem 218 00:09:26,707 --> 00:09:28,537 artık şaşırtıcı gelmez. 219 00:09:28,537 --> 00:09:30,927 İşte burada dün derin öğrenme algoritmasıyla 220 00:09:30,927 --> 00:09:33,607 oluşturduğum metin. 221 00:09:33,607 --> 00:09:37,159 Ve burada algoritma tarafından geliştirilen metinler var. 222 00:09:37,159 --> 00:09:40,102 Bu cümlelerin her biri resimleri tanımlamak 223 00:09:40,102 --> 00:09:42,892 için derin öğrenme algoritmasıyla geliştirildi . 224 00:09:42,892 --> 00:09:45,202 Algoritma daha önce siyah tişörtlü 225 00:09:45,202 --> 00:09:47,356 gitar çalan birini hiç görmemişti. 226 00:09:47,356 --> 00:09:50,170 Önceden adamı görmüştü, siyahi görmüştü, 227 00:09:50,170 --> 00:09:52,709 gitarı görmüştü ama bu resmin roman 228 00:09:52,709 --> 00:09:55,111 tasvirini ayrı olarak yaptı. 229 00:09:56,231 --> 00:09:58,541 Hala tam olarak insan performansında 230 00:09:58,541 --> 00:09:59,701 değiliz ama yakınız. 231 00:09:59,701 --> 00:10:02,260 Testlerde 1/4 oranında insanlar, bilgisayar 232 00:10:02,260 --> 00:10:04,714 tarafından oluşturulan yazıları seçiyor. 233 00:10:04,714 --> 00:10:06,826 Bu sistem şuan sadece 2 haftalık 234 00:10:06,826 --> 00:10:08,855 ama muhtemelen gelecek yıl içerisinde 235 00:10:08,855 --> 00:10:10,651 bu oranlarda devam ederse 236 00:10:10,651 --> 00:10:12,321 algoritma insan performansını 237 00:10:12,321 --> 00:10:14,172 hayli geçmiş olacak. 238 00:10:14,172 --> 00:10:16,534 Yani bilgisayarlar yazabiliyor da. 239 00:10:16,534 --> 00:10:18,073 Tüm bunları birleştirdik 240 00:10:18,073 --> 00:10:20,088 ve durum heyecan verici fırsatlar yarattı. 241 00:10:20,088 --> 00:10:23,170 Örneğin; sağlık alanında Boston'da bir takım, 242 00:10:23,170 --> 00:10:25,675 doktorların kanser teşhisine yardımcı 243 00:10:25,675 --> 00:10:28,614 düzinelerce kliniksel olarak ilişkili tümör 244 00:10:28,614 --> 00:10:31,540 özellikleri keşfettiklerini duyurdu. 245 00:10:31,810 --> 00:10:33,906 Benzer olarak Stanford' da 246 00:10:33,906 --> 00:10:36,889 büyüme altındaki dokulara bakan bir grup; 247 00:10:36,889 --> 00:10:40,350 kanser hastalarının sağkalım oranlarını ölçmede 248 00:10:40,350 --> 00:10:42,772 patoloji uzmanlarından daha iyi olan, 249 00:10:42,772 --> 00:10:46,829 makine öğrenmesine dayalı bir sistem geliştirdi. 250 00:10:46,829 --> 00:10:49,224 Bu iki durumda da tahminlerin daha 251 00:10:49,224 --> 00:10:51,296 hatasız olmasının yanı sıra kavrama 252 00:10:51,296 --> 00:10:53,701 açısından güçlü yeni bir bilim geliştirdiler. 253 00:10:53,701 --> 00:10:55,876 Radyoloji vakasındakiler insanların 254 00:10:55,876 --> 00:10:58,258 anlayabileceği yeni kliniksel indikatörlerdi. 255 00:10:58,258 --> 00:11:00,318 Patoloji vakasında ise bilgisayar, 256 00:11:00,318 --> 00:11:03,888 tanı yapılırken kanser etrafındaki hücrelerin kanser 257 00:11:03,888 --> 00:11:09,260 hücreleri kadar önemli olduğunu keşfetti. 258 00:11:09,260 --> 00:11:11,851 Bu patoloji uzmanlarına onlarca 259 00:11:11,851 --> 00:11:14,413 yıldır öğretilenlerin tam tersi. 260 00:11:15,423 --> 00:11:17,754 Bu iki vakada da tıp uzmanları ve 261 00:11:17,754 --> 00:11:20,075 makine öğrenmesi uzmanlarının 262 00:11:20,075 --> 00:11:22,184 birleşip geliştirdiği bir sistemdi 263 00:11:22,184 --> 00:11:24,364 ancak geçen yıl bunu da geçtik. 264 00:11:24,364 --> 00:11:26,587 Bu örnek mikroskop altındaki insan 265 00:11:26,587 --> 00:11:30,412 dokusunun kanserli bölgelerini tanımlamak üzerine. 266 00:11:30,412 --> 00:11:33,314 Burada gösterilen sistem bu alanları daha 267 00:11:33,314 --> 00:11:35,860 isabetli olarak belirleyebiliyor, 268 00:11:35,860 --> 00:11:38,135 ya da en az patoloji uzmanı kadar 269 00:11:38,135 --> 00:11:40,583 ama tümüyle derin öğrenme kullanılarak ve 270 00:11:40,583 --> 00:11:42,830 herhangi bir tıp geçmişi olmayan 271 00:11:42,830 --> 00:11:44,651 insanlar tarafından geliştirildi. 272 00:11:44,651 --> 00:11:47,578 Benzer olarak nöron segmentasyonu da. 273 00:11:47,578 --> 00:11:49,298 Şu an nöronları insanlar kadar 274 00:11:49,298 --> 00:11:50,948 isabetli segmentleyebiliyoruz 275 00:11:50,948 --> 00:11:52,355 ki bu sistem derin öğrenme 276 00:11:52,355 --> 00:11:53,985 kullanılarak hiç bir tıbbi geçmişi 277 00:11:53,985 --> 00:11:55,901 olmayan kişiler tarafından geliştirildi. 278 00:11:57,381 --> 00:11:59,941 Aynı şekilde ben de, hiç bir tıbbi geçmişim 279 00:11:59,941 --> 00:12:02,070 olmadığı halde medikal alanında 280 00:12:02,070 --> 00:12:04,830 yeni bir şirket açabilirim ki açtım da. 281 00:12:05,660 --> 00:12:08,982 Şirketi açma konusunda biraz korkmuştum ama 282 00:12:08,982 --> 00:12:12,442 teoride bu veri analiz tekniklerini kullanarak 283 00:12:12,442 --> 00:12:15,742 yararlı ilaçlar yapmak mümkün görünüyordu. 284 00:12:15,752 --> 00:12:17,942 Neyse ki geri dönüşler harikaydı 285 00:12:17,942 --> 00:12:20,292 sadece medya değil tıp çevresinde de 286 00:12:20,292 --> 00:12:22,862 ki aynı zamanda çok da destekleyicilerdi. 287 00:12:22,862 --> 00:12:25,718 Teoride, medikal sürecin orta bölümünü alıp 288 00:12:25,718 --> 00:12:29,172 mümkün olduğunca veri analizine çevirerek 289 00:12:29,172 --> 00:12:32,171 doktorları en iyi oldukları alana yoğunlaştırabiliriz. 290 00:12:33,071 --> 00:12:34,874 Bir örnek vermek istiyorum. 291 00:12:34,874 --> 00:12:36,989 Yeni bir tıbbi teşhis testini 292 00:12:36,989 --> 00:12:40,139 üretmek 15 dakikamızı alır 293 00:12:40,139 --> 00:12:42,341 ve gerçek zamanlı olarak da göstereceğim 294 00:12:42,341 --> 00:12:44,105 ama bazı parçalarını keserek 295 00:12:44,105 --> 00:12:45,715 süreci 3 dakikaya indirdim. 296 00:12:45,715 --> 00:12:48,629 Tıbbi teşhis testini oluşturmayı göstermek yerine 297 00:12:48,629 --> 00:12:50,206 daha anlaşılır olduğu için 298 00:12:50,206 --> 00:12:53,867 araba görüntülerini tanımlama testini göstereceğim. 299 00:12:53,867 --> 00:12:57,146 Yaklaşık 1.5 milyon araba resmiyle başlıyoruz ve 300 00:12:57,146 --> 00:12:59,228 çekildikleri açılara göre onları 301 00:12:59,228 --> 00:13:02,519 ayırabilecek bir şey yaratmak istiyorum. 302 00:13:02,519 --> 00:13:04,705 Bütün resimler etiketsiz bu yüzden 303 00:13:04,705 --> 00:13:06,328 sıfırdan başlamak zorundayım. 304 00:13:07,028 --> 00:13:09,626 Derin öğrenme algoritmamızla resimlerdeki 305 00:13:09,626 --> 00:13:12,471 yapıların alanlarını otomatik olarak algılayabilir. 306 00:13:12,471 --> 00:13:14,198 Güzel olan, şu andan itibaren 307 00:13:14,198 --> 00:13:15,988 insan ile bilgisayar artık ortak çalışabilir. 308 00:13:15,988 --> 00:13:18,616 Gördüğünüz gibi insan burada bilgisayara; 309 00:13:18,616 --> 00:13:20,811 daha sonra deneyip, algoritmasını 310 00:13:20,811 --> 00:13:22,881 geliştirmede kullanması için 311 00:13:22,881 --> 00:13:25,131 ilgi alanlarını söylüyor. 312 00:13:25,131 --> 00:13:27,121 Bu derin öğrenme sistemleri 313 00:13:27,121 --> 00:13:28,961 aslında 16.000 boyutlu uzay 314 00:13:28,961 --> 00:13:30,797 ve gördüğünüz gibi bilgisayar burada 315 00:13:30,797 --> 00:13:33,009 uzay boyunca döndürüp yeni yapı 316 00:13:33,009 --> 00:13:35,001 alanları bulmaya çalışıyor. 317 00:13:35,001 --> 00:13:38,052 Başarıyla yapınca da daha sonra bunu süren 318 00:13:38,052 --> 00:13:40,786 kişi ilgi çekici olan alanları gösteriyor. 319 00:13:40,786 --> 00:13:44,298 Ve burada bilgisayar başarılı bir şekilde alanları buldu. 320 00:13:44,298 --> 00:13:45,770 Örneğin: Açılar. 321 00:13:45,770 --> 00:13:47,776 Bu süreç devam ederken, 322 00:13:47,776 --> 00:13:50,106 bilgisayara aradığımız yapı türlerini 323 00:13:50,106 --> 00:13:51,844 adım adım söylüyoruz. 324 00:13:51,844 --> 00:13:54,116 Teşhis testinde pataloji uzmanının 325 00:13:54,116 --> 00:13:57,266 patoz alanlarını tanımlaması gibi düşünebilirsin 326 00:13:57,266 --> 00:13:59,302 ya da örneğin radyolojistin sıkıntı 327 00:13:59,302 --> 00:14:02,151 yaratabilecek nodülleri göstermesi gibi. 328 00:14:02,151 --> 00:14:05,075 Bazen algoritma için sıkıntılı olabilir. 329 00:14:05,075 --> 00:14:07,095 Bu vaka da biraz kafası karışmış. 330 00:14:07,095 --> 00:14:09,507 Arabaların önleri ve arkaları karmakarışık. 331 00:14:09,507 --> 00:14:11,809 Burada biraz daha dikkatli olmalıyız, 332 00:14:11,809 --> 00:14:14,115 arkalara karşılık önleri elle seçmekte ve 333 00:14:14,115 --> 00:14:16,653 daha sonra bunun ilgilendiğimiz tipte 334 00:14:16,653 --> 00:14:20,310 bir grup olduğunu söylemekte. 335 00:14:21,570 --> 00:14:23,986 Bunu biraz yapıyoruz, biraz atlıyoruz bunu, 336 00:14:23,986 --> 00:14:26,270 sonra makine öğrenmesi algoritmasını 337 00:14:26,270 --> 00:14:27,500 bu yüzlerce kadar olan 338 00:14:27,500 --> 00:14:29,295 şeylere dayanarak eğitiyoruz 339 00:14:29,295 --> 00:14:31,198 ve daha iyi olmasını ümit ediyoruz. 340 00:14:31,198 --> 00:14:34,096 Bazı resimlerin solmaya başladığını görebilirsiniz 341 00:14:34,096 --> 00:14:36,288 ve bize bazılarını kendisinin önceden 342 00:14:36,288 --> 00:14:38,712 nasıl anlaması gerektiğini farkettiğini gösteriyor. 343 00:14:38,712 --> 00:14:41,341 Bu benzer resimler konseptini kullanabiliriz 344 00:14:41,341 --> 00:14:43,839 ve benzer resimleri kullanarak bilgisayarın 345 00:14:43,839 --> 00:14:45,612 bu noktada arabaların sadece 346 00:14:45,612 --> 00:14:47,547 önlerini bulabildiğini görebilirsiniz. 347 00:14:47,547 --> 00:14:50,011 Bu aşamada bilgisayar insana: 348 00:14:50,011 --> 00:14:52,245 "Tamam, peki, iyi iş çıkardın." diyebilir. 349 00:14:52,245 --> 00:14:55,550 Bazen, elbette, bu noktada bile 350 00:14:55,550 --> 00:14:58,560 grupların arasından seçmek zor. 351 00:14:58,930 --> 00:15:01,898 Bu durumda, bilgisayarın biraz çevirmesine izin 352 00:15:01,898 --> 00:15:04,808 verdikten sonra bile sağ ve sol taraftaki 353 00:15:04,808 --> 00:15:07,854 resimlerin karmakarışık olarak bulabiliriz. 354 00:15:07,854 --> 00:15:10,395 Yine bilgisayara bir takım ipuçları verebiliriz, 355 00:15:10,395 --> 00:15:13,347 ve diyebiliriz ki :"Tamam, derin öğrenme algoritmasını 356 00:15:13,347 --> 00:15:15,569 kullanarak sağ ve sol tarafları mümkün 357 00:15:15,569 --> 00:15:18,201 olduğunca ayırabilecek bir projeksiyon bulmaya çalış. " 358 00:15:18,201 --> 00:15:20,481 Ve ipucunu verince başarılı oldu. 359 00:15:20,481 --> 00:15:23,139 Objeleri birbirinden ayırabilmek için gereken 360 00:15:23,139 --> 00:15:25,316 düşünme şeklini birlikte bulabildiler. 361 00:15:26,096 --> 00:15:28,206 Yani buradaki fikri anladınız. 362 00:15:29,646 --> 00:15:33,896 Buradaki durum; insanın yerine bilgisayarın geçmesi 363 00:15:36,286 --> 00:15:39,068 değil birlikte çalışmaları. 364 00:15:39,068 --> 00:15:41,623 Burada yaptığımız ise; 6 ya da 7 kişilik 365 00:15:41,623 --> 00:15:45,068 bir takımın yaklaşık 7 senede yapacağı bir şeyi, 366 00:15:45,068 --> 00:15:47,208 bir kişinin yaklaşık 15 dakikada 367 00:15:47,208 --> 00:15:49,718 yapacağı bir şeyle değiştirmek. 368 00:15:49,718 --> 00:15:53,547 Bu süreç yaklaşık 4 ya da 5 yineleme içeriyor. 369 00:15:53,547 --> 00:15:56,696 Gördüğünüz gibi şuan 1.5 milyon resmimizin 370 00:15:56,696 --> 00:15:58,718 %62 si doğru bir şekilde sınıflandırıldı. 371 00:15:58,718 --> 00:16:00,985 Gelinen noktada, oldukça kolay bir şekilde 372 00:16:00,985 --> 00:16:03,234 büyük bölümleri alıp hata olmadığına 373 00:16:03,234 --> 00:16:05,246 emin olmak için kontrol edebiliriz. 374 00:16:05,246 --> 00:16:08,121 Hata olan yerlerde ise bilgisayara bildirebiliriz. 375 00:16:08,741 --> 00:16:12,128 Her farklı grup için bu tür bir süreç kullanarak 376 00:16:12,128 --> 00:16:14,683 1.5 milyon görüntüyü sınıflandırmada 377 00:16:14,683 --> 00:16:16,861 %80 başarı yüzdesine çıktık. 378 00:16:17,611 --> 00:16:19,620 Bu noktada konu sadece 379 00:16:19,620 --> 00:16:21,250 doğru sınıflandırılmamış olan 380 00:16:21,250 --> 00:16:23,038 küçük numarayı bulmak ve 381 00:16:23,038 --> 00:16:25,691 sebebini anlamaya çalışmak üzerine. 382 00:16:25,811 --> 00:16:28,922 Bu yaklaşımı kullanarak; 15 dakikada 383 00:16:28,922 --> 00:16:31,928 %97' lik sınıflandırma oranına ulaştık. 384 00:16:31,928 --> 00:16:34,094 Bu tarz bir teknik bize çok önemli 385 00:16:34,094 --> 00:16:36,343 bir problemi çözmeye izin verebilir; 386 00:16:36,343 --> 00:16:39,087 dünyada tıbbi uzmanlığın olmadığı yerlerde. 387 00:16:39,087 --> 00:16:41,290 Dünya Ekonomik Forumu'na göre; 388 00:16:41,290 --> 00:16:44,124 gelişen dünyada doktor kıtlığı 10 ile 20 katı 389 00:16:44,124 --> 00:16:47,189 arasında ve 300 yıl alacaktır bu problemi 390 00:16:47,189 --> 00:16:50,448 çözmek için yeterli insan yetiştirmek. 391 00:16:50,448 --> 00:16:53,420 Düşünün ki derin öğrenme yaklaşımını kullanarak 392 00:16:53,420 --> 00:16:56,539 verimliliklerini artırmaya yardım edebilsek? 393 00:16:56,539 --> 00:16:58,983 Fırsatlar konusunda oldukça heycanlıyım. 394 00:16:58,983 --> 00:17:01,452 Aynı zamanda problemlerle de ilgileniyorum. 395 00:17:01,452 --> 00:17:03,569 Buradaki problem ise; haritadaki 396 00:17:03,569 --> 00:17:05,563 her mavi alanda servisler 397 00:17:05,563 --> 00:17:07,757 istihdamın %80 den fazla. 398 00:17:07,757 --> 00:17:09,761 Servisler nedir? 399 00:17:09,761 --> 00:17:11,113 İşte servisler. 400 00:17:11,113 --> 00:17:13,453 Bunlar aynı zamanda bilgisayarın 401 00:17:13,453 --> 00:17:15,446 yapılma şeklini öğrendiği şeyler. 402 00:17:15,446 --> 00:17:17,983 Yani gelişen dünyadaki istihdamın %80 'inin 403 00:17:17,983 --> 00:17:20,140 yaptığı şeyler aynı zamanda bilgisayarın 404 00:17:20,140 --> 00:17:22,138 nasıl yapılacağını öğrendiği şeyler. 405 00:17:22,138 --> 00:17:24,860 Bu ne anlama geliyor? Tamam, bir şey olmayacak. 406 00:17:24,860 --> 00:17:26,708 Başka işlerle yer değiştirilcekler. 407 00:17:26,708 --> 00:17:29,146 Örneğin; Veri bilimciler için daha fazla iş olacak. 408 00:17:29,146 --> 00:17:30,458 Aslında öyle değil. 409 00:17:30,458 --> 00:17:32,238 Veri bilimcilerin bunları yapmaları 410 00:17:32,238 --> 00:17:33,544 çok zamanlarını almaz. 411 00:17:33,544 --> 00:17:35,025 Örneğin; bu 4 algoritma da aynı 412 00:17:35,025 --> 00:17:36,594 adam tarafından geliştirildi. 413 00:17:36,594 --> 00:17:39,206 Yani eğer; daha önceden de olmuştu, 414 00:17:39,206 --> 00:17:41,753 yeni işlerin gelip yer değiştirdiği 415 00:17:41,753 --> 00:17:43,948 zamanların sonuçlarını gördük. 416 00:17:43,948 --> 00:17:45,879 Bu yeni işlere ne olacak? 417 00:17:45,879 --> 00:17:48,205 Bunu kestirmek bizim için oldukça zor 418 00:17:48,205 --> 00:17:51,094 çünkü insan performansı bu şekilde kademeli olarak 419 00:17:51,094 --> 00:17:53,499 artıyor ama artık biz bir sisteme, derin öğrenmeye 420 00:17:53,499 --> 00:17:55,999 sahibiz yani katlanarak büyüme kapasitesine 421 00:17:55,999 --> 00:17:57,586 sahip olduğunu biliyoruz. 422 00:17:57,586 --> 00:17:58,536 Ve burdayız. 423 00:17:58,536 --> 00:18:01,027 Şu anda, etrafımızdaki şeyleri görüyoruz ve: 424 00:18:01,027 --> 00:18:03,135 "Bilgisayarlar hala aptal." değil mi? 425 00:18:03,135 --> 00:18:05,037 Ama 5 yıllık süre içinde bilgisayarlar 426 00:18:05,037 --> 00:18:06,786 bu çizelgenin dışında olacak. 427 00:18:06,786 --> 00:18:10,100 Yani bu kabiliyeti hemen düşünmeye başlamalıyız. 428 00:18:10,100 --> 00:18:12,403 Bunu daha önceden görmüştük, elbette. 429 00:18:12,403 --> 00:18:14,782 Sanayi devriminde, motorlar sayesinde 430 00:18:14,782 --> 00:18:17,292 kapasitede kademe atlamayı gördük. 431 00:18:17,292 --> 00:18:19,594 Mesele şu ki, yine de bir süre sonra 432 00:18:19,594 --> 00:18:20,632 işler düzeliyor. 433 00:18:20,632 --> 00:18:22,770 Sosyal bozulma vardı ama bir kez 434 00:18:22,770 --> 00:18:24,838 motorlar güç üretmek için kullanıldı 435 00:18:24,838 --> 00:18:28,024 ve tüm durumlar, her şey düzene oturdu. 436 00:18:28,024 --> 00:18:31,067 Makine Öğrenmesi Devrimi Sanayi devriminden 437 00:18:31,067 --> 00:18:32,830 çok daha farklı olacak çünkü 438 00:18:32,830 --> 00:18:35,570 Makine Öğrenmesi Devrimi asla durulmayacak. 439 00:18:35,570 --> 00:18:38,490 Bilgisayarlar entelektüel aktiviteler de iyiye gittikçe, 440 00:18:38,490 --> 00:18:40,189 entelektüel kapasitede daha 441 00:18:40,189 --> 00:18:42,249 iyi olan bilgisayarlar üretilecek. 442 00:18:42,249 --> 00:18:45,146 Yani bu dünyanın daha önce tanık olmadığı 443 00:18:45,146 --> 00:18:47,496 türde bir değişim olacak bu yüzden 444 00:18:47,496 --> 00:18:49,869 neyin mümkün olduğu konusunda ki 445 00:18:49,869 --> 00:18:51,297 önceki anlayışınız farklı. 446 00:18:51,297 --> 00:18:52,848 Şimdiden bizi etkiliyor. 447 00:18:52,848 --> 00:18:56,304 Son 25 yılda, kapital üretim arttıkça 448 00:18:56,304 --> 00:19:00,608 işçi verimliliği sabitti hatta biraz inişteydi. 449 00:19:01,298 --> 00:19:03,357 Bu yüzden bu konuyu tartışmaya 450 00:19:03,357 --> 00:19:04,908 başlamamızı istiyorum. 451 00:19:04,908 --> 00:19:06,895 İnsanlara bu durum hakkında çoğu kez 452 00:19:06,895 --> 00:19:09,485 bahsettiğimde, insanlar oldukça ilgisiz olabiliyor. 453 00:19:09,485 --> 00:19:12,028 Bilgisayarlar gerçek anlamda düşünemez, 454 00:19:12,028 --> 00:19:14,290 duygusal davranmaz, şiirden anlamaz, 455 00:19:14,290 --> 00:19:16,400 nasıl çalıştıklarını tam olarak anlamıyoruz. 456 00:19:16,400 --> 00:19:17,330 Ne fark eder? 457 00:19:17,330 --> 00:19:19,560 Bilgisayarlar şu an insanların ücret alarak 458 00:19:19,560 --> 00:19:22,440 zamanlarının çoğunu harcadıkları şeyleri yapabiliyor. 459 00:19:22,440 --> 00:19:25,930 O zaman sosyal ve ekonomik yapımızı nasıl uyduracağımızı 460 00:19:25,930 --> 00:19:28,180 düşünmeye başlamamızın ve bu yeni gerçekliğin 461 00:19:28,180 --> 00:19:30,460 farkında olmamızın tam zamanı. 462 00:19:30,460 --> 00:19:31,400 Teşekkürler. 463 00:19:31,400 --> 00:19:32,190 (Alkışlar)