WEBVTT 00:00:00.350 --> 00:00:01.880 Eskiden bilgisayarınıza 00:00:01.880 --> 00:00:04.453 yeni bir şeyler yaptırmak isteseniz 00:00:04.453 --> 00:00:06.257 programlamanız gerekirdi. 00:00:06.257 --> 00:00:08.898 Şimdi, programlama; burada hiç yapmayanlar 00:00:08.898 --> 00:00:11.950 için söylüyorum, her adımı, her detayı 00:00:11.950 --> 00:00:15.317 bilgisayarın yapmasını istediğin her şeyi amacına 00:00:15.317 --> 00:00:18.869 ulaşman için tasarlaman gerekir. 00:00:18.869 --> 00:00:21.595 Nasıl yapacağını bilmediğin bir şeyi 00:00:21.595 --> 00:00:24.648 yapmak istiyorsan bu çok zorlu olacak. NOTE Paragraph 00:00:24.648 --> 00:00:28.131 Arthur Samuel de bunu yaptı. 00:00:28.131 --> 00:00:31.548 1956'da bilgisayarının onu 00:00:31.548 --> 00:00:34.548 damada yenebilmesini istiyordu. 00:00:34.548 --> 00:00:37.108 Her detayıyla nasıl bir program tasarlayarak 00:00:37.108 --> 00:00:40.594 damada senden daha iyi olmasını sağlayabilirsin? 00:00:40.594 --> 00:00:42.116 Bu soruna bir çözüm buldu: 00:00:42.116 --> 00:00:45.840 Binlerce kez bilgisayarıyla dama oynayacak 00:00:45.840 --> 00:00:48.364 ve böylece bilgisayara damayı öğrenecekti. 00:00:48.364 --> 00:00:51.544 Bu işe yaradı ve 1962'de bilgisayar 00:00:51.544 --> 00:00:55.561 Connecticut eyaleti şampiyonunu yendi. NOTE Paragraph 00:00:55.561 --> 00:00:58.534 Bu şekilde Arthur Samuel, makine öğrenmenin 00:00:58.534 --> 00:01:00.251 fikir öncüsüydü ve ona borçluyum, 00:01:00.251 --> 00:01:03.014 çünkü bir makine öğrenimi uygulayıcısıyım. 00:01:03.014 --> 00:01:04.479 200 bini aşkın uygulayıcıyı 00:01:04.479 --> 00:01:07.867 biraraya getiren Kaggle'ın başkanıydım. 00:01:07.867 --> 00:01:09.925 Kaggle yarışmalar düzenleyip çözülememiş 00:01:09.925 --> 00:01:13.633 problemleri çözmeye çalışıyordu ve 00:01:13.633 --> 00:01:17.470 yüzlerce kez başarılı oldular. 00:01:17.470 --> 00:01:19.940 Bu açıdan bakıldığında, makine öğreniminin 00:01:19.940 --> 00:01:23.890 geçmişte, günümüzde ve gelecekte planlanan 00:01:23.890 --> 00:01:26.252 çalışmaları hakkında çok şey öğrendim. 00:01:26.252 --> 00:01:27.726 Ticari anlamda belki de 00:01:27.726 --> 00:01:29.200 makine öğreniminin 00:01:29.200 --> 00:01:30.675 ilk başarısı Google'dır. 00:01:30.675 --> 00:01:33.494 Google bilgisayar algoritması ile 00:01:33.494 --> 00:01:35.536 bilgilere erişmeyi mümkün kılar ve 00:01:35.536 --> 00:01:38.437 bu algoritma makine öğrenimini temel alır. 00:01:38.437 --> 00:01:42.317 Bugüne kadar birçok ticari olarak başarılı uygulaması oldu. 00:01:42.317 --> 00:01:44.773 Amazon, Netflix gibi bir çok 00:01:44.773 --> 00:01:46.570 başarılı şirket makine öğrenimini 00:01:46.570 --> 00:01:47.876 ürünlerini ve filmlerini 00:01:47.876 --> 00:01:49.896 satmak için kullanmışlardır. 00:01:49.896 --> 00:01:51.703 Bu bazen ürkütücü olabilir. 00:01:51.703 --> 00:01:53.917 LinkedIn ve Facebook gibi şirketler bazen size 00:01:53.917 --> 00:01:56.251 tanıyor olabileceğiniz kişileri gösterir ve siz 00:01:56.251 --> 00:01:58.228 bunu nasıl yaptığını bilemezsiniz; işte 00:01:58.228 --> 00:02:01.195 bu makine öğreniminin eseridir. 00:02:01.195 --> 00:02:04.152 Bu sistem, programlanmak yerine datadan 00:02:04.152 --> 00:02:07.399 öğrenen algoritmalardan oluşur. NOTE Paragraph 00:02:07.399 --> 00:02:09.877 Bu IBM'in Watson ile Jeopardy yarışmasında 00:02:09.877 --> 00:02:13.739 oldukça zor ve karışık soruları doğru 00:02:13.739 --> 00:02:16.964 cevaplayarak nasıl iki dünya şampiyonunu 00:02:16.964 --> 00:02:19.799 yenmeyi başardığını açıklar. 00:02:19.799 --> 00:02:23.034 İnsansız arabalar da bu sistem ile çalışır. 00:02:23.034 --> 00:02:25.856 Yaya ile ağaç arasındaki farkı söylemek 00:02:25.856 --> 00:02:28.488 isterseniz buyrun, söyleyin bu çok önemli. 00:02:28.488 --> 00:02:31.075 Bu programların elle nasıl yazıldığını 00:02:31.075 --> 00:02:34.072 bilmiyoruz ama makine öğrenimi ile mümkün. 00:02:34.072 --> 00:02:36.110 Ve bu arabalar bir düz yolda 00:02:36.110 --> 00:02:39.178 kaza yapmadan 1 milyon mili aştı. 00:02:40.798 --> 00:02:42.326 Böylece bilgisayarların, öğrenebildiğini NOTE Paragraph 00:02:42.326 --> 00:02:44.110 ve bazen bizim yapmayı bilmediğimiz 00:02:44.110 --> 00:02:46.010 şeyleri yapmayı öğrenebildiklerini 00:02:46.010 --> 00:02:48.848 veya bizden bunları bizden daha 00:02:48.848 --> 00:02:51.733 iyi yapabileceklerini görüyoruz. 00:02:51.733 --> 00:02:54.478 Makine öğreniminin en iyi örneklerini 00:02:54.478 --> 00:02:57.650 Kaggle'da yürüttüğümüz bir projede gördüm: 00:02:57.940 --> 00:03:01.911 Toronto Üniversitesi'nden Geoffrey Hinton 00:03:01.911 --> 00:03:03.840 ve ekibi otomatik uyuşturucu tespiti 00:03:03.840 --> 00:03:06.130 alanında yarışmayı kazandı. 00:03:06.140 --> 00:03:07.140 Burada ilginç olansa; 00:03:07.140 --> 00:03:10.277 Merck veya uluslararası akademik çevrenin 00:03:10.277 --> 00:03:12.540 geliştirdiği bütün algoritmaları kimya 00:03:12.540 --> 00:03:15.061 ve biyoloji gibi alanlarda geçmişi 00:03:15.061 --> 00:03:18.061 olmayan kişilerin algoritmayı çözmeleri değil bunu 00:03:18.061 --> 00:03:20.230 2 haftada yapmış olmaları. 00:03:20.230 --> 00:03:21.611 Peki bunu nasıl başardılar? 00:03:22.421 --> 00:03:25.342 Derin Öğrenme denilen olağanüstü bir algoritma kullandılar. 00:03:25.342 --> 00:03:28.291 Bu o kadar önemli bir başarıydı ki birkaç 00:03:28.291 --> 00:03:31.412 hafta sonra New York Times'ın kapağında yer aldı. 00:03:31.412 --> 00:03:34.147 Sol kenarda Geoffrey Hinton vardı. 00:03:34.147 --> 00:03:37.558 Derin Öğrenme, insan beyninin çalışmasından 00:03:37.558 --> 00:03:39.960 ilham alınarak oluşturulmuş bir algoritmadır 00:03:39.960 --> 00:03:43.971 ve kapasitesi konusunda teorik kısıtlamalar içermez. 00:03:43.971 --> 00:03:46.474 Ona ne kadar çok veri ve zaman verirseniz 00:03:46.474 --> 00:03:48.276 o kadar iyi sonuçlar elde edersiniz. NOTE Paragraph 00:03:48.276 --> 00:03:50.615 New York Times'ın haberinde derin öğrenme 00:03:50.615 --> 00:03:51.615 ile elde edilen 00:03:51.615 --> 00:03:52.857 bir sonuç daha vardı; 00:03:52.857 --> 00:03:54.147 onu da şimdi göstereceğim: 00:03:54.977 --> 00:03:56.189 Sonuca göre: 00:03:56.189 --> 00:03:58.500 Bilgisayarlar dinleyebilir 00:03:58.500 --> 00:04:00.510 ve anlayabilir. NOTE Paragraph 00:04:00.820 --> 00:04:03.400 Richard Rashid:"Bu yöntemde 00:04:03.400 --> 00:04:05.047 son aşamada gelebilmek 00:04:05.047 --> 00:04:06.913 istediğim nokta 00:04:06.913 --> 00:04:09.913 sizinle Çince konuşmak. 00:04:10.961 --> 00:04:12.306 Olay şu ki; 00:04:12.306 --> 00:04:15.058 bir çok Çinliden çok miktarda 00:04:15.058 --> 00:04:18.378 bilgi alma imkanımız oldu 00:04:18.378 --> 00:04:21.408 ve Çince bir metni alan ve 00:04:21.408 --> 00:04:24.908 Çin diline çeviren yani yazıyı 00:04:24.908 --> 00:04:27.881 konuşmaya dönüştüren bir sistem oluşturduk. 00:04:27.881 --> 00:04:31.509 Sonra konuşmamın bir saatlik kısmını aldık 00:04:31.509 --> 00:04:33.720 ve standart metni konuşma sistemine 00:04:33.720 --> 00:04:35.070 modüle ettik sonuç olarak 00:04:35.070 --> 00:04:37.314 benim konuşmam gibi olmalıydı. 00:04:37.314 --> 00:04:38.904 Sonuç mükemmel olmadı elbette. 00:04:38.904 --> 00:04:41.552 Hatta bir çok hata vardı. 00:04:41.552 --> 00:04:44.036 (Çince) 00:04:44.036 --> 00:04:48.153 (Alkışlar) 00:04:49.446 --> 00:04:53.022 Bu alanda daha çok çalışılması gerekiyor. 00:04:53.022 --> 00:04:56.667 (Çince) 00:04:56.667 --> 00:05:00.100 (Alkışlar) NOTE Paragraph 00:05:01.345 --> 00:05:04.744 Bu, Çinde makine öğrenimi konferansıydı. 00:05:04.744 --> 00:05:07.114 Genelde akademik konferanslarda 00:05:07.114 --> 00:05:09.011 spontane alkışlamalar olmaz ancak 00:05:09.011 --> 00:05:12.407 TEDx konferanslarında rastlanabilir. 00:05:12.407 --> 00:05:13.892 Burada gördüğünüz her şey 00:05:13.892 --> 00:05:15.862 derin öğrenme ile gerçekleşiyor. 00:05:15.862 --> 00:05:17.007 (Alkışlar) Teşekkürler. 00:05:17.007 --> 00:05:19.289 İngilizce uyarlama derin öğrenme ile yapıldı. 00:05:19.289 --> 00:05:22.701 Çince çeviri ve sağ üstteki metin derin öğrenmeyle, 00:05:22.701 --> 00:05:26.008 ve yine sesin entegre edilmesi de derin öğrenme ile yapıldı. NOTE Paragraph 00:05:26.008 --> 00:05:28.972 Derin öğrenme alışılmışın dışında bir şey. 00:05:28.972 --> 00:05:30.242 Tek bir algoritma neredeyse 00:05:30.242 --> 00:05:32.341 her şeyi yapabilecek gibi duruyor 00:05:32.341 --> 00:05:35.242 ve geçen sene öğrendim ki görmeyi de öğrenmiş. 00:05:35.242 --> 00:05:37.628 Almanya'da Alman Trafik İşaretleri Karşılaştırması 00:05:37.628 --> 00:05:40.225 olarak adlandırılan yarışmada 00:05:40.225 --> 00:05:43.618 derin öğrenme bu gibi işaretleri algılamayı öğrendi. 00:05:43.618 --> 00:05:45.712 Diğer algoritmalardan daha iyi algılamakla 00:05:45.712 --> 00:05:48.170 kalmayıp, yarışmanın sıralamasına bakıldığında 00:05:48.170 --> 00:05:50.189 insanlardan da daha iyi tanıdı; 00:05:50.189 --> 00:05:52.041 hatta iki katı daha fazla. 00:05:52.041 --> 00:05:54.037 2011 yılında, bilgisayarların insanlardan 00:05:54.037 --> 00:05:57.442 daha iyi görebildiğini anladık. 00:05:57.442 --> 00:05:59.491 O zamandan beri sayısız çalışma yapıldı. 00:05:59.491 --> 00:06:02.505 2012'de Google; Youtube videolarını izleyen 00:06:02.505 --> 00:06:05.270 ve aylık 16.000 bilgisayardaki veriyi sıkıştırabilen 00:06:05.270 --> 00:06:08.187 derin öğrenme algoritmaları olduğunu açıkladı. 00:06:08.187 --> 00:06:11.028 Ayrıca bilgisayarlar ayrı ayrı insan ve kedi 00:06:11.028 --> 00:06:14.027 gibi konseptleri izleyerek öğrendi. 00:06:14.027 --> 00:06:16.379 Bu insanların öğrenmesine benziyor. 00:06:16.379 --> 00:06:19.119 İnsanlar gördüklerinin anlatılmasıyla değil 00:06:19.119 --> 00:06:22.300 kendileri başlarına öğrenirler. 00:06:22.460 --> 00:06:25.949 Yine 2012'de az önce gördüğümüz Geoffrey Hinton 00:06:25.949 --> 00:06:30.397 1.5 milyon fotoğrafa bakarak neyin fotoğrafları 00:06:30.397 --> 00:06:32.368 olduğunu çözmeye çalışarak 00:06:32.368 --> 00:06:35.126 popüler olan ImageNet yarışmasını kazandı. 00:06:35.126 --> 00:06:37.259 2014 yılında görüntü tanımada 00:06:37.259 --> 00:06:38.789 %6 lık hata payına düştük. 00:06:38.789 --> 00:06:41.268 Bu da insanlardan daha iyi. NOTE Paragraph 00:06:41.268 --> 00:06:44.436 Makinalar gerçekten bu alanda harika işler yapıyor 00:06:44.436 --> 00:06:47.206 ve artık endüstride de kullanılıyor. 00:06:47.206 --> 00:06:49.824 Mesela Google, geçen yıl Fransa'daki 00:06:49.824 --> 00:06:52.390 her bir konumu 2 saatte haritada 00:06:52.390 --> 00:06:54.100 işaretlediğini duyurdu ve 00:06:54.100 --> 00:06:57.089 cadde numaralarını okumak ve tanımlamak 00:06:57.089 --> 00:06:58.979 için cadde görüntülerini 00:06:58.979 --> 00:07:02.039 bir derin öğrenme algoritmasında kullandılar. 00:07:02.039 --> 00:07:04.849 Bunun önceleri ne kadar sürdüğünü düşünün: 00:07:04.849 --> 00:07:07.029 binlerce insan, bir çok yıl. 00:07:08.759 --> 00:07:10.144 Bu Çin'de de oldu. 00:07:10.144 --> 00:07:14.426 Baidu bir çeşit Çin'in Google'ı, sanırım, 00:07:14.426 --> 00:07:16.708 sol üst köşede gördüğünüz Baidu'nun 00:07:16.708 --> 00:07:18.322 derin öğrenme sistemine 00:07:18.322 --> 00:07:20.794 yüklediğim görüntünün örneği 00:07:20.794 --> 00:07:23.548 ve arkaplanda ise sistemin görüntüyü 00:07:23.548 --> 00:07:26.637 tanımlayıp benzerlerini bulduğunu görebilirsiniz. 00:07:26.637 --> 00:07:29.213 Benzer resimler gerçekten de benzer arka planlara, 00:07:29.213 --> 00:07:31.059 benzer yüz açılarına sahip 00:07:31.059 --> 00:07:32.777 hatta bazılarında dilleri dışarıda. 00:07:32.777 --> 00:07:35.985 Tam olarak web sayfasının metnine bakmak gibi değil. 00:07:35.985 --> 00:07:38.235 Tek yaptığım resim yüklemekti. 00:07:38.235 --> 00:07:40.027 O halde gördüklerini anlayabilen ve 00:07:40.027 --> 00:07:42.368 bu sayede gerçek zamanlı olarak yüz 00:07:42.368 --> 00:07:44.432 milyonlarca görüntüyü veritabanlarında 00:07:44.432 --> 00:07:46.306 arayabilen bilgisayarlar var. NOTE Paragraph 00:07:46.306 --> 00:07:49.436 Peki bilgisayarların görmesi ne anlama geliyor? 00:07:49.436 --> 00:07:51.453 Sadece görebilmesini sağlamak değil 00:07:51.453 --> 00:07:53.852 aslında derin öğrenme bundan daha fazlasını yaptı. 00:07:53.852 --> 00:07:56.570 Bu gibi karmaşık ve incelikli cümleler 00:07:56.570 --> 00:07:59.394 artık derin öğrenme algoritmalarıyla anlaşılabilir. 00:07:59.394 --> 00:08:00.697 Gördüğünüz üzere; 00:08:00.697 --> 00:08:03.465 Stanford-tabanlı sistem, üstteki kırmızı 00:08:03.465 --> 00:08:07.384 noktanın negatif bir his ifade ettiğini anlıyor. 00:08:07.384 --> 00:08:09.072 Derin öğrenme hatta 00:08:09.072 --> 00:08:11.283 cümlelerin ne hakkında olduğunu 00:08:11.283 --> 00:08:13.041 ve anlamlarını anlamada insan 00:08:13.041 --> 00:08:15.437 performansına yaklaşmış durumda. 00:08:15.777 --> 00:08:18.425 Aynı zamanda derin öğrenme Çin 00:08:18.425 --> 00:08:22.131 anadil seviyesinde Çince okumada da kullanıldı. NOTE Paragraph 00:08:22.131 --> 00:08:24.652 Bu algoritma Çince konuşamayan ve 00:08:24.652 --> 00:08:27.701 anlamayan insanlar tarafından İsviçre'de geliştirildi. 00:08:27.701 --> 00:08:30.568 Bahsettiğim gibi derin öğrenme kullanma bu işte 00:08:30.568 --> 00:08:33.788 dünyadaki en iyi sistem yerel insanların 00:08:33.788 --> 00:08:36.718 anlama performansına göre bile. NOTE Paragraph 00:08:36.718 --> 00:08:39.682 Bu sistem şirketimde oluşturuldu 00:08:39.682 --> 00:08:42.448 ve bu tarz şeyleri bir arada toplamayı gösteriyor. NOTE Paragraph 00:08:42.448 --> 00:08:44.699 Bu resimlere eklenmiş metin yok ve 00:08:44.699 --> 00:08:47.031 ben buraya cümle yazarken gerçek 00:08:47.031 --> 00:08:49.510 zamanlı olarak resimleri algılıyor, 00:08:49.510 --> 00:08:51.789 ne hakkında olduklarını çözüyor ve 00:08:51.789 --> 00:08:54.352 yazdığım metne benzer resimleri buluyor. 00:08:54.352 --> 00:08:57.108 Görüyorsunuz, bu aslında cümlelerimi anlama 00:08:57.108 --> 00:08:59.332 ve bu resimleri anlama. 00:08:59.332 --> 00:09:01.891 Benzerini Google'da gördüğünüzü düşünüyorum; 00:09:01.891 --> 00:09:04.666 bir şeyleri yazarken size resimler gösterir ama 00:09:04.666 --> 00:09:08.090 asıl yaptığı web sayfalarında yazdıklarınızı aramaktır. 00:09:08.090 --> 00:09:11.091 Bu aslında resimleri anlamaktan oldukça farklı. 00:09:11.091 --> 00:09:13.843 Bu son bir kaç ayda ilk kez 00:09:13.843 --> 00:09:16.543 bilgisayarların yapabildiği bir şey. NOTE Paragraph 00:09:17.091 --> 00:09:19.192 O halde görüyoruz ki bilgisayarlar 00:09:19.192 --> 00:09:21.182 görebilmekle kalmıyor aynı zamanda 00:09:21.182 --> 00:09:22.832 okuyabiliyor ve zaten duyduklarını 00:09:22.832 --> 00:09:24.947 anlayabildiklerini de göstermiştik. 00:09:24.947 --> 00:09:26.707 Belki yazabildiklerini söylesem 00:09:26.707 --> 00:09:28.537 artık şaşırtıcı gelmez. 00:09:28.537 --> 00:09:30.927 İşte burada dün derin öğrenme algoritmasıyla 00:09:30.927 --> 00:09:33.607 oluşturduğum metin. 00:09:33.607 --> 00:09:37.159 Ve burada algoritma tarafından geliştirilen metinler var. 00:09:37.159 --> 00:09:40.102 Bu cümlelerin her biri resimleri tanımlamak 00:09:40.102 --> 00:09:42.892 için derin öğrenme algoritmasıyla geliştirildi . 00:09:42.892 --> 00:09:45.202 Algoritma daha önce siyah tişörtlü 00:09:45.202 --> 00:09:47.356 gitar çalan birini hiç görmemişti. 00:09:47.356 --> 00:09:50.170 Önceden adamı görmüştü, siyahi görmüştü, 00:09:50.170 --> 00:09:52.709 gitarı görmüştü ama bu resmin roman 00:09:52.709 --> 00:09:55.111 tasvirini ayrı olarak yaptı. 00:09:56.231 --> 00:09:58.541 Hala tam olarak insan performansında 00:09:58.541 --> 00:09:59.701 değiliz ama yakınız. 00:09:59.701 --> 00:10:02.260 Testlerde 1/4 oranında insanlar, bilgisayar 00:10:02.260 --> 00:10:04.714 tarafından oluşturulan yazıları seçiyor. 00:10:04.714 --> 00:10:06.826 Bu sistem şuan sadece 2 haftalık 00:10:06.826 --> 00:10:08.855 ama muhtemelen gelecek yıl içerisinde 00:10:08.855 --> 00:10:10.651 bu oranlarda devam ederse 00:10:10.651 --> 00:10:12.321 algoritma insan performansını 00:10:12.321 --> 00:10:14.172 hayli geçmiş olacak. 00:10:14.172 --> 00:10:16.534 Yani bilgisayarlar yazabiliyor da. 00:10:16.534 --> 00:10:18.073 Tüm bunları birleştirdik NOTE Paragraph 00:10:18.073 --> 00:10:20.088 ve durum heyecan verici fırsatlar yarattı. 00:10:20.088 --> 00:10:23.170 Örneğin; sağlık alanında Boston'da bir takım, 00:10:23.170 --> 00:10:25.675 doktorların kanser teşhisine yardımcı 00:10:25.675 --> 00:10:28.614 düzinelerce kliniksel olarak ilişkili tümör 00:10:28.614 --> 00:10:31.540 özellikleri keşfettiklerini duyurdu. 00:10:31.810 --> 00:10:33.906 Benzer olarak Stanford' da 00:10:33.906 --> 00:10:36.889 büyüme altındaki dokulara bakan bir grup; 00:10:36.889 --> 00:10:40.350 kanser hastalarının sağkalım oranlarını ölçmede 00:10:40.350 --> 00:10:42.772 patoloji uzmanlarından daha iyi olan, 00:10:42.772 --> 00:10:46.829 makine öğrenmesine dayalı bir sistem geliştirdi. 00:10:46.829 --> 00:10:49.224 Bu iki durumda da tahminlerin daha 00:10:49.224 --> 00:10:51.296 hatasız olmasının yanı sıra kavrama 00:10:51.296 --> 00:10:53.701 açısından güçlü yeni bir bilim geliştirdiler. 00:10:53.701 --> 00:10:55.876 Radyoloji vakasındakiler insanların 00:10:55.876 --> 00:10:58.258 anlayabileceği yeni kliniksel indikatörlerdi. 00:10:58.258 --> 00:11:00.318 Patoloji vakasında ise bilgisayar, 00:11:00.318 --> 00:11:03.888 tanı yapılırken kanser etrafındaki hücrelerin kanser 00:11:03.888 --> 00:11:09.260 hücreleri kadar önemli olduğunu keşfetti. 00:11:09.260 --> 00:11:11.851 Bu patoloji uzmanlarına onlarca 00:11:11.851 --> 00:11:14.413 yıldır öğretilenlerin tam tersi. 00:11:15.423 --> 00:11:17.754 Bu iki vakada da tıp uzmanları ve 00:11:17.754 --> 00:11:20.075 makine öğrenmesi uzmanlarının 00:11:20.075 --> 00:11:22.184 birleşip geliştirdiği bir sistemdi 00:11:22.184 --> 00:11:24.364 ancak geçen yıl bunu da geçtik. 00:11:24.364 --> 00:11:26.587 Bu örnek mikroskop altındaki insan 00:11:26.587 --> 00:11:30.412 dokusunun kanserli bölgelerini tanımlamak üzerine. 00:11:30.412 --> 00:11:33.314 Burada gösterilen sistem bu alanları daha 00:11:33.314 --> 00:11:35.860 isabetli olarak belirleyebiliyor, 00:11:35.860 --> 00:11:38.135 ya da en az patoloji uzmanı kadar 00:11:38.135 --> 00:11:40.583 ama tümüyle derin öğrenme kullanılarak ve 00:11:40.583 --> 00:11:42.830 herhangi bir tıp geçmişi olmayan 00:11:42.830 --> 00:11:44.651 insanlar tarafından geliştirildi. NOTE Paragraph 00:11:44.651 --> 00:11:47.578 Benzer olarak nöron segmentasyonu da. 00:11:47.578 --> 00:11:49.298 Şu an nöronları insanlar kadar 00:11:49.298 --> 00:11:50.948 isabetli segmentleyebiliyoruz 00:11:50.948 --> 00:11:52.355 ki bu sistem derin öğrenme 00:11:52.355 --> 00:11:53.985 kullanılarak hiç bir tıbbi geçmişi 00:11:53.985 --> 00:11:55.901 olmayan kişiler tarafından geliştirildi. 00:11:57.381 --> 00:11:59.941 Aynı şekilde ben de, hiç bir tıbbi geçmişim 00:11:59.941 --> 00:12:02.070 olmadığı halde medikal alanında 00:12:02.070 --> 00:12:04.830 yeni bir şirket açabilirim ki açtım da. 00:12:05.660 --> 00:12:08.982 Şirketi açma konusunda biraz korkmuştum ama 00:12:08.982 --> 00:12:12.442 teoride bu veri analiz tekniklerini kullanarak 00:12:12.442 --> 00:12:15.742 yararlı ilaçlar yapmak mümkün görünüyordu. 00:12:15.752 --> 00:12:17.942 Neyse ki geri dönüşler harikaydı 00:12:17.942 --> 00:12:20.292 sadece medya değil tıp çevresinde de 00:12:20.292 --> 00:12:22.862 ki aynı zamanda çok da destekleyicilerdi. 00:12:22.862 --> 00:12:25.718 Teoride, medikal sürecin orta bölümünü alıp 00:12:25.718 --> 00:12:29.172 mümkün olduğunca veri analizine çevirerek 00:12:29.172 --> 00:12:32.171 doktorları en iyi oldukları alana yoğunlaştırabiliriz. 00:12:33.071 --> 00:12:34.874 Bir örnek vermek istiyorum. 00:12:34.874 --> 00:12:36.989 Yeni bir tıbbi teşhis testini 00:12:36.989 --> 00:12:40.139 üretmek 15 dakikamızı alır 00:12:40.139 --> 00:12:42.341 ve gerçek zamanlı olarak da göstereceğim 00:12:42.341 --> 00:12:44.105 ama bazı parçalarını keserek 00:12:44.105 --> 00:12:45.715 süreci 3 dakikaya indirdim. 00:12:45.715 --> 00:12:48.629 Tıbbi teşhis testini oluşturmayı göstermek yerine 00:12:48.629 --> 00:12:50.206 daha anlaşılır olduğu için 00:12:50.206 --> 00:12:53.867 araba görüntülerini tanımlama testini göstereceğim. 00:12:53.867 --> 00:12:57.146 Yaklaşık 1.5 milyon araba resmiyle başlıyoruz ve 00:12:57.146 --> 00:12:59.228 çekildikleri açılara göre onları NOTE Paragraph 00:12:59.228 --> 00:13:02.519 ayırabilecek bir şey yaratmak istiyorum. 00:13:02.519 --> 00:13:04.705 Bütün resimler etiketsiz bu yüzden 00:13:04.705 --> 00:13:06.328 sıfırdan başlamak zorundayım. 00:13:07.028 --> 00:13:09.626 Derin öğrenme algoritmamızla resimlerdeki 00:13:09.626 --> 00:13:12.471 yapıların alanlarını otomatik olarak algılayabilir. 00:13:12.471 --> 00:13:14.198 Güzel olan, şu andan itibaren 00:13:14.198 --> 00:13:15.988 insan ile bilgisayar artık ortak çalışabilir. 00:13:15.988 --> 00:13:18.616 Gördüğünüz gibi insan burada bilgisayara; 00:13:18.616 --> 00:13:20.811 daha sonra deneyip, algoritmasını 00:13:20.811 --> 00:13:22.881 geliştirmede kullanması için 00:13:22.881 --> 00:13:25.131 ilgi alanlarını söylüyor. 00:13:25.131 --> 00:13:27.121 Bu derin öğrenme sistemleri 00:13:27.121 --> 00:13:28.961 aslında 16.000 boyutlu uzay 00:13:28.961 --> 00:13:30.797 ve gördüğünüz gibi bilgisayar burada 00:13:30.797 --> 00:13:33.009 uzay boyunca döndürüp yeni yapı 00:13:33.009 --> 00:13:35.001 alanları bulmaya çalışıyor. 00:13:35.001 --> 00:13:38.052 Başarıyla yapınca da daha sonra bunu süren 00:13:38.052 --> 00:13:40.786 kişi ilgi çekici olan alanları gösteriyor. 00:13:40.786 --> 00:13:44.298 Ve burada bilgisayar başarılı bir şekilde alanları buldu. 00:13:44.298 --> 00:13:45.770 Örneğin: Açılar. 00:13:45.770 --> 00:13:47.776 Bu süreç devam ederken, 00:13:47.776 --> 00:13:50.106 bilgisayara aradığımız yapı türlerini 00:13:50.106 --> 00:13:51.844 adım adım söylüyoruz. 00:13:51.844 --> 00:13:54.116 Teşhis testinde pataloji uzmanının 00:13:54.116 --> 00:13:57.266 patoz alanlarını tanımlaması gibi düşünebilirsin 00:13:57.266 --> 00:13:59.302 ya da örneğin radyolojistin sıkıntı 00:13:59.302 --> 00:14:02.151 yaratabilecek nodülleri göstermesi gibi. 00:14:02.151 --> 00:14:05.075 Bazen algoritma için sıkıntılı olabilir. 00:14:05.075 --> 00:14:07.095 Bu vaka da biraz kafası karışmış. 00:14:07.095 --> 00:14:09.507 Arabaların önleri ve arkaları karmakarışık. 00:14:09.507 --> 00:14:11.809 Burada biraz daha dikkatli olmalıyız, 00:14:11.809 --> 00:14:14.115 arkalara karşılık önleri elle seçmekte ve 00:14:14.115 --> 00:14:16.653 daha sonra bunun ilgilendiğimiz tipte NOTE Paragraph 00:14:16.653 --> 00:14:20.310 bir grup olduğunu söylemekte. 00:14:21.570 --> 00:14:23.986 Bunu biraz yapıyoruz, biraz atlıyoruz bunu, 00:14:23.986 --> 00:14:26.270 sonra makine öğrenmesi algoritmasını 00:14:26.270 --> 00:14:27.500 bu yüzlerce kadar olan 00:14:27.500 --> 00:14:29.295 şeylere dayanarak eğitiyoruz 00:14:29.295 --> 00:14:31.198 ve daha iyi olmasını ümit ediyoruz. 00:14:31.198 --> 00:14:34.096 Bazı resimlerin solmaya başladığını görebilirsiniz 00:14:34.096 --> 00:14:36.288 ve bize bazılarını kendisinin önceden 00:14:36.288 --> 00:14:38.712 nasıl anlaması gerektiğini farkettiğini gösteriyor. 00:14:38.712 --> 00:14:41.341 Bu benzer resimler konseptini kullanabiliriz 00:14:41.341 --> 00:14:43.839 ve benzer resimleri kullanarak bilgisayarın 00:14:43.839 --> 00:14:45.612 bu noktada arabaların sadece NOTE Paragraph 00:14:45.612 --> 00:14:47.547 önlerini bulabildiğini görebilirsiniz. 00:14:47.547 --> 00:14:50.011 Bu aşamada bilgisayar insana: 00:14:50.011 --> 00:14:52.245 "Tamam, peki, iyi iş çıkardın." diyebilir. 00:14:52.245 --> 00:14:55.550 Bazen, elbette, bu noktada bile 00:14:55.550 --> 00:14:58.560 grupların arasından seçmek zor. 00:14:58.930 --> 00:15:01.898 Bu durumda, bilgisayarın biraz çevirmesine izin 00:15:01.898 --> 00:15:04.808 verdikten sonra bile sağ ve sol taraftaki 00:15:04.808 --> 00:15:07.854 resimlerin karmakarışık olarak bulabiliriz. 00:15:07.854 --> 00:15:10.395 Yine bilgisayara bir takım ipuçları verebiliriz, 00:15:10.395 --> 00:15:13.347 ve diyebiliriz ki :"Tamam, derin öğrenme algoritmasını 00:15:13.347 --> 00:15:15.569 kullanarak sağ ve sol tarafları mümkün 00:15:15.569 --> 00:15:18.201 olduğunca ayırabilecek bir projeksiyon bulmaya çalış. " 00:15:18.201 --> 00:15:20.481 Ve ipucunu verince başarılı oldu. NOTE Paragraph 00:15:20.481 --> 00:15:23.139 Objeleri birbirinden ayırabilmek için gereken 00:15:23.139 --> 00:15:25.316 düşünme şeklini birlikte bulabildiler. NOTE Paragraph 00:15:26.096 --> 00:15:28.206 Yani buradaki fikri anladınız. 00:15:29.646 --> 00:15:33.896 Buradaki durum; insanın yerine bilgisayarın geçmesi 00:15:36.286 --> 00:15:39.068 değil birlikte çalışmaları. 00:15:39.068 --> 00:15:41.623 Burada yaptığımız ise; 6 ya da 7 kişilik 00:15:41.623 --> 00:15:45.068 bir takımın yaklaşık 7 senede yapacağı bir şeyi, NOTE Paragraph 00:15:45.068 --> 00:15:47.208 bir kişinin yaklaşık 15 dakikada 00:15:47.208 --> 00:15:49.718 yapacağı bir şeyle değiştirmek. 00:15:49.718 --> 00:15:53.547 Bu süreç yaklaşık 4 ya da 5 yineleme içeriyor. 00:15:53.547 --> 00:15:56.696 Gördüğünüz gibi şuan 1.5 milyon resmimizin 00:15:56.696 --> 00:15:58.718 %62 si doğru bir şekilde sınıflandırıldı. 00:15:58.718 --> 00:16:00.985 Gelinen noktada, oldukça kolay bir şekilde 00:16:00.985 --> 00:16:03.234 büyük bölümleri alıp hata olmadığına 00:16:03.234 --> 00:16:05.246 emin olmak için kontrol edebiliriz. 00:16:05.246 --> 00:16:08.121 Hata olan yerlerde ise bilgisayara bildirebiliriz. 00:16:08.741 --> 00:16:12.128 Her farklı grup için bu tür bir süreç kullanarak 00:16:12.128 --> 00:16:14.683 1.5 milyon görüntüyü sınıflandırmada 00:16:14.683 --> 00:16:16.861 %80 başarı yüzdesine çıktık. 00:16:17.611 --> 00:16:19.620 Bu noktada konu sadece 00:16:19.620 --> 00:16:21.250 doğru sınıflandırılmamış olan 00:16:21.250 --> 00:16:23.038 küçük numarayı bulmak ve 00:16:23.038 --> 00:16:25.691 sebebini anlamaya çalışmak üzerine. 00:16:25.811 --> 00:16:28.922 Bu yaklaşımı kullanarak; 15 dakikada NOTE Paragraph 00:16:28.922 --> 00:16:31.928 %97' lik sınıflandırma oranına ulaştık. 00:16:31.928 --> 00:16:34.094 Bu tarz bir teknik bize çok önemli 00:16:34.094 --> 00:16:36.343 bir problemi çözmeye izin verebilir; 00:16:36.343 --> 00:16:39.087 dünyada tıbbi uzmanlığın olmadığı yerlerde. 00:16:39.087 --> 00:16:41.290 Dünya Ekonomik Forumu'na göre; 00:16:41.290 --> 00:16:44.124 gelişen dünyada doktor kıtlığı 10 ile 20 katı 00:16:44.124 --> 00:16:47.189 arasında ve 300 yıl alacaktır bu problemi 00:16:47.189 --> 00:16:50.448 çözmek için yeterli insan yetiştirmek. NOTE Paragraph 00:16:50.448 --> 00:16:53.420 Düşünün ki derin öğrenme yaklaşımını kullanarak 00:16:53.420 --> 00:16:56.539 verimliliklerini artırmaya yardım edebilsek? 00:16:56.539 --> 00:16:58.983 Fırsatlar konusunda oldukça heycanlıyım. 00:16:58.983 --> 00:17:01.452 Aynı zamanda problemlerle de ilgileniyorum. 00:17:01.452 --> 00:17:03.569 Buradaki problem ise; haritadaki 00:17:03.569 --> 00:17:05.563 her mavi alanda servisler 00:17:05.563 --> 00:17:07.757 istihdamın %80 den fazla. 00:17:07.757 --> 00:17:09.761 Servisler nedir? 00:17:09.761 --> 00:17:11.113 İşte servisler. 00:17:11.113 --> 00:17:13.453 Bunlar aynı zamanda bilgisayarın 00:17:13.453 --> 00:17:15.446 yapılma şeklini öğrendiği şeyler. 00:17:15.446 --> 00:17:17.983 Yani gelişen dünyadaki istihdamın %80 'inin 00:17:17.983 --> 00:17:20.140 yaptığı şeyler aynı zamanda bilgisayarın 00:17:20.140 --> 00:17:22.138 nasıl yapılacağını öğrendiği şeyler. 00:17:22.138 --> 00:17:24.860 Bu ne anlama geliyor? Tamam, bir şey olmayacak. 00:17:24.860 --> 00:17:26.708 Başka işlerle yer değiştirilcekler. 00:17:26.708 --> 00:17:29.146 Örneğin; Veri bilimciler için daha fazla iş olacak. 00:17:29.146 --> 00:17:30.458 Aslında öyle değil. 00:17:30.458 --> 00:17:32.238 Veri bilimcilerin bunları yapmaları 00:17:32.238 --> 00:17:33.544 çok zamanlarını almaz. 00:17:33.544 --> 00:17:35.025 Örneğin; bu 4 algoritma da aynı 00:17:35.025 --> 00:17:36.594 adam tarafından geliştirildi. 00:17:36.594 --> 00:17:39.206 Yani eğer; daha önceden de olmuştu, 00:17:39.206 --> 00:17:41.753 yeni işlerin gelip yer değiştirdiği 00:17:41.753 --> 00:17:43.948 zamanların sonuçlarını gördük. 00:17:43.948 --> 00:17:45.879 Bu yeni işlere ne olacak? 00:17:45.879 --> 00:17:48.205 Bunu kestirmek bizim için oldukça zor 00:17:48.205 --> 00:17:51.094 çünkü insan performansı bu şekilde kademeli olarak 00:17:51.094 --> 00:17:53.499 artıyor ama artık biz bir sisteme, derin öğrenmeye NOTE Paragraph 00:17:53.499 --> 00:17:55.999 sahibiz yani katlanarak büyüme kapasitesine 00:17:55.999 --> 00:17:57.586 sahip olduğunu biliyoruz. 00:17:57.586 --> 00:17:58.536 Ve burdayız. 00:17:58.536 --> 00:18:01.027 Şu anda, etrafımızdaki şeyleri görüyoruz ve: 00:18:01.027 --> 00:18:03.135 "Bilgisayarlar hala aptal." değil mi? 00:18:03.135 --> 00:18:05.037 Ama 5 yıllık süre içinde bilgisayarlar 00:18:05.037 --> 00:18:06.786 bu çizelgenin dışında olacak. 00:18:06.786 --> 00:18:10.100 Yani bu kabiliyeti hemen düşünmeye başlamalıyız. 00:18:10.100 --> 00:18:12.403 Bunu daha önceden görmüştük, elbette. 00:18:12.403 --> 00:18:14.782 Sanayi devriminde, motorlar sayesinde 00:18:14.782 --> 00:18:17.292 kapasitede kademe atlamayı gördük. 00:18:17.292 --> 00:18:19.594 Mesele şu ki, yine de bir süre sonra 00:18:19.594 --> 00:18:20.632 işler düzeliyor. 00:18:20.632 --> 00:18:22.770 Sosyal bozulma vardı ama bir kez 00:18:22.770 --> 00:18:24.838 motorlar güç üretmek için kullanıldı 00:18:24.838 --> 00:18:28.024 ve tüm durumlar, her şey düzene oturdu. NOTE Paragraph 00:18:28.024 --> 00:18:31.067 Makine Öğrenmesi Devrimi Sanayi devriminden 00:18:31.067 --> 00:18:32.830 çok daha farklı olacak çünkü 00:18:32.830 --> 00:18:35.570 Makine Öğrenmesi Devrimi asla durulmayacak. 00:18:35.570 --> 00:18:38.490 Bilgisayarlar entelektüel aktiviteler de iyiye gittikçe, NOTE Paragraph 00:18:38.490 --> 00:18:40.189 entelektüel kapasitede daha 00:18:40.189 --> 00:18:42.249 iyi olan bilgisayarlar üretilecek. 00:18:42.249 --> 00:18:45.146 Yani bu dünyanın daha önce tanık olmadığı 00:18:45.146 --> 00:18:47.496 türde bir değişim olacak bu yüzden 00:18:47.496 --> 00:18:49.869 neyin mümkün olduğu konusunda ki 00:18:49.869 --> 00:18:51.297 önceki anlayışınız farklı. 00:18:51.297 --> 00:18:52.848 Şimdiden bizi etkiliyor. 00:18:52.848 --> 00:18:56.304 Son 25 yılda, kapital üretim arttıkça 00:18:56.304 --> 00:19:00.608 işçi verimliliği sabitti hatta biraz inişteydi. 00:19:01.298 --> 00:19:03.357 Bu yüzden bu konuyu tartışmaya 00:19:03.357 --> 00:19:04.908 başlamamızı istiyorum. 00:19:04.908 --> 00:19:06.895 İnsanlara bu durum hakkında çoğu kez 00:19:06.895 --> 00:19:09.485 bahsettiğimde, insanlar oldukça ilgisiz olabiliyor. 00:19:09.485 --> 00:19:12.028 Bilgisayarlar gerçek anlamda düşünemez, 00:19:12.028 --> 00:19:14.290 duygusal davranmaz, şiirden anlamaz, 00:19:14.290 --> 00:19:16.400 nasıl çalıştıklarını tam olarak anlamıyoruz. 00:19:16.400 --> 00:19:17.330 Ne fark eder? 00:19:17.330 --> 00:19:19.560 Bilgisayarlar şu an insanların ücret alarak 00:19:19.560 --> 00:19:22.440 zamanlarının çoğunu harcadıkları şeyleri yapabiliyor. 00:19:22.440 --> 00:19:25.930 O zaman sosyal ve ekonomik yapımızı nasıl uyduracağımızı 00:19:25.930 --> 00:19:28.180 düşünmeye başlamamızın ve bu yeni gerçekliğin 00:19:28.180 --> 00:19:30.460 farkında olmamızın tam zamanı. 00:19:30.460 --> 00:19:31.400 Teşekkürler. 00:19:31.400 --> 00:19:32.190 (Alkışlar)