1 00:00:00,880 --> 00:00:04,893 Als je vroeger een computer iets nieuws wilde laten doen, 2 00:00:04,893 --> 00:00:06,447 moest je hem programmeren. 3 00:00:06,447 --> 00:00:09,858 Voor wie het nooit zelf heeft gedaan: 4 00:00:09,858 --> 00:00:13,360 programmeren vereist dat je tot in het allerpijnlijkste detail 5 00:00:13,360 --> 00:00:16,727 elke stap uitschrijft van wat je wil dat de computer doet 6 00:00:16,727 --> 00:00:19,089 om je doel te bereiken. 7 00:00:19,089 --> 00:00:22,585 Als je iets wil doen, waarvan je zelf niet weet hoe je het moet doen, 8 00:00:22,585 --> 00:00:24,648 dan is dit een grote uitdaging. 9 00:00:24,648 --> 00:00:28,131 Dat was de uitdaging voor deze man, Arthur Samuel. 10 00:00:28,131 --> 00:00:32,208 In 1956 wilde hij deze computer zover krijgen 11 00:00:32,208 --> 00:00:34,548 dat hij Samuel zelf kon verslaan bij het dammen. 12 00:00:34,548 --> 00:00:36,588 Hoe schrijf je een programma 13 00:00:36,588 --> 00:00:40,394 dat tot in het allerpijnlijkste detail, beter is in dammen dan je zelf bent? 14 00:00:40,394 --> 00:00:42,116 Hij kwam met een idee: 15 00:00:42,116 --> 00:00:45,840 hij liet de computer duizenden keren tegen zichzelf spelen 16 00:00:45,840 --> 00:00:48,364 en daarbij leren hoe te dammen. 17 00:00:48,364 --> 00:00:51,544 Het werkte en in 1962 versloeg 18 00:00:51,544 --> 00:00:54,951 deze computer de kampioen van de staat Connecticut. 19 00:00:54,951 --> 00:00:58,534 Zo werd Arthur Samuel de vader van het ‘machinaal leren’. 20 00:00:58,534 --> 00:01:00,251 Ik heb veel aan hem te danken, 21 00:01:00,251 --> 00:01:03,014 want ik doe aan machinaal leren. 22 00:01:03,014 --> 00:01:04,479 Ik was voorzitter van Kaggle, 23 00:01:04,479 --> 00:01:07,867 een gemeenschap van meer dan 200.000 machinaal-lerenbeoefenaars. 24 00:01:07,867 --> 00:01:09,925 Kaggle organiseert wedstrijden 25 00:01:09,925 --> 00:01:13,633 om eerder onopgeloste problemen op te lossen. 26 00:01:13,633 --> 00:01:17,470 Dat lukte al honderden keren. 27 00:01:17,470 --> 00:01:19,940 Daardoor kon ik heel wat te weten komen 28 00:01:19,940 --> 00:01:23,890 over wat machinaal leren kon doen in het verleden, vandaag, 29 00:01:23,890 --> 00:01:26,252 en wat het zou kunnen doen in de toekomst. 30 00:01:26,252 --> 00:01:30,675 Misschien is Google het eerste grote commerciële succes van machinaal leren. 31 00:01:30,675 --> 00:01:33,784 Google liet zien dat het mogelijk is om informatie te vinden 32 00:01:33,784 --> 00:01:35,536 met een computeralgoritme. 33 00:01:35,536 --> 00:01:38,267 Dit algoritme is gebaseerd op machinaal leren. 34 00:01:38,267 --> 00:01:42,053 Sinds die tijd heeft machinaal leren heel wat commerciële successen geboekt. 35 00:01:42,053 --> 00:01:45,350 Bedrijven als Amazon en Netflix gebruiken machinaal leren 36 00:01:45,350 --> 00:01:48,046 om producten te suggereren die je misschien wilt kopen, 37 00:01:48,046 --> 00:01:49,896 of films om naar te kijken. 38 00:01:49,896 --> 00:01:51,703 Soms is het bijna griezelig. 39 00:01:51,703 --> 00:01:53,437 Bedrijven zoals LinkedIn en Facebook 40 00:01:53,437 --> 00:01:56,251 kunnen je soms vertellen wie je vrienden zouden kunnen zijn 41 00:01:56,251 --> 00:01:58,828 en je hebt geen idee hoe dat in zijn werk ging. 42 00:01:58,828 --> 00:02:01,195 Dat is de kracht van machinaal leren. 43 00:02:01,195 --> 00:02:04,152 Deze algoritmen hebben dit uit gegevens geleerd te doen 44 00:02:04,152 --> 00:02:07,399 in plaats van door manueel programmeren. 45 00:02:07,399 --> 00:02:09,877 Daarom ook kon Watson van IBM 46 00:02:09,877 --> 00:02:12,879 de twee wereldkampioenen bij "Jeopardy" verslaan 47 00:02:12,879 --> 00:02:16,219 door heel subtiele en complexe vragen als deze te beantwoorden. 48 00:02:16,219 --> 00:02:20,149 ["O.a. de oude 'Leeuw van Nimrod' verdween hier in 2003 uit het nationaal museum."] 49 00:02:20,149 --> 00:02:23,034 Ook daarom kunnen we nu de eerste zelfsturende auto's zien. 50 00:02:23,034 --> 00:02:26,716 Het verschil zien tussen een boom en een voetganger 51 00:02:26,716 --> 00:02:28,258 is dan nogal belangrijk. 52 00:02:28,258 --> 00:02:31,355 We weten niet hoe we zulke programma's handmatig moeten schrijven, 53 00:02:31,355 --> 00:02:33,622 maar met machinaal leren kan het. 54 00:02:33,622 --> 00:02:37,210 Deze auto heeft er al meer dan een miljoen kilometer opzitten 55 00:02:37,210 --> 00:02:40,186 zonder ongevallen en op gewone wegen. 56 00:02:40,196 --> 00:02:44,110 We weten nu dat computers kunnen leren, 57 00:02:44,110 --> 00:02:46,010 en computers dingen kunnen leren doen 58 00:02:46,010 --> 00:02:49,648 waarvan we eigenlijk soms niet weten hoe we ze zelf moeten doen, 59 00:02:49,648 --> 00:02:51,733 of kunnen ze misschien beter doen dan wij. 60 00:02:51,733 --> 00:02:53,928 Een van de meest verbazingwekkende voorbeelden 61 00:02:53,928 --> 00:02:56,123 van machinaal leren die ik heb gezien, 62 00:02:56,123 --> 00:02:58,930 zag ik op een project dat ik op Kaggle leidde. 63 00:02:58,930 --> 00:03:02,683 Een team geleid door Geoffrey Hinton van de Universiteit van Toronto 64 00:03:02,683 --> 00:03:06,520 won een wedstrijd in het geautomatiseerd ontdekken van geneesmiddelen. 65 00:03:06,520 --> 00:03:10,587 Het was al buitengewoon dat ze alle algoritmen van Merck 66 00:03:10,587 --> 00:03:13,269 en de internationale academische gemeenschap versloegen, 67 00:03:13,269 --> 00:03:15,600 maar daarbij had niemand in het team een achtergrond 68 00:03:15,600 --> 00:03:17,820 in scheikunde, biologie of levenswetenschappen, 69 00:03:17,820 --> 00:03:20,230 en ze deden het in twee weken. 70 00:03:20,230 --> 00:03:21,611 Hoe deden ze het? 71 00:03:22,421 --> 00:03:25,342 Ze gebruikten een buitengewoon algoritme: ‘deep learning’. 72 00:03:25,342 --> 00:03:28,291 Zo belangrijk was dat, dat het een paar weken later 73 00:03:28,291 --> 00:03:31,412 in The New York Times als voorpagina-artikel verscheen. 74 00:03:31,412 --> 00:03:34,147 Dit is Geoffrey Hinton hier links. 75 00:03:34,147 --> 00:03:38,488 Deep learning is een algoritme geïnspireerd op het menselijk brein. 76 00:03:38,488 --> 00:03:40,300 Daardoor is het een algoritme 77 00:03:40,300 --> 00:03:44,141 zonder theoretische beperkingen op wat het kan doen. 78 00:03:44,141 --> 00:03:46,964 Hoe meer gegevens en rekentijd je het geeft, 79 00:03:46,964 --> 00:03:48,276 hoe beter het wordt. 80 00:03:48,276 --> 00:03:50,375 De New York Times toonde in dit artikel ook 81 00:03:50,375 --> 00:03:53,117 een ander uitzonderlijk resultaat van deep learning. 82 00:03:53,117 --> 00:03:55,569 Ik ga het je nu laten zien. 83 00:03:55,569 --> 00:04:00,510 Het toont aan dat computers kunnen luisteren en begrijpen. 84 00:04:00,510 --> 00:04:03,221 (Video) Richard Rashid: De laatste stap 85 00:04:03,221 --> 00:04:06,246 die ik in dit proces wil kunnen zetten, 86 00:04:06,246 --> 00:04:10,961 is om je daadwerkelijk in het Chinees aan te spreken. 87 00:04:10,961 --> 00:04:13,596 Het belangrijkste is 88 00:04:13,596 --> 00:04:18,598 dat we een grote hoeveelheid informatie van vele Chinese sprekers konden vergaren 89 00:04:18,598 --> 00:04:21,128 en een tekst-naar-spraaksysteem produceren 90 00:04:21,128 --> 00:04:25,801 dat Chinese tekst omzet naar Chinese spreektaal. 91 00:04:25,801 --> 00:04:29,929 Daarna hebben we een paar uren mijn eigen stem opgenomen 92 00:04:29,929 --> 00:04:33,800 en ze gebruikt om het standaard tekst-naar-spraak systeem te moduleren 93 00:04:33,800 --> 00:04:36,364 zodat het zou klinken zoals ik. 94 00:04:36,364 --> 00:04:38,904 Het resultaat is niet perfect. 95 00:04:38,904 --> 00:04:41,552 Er zitten nogal wat fouten in. 96 00:04:41,552 --> 00:04:44,036 (In het Chinees) 97 00:04:44,036 --> 00:04:47,403 (Applaus) 98 00:04:49,446 --> 00:04:53,022 Er is nog veel werk te doen op dit gebied. 99 00:04:53,022 --> 00:04:56,667 (In het Chinees) 100 00:04:56,667 --> 00:05:00,100 (Applaus) 101 00:05:00,855 --> 00:05:04,744 Jeremy Howard: Dat was op een conferentie over machinaal leren in China. 102 00:05:04,744 --> 00:05:07,114 Op wetenschappelijke congressen 103 00:05:07,114 --> 00:05:09,011 hoor je niet vaak spontaan applaus, 104 00:05:09,011 --> 00:05:12,687 maar natuurlijk wel eens bij TEDx conferenties, het mag. 105 00:05:12,687 --> 00:05:15,482 Alles wat je zag, gebeurde met deep learning. 106 00:05:15,482 --> 00:05:17,007 (Applaus) Dank je. 107 00:05:17,007 --> 00:05:19,289 De transcriptie in het Engels was deep learning. 108 00:05:19,289 --> 00:05:23,501 Ook de vertaling naar Chinees en de tekst in de rechterbovenhoek is deep learning. 109 00:05:23,501 --> 00:05:26,008 De constructie van de stem, weer deep learning. 110 00:05:26,008 --> 00:05:29,242 Deep learning is buitengewoon. 111 00:05:29,242 --> 00:05:32,341 Een enkel algoritme lijkt bijna alles te kunnen. 112 00:05:32,341 --> 00:05:35,362 Een jaar eerder ontdekte ik dat het systeem ook had leren zien. 113 00:05:35,362 --> 00:05:37,758 Bij een minder bekende wedstrijd in Duitsland, 114 00:05:37,758 --> 00:05:40,545 de German Traffic Sign Recognition Benchmark, 115 00:05:40,545 --> 00:05:43,750 heeft deep learning verkeersborden zoals deze leren herkennen. 116 00:05:43,755 --> 00:05:47,320 Niet alleen kan het verkeersborden beter dan enig ander algoritme herkennen, 117 00:05:47,320 --> 00:05:51,849 het scorebord liet zien dat het ook ongeveer twee keer beter was dan mensen. 118 00:05:51,849 --> 00:05:54,617 In 2011 hadden we dus het eerste voorbeeld 119 00:05:54,617 --> 00:05:57,442 van computers die beter kunnen zien dan mensen. 120 00:05:57,442 --> 00:05:59,491 Sinds die tijd is er veel gebeurd. 121 00:05:59,491 --> 00:06:02,545 In 2012 kondigde Google aan dat ze een deep learning-algoritme 122 00:06:02,545 --> 00:06:04,420 YouTube-video’s lieten bekijken. 123 00:06:04,420 --> 00:06:07,857 Het verwerkte een maand lang de gegevens op 16.000 computers, 124 00:06:07,857 --> 00:06:11,928 en de computer leerde zelfstandig over begrippen als mensen en katten 125 00:06:11,928 --> 00:06:14,027 gewoon door naar de video's te kijken. 126 00:06:14,027 --> 00:06:16,379 Net als de manier waarop mensen leren. 127 00:06:16,379 --> 00:06:19,119 Mensen leren niet doordat hen wordt verteld wat ze zien, 128 00:06:19,119 --> 00:06:22,450 maar door zichzelf deze dingen te leren. 129 00:06:22,450 --> 00:06:25,819 Ook in 2012, won Geoffrey Hinton, die we eerder zagen, 130 00:06:25,819 --> 00:06:28,677 de zeer populaire ImageNet-wedstrijd, 131 00:06:28,677 --> 00:06:32,818 door te kijken naar anderhalf miljoen afbeeldingen om erachter te komen 132 00:06:32,818 --> 00:06:34,256 wat ze voorstelden. 133 00:06:34,256 --> 00:06:37,789 Vanaf 2014 zitten we op een zes procent foutenpercentage 134 00:06:37,789 --> 00:06:39,242 bij beeldherkenning. 135 00:06:39,242 --> 00:06:41,268 Dit is alweer beter dan mensen. 136 00:06:41,268 --> 00:06:45,037 Machines kunnen dit buitengewoon goed 137 00:06:45,037 --> 00:06:47,306 en het wordt nu gebruikt in de industrie. 138 00:06:47,306 --> 00:06:50,348 Vorig jaar kondigde Google bijvoorbeeld aan 139 00:06:50,348 --> 00:06:54,933 dat ze elke locatie in Frankrijk in twee uur tijd in kaart hadden gebracht, 140 00:06:54,933 --> 00:06:58,380 door Street View-beelden 141 00:06:58,380 --> 00:07:02,169 met een deep learning-algoritme te herkennen en de huisnummers te lezen. 142 00:07:02,169 --> 00:07:05,399 Stel je voor hoe lang het anders zou hebben geduurd: 143 00:07:05,399 --> 00:07:08,274 tientallen mensen, vele jaren. 144 00:07:08,274 --> 00:07:10,185 Dit gebeurt ook in China. 145 00:07:10,185 --> 00:07:14,221 Baidu is een soort Chinese Google, denk ik, 146 00:07:14,221 --> 00:07:16,504 en wat je hier ziet in de linkerbovenhoek, 147 00:07:16,504 --> 00:07:19,085 is een voorbeeld van een foto die ik heb geüpload 148 00:07:19,085 --> 00:07:20,956 naar Baidu’s deep learning-systeem. 149 00:07:20,956 --> 00:07:24,607 Daaronder kun je zien dat het systeem heeft begrepen wat dat beeld is 150 00:07:24,607 --> 00:07:26,223 en gelijkaardige beelden vond. 151 00:07:26,223 --> 00:07:29,219 De gelijkaardige beelden hebben gelijkaardige achtergronden, 152 00:07:29,219 --> 00:07:30,877 dezelfde richtingen van gezichten, 153 00:07:30,877 --> 00:07:32,665 sommige zelfs met hun tong uit. 154 00:07:32,665 --> 00:07:35,695 Dit is niet zomaar wat kijken naar de tekst van een webpagina. 155 00:07:35,695 --> 00:07:37,927 Alles wat ik uploadde, waren beelden. 156 00:07:37,927 --> 00:07:41,128 Dus hebben we nu computers die echt begrijpen wat ze zien 157 00:07:41,128 --> 00:07:42,752 en derhalve databases 158 00:07:42,752 --> 00:07:46,306 van honderden miljoenen beelden in real time doorzoeken. 159 00:07:46,306 --> 00:07:49,536 Wat betekent het nu dat computers kunnen zien? 160 00:07:49,536 --> 00:07:51,553 Computers kunnen niet alleen maar zien. 161 00:07:51,553 --> 00:07:53,622 Deep learning doet meer. 162 00:07:53,622 --> 00:07:56,570 Complexe, genuanceerde zinnen zoals deze 163 00:07:56,570 --> 00:07:59,394 zijn nu begrijpelijk met deep learning-algoritmen. 164 00:07:59,394 --> 00:08:00,697 Zoals je hier kunt zien, 165 00:08:00,697 --> 00:08:03,465 heeft dit systeem van Stanford met de rode stip bovenaan 166 00:08:03,465 --> 00:08:07,384 uitgeknobbeld dat deze zin een negatief sentiment weergeeft. 167 00:08:07,384 --> 00:08:10,790 Deep learning komt in de buurt van menselijke prestaties 168 00:08:10,802 --> 00:08:15,923 bij het begrijpen waar zinnen over gaan en wat ze zeggen over die dingen. 169 00:08:15,923 --> 00:08:18,651 Ook is deep learning gebruikt om Chinees te lezen, 170 00:08:18,651 --> 00:08:21,807 weer op ongeveer het niveau van Chinese moedertaalsprekers. 171 00:08:21,807 --> 00:08:23,975 Dit algoritme werd in Zwitserland ontwikkeld 172 00:08:23,975 --> 00:08:27,331 alweer door mensen die geen Chinees spreken of begrijpen. 173 00:08:27,331 --> 00:08:29,132 Zoals ik al zei, deep learning 174 00:08:29,132 --> 00:08:31,771 is zowat het beste systeem ter wereld hiervoor, 175 00:08:31,771 --> 00:08:36,717 zelfs in vergelijking met autochtoon menselijk begrijpen. 176 00:08:36,717 --> 00:08:39,682 Het is een systeem dat we op mijn bedrijf hebben ontwikkeld 177 00:08:39,682 --> 00:08:41,727 door dit allemaal te combineren. 178 00:08:41,727 --> 00:08:44,188 Dit zijn foto’s zonder bijhorende tekst, 179 00:08:44,188 --> 00:08:46,541 en terwijl ik hier zinnen typ, 180 00:08:46,541 --> 00:08:49,510 begrijpt het deze foto’s in real time, 181 00:08:49,510 --> 00:08:51,189 zoekt uit waarover ze gaan 182 00:08:51,189 --> 00:08:54,352 en vindt foto’s die lijken op de tekst die ik schrijf. 183 00:08:54,352 --> 00:08:59,322 Zoals jullie kunnen zien, begrijpt het mijn zinnen en deze foto's echt. 184 00:08:59,332 --> 00:09:01,891 Dit heb je vast al gezien op Google, 185 00:09:01,891 --> 00:09:04,666 waar je woorden kunt intypen en het je afbeeldingen toont, 186 00:09:04,666 --> 00:09:07,790 maar eigenlijk doorzoekt het de webpagina op tekst. 187 00:09:07,790 --> 00:09:11,441 Dat is heel wat anders dan werkelijk begrijpen van de afbeeldingen. 188 00:09:11,441 --> 00:09:13,843 Dit kunnen computers alleen nog maar 189 00:09:13,843 --> 00:09:17,091 sinds de laatste paar maanden. 190 00:09:17,091 --> 00:09:21,182 Computers kunnen dus niet alleen zien, maar ook lezen, 191 00:09:21,182 --> 00:09:24,467 en, zoals we hebben aangetoond, ook begrijpen wat ze horen. 192 00:09:24,467 --> 00:09:28,599 Misschien niet zo verwonderlijk dat ik je vertel dat ze kunnen schrijven. 193 00:09:28,599 --> 00:09:33,172 Deze tekst genereerde ik gisteren met een deep learning-algoritme. 194 00:09:33,172 --> 00:09:37,096 En hier een stukje tekst dat een algoritme van Stanford genereerde. 195 00:09:37,096 --> 00:09:38,860 Elk van deze zinnen werd gegenereerd 196 00:09:38,860 --> 00:09:43,109 door een deep learning-algoritme om elk van deze foto's te beschrijven. 197 00:09:43,109 --> 00:09:47,581 Dit algoritme had nog nooit een man in een zwart shirt gitaar zien spelen. 198 00:09:47,581 --> 00:09:49,801 Het had al apart een man, zwart 199 00:09:49,801 --> 00:09:51,400 en een gitaar gezien, 200 00:09:51,400 --> 00:09:55,694 maar genereerde onafhankelijk de nieuwe beschrijving van dit beeld. 201 00:09:55,694 --> 00:09:58,047 We zijn nog niet zover als menselijke prestaties, 202 00:09:58,047 --> 00:09:59,310 maar we komen in de buurt. 203 00:09:59,310 --> 00:10:02,794 Bij tests geven mensen één op de vier keer de voorkeur 204 00:10:02,794 --> 00:10:04,961 aan het bijschrift van de computer. 205 00:10:04,961 --> 00:10:06,855 Dit systeem is nog maar twee weken oud, 206 00:10:06,855 --> 00:10:09,491 dus waarschijnlijk zal in de loop van volgend jaar, 207 00:10:09,491 --> 00:10:12,762 het computer-algoritme het beter doen dan mensen. 208 00:10:13,364 --> 00:10:16,413 Computers kunnen dus ook schrijven. 209 00:10:16,413 --> 00:10:19,888 Dit alles tezamen leidt tot zeer interessante mogelijkheden. 210 00:10:19,888 --> 00:10:23,295 In de geneeskunde heeft een team in Boston aangekondigd 211 00:10:23,295 --> 00:10:27,224 tientallen nieuwe klinisch relevante eigenschappen van tumoren 212 00:10:27,224 --> 00:10:31,120 te hebben ontdekt, wat artsen helpt bij het maken van prognoses voor kanker. 213 00:10:31,980 --> 00:10:34,516 Ook in Stanford maakte een groep bekend 214 00:10:34,516 --> 00:10:37,569 dat ze, kijkend naar weefsels onder vergroting, 215 00:10:37,569 --> 00:10:40,790 een op machinaal-leren gebaseerd systeem hebben ontwikkeld 216 00:10:40,790 --> 00:10:43,142 dat beter was dan menselijke pathologen 217 00:10:43,142 --> 00:10:47,519 in het voorspellen van overlevingskansen voor kankerpatiënten. 218 00:10:47,519 --> 00:10:50,764 In beide gevallen werden niet alleen de voorspellingen nauwkeuriger, 219 00:10:50,764 --> 00:10:53,266 maar ze genereerden nieuwe inzichtelijke wetenschap. 220 00:10:53,276 --> 00:10:54,421 Bij de radiologie 221 00:10:54,421 --> 00:10:57,876 waren dat nieuwe klinische indicatoren die mensen kunnen begrijpen. 222 00:10:57,876 --> 00:10:59,668 Bij de pathologie 223 00:10:59,668 --> 00:11:04,168 ontdekte het computersysteem dat de cellen rond de kanker 224 00:11:04,168 --> 00:11:07,508 even belangrijk zijn als de kankercellen zelf 225 00:11:07,508 --> 00:11:09,260 bij het maken van een diagnose. 226 00:11:09,260 --> 00:11:14,621 Dit is het tegenovergestelde van wat pathologen decennialang hadden geleerd. 227 00:11:14,621 --> 00:11:17,913 In beide gevallen werden systemen ontwikkeld 228 00:11:17,913 --> 00:11:21,534 door een combinatie van medische experts en machinaal-lerenexperts, 229 00:11:21,534 --> 00:11:24,275 maar dat was vorig jaar, nu staan we verder. 230 00:11:24,275 --> 00:11:27,824 Dit is een voorbeeld van identificatie van carcinomateuze gebieden 231 00:11:27,824 --> 00:11:30,354 van menselijk weefsel onder een microscoop. 232 00:11:30,354 --> 00:11:32,575 Het systeem dat hier wordt getoond, 233 00:11:32,575 --> 00:11:34,798 kan deze doelgebieden preciezer identificeren 234 00:11:34,798 --> 00:11:37,842 of ongeveer net zo precies als menselijke pathologen, maar werd 235 00:11:37,842 --> 00:11:41,134 geheel ontwikkeld met deep learning zonder medische expertise 236 00:11:41,134 --> 00:11:43,660 door mensen zonder achtergrond op dat gebied. 237 00:11:44,730 --> 00:11:47,045 Evenzo bij deze neuronen-segmentatie. 238 00:11:47,045 --> 00:11:48,623 We kunnen nu neuronen ongeveer 239 00:11:48,623 --> 00:11:51,371 net zo nauwkeurig onderscheiden als mensen het kunnen, 240 00:11:51,371 --> 00:11:53,670 maar dit systeem is ontwikkeld met deep learning 241 00:11:53,670 --> 00:11:56,921 met mensen zonder eerdere achtergrond in de geneeskunde. 242 00:11:56,921 --> 00:12:00,148 Ikzelf, als iemand zonder eerdere achtergrond in de geneeskunde, 243 00:12:00,148 --> 00:12:04,305 lijk helemaal gekwalificeerd te zijn om een nieuw medisch bedrijf op te starten, 244 00:12:04,305 --> 00:12:05,931 wat ik dan ook deed. 245 00:12:05,931 --> 00:12:07,761 Ik was doodsbang om het te doen, 246 00:12:07,761 --> 00:12:10,940 maar de theorie leek te suggereren dat het mogelijk moet zijn 247 00:12:10,940 --> 00:12:15,917 om aan zeer bruikbare geneeskunde te doen met deze data-analyse technieken. 248 00:12:15,964 --> 00:12:18,622 Gelukkig is de feedback fantastisch geweest. 249 00:12:18,622 --> 00:12:20,018 Niet alleen van de media 250 00:12:20,018 --> 00:12:23,262 maar ook van de medische gemeenschap, die zeer positief reageerde. 251 00:12:23,262 --> 00:12:27,471 De theorie is dat wij het middelste deel van het medische proces kunnen overnemen 252 00:12:27,471 --> 00:12:30,364 en dat zoveel mogelijk in gegevensanalyse omzetten 253 00:12:30,364 --> 00:12:33,429 om artsen dat te laten doen waarin ze uitblinken. 254 00:12:33,429 --> 00:12:35,031 Ik geef een voorbeeld. 255 00:12:35,031 --> 00:12:37,080 Het kost ons nu ongeveer 15 minuten 256 00:12:37,080 --> 00:12:39,899 om een nieuwe medische diagnostische test te genereren. 257 00:12:39,899 --> 00:12:41,929 Ik toon het in real-time, 258 00:12:41,929 --> 00:12:45,216 maar comprimeerde het tot drie minuten door wat weg te laten. 259 00:12:45,216 --> 00:12:48,727 In plaats van het creëren van een medisch-diagnostische test te tonen, 260 00:12:48,727 --> 00:12:51,846 toon ik een diagnostische test van afbeeldingen van auto's, 261 00:12:51,846 --> 00:12:54,068 want dat begrijpen we allemaal. 262 00:12:54,068 --> 00:12:57,269 We beginnen hier met ongeveer 1,5 miljoen afbeeldingen van auto's, 263 00:12:57,269 --> 00:13:00,475 en ik wil iets maken dat hen kan sorteren 264 00:13:00,475 --> 00:13:02,698 volgens de hoek vanwaar de foto werd genomen. 265 00:13:02,698 --> 00:13:06,586 Deze beelden zijn ongelabeld, dus moet ik beginnen vanaf nul. 266 00:13:06,586 --> 00:13:08,451 Met ons deep learning-algoritme 267 00:13:08,451 --> 00:13:12,158 kan het automatisch structuurdelen identificeren in deze beelden. 268 00:13:12,158 --> 00:13:15,778 Het leuke is dat mens en computer nu kunnen samenwerken. 269 00:13:15,778 --> 00:13:17,956 De mens zoals hier te zien, 270 00:13:17,956 --> 00:13:20,631 wijst de computer op aandachtsgebieden 271 00:13:20,631 --> 00:13:25,281 waarvan hij wil dat de computer ze gebruikt om het algoritme te verbeteren. 272 00:13:25,281 --> 00:13:29,577 Deze deep learning-systemen zijn in feite in een 16.000-dimensionale ruimte. 273 00:13:29,577 --> 00:13:33,009 Je kunt de computer dit in die ruimte zien draaien, 274 00:13:33,009 --> 00:13:35,001 om nieuwe structuurgebieden te vinden. 275 00:13:35,001 --> 00:13:36,782 Als dat lukt, 276 00:13:36,782 --> 00:13:40,786 kan de mens dan wijzen op gebieden die interessant zijn. 277 00:13:40,786 --> 00:13:43,208 Hier heeft de computer goede gebieden gevonden, 278 00:13:43,208 --> 00:13:45,770 bijvoorbeeld hoeken. 279 00:13:45,770 --> 00:13:47,376 Bij het doorlopen van dit proces, 280 00:13:47,376 --> 00:13:50,136 vertellen we de computer geleidelijk aan meer en meer 281 00:13:50,136 --> 00:13:52,144 over de soorten structuren die we zoeken. 282 00:13:52,144 --> 00:13:54,826 Je kunt je voorstellen dat in een diagnostische test 283 00:13:54,826 --> 00:13:57,266 een patholoog zieke gebieden gaat identificeren 284 00:13:57,266 --> 00:14:02,292 of een radioloog potentieel gevaarlijke knobbeltjes aanwijst. 285 00:14:02,292 --> 00:14:04,851 Soms wordt het moeilijk voor het algoritme. 286 00:14:04,851 --> 00:14:06,295 Hier raakte het in de war. 287 00:14:06,295 --> 00:14:09,605 De voor- en achterkanten van de auto's worden door elkaar gehaald. 288 00:14:09,605 --> 00:14:11,437 Dus moeten we hier wat preciezer zijn, 289 00:14:11,437 --> 00:14:14,669 voor- en achterkanten handmatig selecteren 290 00:14:14,669 --> 00:14:16,475 en de computer vertellen 291 00:14:16,475 --> 00:14:21,523 dat dit een soort groep is waarin we geïnteresseerd zijn. 292 00:14:21,523 --> 00:14:24,200 Dat doen we even, we slaan even wat over, 293 00:14:24,200 --> 00:14:26,446 en trainen daarmee het machinaal-lerenalgoritme 294 00:14:26,446 --> 00:14:28,420 op basis van die paar honderd dingen, 295 00:14:28,420 --> 00:14:30,445 en hopen dat het dan veel beter gaat. 296 00:14:30,445 --> 00:14:33,518 Jullie zien, hij begint nu sommige van deze foto’s te vervagen, 297 00:14:33,518 --> 00:14:37,586 en laat daarmee zien dat het sommige ervan zelf begint te begrijpen. 298 00:14:37,586 --> 00:14:41,418 We kunnen dan gebruik maken van het concept van soortgelijke foto's, 299 00:14:41,418 --> 00:14:43,222 daarmee kun je nu zien 300 00:14:43,222 --> 00:14:47,241 dat de computer in staat is om alleen de voorkanten van auto’s te vinden. 301 00:14:47,241 --> 00:14:50,189 Nu kan de mens de computer vertellen: 302 00:14:50,189 --> 00:14:52,482 “Oké, dat heb je goed gedaan.” 303 00:14:53,652 --> 00:14:55,837 Maar zelfs op dit punt 304 00:14:55,837 --> 00:14:59,511 is het soms nog steeds moeilijk groepen te scheiden. 305 00:14:59,511 --> 00:15:03,395 Zelfs na de computer dit een tijdje te laten roteren, 306 00:15:03,399 --> 00:15:06,744 zien we nog steeds dat foto’s van de linker- en de rechterzijde 307 00:15:06,744 --> 00:15:08,052 door elkaar worden gehaald. 308 00:15:08,052 --> 00:15:10,702 We kunnen dan de computer weer enkele tips geven, 309 00:15:10,702 --> 00:15:13,338 en zeggen dat hij een projectie moet zoeken 310 00:15:13,338 --> 00:15:15,945 die de linker- en rechterkant zoveel mogelijk scheidt 311 00:15:15,945 --> 00:15:18,067 door middel van een deep learning-algoritme. 312 00:15:18,067 --> 00:15:21,009 En met die hint – ah, oké, het is gelukt. 313 00:15:21,009 --> 00:15:23,891 Hij vond een manier van denken over deze objecten 314 00:15:23,891 --> 00:15:26,271 dat ze van elkaar scheidde. 315 00:15:26,271 --> 00:15:28,709 Je ziet het idee erachter. 316 00:15:28,709 --> 00:15:36,906 Hier werd de mens niet vervangen door een computer, 317 00:15:36,906 --> 00:15:39,546 maar ze werkten samen. 318 00:15:39,626 --> 00:15:45,488 Dit zou een team van vijf of zes personen zeven jaar hebben gekost. 319 00:15:45,488 --> 00:15:47,703 Dit duurt 15 minuten 320 00:15:47,703 --> 00:15:50,208 voor één enkele persoon. 321 00:15:50,208 --> 00:15:54,158 Dit proces neemt ongeveer vier of vijf iteraties in beslag. 322 00:15:54,158 --> 00:15:56,017 Je kunt zien dat we nu 62% 323 00:15:56,017 --> 00:15:58,976 van onze 1,5 miljoen beelden correct hebben geclassificeerd. 324 00:15:58,976 --> 00:16:02,738 Vanaf nu kunnen we vrij snel heel grote secties aanpakken 325 00:16:02,745 --> 00:16:05,664 en controleren of er geen fouten werden gemaakt. 326 00:16:05,664 --> 00:16:09,616 Waar fouten zijn, kunnen we de computer daarop wijzen. 327 00:16:09,616 --> 00:16:12,661 Met dit soort proces voor elk van de verschillende groepen, 328 00:16:12,661 --> 00:16:15,148 hebben we nu een 80% kans op succes 329 00:16:15,148 --> 00:16:17,563 bij het sorteren van de 1,5 miljoen afbeeldingen. 330 00:16:17,563 --> 00:16:19,641 Dan is het nog zaak 331 00:16:19,641 --> 00:16:23,220 het kleine aantal te vinden dat niet correct werd ingedeeld 332 00:16:23,220 --> 00:16:26,108 en proberen te begrijpen waarom. 333 00:16:26,108 --> 00:16:27,851 Met behulp van die aanpak 334 00:16:27,851 --> 00:16:31,972 krijgen we op 15 minuten tot 97% juiste classificatie. 335 00:16:31,972 --> 00:16:36,572 Dit soort techniek stelt ons in staat een groot probleem op te lossen, 336 00:16:36,578 --> 00:16:39,614 namelijk het gebrek aan medische expertise in de wereld. 337 00:16:39,614 --> 00:16:43,103 Het Wereld Economisch Forum zegt dat er tussen de 10 en 20 keer 338 00:16:43,103 --> 00:16:45,727 te weinig artsen zijn in de derde wereld. 339 00:16:45,727 --> 00:16:47,620 Het zou ongeveer 300 jaar duren 340 00:16:47,620 --> 00:16:50,994 om voldoende mensen op te leiden om dat probleem op te lossen. 341 00:16:50,994 --> 00:16:53,619 Stel dat we hun efficiëntie kunnen verbeteren 342 00:16:53,619 --> 00:16:56,458 met behulp van deep learning? 343 00:16:56,458 --> 00:16:58,690 Ik ben erg enthousiast over de mogelijkheden. 344 00:16:58,690 --> 00:17:01,279 Maar ik zie ook problemen. 345 00:17:01,279 --> 00:17:04,403 Het probleem hier is dat elk gebied in het blauw op deze kaart 346 00:17:04,403 --> 00:17:08,752 ergens is waar de dienstensector instaat voor meer dan 80% van de werkgelegenheid. 347 00:17:08,752 --> 00:17:09,959 Wat zijn diensten? 348 00:17:09,959 --> 00:17:11,473 Dit zijn diensten. 349 00:17:11,473 --> 00:17:15,627 Dit zijn ook exact die dingen die computers net hebben leren doen. 350 00:17:15,627 --> 00:17:19,431 Dus 80% van de werkgelegenheid in de ontwikkelde wereld 351 00:17:19,431 --> 00:17:21,963 zijn zaken die computers net hebben leren doen. 352 00:17:21,963 --> 00:17:23,123 Wat betekent dat? 353 00:17:23,123 --> 00:17:24,588 Het komt wel goed. 354 00:17:24,588 --> 00:17:26,179 Er komen wel andere banen. 355 00:17:26,179 --> 00:17:28,690 Bijvoorbeeld meer banen voor datawetenschappers. 356 00:17:28,690 --> 00:17:32,628 Nou, niet echt. Datawetenschappers kunnen deze dingen heel snel ontwikkelen. 357 00:17:32,628 --> 00:17:35,880 Zo werden deze vier algoritmes alle ontwikkeld door dezelfde man. 358 00:17:35,880 --> 00:17:38,748 Als je denkt: “Ach, het is allemaal al eerder gebeurd, 359 00:17:38,748 --> 00:17:42,126 we zagen wat er vroeger gebeurde als er nieuwe dingen kwamen, 360 00:17:42,126 --> 00:17:44,378 ze worden vervangen door nieuwe banen.” 361 00:17:44,378 --> 00:17:46,494 Maar wat zullen deze nieuwe banen zijn? 362 00:17:46,494 --> 00:17:48,125 Moeilijk in te schatten, 363 00:17:48,125 --> 00:17:51,104 omdat menselijk kunnen met dit geleidelijke tempo groeit, 364 00:17:51,104 --> 00:17:53,666 maar we hebben nu een deep learning-systeem 365 00:17:53,666 --> 00:17:56,893 dat eigenlijk exponentieel in mogelijkheden toeneemt. 366 00:17:56,893 --> 00:17:58,498 Hier zijn we. 367 00:17:58,498 --> 00:17:59,969 We kijken naar wat we hebben 368 00:17:59,969 --> 00:18:03,235 en zeggen: "Ach, computers zijn nog steeds behoorlijk dom." Ja? 369 00:18:03,235 --> 00:18:06,664 Maar in vijf jaar tijd zullen computers buiten deze grafiek vallen. 370 00:18:06,664 --> 00:18:10,049 Daar moeten we nu al beginnen over na te denken. 371 00:18:10,049 --> 00:18:12,579 Hebben we dit niet al eerder zien gebeuren? 372 00:18:12,579 --> 00:18:13,966 In de Industriële Revolutie 373 00:18:13,966 --> 00:18:16,817 deden we een grote stap in mogelijkheden dankzij machines. 374 00:18:17,667 --> 00:18:20,345 Maar na een tijdje vlakte het wat af. 375 00:18:20,345 --> 00:18:22,657 Er was maatschappelijke ontwrichting, 376 00:18:22,657 --> 00:18:25,946 maar zodra machines in alle situaties voor energie gingen zorgen, 377 00:18:25,946 --> 00:18:28,300 kalmeerde het weer. 378 00:18:28,300 --> 00:18:29,773 De Machinaal-Leren Revolutie 379 00:18:29,773 --> 00:18:32,682 zal heel wat anders zijn dan de Industriële Revolutie, 380 00:18:32,682 --> 00:18:35,632 omdat de Machinaal-Leren Revolutie nooit gaat stoppen. 381 00:18:35,632 --> 00:18:38,614 Hoe beter computers worden in intellectuele activiteiten, 382 00:18:38,614 --> 00:18:42,862 hoe meer ze betere computers kunnen bouwen om intellectuele vermogens te verbeteren. 383 00:18:42,862 --> 00:18:44,770 Dit gaat om een soort verandering 384 00:18:44,770 --> 00:18:47,248 die de wereld nog nooit eerder heeft meegemaakt. 385 00:18:47,248 --> 00:18:50,554 Je vorige idee van wat mogelijk is, schiet tekort. 386 00:18:50,974 --> 00:18:52,754 Dit beïnvloedt ons nu al. 387 00:18:52,754 --> 00:18:56,384 Terwijl in de afgelopen 25 jaar de kapitaalproductiviteit toenam, 388 00:18:56,400 --> 00:19:00,588 ging het voor de arbeidsproductiviteit zelfs een beetje omlaag. 389 00:19:01,408 --> 00:19:04,149 Ik zou deze discussie nu willen opstarten. 390 00:19:04,149 --> 00:19:07,176 Ik weet dat wanneer ik mensen hierover vertel, 391 00:19:07,176 --> 00:19:08,666 ze vaak heel afwijzend zijn: 392 00:19:08,666 --> 00:19:11,169 "Computers kunnen toch niet echt denken, 393 00:19:11,169 --> 00:19:13,367 voelen, poëzie begrijpen. 394 00:19:13,367 --> 00:19:15,888 We begrijpen niet echt hoe ze werken." 395 00:19:15,888 --> 00:19:17,374 Dus? 396 00:19:17,374 --> 00:19:19,178 Computers kunnen nu dingen doen 397 00:19:19,178 --> 00:19:21,897 waarvoor mensen al hun hele leven betaald werden, 398 00:19:21,897 --> 00:19:24,318 dus is het nu tijd om te gaan nadenken 399 00:19:24,318 --> 00:19:28,015 hoe we onze sociale en economische structuren gaan aanpassen 400 00:19:28,015 --> 00:19:30,535 en ons bewust worden van deze nieuwe realiteit. 401 00:19:30,535 --> 00:19:31,388 Bedankt. 402 00:19:31,388 --> 00:19:32,190 (Applaus)