0:00:00.880,0:00:04.893 Wenn man früher wollte, [br]dass ein Computer etwas Neues tat, 0:00:04.893,0:00:06.827 musste man ihn programmieren. 0:00:06.827,0:00:09.858 Für alle, die es noch nie[br]selbst probiert haben: 0:00:09.858,0:00:13.360 Beim Programmieren [br]muss man bis ins kleinste Detail 0:00:13.360,0:00:16.727 jeden einzelnen Schritt definieren,[br]den der Computer erledigen soll, 0:00:16.727,0:00:19.089 um sein Ziel zu erreichen. 0:00:19.089,0:00:22.585 Will man also etwas tun, [br]was man selbst noch nicht kann, 0:00:22.585,0:00:24.648 dann wird das eine große Herausforderung. 0:00:24.648,0:00:28.131 Dieser Herausforderung stellte sich [br]dieser Mann, Arthur Samuel. 0:00:28.131,0:00:32.208 1956 wollte er diesem Computer beibringen, 0:00:32.208,0:00:34.548 ihn im Spiel Dame zu schlagen. 0:00:34.548,0:00:36.588 Wie kann man ein Programm schreiben 0:00:36.588,0:00:40.394 und bis ins kleinste Detail definieren, [br]wie man sich selbst in Dame übertrifft? 0:00:40.394,0:00:42.116 Also hatte er eine Idee: 0:00:42.116,0:00:45.840 Er ließ den Computer tausende Male [br]gegen sich selbst spielen, 0:00:45.840,0:00:48.364 sodass er Dame spielen lernte. 0:00:48.364,0:00:51.544 Das funktionierte wirklich, und schon 1962 0:00:51.544,0:00:55.561 besiegte dieser Computer [br]den Landesmeister von Connecticut. 0:00:55.561,0:00:58.534 Arthur Samuel war also [br]der Urvater des Maschinellen Lernens 0:00:58.534,0:01:00.251 und ich schulde ihm viel, 0:01:00.251,0:01:03.014 denn ich bin ein Fachmann [br]im Maschinellen Lernen. 0:01:03.014,0:01:04.479 Ich war Präsident von Kaggle, 0:01:04.479,0:01:07.867 einer Plattform von über 200 000 [br]Fachleuten für Maschinelles Lernen. 0:01:07.867,0:01:09.925 Kaggle veranstaltet Wettbewerbe, 0:01:09.925,0:01:13.633 bei denen bisher ungelöste Probleme [br]gelöst werden sollen, 0:01:13.633,0:01:17.470 und das war schon [br]hunderte Male erfolgreich. 0:01:17.470,0:01:19.940 Aus dieser Warte habe [br]ich viel darüber gelernt, 0:01:19.940,0:01:23.890 was Maschinelles Lernen[br]früher konnte, was es heute kann 0:01:23.890,0:01:26.252 und was es zukünftig vollbringen könnte. 0:01:26.252,0:01:30.675 Der vielleicht erste kommerzielle Erfolg [br]im Maschinellen Lernen war Google. 0:01:30.675,0:01:33.384 Google hat bewiesen, [br]dass man Informationen 0:01:33.384,0:01:36.066 über einen Computeralgorithmus[br]finden kann, 0:01:36.066,0:01:38.437 der auf Maschinellem Lernen basiert. 0:01:38.437,0:01:42.323 Seitdem gab es viele kommerzielle Erfolge [br]im Maschinellen Lernen. 0:01:42.323,0:01:44.270 Firmen wie Amazon oder Netflix 0:01:44.270,0:01:47.876 nutzen Maschinelles Lernen[br]für Kaufempfehlungen 0:01:47.876,0:01:49.896 oder Filmvorschläge. 0:01:49.896,0:01:51.703 Manchmal ist das beinahe gruselig. 0:01:51.703,0:01:53.657 Firmen wie LinkedIn oder Facebook 0:01:53.657,0:01:56.251 schlagen Ihnen manchmal neue Freunde vor 0:01:56.251,0:01:58.228 und Sie haben keine Ahnung, wie das geht, 0:01:58.228,0:02:01.195 und genau das ist die Macht [br]des Maschinellen Lernens. 0:02:01.195,0:02:04.152 Diese Algorithmen haben[br]anhand vorhandener Daten gelernt, 0:02:04.152,0:02:07.399 anstatt von Hand programmiert zu werden. 0:02:07.399,0:02:10.507 So konnte auch IBM Watson dazu bringen, 0:02:10.507,0:02:13.539 die zwei Weltmeister[br]der Quizshow "Jeopardy" zu schlagen, 0:02:13.539,0:02:16.414 wo man knifflige, komplexe Fragen[br]beantworten musste, z. B.: 0:02:16.414,0:02:18.927 ["2003 verschwand u. a. [br]der antike 'Löwe von Nimrud' 0:02:18.927,0:02:20.510 aus dem Museum dieser Stadt."] 0:02:20.510,0:02:23.164 Daher gibt es nun[br]erste selbstfahrende Autos. 0:02:23.164,0:02:25.036 Will man den Unterschied 0:02:25.036,0:02:28.488 etwa zwischen Baum und[br]Fußgänger erkennen, ist das wichtig. 0:02:28.488,0:02:31.075 Wir wissen nicht, wie man [br]solche Programme schreibt, 0:02:31.075,0:02:34.072 aber durch Maschinelles Lernen [br]ist das jetzt möglich. 0:02:34.072,0:02:36.680 Dieses Auto ist schon über 1 Mio. km 0:02:36.680,0:02:40.186 ohne den kleinsten Unfall [br]auf normalen Straßen gefahren. 0:02:40.196,0:02:44.110 Wir wissen also, [br]dass Computer lernen können 0:02:44.110,0:02:46.010 und dass sie auch Dinge lernen können, 0:02:46.010,0:02:48.848 von denen wir nicht wissen, [br]wie sie funktionieren, 0:02:48.848,0:02:51.733 und manchmal sogar besser als wir. 0:02:51.733,0:02:55.928 Eines der faszinierendsten Beispiele [br]für Maschinelles Lernen 0:02:55.928,0:02:58.320 habe ich bei einem meiner [br]Kaggle-Projekte gesehen, 0:02:58.320,0:03:01.911 als ein Team unter der Leitung[br]von Geoffrey Hinton 0:03:01.911,0:03:03.463 von der Universität Toronto 0:03:03.463,0:03:06.140 den Wettstreit für automatische [br]Drogenerkennung gewann. 0:03:06.140,0:03:08.987 Außergewöhnlich war [br]daran nicht nur ihr Sieg 0:03:08.987,0:03:13.000 gegen all die Algorithmen von Merck [br]und der internationalen akademischen Welt, 0:03:13.000,0:03:18.061 sondern, dass das Team kein Vorwissen[br]zu Chemie oder Biowissenschaften hatte 0:03:18.061,0:03:20.230 und nur zwei Wochen brauchte. 0:03:20.230,0:03:22.111 Wie haben sie das gemacht? 0:03:22.111,0:03:25.342 Sie nutzten einen besonderen[br]Algorithmus namens Deep Learning. 0:03:25.342,0:03:27.701 Ihr Erfolg war so bedeutend, 0:03:27.701,0:03:31.412 dass er wenig später auf der Titelseite [br]der NY Times erschien. 0:03:31.412,0:03:34.147 Hier auf der linken Seite [br]sehen Sie Geoffrey Hinton. 0:03:34.147,0:03:38.488 Deep Learning basiert auf der Funktion [br]des menschlichen Gehirns 0:03:38.488,0:03:40.300 und deswegen ist es ein Algorithmus, 0:03:40.300,0:03:44.141 dessen Funktion theoretisch [br]keine Grenzen gesetzt sind. 0:03:44.141,0:03:46.964 Je mehr Daten und Rechenzeit man hat, 0:03:46.964,0:03:48.276 desto besser wird er. 0:03:48.276,0:03:50.615 Die New York Times zeigte in ihrem Artikel 0:03:50.615,0:03:52.857 noch ein Resultat des Deep Learning, 0:03:52.857,0:03:55.569 das ich Ihnen jetzt vorstellen will. 0:03:55.569,0:04:00.510 Es beweist, dass Computer [br]zuhören und verstehen können. 0:04:00.510,0:04:06.251 Richard Rashid (Video):[br]Als letzten Schritt in diesem Prozess 0:04:06.251,0:04:10.961 werde ich Chinesisch mit Ihnen sprechen. 0:04:10.961,0:04:13.596 Als wichtigsten Schritt haben wir 0:04:13.596,0:04:18.598 anhand großer Informationsmengen[br]von vielen Chinesisch-Sprechern 0:04:18.598,0:04:21.128 ein Text-zu-Sprache-System gebaut, 0:04:21.128,0:04:26.061 das chinesischen Text[br]in chinesche Sprache umwandelt, 0:04:26.401,0:04:31.220 und dann haben wir eine etwa einstündige [br]Aufnahme meiner Stimme benutzt, 0:04:31.220,0:04:36.364 um das Text-zu-Sprache-System [br]so zu ändern, dass es wie ich klingt. 0:04:36.364,0:04:38.904 Wieder ist das Ergebnis nicht perfekt. 0:04:38.904,0:04:41.552 Eigentlich hat es sogar [br]ganz schön viele Fehler. 0:04:41.552,0:04:44.036 (Auf Chinesisch) 0:04:44.036,0:04:47.403 (Applaus) 0:04:49.446,0:04:53.022 In diesem Bereich ist noch viel zu tun. 0:04:53.022,0:04:56.667 (Chinesisch) 0:04:56.667,0:05:00.100 (Applaus) 0:05:01.345,0:05:04.744 Jeremy Howard: Das war eine Konferenz[br]zu Maschinellem Lernen in China. 0:05:04.744,0:05:07.114 Übrigens hört man [br]bei akademischen Konferenzen 0:05:07.114,0:05:09.011 nur ganz selten Zwischenapplaus, 0:05:09.011,0:05:12.687 obwohl das bei TEDx-Konferenzen [br]durchaus erwünscht sein kann. 0:05:12.687,0:05:15.482 Was Sie eben gesehen haben,[br]basiert auf Deep Learning. 0:05:15.482,0:05:17.007 (Applaus) Danke! 0:05:17.007,0:05:19.289 Die englische Transkription [br]war Deep Learning. 0:05:19.289,0:05:22.701 Die Übersetzung ins Chinesische und[br]der Text rechts oben – Deep Learning 0:05:22.701,0:05:26.008 und die Modellierung der Stimme[br]-- ebenfalls Deep Learning. 0:05:26.008,0:05:29.242 Deep Learning ist also [br]eine außergewöhnliche Sache. 0:05:29.242,0:05:32.341 Es ist ein einziger Algorithmus, [br]der scheinbar fast alles kann 0:05:32.341,0:05:35.452 und ich fand heraus, dass er [br]ein Jahr zuvor sehen gelernt hatte. 0:05:35.452,0:05:38.388 Bei einem obskuren Wettbewerb [br]der Ruhr-Universität Bochum 0:05:38.388,0:05:40.225 zum Erkennen von Verkehrszeichen 0:05:40.225,0:05:43.618 hat Deep Learning gelernt, [br]Verkehrszeichen wie dieses zu erkennen. 0:05:43.618,0:05:45.462 Er konnte Verkehrszeichen nicht nur 0:05:45.462,0:05:47.470 besser als andere Algorithmen erkennen; 0:05:47.470,0:05:50.189 die Rangliste zeigte, [br]dass er sogar Menschen übertraf 0:05:50.189,0:05:52.041 und zwar um das Doppelte. 0:05:52.041,0:05:54.037 2011 gab es also das erste Beispiel 0:05:54.037,0:05:57.442 für Computer, die besser [br]sehen können als Menschen. 0:05:57.442,0:05:59.491 Seitdem ist viel passiert. 0:05:59.491,0:06:03.005 2012 gab Google bekannt, [br]dass sie einen Deep-Learning-Algorithmus 0:06:03.005,0:06:04.420 Youtube Videos schauen ließen 0:06:04.420,0:06:07.857 und die Daten auf 16 000 Computern [br]einen Monat lang berechnen ließen 0:06:07.857,0:06:11.618 und dass der Computer allein [br]Konzepte wie Menschen oder Katzen 0:06:11.618,0:06:14.157 einzig durch das Betrachten [br]von Videos erkannt hat. 0:06:14.157,0:06:16.379 Menschen lernen sehr ähnlich. 0:06:16.379,0:06:19.119 Sie lernen nicht, indem man[br]ihnen sagt, was sie sehen, 0:06:19.119,0:06:22.450 sondern sie lernen selbst, [br]was diese Dinge sind. 0:06:22.450,0:06:25.819 Übrigens hat 2012 Geoffrey Hinton, [br]den wir vorher gesehen haben, 0:06:25.819,0:06:30.474 den beliebten ImageNet-Wettbewerb[br]mit seinem Versuch gewonnen, 0:06:30.474,0:06:34.751 auf 1,5 Mio. Bildern [br]die Motive zu erkennen. 0:06:34.751,0:06:37.789 2014 sind wir mittlerweile[br]nur noch bei einer 6%igen Fehlerrate 0:06:37.789,0:06:39.242 bei der Bilderkennung. 0:06:39.242,0:06:41.728 Das ist wiederum besser als Menschen. 0:06:41.728,0:06:45.037 Maschinen sind dabei [br]also außergewöhnlich gut 0:06:45.037,0:06:47.586 und das wird nun auch [br]in der Wirtschaft genutzt. 0:06:47.586,0:06:50.348 Zum Beispiel hat Google[br]letztes Jahr bekanntgegeben, 0:06:50.348,0:06:54.933 dass sie jeden Ort Frankreichs [br]in nur 2 Stunden kartografiert hätten, 0:06:54.933,0:06:59.933 indem sie Street-View-Bilder in einen [br]Deep-Learning-Algorithmus einspeisten, 0:06:59.933,0:07:02.919 der dann Hausnummern [br]erkennen und lesen konnte. 0:07:02.919,0:07:08.274 Davor hätte es dutzende Leute [br]und viele Jahre gebraucht. 0:07:08.274,0:07:10.185 Dasselbe passiert in China. 0:07:10.185,0:07:14.221 Baidu ist sowas wie [br]das chinesische Google, 0:07:14.221,0:07:16.504 und was Sie hier oben links sehen, 0:07:16.504,0:07:20.478 ist z. B. ein Bild, das ich in Baidus[br]Deep-Learning-System hochgeladen habe. 0:07:20.478,0:07:24.247 Darunter sehen Sie, [br]dass das System das Bild verstanden 0:07:24.247,0:07:26.483 und ähnliche Bilder gefunden hat. 0:07:26.483,0:07:29.219 Die ähnlichen Bilder haben [br]ähnliche Hintergründe, 0:07:29.219,0:07:30.877 ähnliche Gesichts-Ausrichtung, 0:07:30.877,0:07:32.665 manche sogar die rausgestreckte Zunge. 0:07:32.665,0:07:35.695 Das System schaut eindeutig nicht[br]auf den Text einer Website. 0:07:35.695,0:07:37.107 Es hatte nur ein Bild. 0:07:37.107,0:07:41.128 Also haben wir jetzt Computer, [br]die wirklich verstehen, was sie sehen, 0:07:41.128,0:07:42.752 und daher Datenbanken 0:07:42.752,0:07:46.306 mit vielen Millionen Bildern [br]in Echtzeit durchsuchen können. 0:07:46.306,0:07:49.536 Aber was bedeutet es nun, [br]dass Computer sehen können? 0:07:49.536,0:07:51.553 Tja, es ist nicht nur so, dass sie sehen. 0:07:51.553,0:07:53.622 Genau genommen kann[br]Deep Leaning noch mehr. 0:07:53.622,0:07:56.570 Komplexe, differenzierte Sätze wie dieser 0:07:56.570,0:07:59.394 können nun mit Deep-Learning-Algorithmen [br]verstanden werden. 0:07:59.394,0:08:00.697 Wie Sie hier sehen können, 0:08:00.697,0:08:03.465 zeigt dieses System aus Stanford[br]mit dem roten Punkt oben, 0:08:03.465,0:08:07.384 dass es die negative Botschaft [br]des Satzes erkannt hat. 0:08:07.384,0:08:11.280 Deep Learning ist jetzt [br]fast so gut wie Menschen 0:08:11.280,0:08:15.923 im Verstehen, worum es in Sätzen [br]geht und was gesagt wird. 0:08:15.923,0:08:18.991 Deep Learning wird auch genutzt,[br]um Chinesisch zu lesen 0:08:18.991,0:08:21.807 wieder fast auf Muttersprachler-Niveau. 0:08:21.807,0:08:24.645 Der Algorithmus dafür [br]stammt von Leuten aus der Schweiz, 0:08:24.645,0:08:27.621 die allesamt kein Chinesisch [br]sprechen oder verstehen. 0:08:27.621,0:08:29.812 Wie ich schon sagte: Deep Learning 0:08:29.812,0:08:32.611 ist so ziemlich das beste [br]System der Welt dafür, 0:08:32.611,0:08:36.718 sogar im Vergleich mit [br]dem Wissen von Muttersprachlern. 0:08:36.718,0:08:39.682 Dieses System haben wir [br]in meiner Firma entworfen, 0:08:39.682,0:08:41.728 das all diesen Kram zusammenfügt. 0:08:41.728,0:08:44.189 Das sind Bilder ohne angehängten Text 0:08:44.189,0:08:46.541 und während ich diese Sätze hier eintippe, 0:08:46.541,0:08:49.510 versteht das System die Bilder in Echtzeit 0:08:49.510,0:08:51.189 und erkennt, was sie zeigen, 0:08:51.189,0:08:54.352 und findet ähnliche Bilder [br]zu dem eingetippten Text. 0:08:54.352,0:08:57.108 Sie sehen also, [br]es versteht wirklich meine Sätze 0:08:57.108,0:08:59.332 und ebenso diese Bilder. 0:08:59.332,0:09:01.891 Ich weiß, dass Sie [br]sowas Ähnliches von Google kennen, 0:09:01.891,0:09:04.666 wo man Text eingeben kann [br]und einem Bilder gezeigt werden, 0:09:04.666,0:09:08.090 aber da wird nur die Website [br]nach dem Text durchsucht. 0:09:08.090,0:09:11.091 Das ist ein großer Unterschied dazu,[br]die Bilder zu verstehen. 0:09:11.091,0:09:13.843 Letzteres haben Computer erst 0:09:13.843,0:09:17.091 vor ein paar Monaten gelernt. 0:09:17.091,0:09:21.182 Wir haben gesehen, dass Computer nicht[br]nur sehen, sondern auch lesen können. 0:09:21.182,0:09:24.947 Wir haben natürlich auch gesehen, [br]dass sie verstehen, was sie hören. 0:09:24.947,0:09:28.389 Vielleicht sind Sie nicht überrascht, [br]dass sie auch schreiben können. 0:09:28.389,0:09:33.172 Diesen Text habe ich gestern mit einem[br]Deep-Learning-Algorithmus erzeugt. 0:09:33.172,0:09:37.096 Diesen Text hier hat [br]ein Algorithmus aus Stanford erzeugt. 0:09:37.096,0:09:40.730 Jeder dieser Sätze wurde mit[br]einem Deep-Learning-Algorithmus erzeugt, 0:09:40.730,0:09:43.109 um das jeweilige Bild zu beschreiben. 0:09:43.109,0:09:47.581 Vorher hat der Algorithmus nie einen Mann [br]im schwarzen Hemd Gitarre spielen sehen. 0:09:47.581,0:09:49.801 Er hat einen Mann, die Farbe Schwarz, 0:09:49.801,0:09:51.400 und eine Gitarre gesehen, 0:09:51.400,0:09:55.694 aber er hat selbstständig [br]diese neue Bildbeschreibung erstellt. 0:09:55.694,0:09:59.196 Menschliche Leistung ist das [br]noch nicht, aber nah dran. 0:09:59.196,0:10:03.264 In Tests bevorzugen Menschen [br]die computer-generierte Bildbeschreibung 0:10:03.264,0:10:04.791 nur eines von vier Malen. 0:10:04.791,0:10:06.855 Aber das System ist jetzt[br]erst 2 Wochen alt, 0:10:06.855,0:10:08.671 sodass wahrscheinlich im nächsten Jahr 0:10:08.671,0:10:11.502 der Computeralgorithmus[br]die menschliche Leistung übertrifft, 0:10:11.502,0:10:13.564 so schnell wie die Dinge gerade gehen. 0:10:13.774,0:10:16.093 Computer können also auch schreiben. 0:10:16.413,0:10:19.888 Wenn wir das alles kombinieren,[br]kriegen wir sehr spannenden Möglichkeiten. 0:10:19.888,0:10:21.380 In der Medizin, zum Beispiel, 0:10:21.380,0:10:23.905 hat ein Team aus Boston verkündet, 0:10:23.905,0:10:26.854 dass es Dutzende [br]neue klinisch relevante Merkmale 0:10:26.854,0:10:31.630 von Tumoren entdeckt hätte,[br]die Ärzten bei der Krebsprognose helfen. 0:10:32.220,0:10:35.256 Ähnlich hat in Stanford[br]eine Gruppe bekanntgegeben, 0:10:35.256,0:10:38.179 dass sie für die Gewebeanalyse[br]in vergrößerter Aufnahme 0:10:38.179,0:10:40.690 ein Maschinelles Lernsystem [br]entwickelt haben, 0:10:40.690,0:10:44.292 das menschliche Pathologen [br]tatsächlich dabei übertrifft, 0:10:44.292,0:10:47.519 die Überlebenschancen von [br]Krebspatienten vorherzusagen. 0:10:47.519,0:10:50.614 In beiden Fällen waren [br]die Vorhersagen nicht nur genauer, 0:10:50.614,0:10:53.266 sie förderten auch neue[br]wissenschaftliche Erkenntnisse. 0:10:53.276,0:10:54.781 Im Fall der Radiologie 0:10:54.781,0:10:57.876 waren es neue klinische Indikatoren,[br]die Menschen verstehen. 0:10:57.876,0:10:59.668 Im Fall der Pathologie 0:10:59.668,0:11:04.428 hat das Computersystem herausgefunden, [br]dass die Zellen rund um den Krebs 0:11:04.428,0:11:07.508 genauso wichtig sind [br]wie die Krebszellen selbst 0:11:07.508,0:11:09.260 beim Erstellen der Diagnose. 0:11:09.260,0:11:14.331 Das ist das Gegenteil davon, was man [br]Pathologen jahrzehntelang beibrachte. 0:11:14.901,0:11:17.413 In beiden Fällen wurden die Systeme 0:11:17.413,0:11:21.534 gemeinsam von Experten der Medizin [br]und des Maschinellen Lernens entwickelt, 0:11:21.534,0:11:24.275 aber seit letztem Jahr haben [br]wir auch das überwunden. 0:11:24.275,0:11:27.634 Das hier ist ein Beispiel, [br]wie man krebsgeschädigte Bereiche 0:11:27.634,0:11:30.604 menschlichen Gewebes[br]unter dem Mikroskop erkennt. 0:11:30.604,0:11:34.967 Das hier gezeigte System [br]erkennt solche Bereiche genauer, 0:11:34.967,0:11:37.742 oder etwa gleich genau, [br]wie menschliche Pathologen, 0:11:37.742,0:11:41.134 aber es wurde allein mit Deep Learning, [br]ohne medizinisches Wissen, 0:11:41.134,0:11:44.230 von Leuten ohne Ausbildung [br]in diesem Feld entwickelt. 0:11:44.730,0:11:47.285 Ähnlich ist es bei dieser [br]Neuronen-Segmentierung. 0:11:47.285,0:11:51.193 Neuronen können jetzt damit etwa so genau[br]wie durch Menschen segmentieren werden, 0:11:51.193,0:11:53.670 aber dieses System wurde [br]mit Deep Learning 0:11:53.670,0:11:56.921 von Leuten ohne [br]medizinisches Vorwissen entwickelt. 0:11:56.921,0:12:00.148 Sogar ich, als jemand [br]ohne medizinische Ausbildung, 0:12:00.148,0:12:03.875 scheine nun genug für die Gründung[br]eines medizinisches Unternehmens zu wissen 0:12:03.875,0:12:06.021 -- und das habe ich auch. 0:12:06.021,0:12:07.761 Ich hatte irgendwie Angst davor, 0:12:07.761,0:12:10.650 aber theoretisch [br]schien es möglich zu sein, 0:12:10.650,0:12:16.142 in der Medizin sehr nützliche Dinge allein[br]mit solchen Datenanalysen zu bewirken. 0:12:16.142,0:12:18.622 Glücklicherweise war [br]das Feedback fantastisch, 0:12:18.622,0:12:21.268 sowohl von den Medien [br]als auch von Medizinern, 0:12:21.268,0:12:23.322 die mich sehr unterstützt haben. 0:12:23.322,0:12:27.471 Theoretisch können wir den Mittelteil [br]des medizinischen Vorgangs 0:12:27.471,0:12:30.364 so viel wie möglich [br]der Datenanalyse überlassen, 0:12:30.364,0:12:33.359 sodass Ärzte nur noch tun müssen, [br]was sie am besten können. 0:12:33.359,0:12:35.031 Ich will Ihnen ein Beispiel geben. 0:12:35.031,0:12:39.825 Aktuell brauchen wir 15 Minuten, um einen [br]neuen medizinischen Diagnosetest zu bauen. 0:12:39.825,0:12:41.929 Das zeige ich Ihnen jetzt in Echtzeit, 0:12:41.929,0:12:45.416 aber ich habe es durch Zusammenschneiden [br]auf 3 Minuten gekürzt. 0:12:45.416,0:12:48.477 Anstatt Ihnen das Erstellen eines[br]medizinischen Tests zu zeigen, 0:12:48.477,0:12:52.206 zeige ich Ihnen einen[br]Diagnosetest für Autobilder, 0:12:52.206,0:12:54.068 denn das verstehen wir alle. 0:12:54.068,0:12:57.269 Hier fangen wir mit ungefähr [br]1,5 Mio. Autobildern an, 0:12:57.269,0:13:00.475 und ich möchte etwas bauen,[br]das sie nach dem Winkel sortiert, 0:13:00.475,0:13:02.698 in dem das Foto gemacht wurde. 0:13:02.698,0:13:06.586 Diese Bilder sind jetzt noch [br]nicht benannt, ich fange bei Null an. 0:13:06.586,0:13:08.451 Unser Deep-Learning-Algorithmus 0:13:08.451,0:13:12.158 erkennt automatisch[br]Strukturflächen auf den Bildern. 0:13:12.158,0:13:15.778 Das Schöne ist, dass Mensch und Computer[br]jetzt zusammenarbeiten können. 0:13:15.778,0:13:17.956 Wie Sie hier sehen, 0:13:17.956,0:13:20.631 gibt der Mensch dem Computer [br]Zielbereiche vor, 0:13:20.631,0:13:25.281 womit der Computer dann versuchen soll,[br]seinem Algorithmus zu verbessern. 0:13:25.281,0:13:29.577 Eigentlich sind diese Deep-Learning-[br]Systeme im 16 000-dimensionalen Raum, 0:13:29.577,0:13:32.179 hier können Sie den Computer[br]das durch den Raum 0:13:32.179,0:13:35.001 auf der Suche nach neuen [br]Strukturflächen rotieren sehen. 0:13:35.001,0:13:36.782 Wenn er dabei Erfolg hat, 0:13:36.782,0:13:40.786 kann der menschliche Betreiber [br]dann die interessanten Bereiche festlegen. 0:13:40.786,0:13:43.208 Hier hat der Computer Bereiche gefunden, 0:13:43.208,0:13:45.770 zum Beispiel Winkel. 0:13:45.770,0:13:47.376 Im Verlauf des Prozesses 0:13:47.376,0:13:49.716 sagen wir dem Computer immer mehr 0:13:49.716,0:13:52.144 über die gesuchten Strukturen. 0:13:52.144,0:13:53.916 Bei einem Diagnose-Test zum Beispiel 0:13:53.916,0:13:57.266 würde das dem Pathologen helfen,[br]kranke Bereiche zu identifizieren, 0:13:57.266,0:14:02.292 oder dem Radiologen bei [br]potentiell gefährlichen Knoten. 0:14:02.292,0:14:04.851 Manchmal wird es [br]schwer für den Algorithmus. 0:14:04.851,0:14:06.815 In diesem Fall war er etwas verwirrt. 0:14:06.815,0:14:09.365 Die Vorder- und Rückseiten [br]der Autos sind vermischt. 0:14:09.365,0:14:11.437 Wir müssen hier also sorgfältiger sein, 0:14:11.437,0:14:14.669 und die Vorderseiten manuell [br]von den Rückseiten trennen, 0:14:14.669,0:14:20.175 um dann dem Computer zu sagen, [br]dass das Teil einer Gruppe ist, 0:14:20.175,0:14:21.523 die uns interessiert. 0:14:21.523,0:14:24.420 Das machen wir für eine Weile,[br]wir springen ein wenig weiter, 0:14:24.420,0:14:26.446 und dann trainieren wir den Algorithmus, 0:14:26.446,0:14:28.420 basierend auf diesen paar hundert Sachen, 0:14:28.420,0:14:30.445 und hoffen, dass er besser geworden ist. 0:14:30.445,0:14:33.518 Wie Sie sehen, lässt er [br]einige dieser Bilder jetzt verblassen 0:14:33.518,0:14:38.226 und zeigt uns, dass er schon jetzt [br]ein wenig selbst erkennt. 0:14:38.226,0:14:41.128 Wir können das Konzept [br]der ähnlichen Bilder nutzen 0:14:41.128,0:14:43.222 und dabei sehen Sie, 0:14:43.222,0:14:47.241 dass der Computer jetzt in der Lage ist, [br]nur die Vorderseiten der Autos zu finden. 0:14:47.241,0:14:50.189 Also kann der Mensch dem [br]Computer an diesem Punkt sagen, 0:14:50.189,0:14:52.482 okay, du hast gute Arbeit geleistet. 0:14:53.652,0:14:56.847 Natürlich ist es manchmal[br]selbst hier schwer, 0:14:56.847,0:14:59.511 die einzelnen Gruppen zu unterscheiden. 0:14:59.511,0:15:03.395 Selbst nachdem der Computer [br]die Bilder eine Weile rotiert hat, 0:15:03.399,0:15:06.744 sind die rechten und linken Seiten [br]der Bilder immer noch 0:15:06.744,0:15:08.222 komplett durcheinander. 0:15:08.222,0:15:10.672 Wieder können wir dem[br]Computer Hinweise geben 0:15:10.672,0:15:13.178 und sagen, okay, jetzt [br]versuch mal einen Weg, 0:15:13.178,0:15:15.945 der die rechte und linke Seite[br]so gut wie möglich 0:15:15.945,0:15:18.067 mit dem Deep-Learning-Algorithmus trennt. 0:15:18.067,0:15:21.009 Und mit diesem Hinweis -- [br]ah, okay, jetzt hat er Erfolg. 0:15:21.009,0:15:23.891 Er hat einen Weg gefunden, [br]diese Objekte so sehen, 0:15:23.891,0:15:26.271 der diese hier aussortiert hat. 0:15:26.271,0:15:28.709 Sie haben jetzt einen Eindruck davon. 0:15:28.709,0:15:36.906 Das ist kein Fall, wo der Mensch [br]von einem Computer ersetzt wird, 0:15:36.906,0:15:39.546 sondern sie arbeiten zusammen. 0:15:39.546,0:15:43.556 Wir ersetzen hier etwas, wofür man [br]früher ein Team von fünf oder sechs Leuten 0:15:43.556,0:15:45.098 7 Jahre beschäftigt hat, 0:15:45.098,0:15:47.703 durch etwas, das 15 Minuten 0:15:47.703,0:15:50.208 für eine einzige Person braucht. 0:15:50.208,0:15:54.158 Dieser Vorgang braucht ungefähr [br]vier oder fünf Durchgänge. 0:15:54.158,0:15:56.017 Wie Sie sehen, sind wir nun bei 62 % 0:15:56.017,0:15:58.976 korrekt klassifizierten Bildern[br]aus 1,5 Millionen. 0:15:58.976,0:16:01.448 An dieser Stelle können [br]wir anfangen, sehr schnell 0:16:01.448,0:16:02.745 große Bereiche zu erfassen, 0:16:02.745,0:16:05.664 und sie auf Fehler zu überprüfen. 0:16:05.664,0:16:09.616 Wenn es Fehler gibt, lassen wir [br]das den Computer wissen. 0:16:09.616,0:16:12.661 Indem wir diesen Vorgang auf jede[br]der einzelnen Gruppen anwenden, 0:16:12.661,0:16:15.148 sind wir jetzt bei [br]einer 80%igen Erfolgsrate 0:16:15.148,0:16:17.563 beim Klassifizieren der 1,5 Mio. Bilder. 0:16:17.563,0:16:19.641 An diesem Punkt müssen wir nur noch 0:16:19.641,0:16:23.220 die kleine Zahl der [br]falsch klassifizierten Bilder finden 0:16:23.220,0:16:26.108 und versuchen, die Ursache zu verstehen. 0:16:26.108,0:16:27.851 Wenden wir das an, 0:16:27.851,0:16:31.972 sind wir nach 15 Minuten [br]bei einer Erfolgsquote von 97 %. 0:16:31.972,0:16:36.572 Also könnten wir mit dieser Technik [br]ein großes Problem beheben, 0:16:36.578,0:16:39.614 nämlich, das Fehlen medizinischen [br]Fachwissens in der Welt. 0:16:39.614,0:16:43.103 Laut Weltwirtschaftsforum gibt es [br]zwischen 10x und 20x 0:16:43.103,0:16:45.727 zu wenige Ärzte in Entwicklungsländern 0:16:45.727,0:16:47.840 und es würde etwa 300 Jahre dauern, 0:16:47.840,0:16:50.734 genug Leute auszubilden, [br]um das Problem zu beheben. 0:16:50.734,0:16:53.619 Können Sie sich vorstellen, [br]dass wir ihre Effizienz 0:16:53.619,0:16:56.458 mit diesen Deep-Learning-Ansätzen[br]steigern können? 0:16:56.458,0:16:58.900 Ich bin ganz begeistert[br]von den Möglichkeiten. 0:16:58.900,0:17:01.279 Ich mache mir auch [br]Sorgen über die Probleme. 0:17:01.279,0:17:04.403 Das Problem hierbei ist, [br]in jedem blauen Bereich auf der Karte 0:17:04.403,0:17:08.172 machen Dienstleistungen [br]über 80 % der Beschäftigung aus. 0:17:08.172,0:17:09.959 Was sind Dienstleistungen? 0:17:09.959,0:17:11.473 Das sind Dienstleistungen. 0:17:11.473,0:17:15.627 Das sind außerdem genau die Dinge, [br]die Computer gerade gelernt haben. 0:17:15.627,0:17:19.431 Also sind 80 % der Beschäftigung [br]der entwickelten Welt Dinge, 0:17:19.431,0:17:21.963 die Computer gerade gelernt haben. 0:17:21.963,0:17:23.403 Was bedeutet das? 0:17:23.403,0:17:25.986 Naja, es wird alles gut. [br]Andere Jobs ersetzen diese. 0:17:25.986,0:17:28.693 Zum Beispiel wird es [br]mehr Jobs für Informatiker geben. 0:17:28.693,0:17:29.510 Nun, nicht ganz. 0:17:29.510,0:17:32.628 Informatiker brauchen nicht lange, [br]diese Dinge zu bauen. 0:17:32.628,0:17:35.880 Zum Beispiel wurden diese 4 [br]Algorithmen vom selben Typen gebaut. 0:17:35.880,0:17:38.318 Wenn Sie also denken, oh,[br]das ist alles nicht neu, 0:17:38.318,0:17:42.126 wir haben in der Vergangenheit gesehen, [br]wenn etwas Neues kommt, 0:17:42.126,0:17:44.378 werden sie durch neue Jobs ersetzt, 0:17:44.378,0:17:46.494 was also sind diese neuen Jobs? 0:17:46.494,0:17:48.365 Das ist sehr schwer einzuschätzen, 0:17:48.365,0:17:51.104 weil menschliche Leistung [br]schrittweise wächst, 0:17:51.104,0:17:53.666 aber wir haben jetzt ein System, [br]Deep Learning, 0:17:53.666,0:17:56.893 das seine Leistung [br]nachweislich exponentiell steigert. 0:17:56.893,0:17:58.498 Und da sind wir. 0:17:58.498,0:18:00.559 Zurzeit sehen wir die Dinge um uns herum 0:18:00.559,0:18:03.235 und sagen "Computer sind[br]immer noch ziemlich dumm." Oder? 0:18:03.235,0:18:06.664 Aber in fünf Jahren werden Computer[br]nicht mehr Teil dieser Tabelle sein. 0:18:06.664,0:18:10.529 Wir müssen also schon jetzt anfangen, [br]über diese Leistung nachzudenken. 0:18:10.529,0:18:12.579 Wir haben das natürlich schon mal gesehen. 0:18:12.579,0:18:14.296 Die Industrielle Revolution 0:18:14.296,0:18:17.387 bewirkte einen Evolutionssprung[br]der Leistung durch Motoren. 0:18:17.667,0:18:20.805 Aber nach einer Weile [br]beruhigten sich die Dinge. 0:18:20.805,0:18:22.507 Es gab soziale Umbrüche, 0:18:22.507,0:18:25.946 aber sobald die Motoren damals[br]zur Energiegewinnung genutzt wurden, 0:18:25.946,0:18:28.300 beruhigten sich die Dinge. 0:18:28.300,0:18:30.293 Die Revolution des Maschinellen Lernens 0:18:30.293,0:18:32.682 wird ganz anders [br]als die Industrielle Revolution, 0:18:32.682,0:18:35.632 weil die Revolution nie zu Ende ist. 0:18:35.632,0:18:38.614 Je besser Computer [br]bei intellektuellen Aktivitäten werden, 0:18:38.614,0:18:40.602 desto bessere Computer können sie bauen, 0:18:40.602,0:18:42.862 die intellektuell noch [br]leistungsfähiger sind, 0:18:42.862,0:18:44.970 also wird das eine Art Wandel, 0:18:44.970,0:18:47.248 den die Welt nie zuvor gesehen hat, 0:18:47.248,0:18:50.554 sodass sich Ihr Verständnis [br]des Möglichen ändert. 0:18:50.974,0:18:52.754 Das beeinflusst uns schon jetzt. 0:18:52.754,0:18:56.384 In den letzten 25 Jahren ist[br]die Produktivität des Kapitals gestiegen, 0:18:56.400,0:19:00.908 aber die Produktivität der Arbeit [br]blieb gleich und sank sogar ein bisschen. 0:19:01.408,0:19:04.149 Deswegen will ich, dass wir[br]diese Diskussion jetzt führen. 0:19:04.149,0:19:07.176 Wenn ich Leuten [br]von dieser Situation erzähle, 0:19:07.176,0:19:08.666 sind sie oft sehr abschätzig. 0:19:08.666,0:19:10.339 Computer denken nicht wirklich, 0:19:10.339,0:19:13.367 sie fühlen nichts, [br]sie verstehen Lyrik nicht, 0:19:13.367,0:19:15.888 wir verstehen nicht wirklich, [br]wie sie funktionieren. 0:19:15.888,0:19:17.374 Ja, und? 0:19:17.374,0:19:18.978 Computer können jetzt Dinge tun, 0:19:18.978,0:19:22.087 für die Menschen ihre meiste Zeit [br]gegen Bezahlung aufwenden. 0:19:22.087,0:19:24.098 Wir sollten also jetzt überlegen, 0:19:24.098,0:19:28.015 wie wir unsere sozialen und [br]wirtschaftlichen Strukturen anpassen, 0:19:28.015,0:19:30.385 um diese neue Realität zu erkennen. 0:19:30.385,0:19:31.388 Danke. 0:19:31.388,0:19:32.190 (Applaus)