0:00:00.800,0:00:03.924 Ich bin Teamleiter bei Google [br]im Bereich Maschinenintelligenz, 0:00:03.948,0:00:08.598 das ist die Ingenieurdisziplin,[br]mit der man Computern und Geräten 0:00:08.622,0:00:11.431 etwas von dem beibringen kann,[br]was Gehirne können. 0:00:11.439,0:00:14.532 Deshalb interessieren wir uns[br]auch für echte Gehirne 0:00:14.532,0:00:15.901 und Neurowissenschaften, 0:00:15.901,0:00:20.047 und besonders für die Dinge,[br]die unsere Gehirne können, 0:00:20.071,0:00:24.443 die noch weit über die Fähigkeiten[br]von Computern hinausgehen. 0:00:25.209,0:00:28.818 Ein Teilbereich unserer Arbeit war [br]schon immer die Wahrnehmung, 0:00:28.842,0:00:31.881 also der Vorgang, durch den[br]die Dinge auf der Welt -- 0:00:31.905,0:00:33.489 Geräusche und Bilder -- 0:00:33.513,0:00:35.931 in unserem Kopf zu Konzepten werden. 0:00:36.235,0:00:38.752 Das ist entscheidend für unsere Gehirne 0:00:38.776,0:00:41.650 und auch ziemlich nützlich für Computer. 0:00:41.650,0:00:44.986 Unser Team schreibt Algorithmen [br]für maschinelle Wahrnehmung, 0:00:45.010,0:00:48.158 die etwa ermöglichen, dass[br]Ihre Bilder auf Google Fotos 0:00:48.158,0:00:51.275 basierend auf dem Bildinhalt[br]gesucht werden können. 0:00:51.594,0:00:55.087 Das Gegenstück zur Wahrnehmung [br]ist die Kreativität, 0:00:55.111,0:00:58.143 also das Schaffen einer Sache[br]auf Grundlage eines Konzepts. 0:00:58.143,0:01:01.748 Letztes Jahr kam zwischen unserer [br]Arbeit an maschineller Wahrnehmung, 0:01:01.752,0:01:06.305 dem Feld der maschinellen Kreativität[br]sowie der maschinellen Kunst 0:01:06.305,0:01:08.085 unerwartet eine Verbindung zustande. 0:01:08.086,0:01:11.840 Ich glaube, Michelangelo hatte [br]einen scharfen Blick 0:01:11.864,0:01:15.520 für das duale Verhältnis zwischen[br]Wahrnehmung und Kreativität. 0:01:16.023,0:01:18.029 Ein berühmtes Zitat von ihm lautet: 0:01:18.053,0:01:21.376 "Jeder rohe Stein hat eine Figur in sich, 0:01:22.036,0:01:25.038 der Bildhauer muss sie nur entdecken." 0:01:26.029,0:01:29.245 Ich glaube, Michelangelo wollte sagen, 0:01:29.269,0:01:32.449 dass wir durch Wahrnehmung erschaffen. 0:01:32.453,0:01:35.516 Die Wahrnehmung ist[br]ein Akt der Vorstellung, 0:01:35.520,0:01:38.181 die Grundlage für Kreativität. 0:01:38.691,0:01:42.616 Das Organ, das all das Denken,[br]Wahrnehmen und Vorstellen erledigt, 0:01:42.640,0:01:44.608 ist natürlich das Gehirn. 0:01:45.089,0:01:47.944 Jetzt möchte ich kurz[br]historisch betrachten, 0:01:47.958,0:01:50.080 was wir über Gehirne wissen. 0:01:50.436,0:01:52.792 Denn anders als über [br]das Herz oder die Eingeweide 0:01:52.792,0:01:56.180 kann man nur durch Betrachten [br]nicht viel über Gehirne herausfinden, 0:01:56.180,0:01:57.976 zumindest nicht mit bloßem Auge. 0:01:57.983,0:02:00.399 Die ersten Anatomen, [br]die sich Gehirne ansahen, 0:02:00.423,0:02:04.230 gaben der oberflächlichen Struktur[br]eine ganze Reihe fantasievoller Namen, 0:02:04.254,0:02:06.687 wie Hippocampus, was [br]"kleiner Shrimp" bedeutet. 0:02:06.711,0:02:09.475 Doch so etwas verrät uns [br]natürlich nicht viel darüber, 0:02:09.499,0:02:12.227 was im Inneren wirklich vor sich geht. 0:02:12.780,0:02:16.393 Die erste Person, die meiner Meinung nach[br]wirklich eine Art Einblick 0:02:16.417,0:02:18.417 in die inneren Vorgänge[br]des Gehirns gewann, 0:02:18.447,0:02:22.291 war der große spanische Neuroanatom[br]Santiago Ramón y Cajal 0:02:22.315,0:02:23.859 im 19. Jahrhundert, 0:02:23.883,0:02:27.638 der mit Mikroskopie und Spezialfarbe 0:02:27.662,0:02:31.832 die einzelnen Gehirnzellen [br]selektiv ausfüllte 0:02:31.856,0:02:33.864 oder kontrastreich darstellte, 0:02:33.888,0:02:37.042 um die Morphologie[br]der Zellen zu verstehen. 0:02:37.872,0:02:39.537 Das sind die Zeichnungen, 0:02:39.537,0:02:42.116 die er im 19. Jahrhundert[br]von Neuronen anfertigte. 0:02:42.120,0:02:44.004 Diese zeigt ein Vogelgehirn. 0:02:44.028,0:02:47.219 Sie sehen eine unglaubliche [br]Vielfalt verschiedener Zellarten. 0:02:47.239,0:02:50.538 Sogar die Zelltheorie selbst[br]war damals ziemlich neu. 0:02:50.538,0:02:54.166 Diese Strukturen,[br]diese verzweigten Zellen, 0:02:54.166,0:02:56.761 diese Äste, die sehr, [br]sehr weit reichen können -- 0:02:56.765,0:02:58.428 das war damals völlig neu. 0:02:58.779,0:03:01.682 Sie erinnern ganz klar an Kabel. 0:03:01.706,0:03:05.163 Das mag für manch einen im 19. Jh.[br]offensichtlich gewesen sein, 0:03:05.187,0:03:09.501 als gerade die Revolution [br]der Elektrizität und Verkabelung begann. 0:03:09.964,0:03:11.212 Doch in vielerlei Hinsicht 0:03:11.226,0:03:14.423 wurden Ramón y Cajals [br]mikroanatomische Zeichnungen 0:03:14.423,0:03:16.835 wie diese hier, nie wirklich übertroffen. 0:03:16.859,0:03:18.713 Jetzt, mehr als hundert Jahre später, 0:03:18.737,0:03:21.562 versuchen wir immer noch, [br]Ramón y Cajals Werk zu vollenden. 0:03:21.586,0:03:24.720 Das sind die Rohdaten unserer Mitarbeiter 0:03:24.744,0:03:27.625 am Max-Planck-Institut für Neurobiologie. 0:03:27.649,0:03:30.009 Unsere Mitarbeiter bilden also[br] 0:03:30.009,0:03:34.464 kleine Teile von Gehirngewebe ab. 0:03:34.488,0:03:37.814 Diese ganze Probe hier misst[br]ungefähr einen Kubikmillimeter. 0:03:37.838,0:03:40.459 Hier zeige ich Ihnen [br]ein winziges Stück davon. 0:03:40.483,0:03:42.823 Der Strich links misst circa ein Mikron. 0:03:42.823,0:03:45.322 Die Strukturen, die Sie sehen,[br]sind Mitochondrien, 0:03:45.322,0:03:47.304 die so groß wie Bakterien sind. 0:03:47.304,0:03:49.475 Das sind aufeinanderfolgende Schnitte 0:03:49.475,0:03:52.077 durch diesen sehr, sehr[br]dünnen Gewebeblock. 0:03:52.101,0:03:54.504 Nur zum Vergleich, 0:03:54.528,0:03:58.320 der Durchmesser einer durchschnittlichen[br]Haarsträhne beträgt circa 100 Mikronen. 0:03:58.344,0:04:00.618 Wir sehen hier also etwas[br]noch viel kleineres 0:04:00.642,0:04:02.070 als eine einzelne Haarsträhne. 0:04:02.070,0:04:06.095 Basierend auf den Serien aus[br]Elektronenmikroskopscheiben 0:04:06.119,0:04:11.127 kann man 3D-Nachbildungen[br]von Neuronen wie diese hier erstellen. 0:04:11.131,0:04:14.292 Diese haben in etwa den Stil [br]von Ramón y Cajal. 0:04:14.292,0:04:15.874 Nur ein paar Neutronen leuchten,[br] 0:04:15.878,0:04:18.623 weil wir hier sonst nichts sehen könnten. 0:04:18.623,0:04:19.965 Es wäre so unübersichtlich, 0:04:19.989,0:04:22.299 so überfüllt mit Kabelstrukturen, 0:04:22.299,0:04:24.437 die die Neuronen verbinden. 0:04:25.293,0:04:28.097 Ramón y Cajal war seiner Zeit[br]also etwas voraus. 0:04:28.121,0:04:30.676 Die Fortschritte beim[br]Verstehen des Gehirns 0:04:30.700,0:04:33.461 geschahen in den folgenden[br]Jahrzehnten nur langsam. 0:04:33.461,0:04:36.308 Aber wir wussten,[br]dass Neuronen Elektrizität nutzen. 0:04:36.332,0:04:38.752 Im Zweiten Weltkrieg[br]war unsere Technologie 0:04:38.752,0:04:42.058 für elektronische Experimente[br]an lebenden Neuronen 0:04:42.058,0:04:44.708 zur Erforschung ihrer[br]Funktionsweise ausgereift genug. 0:04:44.708,0:04:48.987 Genau damals wurden auch[br]Computer erfunden, 0:04:49.011,0:04:52.111 hauptsächlich auf Basis von[br]Nachbildungen des Gehirns -- 0:04:52.135,0:04:55.220 "intelligente Maschinen",[br]wie sie Alan Turing nannte, 0:04:55.244,0:04:57.235 einer der Urväter der Infomatik. 0:04:57.923,0:05:02.555 Warren McCulloch und Walter Pitts[br]betrachteten Ramón y Cajals Zeichnung 0:05:02.579,0:05:03.896 eines visuellen Cortex, 0:05:03.920,0:05:05.482 die ich Ihnen hier zeige. 0:05:05.506,0:05:09.948 Das ist der Cortex, der Bilder [br]verarbeitet, die das Auge sieht. 0:05:10.424,0:05:13.932 Sie fanden, dass es [br]wie ein Schaltplan aussah. 0:05:14.353,0:05:18.188 Im Schaltplan von McCulloch [br]und Pitts gibt es viele Details, 0:05:18.212,0:05:19.564 die nicht ganz stimmen. 0:05:19.588,0:05:20.823 Doch der Grundgedanke, 0:05:20.837,0:05:24.899 dass der visuelle Cortex wie eine[br]Reihe Computerelemente funktioniert, 0:05:24.899,0:05:27.819 die Informationen stufenartig[br]nacheinander weiterreichen, 0:05:27.819,0:05:29.235 stimmt im Grunde. 0:05:29.239,0:05:31.629 Besprechen wir kurz, 0:05:31.633,0:05:36.235 was ein Modell für die Verarbeitung[br]visueller Informationen machen müsste. 0:05:36.235,0:05:39.269 Die Grundaufgabe der Wahrnehmung ist es, 0:05:39.269,0:05:43.187 bei einem solchen Bild zu sagen: 0:05:43.211,0:05:44.387 "Das ist ein Vogel", 0:05:44.411,0:05:47.285 für unsere Gehirne ist das sehr einfach. 0:05:47.309,0:05:50.730 Sie müssen aber bedenken,[br]dass das für einen Computer 0:05:50.754,0:05:53.825 noch vor ein paar Jahren[br]völlig unmöglich war. 0:05:53.825,0:05:55.961 Für ein klassisches Rechensystem 0:05:55.961,0:05:58.312 ist das nicht einfach. 0:05:59.366,0:06:01.918 Was zwischen den Pixeln, 0:06:01.942,0:06:05.970 dem Bild eines Vogels [br]und dem Wort "Vogel" passiert, 0:06:05.994,0:06:08.758 ist im Grunde eine Gruppe [br]miteinander verbundener Neuronen 0:06:08.772,0:06:10.167 in einem neuronalen Netzwerk, 0:06:10.177,0:06:11.274 wie in meinem Diagramm. 0:06:11.274,0:06:14.880 Dieses neuronale Netzwerk kann [br]ein natürliches in unserer Sehrinde sein. 0:06:14.880,0:06:16.816 Heute können wir beginnen, 0:06:16.816,0:06:19.844 solche neuronalen Netzwerke [br]in Computern nachbauen. 0:06:19.844,0:06:22.187 Ich gebe Ihnen eine Vorstellung davon. 0:06:22.211,0:06:25.647 Die Pixel können Sie sich als[br]erste Neuronenschicht vorstellen. 0:06:25.651,0:06:28.084 Genau so funktioniert das[br]im Prinzip auch im Auge -- 0:06:28.094,0:06:29.697 mit den Neuronen in der Netzhaut. 0:06:29.737,0:06:31.101 Die Neuronen leiten weiter, 0:06:31.125,0:06:34.512 Schicht für Schicht [br]durch die Neuronenschichten, 0:06:34.512,0:06:37.605 die alle über Synapsen verschiedener [br]Gewichtung verbunden sind. 0:06:37.609,0:06:39.124 Das Verhalten dieses Netzwerks 0:06:39.124,0:06:42.252 wird durch die Stärke[br]all dieser Synapsen bestimmt. 0:06:42.256,0:06:45.594 Diese bestimmen die rechnerischen[br]Eigenschaften des Netzwerks. 0:06:45.594,0:06:47.772 Schlussendlich leuchtet dann ein Neuron 0:06:47.772,0:06:50.009 oder eine kleine Gruppe Neuronen auf 0:06:50.009,0:06:51.430 und sagt "Vogel". 0:06:51.824,0:06:54.956 Jetzt werde ich diese drei Dinge -- 0:06:54.980,0:06:59.676 die Pixel als Input, die Synapsen[br]im neuronalen Netzwerk 0:06:59.700,0:07:01.285 und den Vogel als Output 0:07:01.309,0:07:04.366 durch drei Variablen ersetzen: x, w und y. 0:07:04.853,0:07:06.664 Es kann eine Million x geben -- 0:07:06.688,0:07:08.641 eine Million Pixel in einem Bild. 0:07:08.665,0:07:11.111 Es gibt Milliarden oder Billiarden w, 0:07:11.135,0:07:14.556 die für die Gewichtung der Synapsen[br]im neuronalen Netzwerk stehen. 0:07:14.580,0:07:16.455 Es gibt nur ganz wenige y, 0:07:16.479,0:07:18.337 also Outputs des Netzwerks. 0:07:18.361,0:07:20.360 "Vogel" hat nur fünf Buchstaben. 0:07:21.088,0:07:24.514 Dann tun wir doch einfach so,[br]als sei es nur eine einfache Formel: 0:07:24.538,0:07:26.541 x "x" w = y. 0:07:26.575,0:07:28.941 Ich setze das "Mal"-Zeichen [br]in Anführungszeichen, 0:07:28.965,0:07:31.065 denn der eigentliche Vorgang hier 0:07:31.089,0:07:34.625 ist eine komplizierte Abfolge[br]mathematischer Vorgänge. 0:07:35.172,0:07:36.393 Das ist eine Gleichung. 0:07:36.417,0:07:38.063 Es gibt drei Variablen. 0:07:38.063,0:07:42.219 Bekanntlich kann man eine Variable[br]einer Gleichung lösen, 0:07:42.219,0:07:45.145 wenn man die anderen beiden kennt. 0:07:45.145,0:07:48.472 Das Problem mit der Schlussfolgerung, 0:07:48.472,0:07:51.435 also das Herausfinden,[br]dass das Bild einen Vogel zeigt, 0:07:51.459,0:07:52.733 ist das folgende: 0:07:52.757,0:07:56.216 Y ist unbekannt,[br]und w und x sind bekannt. 0:07:56.240,0:07:58.569 Wir kennen das neuronale [br]Netzwerk und die Pixel. 0:07:58.593,0:08:01.974 Es scheint ein recht[br]einfaches Problem zu sein. 0:08:02.004,0:08:04.260 Wir rechnen zwei mal drei und sind fertig. 0:08:04.862,0:08:08.385 Ich zeige Ihnen jetzt ein neu entwickeltes[br]künstliches neuronales Netzwerk, 0:08:08.385,0:08:09.645 das genau das tut. 0:08:09.645,0:08:12.494 Es läuft in Echtzeit [br]auf einem Mobiltelefon, 0:08:12.518,0:08:15.831 und das an sich ist [br]natürlich schon erstaunlich, 0:08:15.855,0:08:19.107 dass Mobiltelefone so viele[br]Milliarden und Billiarden Vorgänge 0:08:19.107,0:08:20.595 pro Sekunde verarbeiten können. 0:08:20.619,0:08:22.234 Sie sehen hier ein Telefon, 0:08:22.258,0:08:25.789 das Bilder von einem Vogel [br]nacheinander ansieht, 0:08:25.789,0:08:28.564 und sogar nicht nur [br]"Ja, es ist ein Vogel" sagt, 0:08:28.568,0:08:32.329 sondern mit einem solchen Netzwerk[br]auch die Vogelart bestimmt. 0:08:32.890,0:08:34.660 Bei diesem Bild[br] 0:08:34.660,0:08:38.542 kennen wir das x und das w,[br]und das y ist unbekannt. 0:08:38.566,0:08:41.074 Ich lasse hier natürlich[br]den schwierigen Teil aus, 0:08:41.098,0:08:44.959 also wie um alles in der Welt[br]wir das w finden können, 0:08:44.983,0:08:47.170 wie das Gehirn so etwas kann. 0:08:47.194,0:08:49.378 Wie können wir jemals [br]so ein Modell erlernen? 0:08:49.418,0:08:52.651 Wenn wir diesen Lernvorgang, [br]also wie man nach w auflösen kann, 0:08:52.675,0:08:55.322 wenn wir das bei der[br]einfachen Gleichung anwenden, 0:08:55.346,0:08:57.346 in der wir sie uns als Zahlen vorstellen, 0:08:57.370,0:09:00.057 wissen wir genau, was zu tun ist:[br]6 = 2 x w, 0:09:00.081,0:09:03.393 wir teilen durch zwei und fertig. 0:09:04.001,0:09:06.821 Das Problem ist dieses Rechenzeichen. 0:09:06.823,0:09:07.974 Division -- 0:09:07.998,0:09:11.379 wir wählen die Division, weil sie [br]das Gegenteil der Multiplikation ist, 0:09:11.379,0:09:12.583 aber wie gesagt, 0:09:12.607,0:09:15.056 Mulitplikation stimmt hier nicht ganz. 0:09:15.080,0:09:18.406 Es handelt sich um einen sehr [br]komplizierten, nichtlinearen Vorgang 0:09:18.430,0:09:20.134 ohne Umkehrung. 0:09:20.158,0:09:22.032 Wir müssen also herausfinden, 0:09:22.032,0:09:25.356 wie wir die Gleichung[br]ohne Divisionszeichen lösen können. 0:09:25.380,0:09:27.723 Eigentlich ist es ganz einfach: 0:09:27.747,0:09:30.418 Wir zaubern einfach[br]ein wenig mit der Algebra. 0:09:30.442,0:09:33.348 Wir ziehen die 6 auf[br]die rechte Seite der Gleichung. 0:09:33.372,0:09:35.198 Wir multiplizieren immer noch. 0:09:35.675,0:09:39.255 Diese Null -- betrachten [br]wir einfach als Fehler. 0:09:39.279,0:09:41.794 Anders gesagt, wenn wir[br]korrekt nach w auflösen, 0:09:41.818,0:09:43.474 dann ist der Fehler null. 0:09:43.498,0:09:45.436 Wenn wir einen Fehler machen, 0:09:45.460,0:09:47.209 ist der Fehler größer als null. 0:09:47.233,0:09:50.599 Jetzt können wir einfach raten,[br]um den Fehler zu minimieren. 0:09:50.623,0:09:53.310 Computer können das ausgezeichnet. 0:09:53.334,0:09:54.531 Sie raten also ins Blaue: 0:09:54.531,0:09:56.611 Was, wenn w = 0?[br]Dann ist der Fehler 6. 0:09:56.625,0:09:58.841 Wenn w = 1? Dann ist der Fehler 4. 0:09:58.841,0:10:01.232 Dann kann der Computer Marco Polo spielen 0:10:01.256,0:10:03.623 und den Fehler gegen Null gehen lassen. 0:10:03.647,0:10:07.021 Dabei nähert er sich immer mehr dem w an. 0:10:07.045,0:10:10.701 Meist schafft er es nicht ganz,[br]aber nach ungefähr einem Dutzend Schritten 0:10:10.725,0:10:15.349 liegen wir bei w = 2,999,[br]und das ist genau genug. 0:10:16.302,0:10:18.116 Das ist der Lernprozess. 0:10:18.140,0:10:20.694 Erinnern Sie sich daran, 0:10:20.694,0:10:25.272 dass wir gerade viele bekannte x[br]und bekannte y genommen haben. 0:10:25.296,0:10:28.970 Wir lösten das w in der Mitte[br]durch ein Wiederholungsverfahren. 0:10:28.970,0:10:32.330 Genauso lernen auch wir. 0:10:32.354,0:10:34.584 Als Babys sehen wir sehr viele Bilder. 0:10:34.608,0:10:37.701 Jemand sagt: "Das ist ein Vogel; [br]das ist kein Vogel." 0:10:37.714,0:10:39.812 Mit der Zeit und durch Wiederholung 0:10:39.836,0:10:43.104 lösen wir nach w und diesen[br]neuronalen Verbindungen auf. 0:10:43.460,0:10:47.270 Jetzt haben wir mit x und w [br]nach y aufgelöst. 0:10:47.270,0:10:49.447 Die alltägliche, schnelle Wahrnehmung. 0:10:49.447,0:10:51.744 Herauszufinden, wie man[br]nach w auflösen kann, 0:10:51.748,0:10:53.265 ist Lernen und viel schwerer, 0:10:53.265,0:10:54.524 weil wir die Fehler 0:10:54.524,0:10:56.881 nur über viele Übungsbeispiele[br]minimieren können. 0:10:56.881,0:10:58.285 Vor ungefähr einem Jahr 0:10:58.285,0:11:01.106 wollte Alex Mordvintsev[br]aus unserem Team herausfinden, 0:11:01.106,0:11:03.636 was passiert, wenn wir nach x auflösen 0:11:03.660,0:11:05.697 und w und y bekannt sind. 0:11:06.074,0:11:06.995 Anders ausgedrückt: 0:11:06.995,0:11:08.651 Sie wissen, dass es ein Vogel ist. 0:11:08.675,0:11:12.268 Ihr neuronales Netzwerk[br]ist schon auf Vögel trainiert, 0:11:12.268,0:11:14.596 doch was ist das Bild eines Vogels? 0:11:15.034,0:11:20.058 Tatsächlich kann man die gleiche[br]Fehlerminimierungsstrategie [br] 0:11:20.082,0:11:23.512 bei Netzwerken zum Erkennen [br]von Vögeln anwenden. 0:11:23.536,0:11:26.924 Das Ergebnis ist ... 0:11:30.400,0:11:32.105 ein Bild von Vögeln. 0:11:32.724,0:11:36.545 Dieses Bild von Vögeln wurde von einem[br]neuronalen Netzwerk erschaffen, 0:11:36.545,0:11:38.621 das auf das Vogelerkennen trainiert wurde, 0:11:38.621,0:11:41.857 und zwar nur durch Auflösen nach x,[br]nicht durch Auflösen nach y. 0:11:41.857,0:11:43.835 All das passiert durch Wiederholungen. 0:11:43.835,0:11:45.579 Noch ein lustiges Beispiel. 0:11:45.603,0:11:49.040 Dies ist die Arbeit unseres [br]Teammitglieds Mike Tyka, 0:11:49.064,0:11:51.372 der es "Animal Parade" nennt. 0:11:51.396,0:11:54.272 Es erinnert mich etwas an[br]Kunstwerke von William Kentridge, 0:11:54.296,0:11:56.819 der Skizzen macht, sie dann wegradiert, 0:11:56.819,0:11:58.249 Skizzen macht, sie wegradiert, 0:11:58.263,0:11:59.691 und so einen Film erschafft. 0:11:59.715,0:12:00.866 In diesem Fall 0:12:00.890,0:12:04.177 setzt Mike für y verschiedene Tiere[br]in ein Netzwerk ein, 0:12:04.191,0:12:08.163 das verschiedene Tiere[br]erkennen und unterscheiden kann. 0:12:08.163,0:12:12.762 Heraus kommt dieser seltsame[br]Übergang von Tier zu Tier im Stil Eschers. 0:12:14.221,0:12:18.729 Hier haben Mike und Alex [br]gemeinsam versucht, 0:12:18.729,0:12:21.618 das y auf nur zwei [br]Dimensionen einzuschränken 0:12:21.642,0:12:25.080 und so eine Karte von[br]allen Dingen im Raum zu erstellen, 0:12:25.104,0:12:26.823 die dieses Netzwerk erkennt. 0:12:26.847,0:12:28.734 Durch diese Darstellung 0:12:28.734,0:12:31.276 oder Bildgenerierung [br]auf der gesamten Oberfläche, 0:12:31.280,0:12:34.466 wobei y auf der Oberfläche variiert,[br]wird eine Art Karte erstellt -- 0:12:34.466,0:12:37.621 eine visuelle Karte all der Dinge,[br]die das Netzwerk erkennen kann. 0:12:37.621,0:12:40.910 Alle Tiere sind da, "armadillo" [br]ist genau an dieser Stelle. 0:12:40.919,0:12:43.438 Dasselbe kann man auch [br]mit anderen Netzwerken machen. 0:12:43.452,0:12:46.296 Dieses Netzwerk erkennt Gesichter 0:12:46.320,0:12:48.320 und unterscheidet sie voneinander. 0:12:48.344,0:12:51.593 Hier setzten wir [br]ein y ein, das "ich" sagt, 0:12:51.617,0:12:53.292 also die Parameter meines Gesichts. 0:12:53.312,0:12:54.922 Wenn das Netzwerk nach x auflöst, 0:12:54.946,0:12:57.564 generiert es dieses verrückte, 0:12:57.588,0:13:02.016 kubistisch angehauchte, surreale,[br]psychedelische Bild von mir 0:13:02.040,0:13:03.846 aus verschiedenen Blickwinkeln. 0:13:03.870,0:13:06.824 Es wirkt wie eine Betrachtung [br]aus verschiedenen Blickwinkeln, 0:13:06.824,0:13:10.485 weil das Netzwerk so aufgebaut ist,[br]dass es die Vieldeutigkeit umgehen kann, 0:13:10.485,0:13:13.295 die durch Gesichter in verschiedenen Posen 0:13:13.295,0:13:16.215 oder verschiedene Belichtungen entsteht. 0:13:16.239,0:13:18.318 Wenn man bei dieser Art Rekonstruktion 0:13:18.318,0:13:22.222 nun keinerlei Musterbild[br]oder Hilfsstatistiken verwendet, 0:13:22.222,0:13:25.676 vermischen sich die Ansichten [br]aus den verschiedenen Blickwinkeln 0:13:25.700,0:13:27.448 aufgrund der Vieldeutigkeit. 0:13:27.786,0:13:32.009 Das passert, wenn Alex [br]während des Optimierungsprozesses 0:13:32.033,0:13:36.274 zur Rekonstruktion meines Gesichts[br]sein eigenes Gesicht als Muster verwendet. 0:13:36.284,0:13:38.612 Sie sehen also, es ist nicht perfekt. 0:13:38.636,0:13:40.064 Wir müssen noch hart arbeiten, 0:13:40.064,0:13:43.257 um diesen Optimierungsprozess [br]optimieren zu können. 0:13:43.257,0:13:45.838 Aber langsam entstehen[br]stimmigere Gesichter, 0:13:45.862,0:13:48.396 da mein Gesicht als Muster diente. 0:13:48.892,0:13:51.087 Man muss nicht bei Null 0:13:51.097,0:13:52.573 oder weißem Rauschen beginnen. 0:13:52.597,0:13:53.901 Wenn man nach x auflöst, 0:13:53.925,0:13:57.814 kann man mit einem x anfangen,[br]das selbst schon ein anderes Bild ist. 0:13:57.838,0:14:00.394 Das soll diese Vorführung zeigen. 0:14:00.418,0:14:03.784 Das ist ein Netzwerk,[br]das verschiedenste Objekte -- 0:14:03.784,0:14:07.683 menschgemachte Strukturen, Tiere usw. --[br]kategorisieren können soll. 0:14:07.707,0:14:10.300 Wir beginnen nur mit einem Wolkenbild, 0:14:10.324,0:14:11.995 und während der Optimierung 0:14:12.019,0:14:16.505 findet das Netzwerk quasi heraus,[br]was es in den Wolken sieht. 0:14:16.931,0:14:19.251 Je länger man zusieht, 0:14:19.275,0:14:22.548 desto mehr sieht man in den Wolken. 0:14:23.004,0:14:26.323 Man kann mit dem Gesichtsnetzwerk[br]Halluzinationen einfügen, 0:14:26.323,0:14:28.545 und ganz schön verrücktes Zeug machen. 0:14:28.545,0:14:29.589 (Lachen) 0:14:30.401,0:14:33.145 Mike hat noch mehr Experimente gemacht, 0:14:33.169,0:14:37.074 bei denen er ein Wolkenbild nimmt, 0:14:37.078,0:14:40.695 halluziniert, heranzoomt, halluziniert,[br]heranzoomt, halluziniert und zoomt. 0:14:40.695,0:14:42.400 Auf diese Weise kann man vielleicht 0:14:42.400,0:14:45.479 eine Art Fluchtzustand des Netzwerks 0:14:45.503,0:14:48.867 oder eine Art freie Assoziation erzeugen, 0:14:48.867,0:14:51.434 bei der sich das Netzwerk selbst [br]in den Schwanz beißt. 0:14:51.458,0:14:54.879 Jedes Bild ist nun die Grundlage für: 0:14:54.903,0:14:56.804 "Was glaube ich, als nächstes zu sehen? 0:14:56.814,0:14:59.531 Was erwarte ich als nächstes,[br]und danach und danach?" 0:14:59.531,0:15:02.423 Öffentlich habe ich dies das erste Mal 0:15:02.447,0:15:07.884 einer Vorlesungsgruppe namens[br]"Higher Education" in Seattle gezeigt, 0:15:07.908,0:15:10.725 kurz nachdem Marihuana legalisiert wurde. 0:15:10.725,0:15:12.784 (Lachen) 0:15:14.627,0:15:16.731 Ich möchte nun zum Ende kommen 0:15:16.755,0:15:21.010 und festhalten, dass dieser Technologie[br]keine Grenzen gesetzt sind. 0:15:21.034,0:15:24.699 Ich habe Ihnen nur visuelle Beispiele [br]gezeigt, einfach, weil es Spaß macht. 0:15:24.723,0:15:27.174 Aber es ist keine [br]rein visuelle Technologie. 0:15:27.198,0:15:29.191 Ross Goodwin, künstlerischer Mitarbeiter, 0:15:29.215,0:15:32.886 hat Experimente gemacht, bei denen [br]eine Kamera ein Bild schießt 0:15:32.910,0:15:37.254 und ein Comuter in seinem Rucksack[br]ein Gedicht mit einem neuronalen Netzwerk [br] 0:15:37.294,0:15:39.112 basierend auf dem Bildinhalt schreibt. 0:15:39.136,0:15:42.577 Trainiert wurde das neuronale [br]Gedichtenetzwerk mit den Werken 0:15:42.587,0:15:44.351 der Dichtungen des 20. Jahrhunderts. 0:15:44.365,0:15:45.864 Die Gedichte sind, naja, 0:15:45.888,0:15:47.862 also ich finde sie gar nicht so schlecht. 0:15:47.862,0:15:49.210 (Lachen) 0:15:49.234,0:15:50.523 Zurück zu 0:15:50.523,0:15:52.433 Michelangelo, 0:15:52.433,0:15:53.881 ich denke, der lag richtig: 0:15:53.881,0:15:57.617 Wahrnehmung und Kreativität[br]sind sehr eng miteinander verbunden. 0:15:57.617,0:16:00.245 Gerade haben wir [br]neuronale Netzwerke gesehen, 0:16:00.269,0:16:01.912 die nur darauf trainiert sind, [br] 0:16:01.912,0:16:04.838 verschiedene Dinge [br]zu unterscheiden oder zu erkennen, 0:16:04.862,0:16:08.023 und umgekehrt werden können, [br]um etwas zu erschaffen. 0:16:08.047,0:16:09.830 Daraus schließe ich nicht nur, 0:16:09.854,0:16:14.752 dass Michelangelo die Skulptur[br]im Stein wirklich sehen konnte, 0:16:14.752,0:16:18.390 sondern auch, dass jedes Wesen,[br]jedes Geschöpf, jedes Alien, 0:16:18.414,0:16:22.071 das zu solchen Wahrnehmungen fähig ist, 0:16:22.075,0:16:23.490 auch Dinge erschaffen kann, 0:16:23.494,0:16:26.718 denn in beiden Fällen kommt die[br]gleiche Maschinerie zum Einsatz. 0:16:26.742,0:16:30.558 Ich denke auch, [br]dass keinesfalls nur Menschen 0:16:30.588,0:16:32.508 wahrnehmen und kreativ sein können. 0:16:32.532,0:16:36.240 Langsam gibt es Computermodelle,[br]die genau das Gleiche können. 0:16:36.264,0:16:39.692 Das sollte keine Überraschung sein,[br]denn das Gehirn basiert auf Rechnen. 0:16:39.702,0:16:41.273 Schließlich entstanden Computer 0:16:41.297,0:16:45.965 aus den Versuchen,[br]intelligente Maschinen zu bauen. 0:16:45.989,0:16:48.451 Sie sind Modelle unserer[br]Vorstellung dessen, 0:16:48.475,0:16:51.488 wie wir Maschinen [br]intelligent machen können. 0:16:51.512,0:16:53.674 Jetzt erfüllen wir langsam 0:16:53.698,0:16:56.104 ein paar der Versprechen[br]der ersten Vorreiter, 0:16:56.128,0:16:57.841 von Turing und von Neumann 0:16:57.865,0:17:00.130 und McCulloch und Pitts. 0:17:00.154,0:17:04.252 Ich denke, beim Rechnen[br]geht es nicht nur um Buchhaltung 0:17:04.276,0:17:06.423 oder Candy Crush oder so etwas. 0:17:06.447,0:17:09.515 Von Anfang an haben wir sie als [br]Abbild unseres Verstands gebaut. 0:17:09.519,0:17:12.432 Mit ihnen können wir unseren[br]eigenen Verstand besser verstehen 0:17:12.442,0:17:14.631 und unsere Fähigkeiten erweitern. 0:17:14.631,0:17:15.914 Vielen Dank. 0:17:15.914,0:17:20.337 (Applaus)