0:00:00.800,0:00:03.924
Ich bin Teamleiter bei Google [br]im Bereich Maschinenintelligenz,

0:00:03.948,0:00:08.598
das ist die Ingenieurdisziplin,[br]mit der man Computern und Geräten

0:00:08.622,0:00:11.431
etwas von dem beibringen kann,[br]was Gehirne können.

0:00:11.439,0:00:14.532
Deshalb interessieren wir uns[br]auch für echte Gehirne

0:00:14.532,0:00:15.901
und Neurowissenschaften,

0:00:15.901,0:00:20.047
und besonders für die Dinge,[br]die unsere Gehirne können,

0:00:20.071,0:00:24.443
die noch weit über die Fähigkeiten[br]von Computern hinausgehen.

0:00:25.209,0:00:28.818
Ein Teilbereich unserer Arbeit war [br]schon immer die Wahrnehmung,

0:00:28.842,0:00:31.881
also der Vorgang, durch den[br]die Dinge auf der Welt --

0:00:31.905,0:00:33.489
Geräusche und Bilder --

0:00:33.513,0:00:35.931
in unserem Kopf zu Konzepten werden.

0:00:36.235,0:00:38.752
Das ist entscheidend für unsere Gehirne

0:00:38.776,0:00:41.650
und auch ziemlich nützlich für Computer.

0:00:41.650,0:00:44.986
Unser Team schreibt Algorithmen [br]für maschinelle Wahrnehmung,

0:00:45.010,0:00:48.158
die etwa ermöglichen, dass[br]Ihre Bilder auf Google Fotos

0:00:48.158,0:00:51.275
basierend auf dem Bildinhalt[br]gesucht werden können.

0:00:51.594,0:00:55.087
Das Gegenstück zur Wahrnehmung [br]ist die Kreativität,

0:00:55.111,0:00:58.143
also das Schaffen einer Sache[br]auf Grundlage eines Konzepts.

0:00:58.143,0:01:01.748
Letztes Jahr kam zwischen unserer [br]Arbeit an maschineller Wahrnehmung,

0:01:01.752,0:01:06.305
dem Feld der maschinellen Kreativität[br]sowie der maschinellen Kunst

0:01:06.305,0:01:08.085
unerwartet eine Verbindung zustande.

0:01:08.086,0:01:11.840
Ich glaube, Michelangelo hatte [br]einen scharfen Blick

0:01:11.864,0:01:15.520
für das duale Verhältnis zwischen[br]Wahrnehmung und Kreativität.

0:01:16.023,0:01:18.029
Ein berühmtes Zitat von ihm lautet:

0:01:18.053,0:01:21.376
"Jeder rohe Stein hat eine Figur in sich,

0:01:22.036,0:01:25.038
der Bildhauer muss sie nur entdecken."

0:01:26.029,0:01:29.245
Ich glaube, Michelangelo wollte sagen,

0:01:29.269,0:01:32.449
dass wir durch Wahrnehmung erschaffen.

0:01:32.453,0:01:35.516
Die Wahrnehmung ist[br]ein Akt der Vorstellung,

0:01:35.520,0:01:38.181
die Grundlage für Kreativität.

0:01:38.691,0:01:42.616
Das Organ, das all das Denken,[br]Wahrnehmen und Vorstellen erledigt,

0:01:42.640,0:01:44.608
ist natürlich das Gehirn.

0:01:45.089,0:01:47.944
Jetzt möchte ich kurz[br]historisch betrachten,

0:01:47.958,0:01:50.080
was wir über Gehirne wissen.

0:01:50.436,0:01:52.792
Denn anders als über [br]das Herz oder die Eingeweide

0:01:52.792,0:01:56.180
kann man nur durch Betrachten [br]nicht viel über Gehirne herausfinden,

0:01:56.180,0:01:57.976
zumindest nicht mit bloßem Auge.

0:01:57.983,0:02:00.399
Die ersten Anatomen, [br]die sich Gehirne ansahen,

0:02:00.423,0:02:04.230
gaben der oberflächlichen Struktur[br]eine ganze Reihe fantasievoller Namen,

0:02:04.254,0:02:06.687
wie Hippocampus, was [br]"kleiner Shrimp" bedeutet.

0:02:06.711,0:02:09.475
Doch so etwas verrät uns [br]natürlich nicht viel darüber,

0:02:09.499,0:02:12.227
was im Inneren wirklich vor sich geht.

0:02:12.780,0:02:16.393
Die erste Person, die meiner Meinung nach[br]wirklich eine Art Einblick

0:02:16.417,0:02:18.417
in die inneren Vorgänge[br]des Gehirns gewann,

0:02:18.447,0:02:22.291
war der große spanische Neuroanatom[br]Santiago Ramón y Cajal

0:02:22.315,0:02:23.859
im 19. Jahrhundert,

0:02:23.883,0:02:27.638
der mit Mikroskopie und Spezialfarbe

0:02:27.662,0:02:31.832
die einzelnen Gehirnzellen [br]selektiv ausfüllte

0:02:31.856,0:02:33.864
oder kontrastreich darstellte,

0:02:33.888,0:02:37.042
um die Morphologie[br]der Zellen zu verstehen.

0:02:37.872,0:02:39.537
Das sind die Zeichnungen,

0:02:39.537,0:02:42.116
die er im 19. Jahrhundert[br]von Neuronen anfertigte.

0:02:42.120,0:02:44.004
Diese zeigt ein Vogelgehirn.

0:02:44.028,0:02:47.219
Sie sehen eine unglaubliche [br]Vielfalt verschiedener Zellarten.

0:02:47.239,0:02:50.538
Sogar die Zelltheorie selbst[br]war damals ziemlich neu.

0:02:50.538,0:02:54.166
Diese Strukturen,[br]diese verzweigten Zellen,

0:02:54.166,0:02:56.761
diese Äste, die sehr, [br]sehr weit reichen können --

0:02:56.765,0:02:58.428
das war damals völlig neu.

0:02:58.779,0:03:01.682
Sie erinnern ganz klar an Kabel.

0:03:01.706,0:03:05.163
Das mag für manch einen im 19. Jh.[br]offensichtlich gewesen sein,

0:03:05.187,0:03:09.501
als gerade die Revolution [br]der Elektrizität und Verkabelung begann.

0:03:09.964,0:03:11.212
Doch in vielerlei Hinsicht

0:03:11.226,0:03:14.423
wurden Ramón y Cajals [br]mikroanatomische Zeichnungen

0:03:14.423,0:03:16.835
wie diese hier, nie wirklich übertroffen.

0:03:16.859,0:03:18.713
Jetzt, mehr als hundert Jahre später,

0:03:18.737,0:03:21.562
versuchen wir immer noch, [br]Ramón y Cajals Werk zu vollenden.

0:03:21.586,0:03:24.720
Das sind die Rohdaten unserer Mitarbeiter

0:03:24.744,0:03:27.625
am Max-Planck-Institut für Neurobiologie.

0:03:27.649,0:03:30.009
Unsere Mitarbeiter bilden also[br]

0:03:30.009,0:03:34.464
kleine Teile von Gehirngewebe ab.

0:03:34.488,0:03:37.814
Diese ganze Probe hier misst[br]ungefähr einen Kubikmillimeter.

0:03:37.838,0:03:40.459
Hier zeige ich Ihnen [br]ein winziges Stück davon.

0:03:40.483,0:03:42.823
Der Strich links misst circa ein Mikron.

0:03:42.823,0:03:45.322
Die Strukturen, die Sie sehen,[br]sind Mitochondrien,

0:03:45.322,0:03:47.304
die so groß wie Bakterien sind.

0:03:47.304,0:03:49.475
Das sind aufeinanderfolgende Schnitte

0:03:49.475,0:03:52.077
durch diesen sehr, sehr[br]dünnen Gewebeblock.

0:03:52.101,0:03:54.504
Nur zum Vergleich,

0:03:54.528,0:03:58.320
der Durchmesser einer durchschnittlichen[br]Haarsträhne beträgt circa 100 Mikronen.

0:03:58.344,0:04:00.618
Wir sehen hier also etwas[br]noch viel kleineres

0:04:00.642,0:04:02.070
als eine einzelne Haarsträhne.

0:04:02.070,0:04:06.095
Basierend auf den Serien aus[br]Elektronenmikroskopscheiben

0:04:06.119,0:04:11.127
kann man 3D-Nachbildungen[br]von Neuronen wie diese hier erstellen.

0:04:11.131,0:04:14.292
Diese haben in etwa den Stil [br]von Ramón y Cajal.

0:04:14.292,0:04:15.874
Nur ein paar Neutronen leuchten,[br]

0:04:15.878,0:04:18.623
weil wir hier sonst nichts sehen könnten.

0:04:18.623,0:04:19.965
Es wäre so unübersichtlich,

0:04:19.989,0:04:22.299
so überfüllt mit Kabelstrukturen,

0:04:22.299,0:04:24.437
die die Neuronen verbinden.

0:04:25.293,0:04:28.097
Ramón y Cajal war seiner Zeit[br]also etwas voraus.

0:04:28.121,0:04:30.676
Die Fortschritte beim[br]Verstehen des Gehirns

0:04:30.700,0:04:33.461
geschahen in den folgenden[br]Jahrzehnten nur langsam.

0:04:33.461,0:04:36.308
Aber wir wussten,[br]dass Neuronen Elektrizität nutzen.

0:04:36.332,0:04:38.752
Im Zweiten Weltkrieg[br]war unsere Technologie

0:04:38.752,0:04:42.058
für elektronische Experimente[br]an lebenden Neuronen

0:04:42.058,0:04:44.708
zur Erforschung ihrer[br]Funktionsweise ausgereift genug.

0:04:44.708,0:04:48.987
Genau damals wurden auch[br]Computer erfunden,

0:04:49.011,0:04:52.111
hauptsächlich auf Basis von[br]Nachbildungen des Gehirns --

0:04:52.135,0:04:55.220
"intelligente Maschinen",[br]wie sie Alan Turing nannte,

0:04:55.244,0:04:57.235
einer der Urväter der Infomatik.

0:04:57.923,0:05:02.555
Warren McCulloch und Walter Pitts[br]betrachteten Ramón y Cajals Zeichnung

0:05:02.579,0:05:03.896
eines visuellen Cortex,

0:05:03.920,0:05:05.482
die ich Ihnen hier zeige.

0:05:05.506,0:05:09.948
Das ist der Cortex, der Bilder [br]verarbeitet, die das Auge sieht.

0:05:10.424,0:05:13.932
Sie fanden, dass es [br]wie ein Schaltplan aussah.

0:05:14.353,0:05:18.188
Im Schaltplan von McCulloch [br]und Pitts gibt es viele Details,

0:05:18.212,0:05:19.564
die nicht ganz stimmen.

0:05:19.588,0:05:20.823
Doch der Grundgedanke,

0:05:20.837,0:05:24.899
dass der visuelle Cortex wie eine[br]Reihe Computerelemente funktioniert,

0:05:24.899,0:05:27.819
die Informationen stufenartig[br]nacheinander weiterreichen,

0:05:27.819,0:05:29.235
stimmt im Grunde.

0:05:29.239,0:05:31.629
Besprechen wir kurz,

0:05:31.633,0:05:36.235
was ein Modell für die Verarbeitung[br]visueller Informationen machen müsste.

0:05:36.235,0:05:39.269
Die Grundaufgabe der Wahrnehmung ist es,

0:05:39.269,0:05:43.187
bei einem solchen Bild zu sagen:

0:05:43.211,0:05:44.387
"Das ist ein Vogel",

0:05:44.411,0:05:47.285
für unsere Gehirne ist das sehr einfach.

0:05:47.309,0:05:50.730
Sie müssen aber bedenken,[br]dass das für einen Computer

0:05:50.754,0:05:53.825
noch vor ein paar Jahren[br]völlig unmöglich war.

0:05:53.825,0:05:55.961
Für ein klassisches Rechensystem

0:05:55.961,0:05:58.312
ist das nicht einfach.

0:05:59.366,0:06:01.918
Was zwischen den Pixeln,

0:06:01.942,0:06:05.970
dem Bild eines Vogels [br]und dem Wort "Vogel" passiert,

0:06:05.994,0:06:08.758
ist im Grunde eine Gruppe [br]miteinander verbundener Neuronen

0:06:08.772,0:06:10.167
in einem neuronalen Netzwerk,

0:06:10.177,0:06:11.274
wie in meinem Diagramm.

0:06:11.274,0:06:14.880
Dieses neuronale Netzwerk kann [br]ein natürliches in unserer Sehrinde sein.

0:06:14.880,0:06:16.816
Heute können wir beginnen,

0:06:16.816,0:06:19.844
solche neuronalen Netzwerke [br]in Computern nachbauen.

0:06:19.844,0:06:22.187
Ich gebe Ihnen eine Vorstellung davon.

0:06:22.211,0:06:25.647
Die Pixel können Sie sich als[br]erste Neuronenschicht vorstellen.

0:06:25.651,0:06:28.084
Genau so funktioniert das[br]im Prinzip auch im Auge --

0:06:28.094,0:06:29.697
mit den Neuronen in der Netzhaut.

0:06:29.737,0:06:31.101
Die Neuronen leiten weiter,

0:06:31.125,0:06:34.512
Schicht für Schicht [br]durch die Neuronenschichten,

0:06:34.512,0:06:37.605
die alle über Synapsen verschiedener [br]Gewichtung verbunden sind.

0:06:37.609,0:06:39.124
Das Verhalten dieses Netzwerks

0:06:39.124,0:06:42.252
wird durch die Stärke[br]all dieser Synapsen bestimmt.

0:06:42.256,0:06:45.594
Diese bestimmen die rechnerischen[br]Eigenschaften des Netzwerks.

0:06:45.594,0:06:47.772
Schlussendlich leuchtet dann ein Neuron

0:06:47.772,0:06:50.009
oder eine kleine Gruppe Neuronen auf

0:06:50.009,0:06:51.430
und sagt "Vogel".

0:06:51.824,0:06:54.956
Jetzt werde ich diese drei Dinge --

0:06:54.980,0:06:59.676
die Pixel als Input, die Synapsen[br]im neuronalen Netzwerk

0:06:59.700,0:07:01.285
und den Vogel als Output

0:07:01.309,0:07:04.366
durch drei Variablen ersetzen: x, w und y.

0:07:04.853,0:07:06.664
Es kann eine Million x geben --

0:07:06.688,0:07:08.641
eine Million Pixel in einem Bild.

0:07:08.665,0:07:11.111
Es gibt Milliarden oder Billiarden w,

0:07:11.135,0:07:14.556
die für die Gewichtung der Synapsen[br]im neuronalen Netzwerk stehen.

0:07:14.580,0:07:16.455
Es gibt nur ganz wenige y,

0:07:16.479,0:07:18.337
also Outputs des Netzwerks.

0:07:18.361,0:07:20.360
"Vogel" hat nur fünf Buchstaben.

0:07:21.088,0:07:24.514
Dann tun wir doch einfach so,[br]als sei es nur eine einfache Formel:

0:07:24.538,0:07:26.541
x "x" w = y.

0:07:26.575,0:07:28.941
Ich setze das "Mal"-Zeichen [br]in Anführungszeichen,

0:07:28.965,0:07:31.065
denn der eigentliche Vorgang hier

0:07:31.089,0:07:34.625
ist eine komplizierte Abfolge[br]mathematischer Vorgänge.

0:07:35.172,0:07:36.393
Das ist eine Gleichung.

0:07:36.417,0:07:38.063
Es gibt drei Variablen.

0:07:38.063,0:07:42.219
Bekanntlich kann man eine Variable[br]einer Gleichung lösen,

0:07:42.219,0:07:45.145
wenn man die anderen beiden kennt.

0:07:45.145,0:07:48.472
Das Problem mit der Schlussfolgerung,

0:07:48.472,0:07:51.435
also das Herausfinden,[br]dass das Bild einen Vogel zeigt,

0:07:51.459,0:07:52.733
ist das folgende:

0:07:52.757,0:07:56.216
Y ist unbekannt,[br]und w und x sind bekannt.

0:07:56.240,0:07:58.569
Wir kennen das neuronale [br]Netzwerk und die Pixel.

0:07:58.593,0:08:01.974
Es scheint ein recht[br]einfaches Problem zu sein.

0:08:02.004,0:08:04.260
Wir rechnen zwei mal drei und sind fertig.

0:08:04.862,0:08:08.385
Ich zeige Ihnen jetzt ein neu entwickeltes[br]künstliches neuronales Netzwerk,

0:08:08.385,0:08:09.645
das genau das tut.

0:08:09.645,0:08:12.494
Es läuft in Echtzeit [br]auf einem Mobiltelefon,

0:08:12.518,0:08:15.831
und das an sich ist [br]natürlich schon erstaunlich,

0:08:15.855,0:08:19.107
dass Mobiltelefone so viele[br]Milliarden und Billiarden Vorgänge

0:08:19.107,0:08:20.595
pro Sekunde verarbeiten können.

0:08:20.619,0:08:22.234
Sie sehen hier ein Telefon,

0:08:22.258,0:08:25.789
das Bilder von einem Vogel [br]nacheinander ansieht,

0:08:25.789,0:08:28.564
und sogar nicht nur [br]"Ja, es ist ein Vogel" sagt,

0:08:28.568,0:08:32.329
sondern mit einem solchen Netzwerk[br]auch die Vogelart bestimmt.

0:08:32.890,0:08:34.660
Bei diesem Bild[br]

0:08:34.660,0:08:38.542
kennen wir das x und das w,[br]und das y ist unbekannt.

0:08:38.566,0:08:41.074
Ich lasse hier natürlich[br]den schwierigen Teil aus,

0:08:41.098,0:08:44.959
also wie um alles in der Welt[br]wir das w finden können,

0:08:44.983,0:08:47.170
wie das Gehirn so etwas kann.

0:08:47.194,0:08:49.378
Wie können wir jemals [br]so ein Modell erlernen?

0:08:49.418,0:08:52.651
Wenn wir diesen Lernvorgang, [br]also wie man nach w auflösen kann,

0:08:52.675,0:08:55.322
wenn wir das bei der[br]einfachen Gleichung anwenden,

0:08:55.346,0:08:57.346
in der wir sie uns als Zahlen vorstellen,

0:08:57.370,0:09:00.057
wissen wir genau, was zu tun ist:[br]6 = 2 x w,

0:09:00.081,0:09:03.393
wir teilen durch zwei und fertig.

0:09:04.001,0:09:06.821
Das Problem ist dieses Rechenzeichen.

0:09:06.823,0:09:07.974
Division --

0:09:07.998,0:09:11.379
wir wählen die Division, weil sie [br]das Gegenteil der Multiplikation ist,

0:09:11.379,0:09:12.583
aber wie gesagt,

0:09:12.607,0:09:15.056
Mulitplikation stimmt hier nicht ganz.

0:09:15.080,0:09:18.406
Es handelt sich um einen sehr [br]komplizierten, nichtlinearen Vorgang

0:09:18.430,0:09:20.134
ohne Umkehrung.

0:09:20.158,0:09:22.032
Wir müssen also herausfinden,

0:09:22.032,0:09:25.356
wie wir die Gleichung[br]ohne Divisionszeichen lösen können.

0:09:25.380,0:09:27.723
Eigentlich ist es ganz einfach:

0:09:27.747,0:09:30.418
Wir zaubern einfach[br]ein wenig mit der Algebra.

0:09:30.442,0:09:33.348
Wir ziehen die 6 auf[br]die rechte Seite der Gleichung.

0:09:33.372,0:09:35.198
Wir multiplizieren immer noch.

0:09:35.675,0:09:39.255
Diese Null -- betrachten [br]wir einfach als Fehler.

0:09:39.279,0:09:41.794
Anders gesagt, wenn wir[br]korrekt nach w auflösen,

0:09:41.818,0:09:43.474
dann ist der Fehler null.

0:09:43.498,0:09:45.436
Wenn wir einen Fehler machen,

0:09:45.460,0:09:47.209
ist der Fehler größer als null.

0:09:47.233,0:09:50.599
Jetzt können wir einfach raten,[br]um den Fehler zu minimieren.

0:09:50.623,0:09:53.310
Computer können das ausgezeichnet.

0:09:53.334,0:09:54.531
Sie raten also ins Blaue:

0:09:54.531,0:09:56.611
Was, wenn w = 0?[br]Dann ist der Fehler 6.

0:09:56.625,0:09:58.841
Wenn w = 1? Dann ist der Fehler 4.

0:09:58.841,0:10:01.232
Dann kann der Computer Marco Polo spielen

0:10:01.256,0:10:03.623
und den Fehler gegen Null gehen lassen.

0:10:03.647,0:10:07.021
Dabei nähert er sich immer mehr dem w an.

0:10:07.045,0:10:10.701
Meist schafft er es nicht ganz,[br]aber nach ungefähr einem Dutzend Schritten

0:10:10.725,0:10:15.349
liegen wir bei w = 2,999,[br]und das ist genau genug.

0:10:16.302,0:10:18.116
Das ist der Lernprozess.

0:10:18.140,0:10:20.694
Erinnern Sie sich daran,

0:10:20.694,0:10:25.272
dass wir gerade viele bekannte x[br]und bekannte y genommen haben.

0:10:25.296,0:10:28.970
Wir lösten das w in der Mitte[br]durch ein Wiederholungsverfahren.

0:10:28.970,0:10:32.330
Genauso lernen auch wir.

0:10:32.354,0:10:34.584
Als Babys sehen wir sehr viele Bilder.

0:10:34.608,0:10:37.701
Jemand sagt: "Das ist ein Vogel; [br]das ist kein Vogel."

0:10:37.714,0:10:39.812
Mit der Zeit und durch Wiederholung

0:10:39.836,0:10:43.104
lösen wir nach w und diesen[br]neuronalen Verbindungen auf.

0:10:43.460,0:10:47.270
Jetzt haben wir mit x und w [br]nach y aufgelöst.

0:10:47.270,0:10:49.447
Die alltägliche, schnelle Wahrnehmung.

0:10:49.447,0:10:51.744
Herauszufinden, wie man[br]nach w auflösen kann,

0:10:51.748,0:10:53.265
ist Lernen und viel schwerer,

0:10:53.265,0:10:54.524
weil wir die Fehler

0:10:54.524,0:10:56.881
nur über viele Übungsbeispiele[br]minimieren können.

0:10:56.881,0:10:58.285
Vor ungefähr einem Jahr

0:10:58.285,0:11:01.106
wollte Alex Mordvintsev[br]aus unserem Team herausfinden,

0:11:01.106,0:11:03.636
was passiert, wenn wir nach x auflösen

0:11:03.660,0:11:05.697
und w und y bekannt sind.

0:11:06.074,0:11:06.995
Anders ausgedrückt:

0:11:06.995,0:11:08.651
Sie wissen, dass es ein Vogel ist.

0:11:08.675,0:11:12.268
Ihr neuronales Netzwerk[br]ist schon auf Vögel trainiert,

0:11:12.268,0:11:14.596
doch was ist das Bild eines Vogels?

0:11:15.034,0:11:20.058
Tatsächlich kann man die gleiche[br]Fehlerminimierungsstrategie [br]

0:11:20.082,0:11:23.512
bei Netzwerken zum Erkennen [br]von Vögeln anwenden.

0:11:23.536,0:11:26.924
Das Ergebnis ist ...

0:11:30.400,0:11:32.105
ein Bild von Vögeln.

0:11:32.724,0:11:36.545
Dieses Bild von Vögeln wurde von einem[br]neuronalen Netzwerk erschaffen,

0:11:36.545,0:11:38.621
das auf das Vogelerkennen trainiert wurde,

0:11:38.621,0:11:41.857
und zwar nur durch Auflösen nach x,[br]nicht durch Auflösen nach y.

0:11:41.857,0:11:43.835
All das passiert durch Wiederholungen.

0:11:43.835,0:11:45.579
Noch ein lustiges Beispiel.

0:11:45.603,0:11:49.040
Dies ist die Arbeit unseres [br]Teammitglieds Mike Tyka,

0:11:49.064,0:11:51.372
der es "Animal Parade" nennt.

0:11:51.396,0:11:54.272
Es erinnert mich etwas an[br]Kunstwerke von William Kentridge,

0:11:54.296,0:11:56.819
der Skizzen macht, sie dann wegradiert,

0:11:56.819,0:11:58.249
Skizzen macht, sie wegradiert,

0:11:58.263,0:11:59.691
und so einen Film erschafft.

0:11:59.715,0:12:00.866
In diesem Fall

0:12:00.890,0:12:04.177
setzt Mike für y verschiedene Tiere[br]in ein Netzwerk ein,

0:12:04.191,0:12:08.163
das verschiedene Tiere[br]erkennen und unterscheiden kann.

0:12:08.163,0:12:12.762
Heraus kommt dieser seltsame[br]Übergang von Tier zu Tier im Stil Eschers.

0:12:14.221,0:12:18.729
Hier haben Mike und Alex [br]gemeinsam versucht,

0:12:18.729,0:12:21.618
das y auf nur zwei [br]Dimensionen einzuschränken

0:12:21.642,0:12:25.080
und so eine Karte von[br]allen Dingen im Raum zu erstellen,

0:12:25.104,0:12:26.823
die dieses Netzwerk erkennt.

0:12:26.847,0:12:28.734
Durch diese Darstellung

0:12:28.734,0:12:31.276
oder Bildgenerierung [br]auf der gesamten Oberfläche,

0:12:31.280,0:12:34.466
wobei y auf der Oberfläche variiert,[br]wird eine Art Karte erstellt --

0:12:34.466,0:12:37.621
eine visuelle Karte all der Dinge,[br]die das Netzwerk erkennen kann.

0:12:37.621,0:12:40.910
Alle Tiere sind da, "armadillo" [br]ist genau an dieser Stelle.

0:12:40.919,0:12:43.438
Dasselbe kann man auch [br]mit anderen Netzwerken machen.

0:12:43.452,0:12:46.296
Dieses Netzwerk erkennt Gesichter

0:12:46.320,0:12:48.320
und unterscheidet sie voneinander.

0:12:48.344,0:12:51.593
Hier setzten wir [br]ein y ein, das "ich" sagt,

0:12:51.617,0:12:53.292
also die Parameter meines Gesichts.

0:12:53.312,0:12:54.922
Wenn das Netzwerk nach x auflöst,

0:12:54.946,0:12:57.564
generiert es dieses verrückte,

0:12:57.588,0:13:02.016
kubistisch angehauchte, surreale,[br]psychedelische Bild von mir

0:13:02.040,0:13:03.846
aus verschiedenen Blickwinkeln.

0:13:03.870,0:13:06.824
Es wirkt wie eine Betrachtung [br]aus verschiedenen Blickwinkeln,

0:13:06.824,0:13:10.485
weil das Netzwerk so aufgebaut ist,[br]dass es die Vieldeutigkeit umgehen kann,

0:13:10.485,0:13:13.295
die durch Gesichter in verschiedenen Posen

0:13:13.295,0:13:16.215
oder verschiedene Belichtungen entsteht.

0:13:16.239,0:13:18.318
Wenn man bei dieser Art Rekonstruktion

0:13:18.318,0:13:22.222
nun keinerlei Musterbild[br]oder Hilfsstatistiken verwendet,

0:13:22.222,0:13:25.676
vermischen sich die Ansichten [br]aus den verschiedenen Blickwinkeln

0:13:25.700,0:13:27.448
aufgrund der Vieldeutigkeit.

0:13:27.786,0:13:32.009
Das passert, wenn Alex [br]während des Optimierungsprozesses

0:13:32.033,0:13:36.274
zur Rekonstruktion meines Gesichts[br]sein eigenes Gesicht als Muster verwendet.

0:13:36.284,0:13:38.612
Sie sehen also, es ist nicht perfekt.

0:13:38.636,0:13:40.064
Wir müssen noch hart arbeiten,

0:13:40.064,0:13:43.257
um diesen Optimierungsprozess [br]optimieren zu können.

0:13:43.257,0:13:45.838
Aber langsam entstehen[br]stimmigere Gesichter,

0:13:45.862,0:13:48.396
da mein Gesicht als Muster diente.

0:13:48.892,0:13:51.087
Man muss nicht bei Null

0:13:51.097,0:13:52.573
oder weißem Rauschen beginnen.

0:13:52.597,0:13:53.901
Wenn man nach x auflöst,

0:13:53.925,0:13:57.814
kann man mit einem x anfangen,[br]das selbst schon ein anderes Bild ist.

0:13:57.838,0:14:00.394
Das soll diese Vorführung zeigen.

0:14:00.418,0:14:03.784
Das ist ein Netzwerk,[br]das verschiedenste Objekte --

0:14:03.784,0:14:07.683
menschgemachte Strukturen, Tiere usw. --[br]kategorisieren können soll.

0:14:07.707,0:14:10.300
Wir beginnen nur mit einem Wolkenbild,

0:14:10.324,0:14:11.995
und während der Optimierung

0:14:12.019,0:14:16.505
findet das Netzwerk quasi heraus,[br]was es in den Wolken sieht.

0:14:16.931,0:14:19.251
Je länger man zusieht,

0:14:19.275,0:14:22.548
desto mehr sieht man in den Wolken.

0:14:23.004,0:14:26.323
Man kann mit dem Gesichtsnetzwerk[br]Halluzinationen einfügen,

0:14:26.323,0:14:28.545
und ganz schön verrücktes Zeug machen.

0:14:28.545,0:14:29.589
(Lachen)

0:14:30.401,0:14:33.145
Mike hat noch mehr Experimente gemacht,

0:14:33.169,0:14:37.074
bei denen er ein Wolkenbild nimmt,

0:14:37.078,0:14:40.695
halluziniert, heranzoomt, halluziniert,[br]heranzoomt, halluziniert und zoomt.

0:14:40.695,0:14:42.400
Auf diese Weise kann man vielleicht

0:14:42.400,0:14:45.479
eine Art Fluchtzustand des Netzwerks

0:14:45.503,0:14:48.867
oder eine Art freie Assoziation erzeugen,

0:14:48.867,0:14:51.434
bei der sich das Netzwerk selbst [br]in den Schwanz beißt.

0:14:51.458,0:14:54.879
Jedes Bild ist nun die Grundlage für:

0:14:54.903,0:14:56.804
"Was glaube ich, als nächstes zu sehen?

0:14:56.814,0:14:59.531
Was erwarte ich als nächstes,[br]und danach und danach?"

0:14:59.531,0:15:02.423
Öffentlich habe ich dies das erste Mal

0:15:02.447,0:15:07.884
einer Vorlesungsgruppe namens[br]"Higher Education" in Seattle gezeigt,

0:15:07.908,0:15:10.725
kurz nachdem Marihuana legalisiert wurde.

0:15:10.725,0:15:12.784
(Lachen)

0:15:14.627,0:15:16.731
Ich möchte nun zum Ende kommen

0:15:16.755,0:15:21.010
und festhalten, dass dieser Technologie[br]keine Grenzen gesetzt sind.

0:15:21.034,0:15:24.699
Ich habe Ihnen nur visuelle Beispiele [br]gezeigt, einfach, weil es Spaß macht.

0:15:24.723,0:15:27.174
Aber es ist keine [br]rein visuelle Technologie.

0:15:27.198,0:15:29.191
Ross Goodwin, künstlerischer Mitarbeiter,

0:15:29.215,0:15:32.886
hat Experimente gemacht, bei denen [br]eine Kamera ein Bild schießt

0:15:32.910,0:15:37.254
und ein Comuter in seinem Rucksack[br]ein Gedicht mit einem neuronalen Netzwerk [br]

0:15:37.294,0:15:39.112
basierend auf dem Bildinhalt schreibt.

0:15:39.136,0:15:42.577
Trainiert wurde das neuronale [br]Gedichtenetzwerk mit den Werken

0:15:42.587,0:15:44.351
der Dichtungen des 20. Jahrhunderts.

0:15:44.365,0:15:45.864
Die Gedichte sind, naja,

0:15:45.888,0:15:47.862
also ich finde sie gar nicht so schlecht.

0:15:47.862,0:15:49.210
(Lachen)

0:15:49.234,0:15:50.523
Zurück zu

0:15:50.523,0:15:52.433
Michelangelo,

0:15:52.433,0:15:53.881
ich denke, der lag richtig:

0:15:53.881,0:15:57.617
Wahrnehmung und Kreativität[br]sind sehr eng miteinander verbunden.

0:15:57.617,0:16:00.245
Gerade haben wir [br]neuronale Netzwerke gesehen,

0:16:00.269,0:16:01.912
die nur darauf trainiert sind, [br]

0:16:01.912,0:16:04.838
verschiedene Dinge [br]zu unterscheiden oder zu erkennen,

0:16:04.862,0:16:08.023
und umgekehrt werden können, [br]um etwas zu erschaffen.

0:16:08.047,0:16:09.830
Daraus schließe ich nicht nur,

0:16:09.854,0:16:14.752
dass Michelangelo die Skulptur[br]im Stein wirklich sehen konnte,

0:16:14.752,0:16:18.390
sondern auch, dass jedes Wesen,[br]jedes Geschöpf, jedes Alien,

0:16:18.414,0:16:22.071
das zu solchen Wahrnehmungen fähig ist,

0:16:22.075,0:16:23.490
auch Dinge erschaffen kann,

0:16:23.494,0:16:26.718
denn in beiden Fällen kommt die[br]gleiche Maschinerie zum Einsatz.

0:16:26.742,0:16:30.558
Ich denke auch, [br]dass keinesfalls nur Menschen

0:16:30.588,0:16:32.508
wahrnehmen und kreativ sein können.

0:16:32.532,0:16:36.240
Langsam gibt es Computermodelle,[br]die genau das Gleiche können.

0:16:36.264,0:16:39.692
Das sollte keine Überraschung sein,[br]denn das Gehirn basiert auf Rechnen.

0:16:39.702,0:16:41.273
Schließlich entstanden Computer

0:16:41.297,0:16:45.965
aus den Versuchen,[br]intelligente Maschinen zu bauen.

0:16:45.989,0:16:48.451
Sie sind Modelle unserer[br]Vorstellung dessen,

0:16:48.475,0:16:51.488
wie wir Maschinen [br]intelligent machen können.

0:16:51.512,0:16:53.674
Jetzt erfüllen wir langsam

0:16:53.698,0:16:56.104
ein paar der Versprechen[br]der ersten Vorreiter,

0:16:56.128,0:16:57.841
von Turing und von Neumann

0:16:57.865,0:17:00.130
und McCulloch und Pitts.

0:17:00.154,0:17:04.252
Ich denke, beim Rechnen[br]geht es nicht nur um Buchhaltung

0:17:04.276,0:17:06.423
oder Candy Crush oder so etwas.

0:17:06.447,0:17:09.515
Von Anfang an haben wir sie als [br]Abbild unseres Verstands gebaut.

0:17:09.519,0:17:12.432
Mit ihnen können wir unseren[br]eigenen Verstand besser verstehen

0:17:12.442,0:17:14.631
und unsere Fähigkeiten erweitern.

0:17:14.631,0:17:15.914
Vielen Dank.

0:17:15.914,0:17:20.337
(Applaus)