Return to Video

Wie Computer Kreativität lernen

  • 0:01 - 0:04
    Ich bin Teamleiter bei Google
    im Bereich Maschinenintelligenz,
  • 0:04 - 0:09
    das ist die Ingenieurdisziplin,
    mit der man Computern und Geräten
  • 0:09 - 0:11
    etwas von dem beibringen kann,
    was Gehirne können.
  • 0:11 - 0:15
    Deshalb interessieren wir uns
    auch für echte Gehirne
  • 0:15 - 0:16
    und Neurowissenschaften,
  • 0:16 - 0:20
    und besonders für die Dinge,
    die unsere Gehirne können,
  • 0:20 - 0:24
    die noch weit über die Fähigkeiten
    von Computern hinausgehen.
  • 0:25 - 0:29
    Ein Teilbereich unserer Arbeit war
    schon immer die Wahrnehmung,
  • 0:29 - 0:32
    also der Vorgang, durch den
    die Dinge auf der Welt --
  • 0:32 - 0:33
    Geräusche und Bilder --
  • 0:34 - 0:36
    in unserem Kopf zu Konzepten werden.
  • 0:36 - 0:39
    Das ist entscheidend für unsere Gehirne
  • 0:39 - 0:42
    und auch ziemlich nützlich für Computer.
  • 0:42 - 0:45
    Unser Team schreibt Algorithmen
    für maschinelle Wahrnehmung,
  • 0:45 - 0:48
    die etwa ermöglichen, dass
    Ihre Bilder auf Google Fotos
  • 0:48 - 0:51
    basierend auf dem Bildinhalt
    gesucht werden können.
  • 0:52 - 0:55
    Das Gegenstück zur Wahrnehmung
    ist die Kreativität,
  • 0:55 - 0:58
    also das Schaffen einer Sache
    auf Grundlage eines Konzepts.
  • 0:58 - 1:02
    Letztes Jahr kam zwischen unserer
    Arbeit an maschineller Wahrnehmung,
  • 1:02 - 1:06
    dem Feld der maschinellen Kreativität
    sowie der maschinellen Kunst
  • 1:06 - 1:08
    unerwartet eine Verbindung zustande.
  • 1:08 - 1:12
    Ich glaube, Michelangelo hatte
    einen scharfen Blick
  • 1:12 - 1:16
    für das duale Verhältnis zwischen
    Wahrnehmung und Kreativität.
  • 1:16 - 1:18
    Ein berühmtes Zitat von ihm lautet:
  • 1:18 - 1:21
    "Jeder rohe Stein hat eine Figur in sich,
  • 1:22 - 1:25
    der Bildhauer muss sie nur entdecken."
  • 1:26 - 1:29
    Ich glaube, Michelangelo wollte sagen,
  • 1:29 - 1:32
    dass wir durch Wahrnehmung erschaffen.
  • 1:32 - 1:36
    Die Wahrnehmung ist
    ein Akt der Vorstellung,
  • 1:36 - 1:38
    die Grundlage für Kreativität.
  • 1:39 - 1:43
    Das Organ, das all das Denken,
    Wahrnehmen und Vorstellen erledigt,
  • 1:43 - 1:45
    ist natürlich das Gehirn.
  • 1:45 - 1:48
    Jetzt möchte ich kurz
    historisch betrachten,
  • 1:48 - 1:50
    was wir über Gehirne wissen.
  • 1:50 - 1:53
    Denn anders als über
    das Herz oder die Eingeweide
  • 1:53 - 1:56
    kann man nur durch Betrachten
    nicht viel über Gehirne herausfinden,
  • 1:56 - 1:58
    zumindest nicht mit bloßem Auge.
  • 1:58 - 2:00
    Die ersten Anatomen,
    die sich Gehirne ansahen,
  • 2:00 - 2:04
    gaben der oberflächlichen Struktur
    eine ganze Reihe fantasievoller Namen,
  • 2:04 - 2:07
    wie Hippocampus, was
    "kleiner Shrimp" bedeutet.
  • 2:07 - 2:09
    Doch so etwas verrät uns
    natürlich nicht viel darüber,
  • 2:09 - 2:12
    was im Inneren wirklich vor sich geht.
  • 2:13 - 2:16
    Die erste Person, die meiner Meinung nach
    wirklich eine Art Einblick
  • 2:16 - 2:18
    in die inneren Vorgänge
    des Gehirns gewann,
  • 2:18 - 2:22
    war der große spanische Neuroanatom
    Santiago Ramón y Cajal
  • 2:22 - 2:24
    im 19. Jahrhundert,
  • 2:24 - 2:28
    der mit Mikroskopie und Spezialfarbe
  • 2:28 - 2:32
    die einzelnen Gehirnzellen
    selektiv ausfüllte
  • 2:32 - 2:34
    oder kontrastreich darstellte,
  • 2:34 - 2:37
    um die Morphologie
    der Zellen zu verstehen.
  • 2:38 - 2:40
    Das sind die Zeichnungen,
  • 2:40 - 2:42
    die er im 19. Jahrhundert
    von Neuronen anfertigte.
  • 2:42 - 2:44
    Diese zeigt ein Vogelgehirn.
  • 2:44 - 2:47
    Sie sehen eine unglaubliche
    Vielfalt verschiedener Zellarten.
  • 2:47 - 2:51
    Sogar die Zelltheorie selbst
    war damals ziemlich neu.
  • 2:51 - 2:54
    Diese Strukturen,
    diese verzweigten Zellen,
  • 2:54 - 2:57
    diese Äste, die sehr,
    sehr weit reichen können --
  • 2:57 - 2:58
    das war damals völlig neu.
  • 2:59 - 3:02
    Sie erinnern ganz klar an Kabel.
  • 3:02 - 3:05
    Das mag für manch einen im 19. Jh.
    offensichtlich gewesen sein,
  • 3:05 - 3:10
    als gerade die Revolution
    der Elektrizität und Verkabelung begann.
  • 3:10 - 3:11
    Doch in vielerlei Hinsicht
  • 3:11 - 3:14
    wurden Ramón y Cajals
    mikroanatomische Zeichnungen
  • 3:14 - 3:17
    wie diese hier, nie wirklich übertroffen.
  • 3:17 - 3:19
    Jetzt, mehr als hundert Jahre später,
  • 3:19 - 3:22
    versuchen wir immer noch,
    Ramón y Cajals Werk zu vollenden.
  • 3:22 - 3:25
    Das sind die Rohdaten unserer Mitarbeiter
  • 3:25 - 3:28
    am Max-Planck-Institut für Neurobiologie.
  • 3:28 - 3:30
    Unsere Mitarbeiter bilden also
  • 3:30 - 3:34
    kleine Teile von Gehirngewebe ab.
  • 3:34 - 3:38
    Diese ganze Probe hier misst
    ungefähr einen Kubikmillimeter.
  • 3:38 - 3:40
    Hier zeige ich Ihnen
    ein winziges Stück davon.
  • 3:40 - 3:43
    Der Strich links misst circa ein Mikron.
  • 3:43 - 3:45
    Die Strukturen, die Sie sehen,
    sind Mitochondrien,
  • 3:45 - 3:47
    die so groß wie Bakterien sind.
  • 3:47 - 3:49
    Das sind aufeinanderfolgende Schnitte
  • 3:49 - 3:52
    durch diesen sehr, sehr
    dünnen Gewebeblock.
  • 3:52 - 3:55
    Nur zum Vergleich,
  • 3:55 - 3:58
    der Durchmesser einer durchschnittlichen
    Haarsträhne beträgt circa 100 Mikronen.
  • 3:58 - 4:01
    Wir sehen hier also etwas
    noch viel kleineres
  • 4:01 - 4:02
    als eine einzelne Haarsträhne.
  • 4:02 - 4:06
    Basierend auf den Serien aus
    Elektronenmikroskopscheiben
  • 4:06 - 4:11
    kann man 3D-Nachbildungen
    von Neuronen wie diese hier erstellen.
  • 4:11 - 4:14
    Diese haben in etwa den Stil
    von Ramón y Cajal.
  • 4:14 - 4:16
    Nur ein paar Neutronen leuchten,
  • 4:16 - 4:19
    weil wir hier sonst nichts sehen könnten.
  • 4:19 - 4:20
    Es wäre so unübersichtlich,
  • 4:20 - 4:22
    so überfüllt mit Kabelstrukturen,
  • 4:22 - 4:24
    die die Neuronen verbinden.
  • 4:25 - 4:28
    Ramón y Cajal war seiner Zeit
    also etwas voraus.
  • 4:28 - 4:31
    Die Fortschritte beim
    Verstehen des Gehirns
  • 4:31 - 4:33
    geschahen in den folgenden
    Jahrzehnten nur langsam.
  • 4:33 - 4:36
    Aber wir wussten,
    dass Neuronen Elektrizität nutzen.
  • 4:36 - 4:39
    Im Zweiten Weltkrieg
    war unsere Technologie
  • 4:39 - 4:42
    für elektronische Experimente
    an lebenden Neuronen
  • 4:42 - 4:45
    zur Erforschung ihrer
    Funktionsweise ausgereift genug.
  • 4:45 - 4:49
    Genau damals wurden auch
    Computer erfunden,
  • 4:49 - 4:52
    hauptsächlich auf Basis von
    Nachbildungen des Gehirns --
  • 4:52 - 4:55
    "intelligente Maschinen",
    wie sie Alan Turing nannte,
  • 4:55 - 4:57
    einer der Urväter der Infomatik.
  • 4:58 - 5:03
    Warren McCulloch und Walter Pitts
    betrachteten Ramón y Cajals Zeichnung
  • 5:03 - 5:04
    eines visuellen Cortex,
  • 5:04 - 5:05
    die ich Ihnen hier zeige.
  • 5:06 - 5:10
    Das ist der Cortex, der Bilder
    verarbeitet, die das Auge sieht.
  • 5:10 - 5:14
    Sie fanden, dass es
    wie ein Schaltplan aussah.
  • 5:14 - 5:18
    Im Schaltplan von McCulloch
    und Pitts gibt es viele Details,
  • 5:18 - 5:20
    die nicht ganz stimmen.
  • 5:20 - 5:21
    Doch der Grundgedanke,
  • 5:21 - 5:25
    dass der visuelle Cortex wie eine
    Reihe Computerelemente funktioniert,
  • 5:25 - 5:28
    die Informationen stufenartig
    nacheinander weiterreichen,
  • 5:28 - 5:29
    stimmt im Grunde.
  • 5:29 - 5:32
    Besprechen wir kurz,
  • 5:32 - 5:36
    was ein Modell für die Verarbeitung
    visueller Informationen machen müsste.
  • 5:36 - 5:39
    Die Grundaufgabe der Wahrnehmung ist es,
  • 5:39 - 5:43
    bei einem solchen Bild zu sagen:
  • 5:43 - 5:44
    "Das ist ein Vogel",
  • 5:44 - 5:47
    für unsere Gehirne ist das sehr einfach.
  • 5:47 - 5:51
    Sie müssen aber bedenken,
    dass das für einen Computer
  • 5:51 - 5:54
    noch vor ein paar Jahren
    völlig unmöglich war.
  • 5:54 - 5:56
    Für ein klassisches Rechensystem
  • 5:56 - 5:58
    ist das nicht einfach.
  • 5:59 - 6:02
    Was zwischen den Pixeln,
  • 6:02 - 6:06
    dem Bild eines Vogels
    und dem Wort "Vogel" passiert,
  • 6:06 - 6:09
    ist im Grunde eine Gruppe
    miteinander verbundener Neuronen
  • 6:09 - 6:10
    in einem neuronalen Netzwerk,
  • 6:10 - 6:11
    wie in meinem Diagramm.
  • 6:11 - 6:15
    Dieses neuronale Netzwerk kann
    ein natürliches in unserer Sehrinde sein.
  • 6:15 - 6:17
    Heute können wir beginnen,
  • 6:17 - 6:20
    solche neuronalen Netzwerke
    in Computern nachbauen.
  • 6:20 - 6:22
    Ich gebe Ihnen eine Vorstellung davon.
  • 6:22 - 6:26
    Die Pixel können Sie sich als
    erste Neuronenschicht vorstellen.
  • 6:26 - 6:28
    Genau so funktioniert das
    im Prinzip auch im Auge --
  • 6:28 - 6:30
    mit den Neuronen in der Netzhaut.
  • 6:30 - 6:31
    Die Neuronen leiten weiter,
  • 6:31 - 6:35
    Schicht für Schicht
    durch die Neuronenschichten,
  • 6:35 - 6:38
    die alle über Synapsen verschiedener
    Gewichtung verbunden sind.
  • 6:38 - 6:39
    Das Verhalten dieses Netzwerks
  • 6:39 - 6:42
    wird durch die Stärke
    all dieser Synapsen bestimmt.
  • 6:42 - 6:46
    Diese bestimmen die rechnerischen
    Eigenschaften des Netzwerks.
  • 6:46 - 6:48
    Schlussendlich leuchtet dann ein Neuron
  • 6:48 - 6:50
    oder eine kleine Gruppe Neuronen auf
  • 6:50 - 6:51
    und sagt "Vogel".
  • 6:52 - 6:55
    Jetzt werde ich diese drei Dinge --
  • 6:55 - 7:00
    die Pixel als Input, die Synapsen
    im neuronalen Netzwerk
  • 7:00 - 7:01
    und den Vogel als Output
  • 7:01 - 7:04
    durch drei Variablen ersetzen: x, w und y.
  • 7:05 - 7:07
    Es kann eine Million x geben --
  • 7:07 - 7:09
    eine Million Pixel in einem Bild.
  • 7:09 - 7:11
    Es gibt Milliarden oder Billiarden w,
  • 7:11 - 7:15
    die für die Gewichtung der Synapsen
    im neuronalen Netzwerk stehen.
  • 7:15 - 7:16
    Es gibt nur ganz wenige y,
  • 7:16 - 7:18
    also Outputs des Netzwerks.
  • 7:18 - 7:20
    "Vogel" hat nur fünf Buchstaben.
  • 7:21 - 7:25
    Dann tun wir doch einfach so,
    als sei es nur eine einfache Formel:
  • 7:25 - 7:27
    x "x" w = y.
  • 7:27 - 7:29
    Ich setze das "Mal"-Zeichen
    in Anführungszeichen,
  • 7:29 - 7:31
    denn der eigentliche Vorgang hier
  • 7:31 - 7:35
    ist eine komplizierte Abfolge
    mathematischer Vorgänge.
  • 7:35 - 7:36
    Das ist eine Gleichung.
  • 7:36 - 7:38
    Es gibt drei Variablen.
  • 7:38 - 7:42
    Bekanntlich kann man eine Variable
    einer Gleichung lösen,
  • 7:42 - 7:45
    wenn man die anderen beiden kennt.
  • 7:45 - 7:48
    Das Problem mit der Schlussfolgerung,
  • 7:48 - 7:51
    also das Herausfinden,
    dass das Bild einen Vogel zeigt,
  • 7:51 - 7:53
    ist das folgende:
  • 7:53 - 7:56
    Y ist unbekannt,
    und w und x sind bekannt.
  • 7:56 - 7:59
    Wir kennen das neuronale
    Netzwerk und die Pixel.
  • 7:59 - 8:02
    Es scheint ein recht
    einfaches Problem zu sein.
  • 8:02 - 8:04
    Wir rechnen zwei mal drei und sind fertig.
  • 8:05 - 8:08
    Ich zeige Ihnen jetzt ein neu entwickeltes
    künstliches neuronales Netzwerk,
  • 8:08 - 8:10
    das genau das tut.
  • 8:10 - 8:12
    Es läuft in Echtzeit
    auf einem Mobiltelefon,
  • 8:13 - 8:16
    und das an sich ist
    natürlich schon erstaunlich,
  • 8:16 - 8:19
    dass Mobiltelefone so viele
    Milliarden und Billiarden Vorgänge
  • 8:19 - 8:21
    pro Sekunde verarbeiten können.
  • 8:21 - 8:22
    Sie sehen hier ein Telefon,
  • 8:22 - 8:26
    das Bilder von einem Vogel
    nacheinander ansieht,
  • 8:26 - 8:29
    und sogar nicht nur
    "Ja, es ist ein Vogel" sagt,
  • 8:29 - 8:32
    sondern mit einem solchen Netzwerk
    auch die Vogelart bestimmt.
  • 8:33 - 8:35
    Bei diesem Bild
  • 8:35 - 8:39
    kennen wir das x und das w,
    und das y ist unbekannt.
  • 8:39 - 8:41
    Ich lasse hier natürlich
    den schwierigen Teil aus,
  • 8:41 - 8:45
    also wie um alles in der Welt
    wir das w finden können,
  • 8:45 - 8:47
    wie das Gehirn so etwas kann.
  • 8:47 - 8:49
    Wie können wir jemals
    so ein Modell erlernen?
  • 8:49 - 8:53
    Wenn wir diesen Lernvorgang,
    also wie man nach w auflösen kann,
  • 8:53 - 8:55
    wenn wir das bei der
    einfachen Gleichung anwenden,
  • 8:55 - 8:57
    in der wir sie uns als Zahlen vorstellen,
  • 8:57 - 9:00
    wissen wir genau, was zu tun ist:
    6 = 2 x w,
  • 9:00 - 9:03
    wir teilen durch zwei und fertig.
  • 9:04 - 9:07
    Das Problem ist dieses Rechenzeichen.
  • 9:07 - 9:08
    Division --
  • 9:08 - 9:11
    wir wählen die Division, weil sie
    das Gegenteil der Multiplikation ist,
  • 9:11 - 9:13
    aber wie gesagt,
  • 9:13 - 9:15
    Mulitplikation stimmt hier nicht ganz.
  • 9:15 - 9:18
    Es handelt sich um einen sehr
    komplizierten, nichtlinearen Vorgang
  • 9:18 - 9:20
    ohne Umkehrung.
  • 9:20 - 9:22
    Wir müssen also herausfinden,
  • 9:22 - 9:25
    wie wir die Gleichung
    ohne Divisionszeichen lösen können.
  • 9:25 - 9:28
    Eigentlich ist es ganz einfach:
  • 9:28 - 9:30
    Wir zaubern einfach
    ein wenig mit der Algebra.
  • 9:30 - 9:33
    Wir ziehen die 6 auf
    die rechte Seite der Gleichung.
  • 9:33 - 9:35
    Wir multiplizieren immer noch.
  • 9:36 - 9:39
    Diese Null -- betrachten
    wir einfach als Fehler.
  • 9:39 - 9:42
    Anders gesagt, wenn wir
    korrekt nach w auflösen,
  • 9:42 - 9:43
    dann ist der Fehler null.
  • 9:43 - 9:45
    Wenn wir einen Fehler machen,
  • 9:45 - 9:47
    ist der Fehler größer als null.
  • 9:47 - 9:51
    Jetzt können wir einfach raten,
    um den Fehler zu minimieren.
  • 9:51 - 9:53
    Computer können das ausgezeichnet.
  • 9:53 - 9:55
    Sie raten also ins Blaue:
  • 9:55 - 9:57
    Was, wenn w = 0?
    Dann ist der Fehler 6.
  • 9:57 - 9:59
    Wenn w = 1? Dann ist der Fehler 4.
  • 9:59 - 10:01
    Dann kann der Computer Marco Polo spielen
  • 10:01 - 10:04
    und den Fehler gegen Null gehen lassen.
  • 10:04 - 10:07
    Dabei nähert er sich immer mehr dem w an.
  • 10:07 - 10:11
    Meist schafft er es nicht ganz,
    aber nach ungefähr einem Dutzend Schritten
  • 10:11 - 10:15
    liegen wir bei w = 2,999,
    und das ist genau genug.
  • 10:16 - 10:18
    Das ist der Lernprozess.
  • 10:18 - 10:21
    Erinnern Sie sich daran,
  • 10:21 - 10:25
    dass wir gerade viele bekannte x
    und bekannte y genommen haben.
  • 10:25 - 10:29
    Wir lösten das w in der Mitte
    durch ein Wiederholungsverfahren.
  • 10:29 - 10:32
    Genauso lernen auch wir.
  • 10:32 - 10:35
    Als Babys sehen wir sehr viele Bilder.
  • 10:35 - 10:38
    Jemand sagt: "Das ist ein Vogel;
    das ist kein Vogel."
  • 10:38 - 10:40
    Mit der Zeit und durch Wiederholung
  • 10:40 - 10:43
    lösen wir nach w und diesen
    neuronalen Verbindungen auf.
  • 10:43 - 10:47
    Jetzt haben wir mit x und w
    nach y aufgelöst.
  • 10:47 - 10:49
    Die alltägliche, schnelle Wahrnehmung.
  • 10:49 - 10:52
    Herauszufinden, wie man
    nach w auflösen kann,
  • 10:52 - 10:53
    ist Lernen und viel schwerer,
  • 10:53 - 10:55
    weil wir die Fehler
  • 10:55 - 10:57
    nur über viele Übungsbeispiele
    minimieren können.
  • 10:57 - 10:58
    Vor ungefähr einem Jahr
  • 10:58 - 11:01
    wollte Alex Mordvintsev
    aus unserem Team herausfinden,
  • 11:01 - 11:04
    was passiert, wenn wir nach x auflösen
  • 11:04 - 11:06
    und w und y bekannt sind.
  • 11:06 - 11:07
    Anders ausgedrückt:
  • 11:07 - 11:09
    Sie wissen, dass es ein Vogel ist.
  • 11:09 - 11:12
    Ihr neuronales Netzwerk
    ist schon auf Vögel trainiert,
  • 11:12 - 11:15
    doch was ist das Bild eines Vogels?
  • 11:15 - 11:20
    Tatsächlich kann man die gleiche
    Fehlerminimierungsstrategie
  • 11:20 - 11:24
    bei Netzwerken zum Erkennen
    von Vögeln anwenden.
  • 11:24 - 11:27
    Das Ergebnis ist ...
  • 11:30 - 11:32
    ein Bild von Vögeln.
  • 11:33 - 11:37
    Dieses Bild von Vögeln wurde von einem
    neuronalen Netzwerk erschaffen,
  • 11:37 - 11:39
    das auf das Vogelerkennen trainiert wurde,
  • 11:39 - 11:42
    und zwar nur durch Auflösen nach x,
    nicht durch Auflösen nach y.
  • 11:42 - 11:44
    All das passiert durch Wiederholungen.
  • 11:44 - 11:46
    Noch ein lustiges Beispiel.
  • 11:46 - 11:49
    Dies ist die Arbeit unseres
    Teammitglieds Mike Tyka,
  • 11:49 - 11:51
    der es "Animal Parade" nennt.
  • 11:51 - 11:54
    Es erinnert mich etwas an
    Kunstwerke von William Kentridge,
  • 11:54 - 11:57
    der Skizzen macht, sie dann wegradiert,
  • 11:57 - 11:58
    Skizzen macht, sie wegradiert,
  • 11:58 - 12:00
    und so einen Film erschafft.
  • 12:00 - 12:01
    In diesem Fall
  • 12:01 - 12:04
    setzt Mike für y verschiedene Tiere
    in ein Netzwerk ein,
  • 12:04 - 12:08
    das verschiedene Tiere
    erkennen und unterscheiden kann.
  • 12:08 - 12:13
    Heraus kommt dieser seltsame
    Übergang von Tier zu Tier im Stil Eschers.
  • 12:14 - 12:19
    Hier haben Mike und Alex
    gemeinsam versucht,
  • 12:19 - 12:22
    das y auf nur zwei
    Dimensionen einzuschränken
  • 12:22 - 12:25
    und so eine Karte von
    allen Dingen im Raum zu erstellen,
  • 12:25 - 12:27
    die dieses Netzwerk erkennt.
  • 12:27 - 12:29
    Durch diese Darstellung
  • 12:29 - 12:31
    oder Bildgenerierung
    auf der gesamten Oberfläche,
  • 12:31 - 12:34
    wobei y auf der Oberfläche variiert,
    wird eine Art Karte erstellt --
  • 12:34 - 12:38
    eine visuelle Karte all der Dinge,
    die das Netzwerk erkennen kann.
  • 12:38 - 12:41
    Alle Tiere sind da, "armadillo"
    ist genau an dieser Stelle.
  • 12:41 - 12:43
    Dasselbe kann man auch
    mit anderen Netzwerken machen.
  • 12:43 - 12:46
    Dieses Netzwerk erkennt Gesichter
  • 12:46 - 12:48
    und unterscheidet sie voneinander.
  • 12:48 - 12:52
    Hier setzten wir
    ein y ein, das "ich" sagt,
  • 12:52 - 12:53
    also die Parameter meines Gesichts.
  • 12:53 - 12:55
    Wenn das Netzwerk nach x auflöst,
  • 12:55 - 12:58
    generiert es dieses verrückte,
  • 12:58 - 13:02
    kubistisch angehauchte, surreale,
    psychedelische Bild von mir
  • 13:02 - 13:04
    aus verschiedenen Blickwinkeln.
  • 13:04 - 13:07
    Es wirkt wie eine Betrachtung
    aus verschiedenen Blickwinkeln,
  • 13:07 - 13:10
    weil das Netzwerk so aufgebaut ist,
    dass es die Vieldeutigkeit umgehen kann,
  • 13:10 - 13:13
    die durch Gesichter in verschiedenen Posen
  • 13:13 - 13:16
    oder verschiedene Belichtungen entsteht.
  • 13:16 - 13:18
    Wenn man bei dieser Art Rekonstruktion
  • 13:18 - 13:22
    nun keinerlei Musterbild
    oder Hilfsstatistiken verwendet,
  • 13:22 - 13:26
    vermischen sich die Ansichten
    aus den verschiedenen Blickwinkeln
  • 13:26 - 13:27
    aufgrund der Vieldeutigkeit.
  • 13:28 - 13:32
    Das passert, wenn Alex
    während des Optimierungsprozesses
  • 13:32 - 13:36
    zur Rekonstruktion meines Gesichts
    sein eigenes Gesicht als Muster verwendet.
  • 13:36 - 13:39
    Sie sehen also, es ist nicht perfekt.
  • 13:39 - 13:40
    Wir müssen noch hart arbeiten,
  • 13:40 - 13:43
    um diesen Optimierungsprozess
    optimieren zu können.
  • 13:43 - 13:46
    Aber langsam entstehen
    stimmigere Gesichter,
  • 13:46 - 13:48
    da mein Gesicht als Muster diente.
  • 13:49 - 13:51
    Man muss nicht bei Null
  • 13:51 - 13:53
    oder weißem Rauschen beginnen.
  • 13:53 - 13:54
    Wenn man nach x auflöst,
  • 13:54 - 13:58
    kann man mit einem x anfangen,
    das selbst schon ein anderes Bild ist.
  • 13:58 - 14:00
    Das soll diese Vorführung zeigen.
  • 14:00 - 14:04
    Das ist ein Netzwerk,
    das verschiedenste Objekte --
  • 14:04 - 14:08
    menschgemachte Strukturen, Tiere usw. --
    kategorisieren können soll.
  • 14:08 - 14:10
    Wir beginnen nur mit einem Wolkenbild,
  • 14:10 - 14:12
    und während der Optimierung
  • 14:12 - 14:17
    findet das Netzwerk quasi heraus,
    was es in den Wolken sieht.
  • 14:17 - 14:19
    Je länger man zusieht,
  • 14:19 - 14:23
    desto mehr sieht man in den Wolken.
  • 14:23 - 14:26
    Man kann mit dem Gesichtsnetzwerk
    Halluzinationen einfügen,
  • 14:26 - 14:29
    und ganz schön verrücktes Zeug machen.
  • 14:29 - 14:30
    (Lachen)
  • 14:30 - 14:33
    Mike hat noch mehr Experimente gemacht,
  • 14:33 - 14:37
    bei denen er ein Wolkenbild nimmt,
  • 14:37 - 14:41
    halluziniert, heranzoomt, halluziniert,
    heranzoomt, halluziniert und zoomt.
  • 14:41 - 14:42
    Auf diese Weise kann man vielleicht
  • 14:42 - 14:45
    eine Art Fluchtzustand des Netzwerks
  • 14:46 - 14:49
    oder eine Art freie Assoziation erzeugen,
  • 14:49 - 14:51
    bei der sich das Netzwerk selbst
    in den Schwanz beißt.
  • 14:51 - 14:55
    Jedes Bild ist nun die Grundlage für:
  • 14:55 - 14:57
    "Was glaube ich, als nächstes zu sehen?
  • 14:57 - 15:00
    Was erwarte ich als nächstes,
    und danach und danach?"
  • 15:00 - 15:02
    Öffentlich habe ich dies das erste Mal
  • 15:02 - 15:08
    einer Vorlesungsgruppe namens
    "Higher Education" in Seattle gezeigt,
  • 15:08 - 15:11
    kurz nachdem Marihuana legalisiert wurde.
  • 15:11 - 15:13
    (Lachen)
  • 15:15 - 15:17
    Ich möchte nun zum Ende kommen
  • 15:17 - 15:21
    und festhalten, dass dieser Technologie
    keine Grenzen gesetzt sind.
  • 15:21 - 15:25
    Ich habe Ihnen nur visuelle Beispiele
    gezeigt, einfach, weil es Spaß macht.
  • 15:25 - 15:27
    Aber es ist keine
    rein visuelle Technologie.
  • 15:27 - 15:29
    Ross Goodwin, künstlerischer Mitarbeiter,
  • 15:29 - 15:33
    hat Experimente gemacht, bei denen
    eine Kamera ein Bild schießt
  • 15:33 - 15:37
    und ein Comuter in seinem Rucksack
    ein Gedicht mit einem neuronalen Netzwerk
  • 15:37 - 15:39
    basierend auf dem Bildinhalt schreibt.
  • 15:39 - 15:43
    Trainiert wurde das neuronale
    Gedichtenetzwerk mit den Werken
  • 15:43 - 15:44
    der Dichtungen des 20. Jahrhunderts.
  • 15:44 - 15:46
    Die Gedichte sind, naja,
  • 15:46 - 15:48
    also ich finde sie gar nicht so schlecht.
  • 15:48 - 15:49
    (Lachen)
  • 15:49 - 15:51
    Zurück zu
  • 15:51 - 15:52
    Michelangelo,
  • 15:52 - 15:54
    ich denke, der lag richtig:
  • 15:54 - 15:58
    Wahrnehmung und Kreativität
    sind sehr eng miteinander verbunden.
  • 15:58 - 16:00
    Gerade haben wir
    neuronale Netzwerke gesehen,
  • 16:00 - 16:02
    die nur darauf trainiert sind,
  • 16:02 - 16:05
    verschiedene Dinge
    zu unterscheiden oder zu erkennen,
  • 16:05 - 16:08
    und umgekehrt werden können,
    um etwas zu erschaffen.
  • 16:08 - 16:10
    Daraus schließe ich nicht nur,
  • 16:10 - 16:15
    dass Michelangelo die Skulptur
    im Stein wirklich sehen konnte,
  • 16:15 - 16:18
    sondern auch, dass jedes Wesen,
    jedes Geschöpf, jedes Alien,
  • 16:18 - 16:22
    das zu solchen Wahrnehmungen fähig ist,
  • 16:22 - 16:23
    auch Dinge erschaffen kann,
  • 16:23 - 16:27
    denn in beiden Fällen kommt die
    gleiche Maschinerie zum Einsatz.
  • 16:27 - 16:31
    Ich denke auch,
    dass keinesfalls nur Menschen
  • 16:31 - 16:33
    wahrnehmen und kreativ sein können.
  • 16:33 - 16:36
    Langsam gibt es Computermodelle,
    die genau das Gleiche können.
  • 16:36 - 16:40
    Das sollte keine Überraschung sein,
    denn das Gehirn basiert auf Rechnen.
  • 16:40 - 16:41
    Schließlich entstanden Computer
  • 16:41 - 16:46
    aus den Versuchen,
    intelligente Maschinen zu bauen.
  • 16:46 - 16:48
    Sie sind Modelle unserer
    Vorstellung dessen,
  • 16:48 - 16:51
    wie wir Maschinen
    intelligent machen können.
  • 16:52 - 16:54
    Jetzt erfüllen wir langsam
  • 16:54 - 16:56
    ein paar der Versprechen
    der ersten Vorreiter,
  • 16:56 - 16:58
    von Turing und von Neumann
  • 16:58 - 17:00
    und McCulloch und Pitts.
  • 17:00 - 17:04
    Ich denke, beim Rechnen
    geht es nicht nur um Buchhaltung
  • 17:04 - 17:06
    oder Candy Crush oder so etwas.
  • 17:06 - 17:10
    Von Anfang an haben wir sie als
    Abbild unseres Verstands gebaut.
  • 17:10 - 17:12
    Mit ihnen können wir unseren
    eigenen Verstand besser verstehen
  • 17:12 - 17:15
    und unsere Fähigkeiten erweitern.
  • 17:15 - 17:16
    Vielen Dank.
  • 17:16 - 17:20
    (Applaus)
Title:
Wie Computer Kreativität lernen
Speaker:
Blaise Agüera y Arcas
Description:

Im Bereich der Kunst und der Kreativität steht uns etwas Bahnbrechendes bevor – und es stammt nicht von Menschen. Blaise Agüera y Arcas, leitender Wissenschaftler bei Google, arbeitet mit sogenannten "Deep Neural Networks" für Maschinenwahrnehmung und dezentrales Lernen. In dieser fesselnden Vorführung zeigt er, wie man neuronale Netzwerke, die Bilder erkennen können, so umkehrt, dass sie Bilder erzeugen. Das Ergebnis: Spektakuläre, sinnestäuschende Collagen (und Gedichte!), die kaum einer Kategorie zugeordnet werden können. "Wahrnehmung und Kreativität sind sehr eng miteinander verbunden", sagt Agüera y Arcas. "Jedes Wesen, jedes Geschöpf, das der Wahrnehmung fähig ist, kann auch Dinge erschaffen."

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
17:34

German subtitles

Revisions