34C3 - Beeinflussung durch Künstliche Intelligenz

Edit subtitles

0:16 - 0:22

Herald-Angel: Der nächste Vortrag ist
„Beeinflussung durch Künstliche
0:22 - 0:27

Intelligenz". Es ist ein
Einführungsvortrag, also einer der
0:27 - 0:32

explizit dazu gedacht ist, dass ihr das
ohne Vorkenntnisse versteht. Und es geht
0:32 - 0:41

ums Maschinelle Lernen. Unsere Sprecher
sind die Karen – sie forscht in Amsterdam
0:41 - 0:48

an Maschinellem Lernen, kommt ursprünglich
aus Leipzig – und der Hendrik Heuer, der
0:48 - 0:55

in Bremen an Mensch-Computer-Interaktion
forscht. Großes Willkommen für die beiden!
0:55 - 1:03

Applaus
1:03 - 1:07

Hendrik Heuer: Vielen Dank! Moin erstmal!
Willkommen zu unserem Vortrag
1:07 - 1:11

„Beeinflussung durch Künstliche
Intelligenz" über die Banalität der
1:11 - 1:15

Beeinflussung und das Leben mit
Algorithmen. Wir würden gern mit einem
1:15 - 1:20

Zitat von Kate Crawford beginnen. Kate
Crawford ist die Gründerin des AI Now
1:20 - 1:24

Institut das die sozialen Auswirkungen von
künstlicher Intelligenz untersucht. Sie
1:24 - 1:28

ist außerdem ein Principal Researcher bei
Microsoft Research und Professorin an der
1:28 - 1:34

New York University. Und die hat beim AI
Now Symposium in diesem Jahr gesagt: „Die
1:34 - 1:37

Menschen befürchten, dass Computer zu
intelligent werden und die Welt erobern.
1:37 - 1:43

Aber Computer sind zu dumm und haben die
Welt bereits erobert." Wir teilen diese
1:43 - 1:47

Ansicht. Es gibt keine digitale Welt. Die
Welt ist digital, das heißt durch digitale
1:47 - 1:52

Medien konstruiert. Und uns war es ein
Anliegen, einige englischsprachige
1:52 - 1:56

Diskussion jetzt nochmal auf Deutsch
zusammenzuführen. Es können also Beispiele
1:56 - 2:01

kommen die der eine oder andere vielleicht
schon kennt. Aber wir führen sie hier
2:01 - 2:05

nochmal zusammen und versuchen sie zu
kontextualisieren. Warum Banalität der
2:05 - 2:10

Überwachung? Banalität, weil die Systeme
des maschinellen Lernens im Kern sehr
2:10 - 2:15

simpel sind, weil aber auch die
Beeinflussung sehr subtil sein kann und
2:15 - 2:17

das Ganze ist auch eine Reminiszenz an
Hannah Arendt.
2:17 - 2:21

Noch mal kurz zu uns. Wie gesagt: Ich
werde die ersten 20 Minuten sprechen über
2:21 - 2:25

die Mensch-Computer-Interaktions-
Perspektive, Karen Ullrich wird die zweite
2:25 - 2:29

Hälfte bestreiten. Karen ist
wissenschaftliche Mitarbeiterin in
2:29 - 2:34

Amsterdam, im Amsterdam Machine Learning
Lab, und sie forscht direkt zu den
2:34 - 2:38

Algorithmen des maschinellen Lernens,
insbesondere Bayesian methods, also ein
2:38 - 2:42

Hintergrund im Deep Learning und der
Informationstheorie. Ich bin
2:42 - 2:46

wissenschaftlicher Mitarbeiter im Institut
für Informationsmanagement Bremen und mir
2:46 - 2:50

geht es um die Nutzererfahrung von
Maschine Learning, insbesondere das
2:50 - 2:56

Vertrauen. Wir würden jetzt gerne anfangen
mit einem Beispiel, das jeder kennt: Spam-
2:56 - 3:00

Erkennung. Benutzt wahrscheinlich jeder
hier. Funktioniert auch nicht immer. Aber
3:00 - 3:03

man muss sich wirklich vor Augen führen,
dass es eine beeindruckende technische
3:03 - 3:07

Leistung ist, auch wenn es manchmal nicht
funktioniert. Und wir nehmen es hier, um
3:07 - 3:12

den Unterschied zwischen imperativer
Programmierung und maschinellem Lernen zu
3:12 - 3:17

verdeutlichen. Imperative Programmierung
ist das, woran wahrscheinlich jeder denkt,
3:17 - 3:18

wenn er an Informatik und Programmierung
denkt.
3:18 - 3:22

Es geht um Regeln und Anweisungen: Wenn X
3:22 - 3:26

dann Y. Das Wort Imperativ für Befehl
steckt ja auch schon im Namen. Und wenn
3:26 - 3:30

wir jetzt Spam imperativ erkennen wollen
würden, dann würde man zum Beispiel
3:30 - 3:34

gucken, Okay das Wort Viagra wird so
geschrieben in der Nachricht vorkommen,
3:34 - 3:39

dann ist es eine Spam-Nachricht.
Andererseits ist es eine gutartige
3:39 - 3:44

Nachricht. Maschinelles Lernen ist jetzt
ein komplett anderer Ansatz. Da hat man
3:44 - 3:49

eine Vorhersage die man iterativ, also
immer und immer wieder, verbessert. Für
3:49 - 3:53

die Spam-Klassifikation versucht man zum
Beispiel Kombinationen von Wörtern zu
3:53 - 3:57

finden, durch die es wahrscheinlich wird,
dass es sich um Spam handelt.
3:57 - 4:02

Der Kernbegriff ist hier also wahrscheinlich. Und
das sieht dann so aus, dass man für viele
4:02 - 4:07

verschiedene Beispiele prognostiziert, ob
eine Nachricht Spam ist oder nicht. Dann
4:07 - 4:12

berechnet man Fehler mit einer geeigneten
Fehlerfunktion und dann ändert man seine
4:12 - 4:17

Parameter, um den Fehler zu verringern und
geht wieder zum ersten Schritt und macht
4:17 - 4:22

das immer und immer wieder. Natürlich ist
es nicht ganz so einfach, diesen Fehler zu
4:22 - 4:25

berechnen, und auch die Parameter zu
verändern, ist ein eigenes
4:25 - 4:28

Forschungsgebiet. Aber im Kern ist es
wirklich so simpel wie wir es hier
4:28 - 4:33

darstellen. Und deswegen ist es spannend
im Hinterkopf zu behalten. Dabei ist es
4:33 - 4:37

aber spannend im Hinterkopf zu behalten,
dass Spam-Erkennen nicht mit
4:37 - 4:41

Textverständnis gleichzusetzen ist. Das
heißt der Algorithmus muss nicht erst
4:41 - 4:45

Kafka verstehen können, um zu erkennen, ob
etwas Spam ist oder nicht. Und dieses
4:45 - 4:49

Problem, dass etwas wirkungsvoller
aussieht als es vermeintlich ist, wird uns
4:49 - 4:55

im Laufe des Vortrags noch begegnen.
Wir haben jetzt ein weiteres, immer noch
4:55 - 4:59

vereinfachtes Beispiel für eine
Entscheidungshilfe, hier aus der Medizin.
4:59 - 5:04

Das Ziel ist hier die Erkennung von
Brustkrebs. Statt Wörtern wie beim Spam
5:04 - 5:10

haben wir verschiedene Features, das heißt
Charakteristika, an denen man zum Beispiel
5:10 - 5:15

gutartigen von bösartigem Brustkrebs
unterscheiden kann. Dazu gehören hier der
5:15 - 5:21

Radius, die Textur, Umfang, Fläche, Glätte
aber auch so Sachen wie die Symmetrie und
5:21 - 5:26

die Zahl konkaver Punkte, also nach innen
gewölbter Punkte, das seht ihr hier oben.
5:26 - 5:31

Insgesamt gibt es in diesem vereinfachten
Datensatz 32 verschiedene Charakteristika.
5:31 - 5:36

Und wenn wir jetzt zwei Charakteristika
wie z.B. die durchschnittliche Zahl der
5:36 - 5:41

konkaven Punkte und die durchschnittliche
Fläche in Pixeln anschauen und abtragen,
5:41 - 5:45

dann erkennt man eine deutliche Tendenz:
Ab einem bestimmten Punkt – ab einer
5:45 - 5:49

bestimmten Zahl Punkte und ab einer
bestimmten Fläche – sehen wir nur noch
5:49 - 5:54

bösartigen Brustkrebs. Das heißt
mathematisch können wir im Beispiel
5:54 - 5:58

einfach eine Linie durch diesen Datensatz
ziehen und das ist eine sogenannte
5:58 - 6:02

Entscheidungsgrenze, die Decision-
Boundary. Die Entscheidungsgrenze muss
6:02 - 6:05

nicht linear sein, es muss nicht eine
einfache Linie sein.
6:05 - 6:10

Die kann durchaus komplexer sein und in
der Regel ist sie das. Und dieser Ansatz
6:10 - 6:15

ist durchaus analog zu dem, was eine
erfahrene Ärztin oder ein erfahrener Arzt
6:15 - 6:19

mehr oder weniger bewusst machen würde.
Die haben auch aus Erfahrung gelernt: ab
6:19 - 6:24

der Größe, und ab der Fläche und der Zahl
ist es wahrscheinlich bösartig oder
6:24 - 6:27

gutartig. Der Clou am Maschinellen Lernen
ist jetzt, dass wir das für viele
6:27 - 6:32

verschiedene Charakteristika gleichzeitig
machen können. Und darüber hinaus
6:32 - 6:36

profitieren wir sehr stark davon, wenn wir
mehr Daten haben, weil wir dadurch bessere
6:36 - 6:39

Entscheidungen treffen können. Weil wir
eine bessere Entscheidungsgrenze finden.
6:39 - 6:45

Ihr seht aber auch, dass eine gute Zahl an
roten und blauen Punkten im Beispiel auf
6:45 - 6:50

der falschen Seite der Grenze liegen.
Das heißt dort machen wir Fehler und da
6:50 - 6:53

muss man im Hinterkopf behalten, dass es
verschiedene Arten von Fehlern gibt und
6:53 - 6:57

die auch verschiedene Auswirkungen haben.
Falls ich zum Beispiel jemandem mit
6:57 - 7:03

gutartigen Brustkrebs fälschlicherweise
sage, dass ihr Brustkrebs bösartig ist,
7:03 - 7:08

löst das sicherlich Stress aus und ist
keine angenehme Situation. Falls ich aber
7:08 - 7:12

jemanden mit bösartigem Brustkrebs
fälschlicherweise sage, dass ihr
7:12 - 7:15

Brustkrebs gutartig ist und sie auch
entsprechend behandle, kann das deutlich
7:15 - 7:20

schlimmere Konsequenzen haben. Das ist
jetzt natürlich ein vereinfachtes
7:20 - 7:25

Beispiel. Aber gleichzeitig werden wir
zeigen, dass ähnliche Entscheidungshilfen
7:25 - 7:29

durchaus in sehr kritischen Bereichen
genutzt werden. Vorher wollen wir noch
7:29 - 7:34

einmal die Wirkungsmacht von Big Data
zeigen und da geht es darum,
7:34 - 7:40

Persönlichkeitsmerkmale zu erkennen. Das
heißt hier nimmt man digitale Spuren wie
7:40 - 7:44

Facebook-Likes, die relativ einfach
zugänglich sind, es aber ermöglichen,
7:44 - 7:47

hochgradig sensible
Persönlichkeitsmerkmale vorherzusagen.
7:47 - 7:54

Das ist ein Paper von 2013 und für die
Studie haben sie 58.000 Freiwillige in den
7:54 - 7:58

USA gefunden, die eine Facebook-App
benutzt haben. Und die haben dieser
7:58 - 8:02

Facebook-App ihr komplettes Profil zur
Verfügung gestellt mit allen Likes aber
8:02 - 8:06

auch mit allen Informationen wie zum
Beispiel der sexuellen Orientierung oder
8:06 - 8:11

der religiösen Zugehörigkeit. Was jetzt
gemacht wurde ist mit einem sehr einfachen
8:11 - 8:17

Modell, mit einem einfachen Regressions-
Modell, vorhergesagt, von welchen Likes,
8:17 - 8:21

ob man anhand der Likes bestimmte
Persönlichkeitsmerkmale erkennen kann. Und
8:21 - 8:27

es zeigt sich, dass man zum Beispiel mit
95-prozentiger Genauigkeit erkennen kann,
8:27 - 8:33

ob jemand weiß oder afroamerikanisch ist.
Sexuelle Orientierung kann man auch mit
8:33 - 8:39

sehr hoher Genauigkeit nur anhand der
Likes erkennen, das Geschlecht, die
8:39 - 8:44

politische Orientierung, die religiöse
Zugehörigkeit, aber auch so Sachen wie die
8:44 - 8:49

Drogenerfahrung und der Familienstand der
Eltern in der Kindheit.
8:49 - 8:54

Und ihr seht schon bei der religiösen
Zugehörigkeit sind wir bei 82 Prozent
8:54 - 8:59

Genauigkeit, bei so etwas wie
Drogenerfahrung und der Ehe ist es relativ
8:59 - 9:04

wenig mit der Genauigkeit: Es ist eine
50/50 Chance, wenn wir raten würden.
9:04 - 9:09

Aber es ist trotzdem eine Indikation. Und
wir zeigen das auch nur, weil das
9:09 - 9:13

wahnsinnige Möglichkeiten der
Diskriminierung bildet. Und das passiert
9:13 - 9:18

auch auf dem Wohnungsmarkt oder auf dem
Arbeitsmarkt. Das heißt was wir hier
9:18 - 9:21

zeigen wollen, ist, dass wir unsere
Vorstellungen von Datenschutz überdenken
9:21 - 9:26

und ausweiten müssen, weil man halt auch
Persönlichkeitsmerkmale inferieren können
9:26 - 9:32

kann. Denn man kann mit solchen Modellen
auch die Likes finden, die am
9:32 - 9:36

aussagekräftigsten für ein bestimmtes
Charakteristikum sind. Das heißt wir haben
9:36 - 9:41

hier drei Likes: einmal die Marke Harley-
Davidson, Kringel-Pommes/curly fries und
9:41 - 9:45

das Musical Wicked. Und ich überlasse es
euch mal, herauszufinden, welches Bild mit
9:45 - 9:50

niedriger Intelligenz, hoher Intelligenz
und Homosexualität bei Männern verbunden
9:50 - 9:56

ist. Diese durchaus fragwürdige
Forschungsrichtung nennt sich Psychometrik
9:56 - 10:01

oder auch Psychografie. Und das Spannende
ist, dass sie ja relativ nah dran ist am
10:01 - 10:04

Kern-Versprechen von so Unternehmen wie
Google und Facebook.
10:04 - 10:09

Denn die versprechen ihren Kunden – ihren
Werbekunden – wir finden für euch
10:09 - 10:13

Leute, die sich für Dienst X oder Produkt
Y interessieren könnten. Und hier haben
10:13 - 10:18

wir jetzt das Element der Beeinflussung.
Beeinflussung heißt hier, Big Data zu
10:18 - 10:23

nutzen, um Leute zu finden, und die
Beeinflussung ist noch sehr banal. Aber
10:23 - 10:27

solche Forschung kann natürlich auch
genutzt werden, um zum Beispiel in einer
10:27 - 10:31

großen Menge von Wählerinnen jene zu
finden, die noch überzeugt werden könnten.
10:31 - 10:35

Und ihr habt – viele von euch haben
wahrscheinlich den Artikel in das Magazin
10:35 - 10:39

gelesen, wo kolportiert wurde, dass diese Art
von Psychografie für Trump und Brexit
10:39 - 10:43

verantwortlich ist. Vor der Bundestagswahl
gab es ja auch eine große Diskussion, dass
10:43 - 10:48

das hier passieren könnte. Wir glauben,
dass das mit Vorsicht zu genießen ist,
10:48 - 10:51

aber die Möglichkeit mit derartigen
Ansätzen überzeugbare Wählerinnen und Wähler
10:51 - 10:54

zu finden und anzusprechen, ist durchaus
realistisch.
10:54 - 11:01

Und wir haben schon gesehen, dass es
dadurch so eine Art Diskriminierung 2.0
11:01 - 11:05

gibt. Denn ein homophober Arbeitgeber muss
nicht mehr direkt erfragen, ob jemand
11:05 - 11:10

homosexuell ist, wenn er es aus einem
Facebook-Profil vorhersagen kann, und es
11:10 - 11:13

interessiert ihn vielleicht auch nicht, ob
er da einen Fehler macht und einen
11:13 - 11:18

Heterosexuellen möglicherweise falsch
einordnet. Diese Beeinflussung kann aber
11:18 - 11:24

durchaus direkter sein. In den USA werden
Algorithmen jetzt schon im Justizsystem
11:24 - 11:28

als Entscheidungshilfe eingesetzt, und da
wird zum Beispiel mit bestimmten
11:28 - 11:33

Informationen über die Leute vorhergesagt,
ob jemand rückfällig wird, der im
11:33 - 11:38

Gefängnis ist, oder nicht. Das heißt man
versucht vorherzusagen auf einer Skala von
11:38 - 11:44

1 für ungefährlich bis 10 für hochgradig
gefährlich, wo jemand hinkommt. Und hier
11:44 - 11:49

haben wir zwei Beispiele: Einmal den Herrn
links – VP die Initialen –, der zwei
11:49 - 11:54

bewaffnete Raubüberfälle begangen und
einen versuchten bewaffneten Raubüberfall,
11:54 - 11:59

und die Risikoeinschätzung ist hier 3
niedriges Risiko.
11:59 - 12:04

Daneben steht die Dame – BB –, die hat
vier Ordnungswidrigkeiten unter
12:04 - 12:12

Jugendstrafrecht auf dem Kerbholz, und die
wird eingestuft mit hohes Risiko. Und wie
12:12 - 12:15

sieht das jetzt aus. Also die Leute von
ProPublica die das recherchiert haben,
12:15 - 12:21

haben jetzt über zwei Jahre geguckt, wer
wirklich rückfällig wird und wer nicht. BB
12:21 - 12:25

– die Dame rechts –, die begeht keine
weiteren Verbrechen. VP – der Herr links
12:25 - 12:28

–, der begeht nach seiner Freilassung
direkt einen schweren Diebstahl. Das
12:28 - 12:31

Besondere ist hier, und ihr werdet es
wahrscheinlich schon geraten haben, ist,
12:31 - 12:36

dass der Algorithmus systematisch
Afroamerikanerinnen diskriminiert. Es gibt
12:36 - 12:41

also ein Bias, eine Verzerrung, gegen
Schwarze. Darüber hinaus sind diese
12:41 - 12:46

Vorhersagen von den proprietären Kompass-
Systemen nur in 61 Prozent derzeit
12:46 - 12:51

richtig. Wenn man jetzt die wirkliche
Rückfälligkeit über zwei Jahren nimmt. Und
12:51 - 12:55

wir kennen das aus der Statistik: Dort
unterscheiden wir den Fehler erster Art
12:55 - 12:59

und den Fehler zweiter Art. Das heißt
unsere Nullhypothese ist: Der oder die
12:59 - 13:04

Straftäterin wird nicht rückfällig.
Der Fehler erster Art ist jetzt, dass die,
13:04 - 13:09

die mit hohem Risiko eingestuft werden,
aber nicht rückfällig werden. Und da sehen
13:09 - 13:12

wir – oder hat ProPublica herausgefunden
–, dass die Wahrscheinlichkeit, dass ein
13:12 - 13:18

Weißer oder eine Weiße Opfer dieses
Fehlers wird, bei 23,5 Prozent liegt und
13:18 - 13:22

bei Afroamerikanerinnen liegt die
Wahrscheinlichkeit bei 44,9, also fast
13:22 - 13:26

doppelt so hoch. Es gibt auch den Fehler
zweiter Art. Das ist die
13:26 - 13:29

Wahrscheinlichkeit,
dass jemand mit niedrigem Risiko
13:29 - 13:34

eingestuft wird, aber trotzdem rückfällig
wird. Und hier ist die Wahrscheinlichkeit
13:34 - 13:42

umgekehrt: Weiße haben eine 47-Prozent-
Chance diesem Fehler zum Opfer zu fallen.
13:42 - 13:50

Afroamerikanerinnen nur 28 Prozent. Aber
wie kommt das? Wir nehmen jetzt mal an,
13:50 - 13:53

dass das kompetente Programmiererinnen
sind, die in den Maschine Learning Kursen,
13:53 - 13:57

die sie gemacht haben, gut aufgepasst
haben und technisch alles richtig gemacht
13:57 - 14:00

haben.
Nun lernt Maschine Learning immer eine
14:00 - 14:05

Abbildung von einem X auf ein Y. Z. B.
hier haben wir bestimmte Informationen zu
14:05 - 14:11

Gefangenen und diese Rückfälligkeit der
Gefangenen. Das Problem ist jetzt das X
14:11 - 14:15

ist keine Stichprobe der Grundgesamtheit,
sondern eine Untermenge der
14:15 - 14:19

Grundgesamtheit, die die Polizei
untersucht hat. Es ist also ein X', es ist
14:19 - 14:24

nicht repräsentativ. Und das kann eine
selbsterfüllende Prophezeiung sein. Denn
14:24 - 14:27

vielleicht sind Afroamerikanerinnen
einfach in der Situation, dass sie
14:27 - 14:32

deutlich häufiger kontrolliert werden und
es einfach dadurch mehr Straffälle in
14:32 - 14:37

dem Datensatz gibt. Und auf der auch auf
der anderen Seite auf der Y Seite, das
14:37 - 14:40

heißt diese Risikobeurteilung, ob man
rückfällig wird oder nicht, ist ebenfalls
14:40 - 14:45

eine Verfälschung. Denn die bezieht sich
ja auch nur auf die, die vom Rechtssystem
14:45 - 14:50

verurteilt werden.
Das heißt hier haben wir auch ein Y'. Wenn
14:50 - 14:54

man zum Beispiel ein Jurysystem hat, wie
man es in den USA findet, dann kann auch
14:54 - 14:59

dort latent oder weniger latent
diskriminiert werden. Das macht Maschine
14:59 - 15:04

Learning – pseudo-objektive, mathematische
Modelle – zu einer Art Geldwäsche für
15:04 - 15:09

Vorurteile. Weil sie fallen in dieses
System rein und sind dann erst einmal
15:09 - 15:14

nicht mehr sichtbar. Und hier kommen wir
jetzt zum Element der direkten
15:14 - 15:17

Beeinflussung.
Denn diese Systeme werden zwar nur als
15:17 - 15:22

Entscheidungshilfen verkauft, es sind halt
nur Werkzeuge, die genutzt werden können,
15:22 - 15:26

aber die Leute, die die Entscheidung
treffen, verlassen sich direkt auf diese
15:26 - 15:30

Systeme. Das heißt sie vertrauen diesen
diskriminierenden Algorithmen. Das
15:30 - 15:33

Beispiel kommt aus dem hervorragenden
Deutschlandfunk-Feature von Thomas
15:33 - 15:40

Schimmeck. Und der hat zum Beispiel
Veronika Hiller, die Bewährungshelferin,
15:40 - 15:45

die dem Richter im Endeffekt ein Strafmaß
vorschlägt, interviewt. Das Spannende ist,
15:45 - 15:48

die hat also ein Vierteljahrhundert
Erfahrung im Dienst. Aber sie schwört auf
15:48 - 15:53

diesen Algorithmus. Sie sagt der ist gut,
akkurat und einfach. Was wir einfach
15:53 - 15:58

zeigen wollen, ist, dass es hier um sozio-
technische Systeme geht. Das heißt es
15:58 - 16:02

geht nicht nur um das Maschine Learning.
Es geht nicht nur um den Algorithmus.
16:02 - 16:05

Sondern es geht auch um die Menschen, die
ihn nutzen. Denn selbst wenn das System
16:05 - 16:10

fair wäre – wir haben gerade gesehen dass
es das nicht ist –, heißt es immer noch
16:10 - 16:14

nicht, dass die Ergebnisse des Systems
auch fair interpretiert werden, und wir
16:14 - 16:18

finden das ist sehr wichtig für jene, die
solche Systeme bauen – und da sind
16:18 - 16:22

wahrscheinlich einige heute hier. Diese
Verzerrung in und durch Daten sind
16:22 - 16:27

allgegenwärtig. Wir haben zum Beispiel
hier ein Beispiel von Google. Das ist eine
16:27 - 16:32

Suche nach den Keywords „Three White
Teenagers". Und das ist eine Suche nach
16:32 - 16:38

den Keywords „Three Black Teenagers". Das
heißt Technologie offenbart hier
16:38 - 16:42

gesellschaftliche Probleme.
Wir haben es wie gesagt mit sozi-
16:42 - 16:47

technischen Systemen zu tun, die eine
bestimmte Weltvorstellung festschreiben,
16:47 - 16:52

vermitteln, aber auch verstärken können.
Und die Probleme können ganz subtil und
16:52 - 16:56

banal sein wie zum Beispiel dieses
Beispiel aus der statistischen Übersetzung
16:56 - 17:00

zeigt: Jetzt muss man wissen, dass die
türkische Sprache nicht zwischen
17:00 - 17:04

Geschlechtern unterscheidet, das heißt
„er", „sie" und „es" sind alle „o". Es
17:04 - 17:08

gibt auch keine Unterscheidung zwischen
„Arzt" und „Ärztin" beides „Doktor". Und
17:08 - 17:12

wenn wir jetzt mit Google Translate oder
einem anderen statistischen
17:12 - 17:17

Übersetzungsprogramm Sätze wie „Er ist ein
Babysitter." und „Sie ist eine Ärztin."
17:17 - 17:21

hin und her übersetzen, dann stellen wir
fest, dass die Übersetzung bestimmte
17:21 - 17:23

Geschlechterklischees widerspiegelt.
17:23 - 17:28

Und ihr könnt mit dem was ihr bisher über
Machine Learning gelernt habt in diesem
17:28 - 17:32

Vortrag vielleicht schon erklären, wie das
passiert. Wir lernen aus Beispielen und in
17:32 - 17:38

diesen Beispielen sind Verzerrungen. In
diesem Fall mehr weibliche Babysitter,
17:38 - 17:41

mehr männliche Ärzte.
Denn wenn wir übersetzen dann berechnen
17:41 - 17:45

wir ja Wahrscheinlichkeiten und nehmen in
der Regel einfach das wahrscheinlichste
17:45 - 17:49

Ergebnis. Das heißt selbst minimale
Verzerrungen können verstärkt werden. Das
17:49 - 17:55

heißt eine Babysitterin mehr, ein Arzt
mehr und diese Übersetzung sieht so aus,
17:55 - 17:59

wie wir sie gerade sehen. Aber hier haben
wir etwas, das technisch erklärbar ist.
17:59 - 18:03

Aber welche Auswirkungen hat das auf die
NutzerInnen. Welche Auswirkungen hat das
18:03 - 18:09

auf die Weltsicht, wenn man die Google-
Ergebnisse so sieht wie man sie sieht. Und
18:09 - 18:14

anhand von Facebook wollen wir jetzt
zeigen, wie direkt und intransparent diese
18:14 - 18:18

Beeinflussung sein kann. Auch Facebook ist
ein hochkomplexes sozio-technisches
18:18 - 18:23

System, in dem NutzerInnen gleichzeitig
Produzenten und KonsumentInnen sind.
18:23 - 18:29

Facebooks erklärtes Ziel lautet ja, jedem
zu jeder Zeit die richtigen Inhalte zu
18:29 - 18:34

zeigen. Dafür nutzt Facebook nach eigener
Aussage hundert tausend verschiedene
18:34 - 18:38

Faktoren, um algorithmisch die besten
Geschichten aus den potenziellen
18:38 - 18:40

Geschichten auszuwählen.
18:40 - 18:45

Das heißt, wenn ihr euch jetzt vorstellt -
das sind jetzt Zahlen aus dem Kosinski-
18:45 - 18:51

Paper mit den Persönlichkeitsmerkmalen.
Das heißt da haben die Leute im Median 200
18:51 - 18:57

Bekannte und liken 68 Seiten. Das heißt
wenn nur jeder Dritte was macht, dann sind
18:57 - 19:01

das pro Tag 90 potenzielle Beiträge. Wenn
man jetzt nur fünf oder zehn Minuten auf
19:01 - 19:04

der Seite verweilt, dann kann man sich
nicht angucken. Das heißt eine
19:04 - 19:10

chronologische Darstellung ist zwecklos
und eine Kuration unumgänglich. Und
19:10 - 19:15

deswegen sortiert Facebook die Nachrichten
nach einem Algorithmus. Das Problem ist
19:15 - 19:18

aber, dass dieser Vorgang sehr
intransparent ist. Das heißt die
19:18 - 19:20

NutzerInnen sehen und verstehen die
Algorithmen nicht
19:20 - 19:25

Und die glauben im Zweifelsfall wenn sie
darauf angesprochen werden, dass die
19:25 - 19:30

Algorithmen objektiv und unabhängig sind.
Und dabei beziehe ich mich auf folgende
19:30 - 19:36

Studie. Die kommt aus der CHI, der
Computer Human Interaction Community. Und
19:36 - 19:42

dort waren sich 62,5% der Teilnehmer und
Teilnehmerinnen in dieser Studie der
19:42 - 19:48

Existenz von Newsfeed-Algorithmen, also
von dieser algorithmischen Kuration, nicht
19:48 - 19:52

bewusst. Das heißt wir haben hier eine
qualitative Studie mit 40 TeilnehmerInnen,
19:52 - 19:56

die so ausgewählt wurden, dass sie
repräsentativ sind für die US-
19:56 - 20:01

Grundgesamtheit. Und von denen war also 25
Personen nicht bewusst, dass überhaupt
20:01 - 20:07

irgendwie sortiert wird. Die Studie zeigt
auch, dass die TeilnehmerInnen durchaus
20:07 - 20:11

verärgert sind, wenn sie Posts von engen
Freunden oder Familienmitgliedern nicht
20:11 - 20:16

sehen. Spannend ist aber jetzt: Die
Teilnehmer suchen den Fehler eher bei sich
20:16 - 20:19

oder anderen, als bei einem Algorithmus,
von dem sie im Zweifelsfall auch nichts
20:19 - 20:25

wissen. Sie glauben dann z.B. dass sie
etwas übersehen haben oder sie denken,
20:25 - 20:30

dass ihnen bestimmte Bekannte bewusst
Geschichten vorenthalten, weil sie
20:30 - 20:34

vielleicht nicht so gut miteinander
bekannt sind, sich noch nicht so gut
20:34 - 20:37

kennen. Daher kommt auch dieses
titelgebende Zitat: "I always assumed that
20:37 - 20:41

I wasn't really that close to [that
person], so that's fine. What the hell?"
20:41 - 20:45

Das heißt hier hat jemand gedacht "Okay,
ich sehe die Babyfotos vielleicht nicht,
20:45 - 20:49

weil ich die Person nicht so gut kenne,
aber die Person hat das für alle geteilt".
20:49 - 20:54

Und hier hat der Algorithmus jetzt die
Entscheidung getroffen, dass Person A das
20:54 - 21:00

Baby von Person B nicht sieht. Das heißt
diese Systeme, die im Schatten agieren und
21:00 - 21:04

denen sich die BenutzerInnen nicht bewusst
sind, haben Auswirkungen auf
21:04 - 21:08

zwischenmenschliche Beziehungen. Sie
rekonfigurieren sie. Und darüber hinaus
21:08 - 21:12

muss man sich auch noch einmal bewusst
machen, was diese Nachrichten-
21:12 - 21:16

Empfehlungssysteme eigentlich erreichen
wollen. Sie sind ja von der Art her wie
21:16 - 21:21

Netflix. Das heißt wenn ich auf Youtube
oder einem anderen Portal mir Videos
21:21 - 21:25

angucke und ich gucke mir zehn Videos an
und davon sind vier mit lustigen Hunde-
21:25 - 21:30

Babys, dann folgert das System "Ok,
Hendrik mag lustige Hunde-Babys. Dem zeige
21:30 - 21:35

ich jetzt in Zukunft mehr lustige Hunde-
Babys". Nun sind aber auch Nachrichten auf
21:35 - 21:39

Plattformen wie Youtube. Das heißt wenn
ich mir jetzt zehn Videos angucke und von
21:39 - 21:44

denen geht es in vielen darum, dass
Flüchtlinge kriminell sind, dann empfiehlt
21:44 - 21:49

mir das System Videos von kriminellen
Flüchtlingen. Das heißt da passiert etwas
21:49 - 21:55

mit meiner Weltwahrnehmung. Das heißt so
derartige Filterblasen und Echokammern
21:55 - 22:00

entstehen online. Die gibts natürlich auch
im echten Leben. Der Freundeskreis ist
22:00 - 22:05

auch eine Echokammer, in der bestimmte
Weltvorstellungen geteilt werden, aber
22:05 - 22:09

hier sind sie durchaus intransparenter,
denn es passiert unter dem gleichen Logo.
22:09 - 22:15

Bei mir ist ein YouTube-Logo, bei euch ist
ein YouTube-Logo. Und das sind Probleme,
22:15 - 22:18

denen wir uns stellen müssen, mit denen
wir umgehen müssen.
22:18 - 22:23

Und das war mein Teil zur Perspektive der
Mensch-Computer-Interaktion, die sich also
22:23 - 22:27

als eigenes Feld mit derartigen
Fragestellungen auseinandersetzt. Und ich
22:27 - 22:31

übergebe jetzt an Karen, die nochmal
technisch ins Detail gehen wird.
22:31 - 22:44

Applaus
Karen: Ja. Zum ersten Teil dieser Präsentation
22:44 - 22:48

zeigten wir, dass Algorithmen uns schon
heute schon beeinflussen, bewusst und
22:48 - 22:52

unbewusst, direkt und indirekt. Und wir
haben gesehen mit welcher Rigorosität ihre
22:52 - 22:57

Voraussagen umgesetzt werden, nachdem sie
einmal zur Verfügung stehen. Das immer
22:57 - 23:00

unter der Annahme der
Unvoreingenommenheit. Wir haben auch
23:00 - 23:04

bereits angedeutet, dass dieses massive
Vertrauen nicht unbedingt angebracht ist.
23:04 - 23:09

In diesem zweiten Teil der Präsentation
möchten wir darauf eingehen wann dieses
23:09 - 23:12

Vertrauen nicht angebracht ist. Dabei
möchte ich besonders auf ein Wort
23:12 - 23:17

eingehen, das wir bereits viel verwendet
haben. Das Wort Bias oder zu Deutsch
23:17 - 23:21

Verzerrung. Beim maschinellen Lernen
können wir grundsätzlich in zwei
23:21 - 23:24

verschiedene Formen von Bias
unterscheiden. Auf der einen Seite haben
23:24 - 23:29

wir Bias der Daten, also Bias der ein
Spiegel ist unserer eigenen Vorurteile und
23:29 - 23:33

Moralvorstellungen, ob uns das jetzt
bewusst ist oder nicht.
23:33 - 23:37

Bias in Daten kann aber auch entstehen
ganz zufällig durch mangelhafte Erhebung
23:37 - 23:43

von Daten. Wenn das passiert wird eine
Grundgesamtheit also die Population
23:43 - 23:49

verzerrt abgebildet. Auf der anderen Seite
befindet sich der Bias durch das
23:49 - 23:51

Modellieren.
Das sind also die Gesamtheit aller
23:51 - 23:54

Annahmen die Ingenieure und
Wissenschaftler von Algorithmen machen und
23:54 - 24:00

machen müssen, um überhaupt Voraussagen
treffen zu können. Dabei kann sich
24:00 - 24:08

wiederum der Bias des Modells so auf die
Daten auswirken, dass der Bias in den
24:08 - 24:12

Daten verringert wird. Dazu gibt es
vielfältige Forschung. Es kann aber auch
24:12 - 24:19

den Bias in den Daten verstärken. Auf der
anderen Seite knn auch Bias in Daten den
24:19 - 24:25

Modellier-Bias beeinflussen. Wir werden im
Folgenden, den folgenden 4 Beispielen, uns
24:25 - 24:29

mit all diesen Phänomenen auseinander-
setzen. Maschinelles Lernen hat in den
24:29 - 24:33

letzten Jahren viele Durchbrüche bei der
algorithmischen Wahrnehmung erzielt.
24:33 - 24:37

Algorithmen bewältigen kognitive Aufgaben,
die vor kurzem in weiter Ferne schienen.
24:37 - 24:42

Das hat aber auch eine Welle von Forschung
ausgelöst, die unlösbar geglaubte Aufgaben
24:42 - 24:47

wieder aufgreift und neu bewertet.
Eine Studie dieser Welle ist im November
24:47 - 24:53

letzten Jahres erschienen zwei Forscher
der Shanghai Jiaotong-Universität
24:53 - 24:58

behaupten zeigen zu können, dass man
Menschen mit kriminellen Absichten bereits
24:58 - 25:01

an einem einfachen Ausweis-Foto erkennen
kann und dies mit 90 prozentiger
25:01 - 25:07

Trefferwahrscheinlichkeit. Dieses Ergebnis
steht natürlich im starken Kontrast zu den
25:07 - 25:10

Forschungsergebnissen der letzten Dekaden,
die Kriminalität eher sozio-ökonomischen
25:10 - 25:14

Umständen zuschreiben. Wir wollen uns also
im Folgenden mit dieser Studie ein
25:14 - 25:20

bisschen näher beschäftigen. Die Autoren
sammelten hierzu 1800 Fotos von Chinesen
25:20 - 25:25

im Alter zwischen 18 und 55 Jahren, die
keine bemerkbaren Gesichtsbehaarungen,
25:25 - 25:30

Narben oder Tattoos zeigten. Dabei
repräsentieren zirka 700 Fotos die Rubrik
25:30 - 25:36

kriminell. Die Fotos selbst wurden von der
Polizei bereitgestellt und es handelt sich
25:36 - 25:40

bei allen Fotos um bereits verurteilte
Straftäter.
25:40 - 25:43

Auf der anderen Seite mussten nun auch
Bilder rechtschaffender Bürger
25:43 - 25:47

repräsentiert werden. Dafür wurden 1100
Fotos aus verschiedenen Quellen des
25:47 - 25:51

Internets beschafft. Dabei ist anzunehmen,
dass diese von Seiten wie LinkedIn
25:51 - 25:55

stammen, da die Autoren den Beruf der
vermeintlich rechtschaffenen kennen. Um
25:55 - 26:00

uns nun ein besseres Bild über die Daten
zu machen, wollen wir uns also ein paar
26:00 - 26:04

Datenpunkte anschauen.
Jeder dieser Reihe entsprechen drei
26:04 - 26:08

Datenpunkte aus jeweils einer Kategorie
kriminell oder rechtschaffend.
26:08 - 26:10

Dazu würde ich ein kleines Experiment
wagen. Also ich zähle dann gleich mal bis
26:10 - 26:15

zwei und alle die glauben, die obere Reihe
seien die Rechtschaffenden, die bitte ich
26:15 - 26:20

dann die linke Hand zu heben. Ich hebe die
rechte Hand, damit ihr wisst, welche Hand.
26:20 - 26:24

Und diejenigen, die denken die untere
Reihe wären die Rechtschaffenden, die
26:24 - 26:27

bitte ich also die rechte Hand zu heben.
Das können wir gleich mal probieren, also
26:27 - 26:33

ich zähle nochmal bis 2: eins, zwei und
dann heben wir halt die Hand.
26:33 - 26:37

Okay. Also die meisten von uns sind uns
relativ einig dass wir die rechtschaffenen
26:37 - 26:41

identifizieren können. Aber warum können
wir das? Eigentlich sollten Menschen dazu
26:41 - 26:45

ja nicht in der Lage sein und wir wissen,
dass wir dazu nicht in der Lage sind.
26:45 - 26:50

Ich denke also die meisten von uns haben
gewisse Hinweise in den Bildern
26:50 - 26:53

wahrgenommen, die auf der
Unterschiedlichkeit der Quellen beruhen.
26:53 - 26:57

Also ganz offensichtlich hier der Kragen
im Bild, der darauf hinweist, dass es
26:57 - 27:02

vielleicht ein Bewerbungsfoto sein könnte
oder ein leichtes Grinsen im Gesicht.
27:02 - 27:07

Dahingegen sind die Leute, die auf der
kriminellen Seite sind nicht besonders
27:07 - 27:10

vorteilhaft dargestellt. Also dem Mann
hier wird der Scheinwerfer ins Gesicht
27:10 - 27:17

gestrahlt, was dann Hautunreinheiten und
Falten besonders betont. Wohingegen bei
27:17 - 27:21

den Bewerbungsfotos offensichtlich Make-Up
im Spiel ist oder Photoshop. Im
27:21 - 27:29

trivialsten Fall kann es also sein, dass
der Algorithmus einfach nur erkennt, in
27:29 - 27:33

welchen Fotos Photoshop nachgeholfen hat.
Das kann man also zum Beispiel schon an
27:33 - 27:38

lokalen Pixel Statistiken gut erkennen.
Diese Studie ist vielleicht ein extremes
27:38 - 27:42

Beispiel, wie gravierend sich die
verwendeten Daten auf das Ergebnis einer
27:42 - 27:46

Voraussage eines Algorithmus auswirken
können. Dies ist ein besonders starkes
27:46 - 27:50

Beispiel für Stichproben-Verzerrung, also
Bias in dem Gruppen unterschiedlich
27:50 - 27:54

dargestellt werden.
Bias kann aber auch entstehen ganz
27:54 - 27:57

zufällig, wenn zu wenige Datenpunkte
vorhanden sind, um verlässliche Aussagen
27:57 - 28:00

zu treffen.
Solche Probleme sehen wir also oft in
28:00 - 28:05

medizinischen Studien oder psychologischen
Studien, wo Tests teuer und langwierig
28:05 - 28:09

sind.
Melde-Bias beschreibt, wenn Befragte
28:09 - 28:11

unkorrekte Angaben machen.
Das geschieht zum Beispiel oft bei
28:11 - 28:16

Gewaltverbrechen, bei denen Angst und
Repression eine Rolle spielen. Und
28:16 - 28:20

natürlich spielen auch die verwendeten
Merkmale, die ein gewisses Problem
28:20 - 28:25

beschreiben sollen, eine große Rolle.
Kommen wir nun zur zweiten Kategorie: dem
28:25 - 28:29

Bias in den Modellen.
Hat man sich früher also vor dem die
28:29 - 28:34

Deeplearning-Hype, sagen wir mal vor 2012
eine Einführungsveranstaltung zum
28:34 - 28:38

maschinellen Lernen gesetzt, dann begann
fast jeder mit dem Erklären des No-free-
28:38 - 28:45

Lunch-Theorems. Also der Aussage, dass
kein Modell in allen möglichen Szenarien
28:45 - 28:48

funktioniert.
Daraus schlussfolgerten wir, dass wir
28:48 - 28:53

Annahmen machen müssen, die das Modell im
Hinblick auf unser spezifisches Problem
28:53 - 28:58

beschränken. Diese Annahmen haben aber
ihre Grenzen. Dann versagt das Modell,
28:58 - 29:00

ohne dass sich das Modell darüber bewusst
ist.
29:00 - 29:07

Das heißt also unser Job als
Wissenschaftler oder Studierender ist es,
29:07 - 29:15

diese Grenzfälle zu benennen und zu
testen, ob in unserem speziellen
29:15 - 29:18

Anwendungsfall diese Algorithmen nicht
versagen.
29:18 - 29:23

An diesen Prinzipien hat sich auch bis
heute nichts geändert, aber der Erfolg des
29:23 - 29:25

maschinellen Lernens in bestimmten
Bereichen lässt selbst uns
29:25 - 29:30

WissenschaftlerInnen diese universalen
Regeln manchmal vergessen.
29:30 - 29:34

Wir sind dann versucht zu glauben, dass
Modelle so flexibel sind, dass die Grenzen
29:34 - 29:37

quasi nicht mehr existieren.
Im Folgenden möchte ich aber auf ein
29:37 - 29:41

Beispiel eingehen, das sich auch mit dem
Deeplearning-Hype gar nicht geändert hat.
29:41 - 29:47

Und das ist das Problem der Zielsetzung
und die Frage, wie Erfolg zu bewerten ist.
29:47 - 29:52

Am Beginn des Vortrags sprach Hendrik über
das Messen von Fehlern und, dass das
29:52 - 29:55

Korrigieren dieser Fehler ein wichtiger
Mechanismus sei, um Algorithmen zu
29:55 - 29:59

trainieren.
Doch was ein Fehler ist, ist oft nicht
29:59 - 30:02

einfach zu bestimmen und es liegt in der
Hand des Ingenieurs zu definieren.
30:02 - 30:04

Zum Beispiel wie messe ich Erfolg bei
YouTube-Empfehlungen?
30:04 - 30:09

Messe ich die Zeit die jemand auf der
Plattform verbringt? Das kann aber auch
30:09 - 30:12

bedeuten, dass der PC vielleicht noch
einer Ecke steht und die Personen gar
30:12 - 30:16

nicht mehr im Raum ist oder messe ich die
Anzahl von Klicks? Aber wenn diese zu
30:16 - 30:19

frequent sind, dann bedeutet das
vielleicht, dass die Person das Video gar
30:19 - 30:24

nicht mag.
Ein anderes Problem sind Übersetzungen.
30:24 - 30:32

Stellen Sie sich nur also vor, dass wir
einen Korpus von Übersetzungen haben und
30:32 - 30:36

wir wollen messen, ob ein Text richtig
übersetzt wurde.
30:36 - 30:44

Wie können wir das messen? Wort für Wort
oder Paragraph für Paragraph? Wenn wir
30:44 - 30:47

Wort für Wort messen, dann spielen wir
vielleicht mit der Wortreihenfolge in
30:47 - 30:49

verschiedenen Sprachen und das
funktioniert dann nicht so gut. Wenn wir
30:49 - 30:54

Paragraph für Paragraph messen,
funktioniert das vielleicht nicht so gut,
30:54 - 30:58

weil der Algorithmus den Kontext nicht
mehr begreift. Und wie gehen wir mit
30:58 - 31:01

Synonymen um? Wenn also der Algorithmus
ein richtiges Synonymen gefunden hat, wird
31:01 - 31:05

dann trotzdem ein Fehler berechnet, wenn
der spezielle Datenpunkt besagt, dass das
31:05 - 31:08

vielleicht als ein anderes Synonym zu
übersetzen ist? Man muss also
31:08 - 31:13

Entscheidungen treffen. Die Ingenieure bei
Google und anderen führenden
31:13 - 31:21

Übersetzungssystem beantworten die Frage
folgendermaßen: Wir übersetzen Satz für
31:21 - 31:26

Satz. Dabei gehen wir davon aus, dass
Sätze unabhängig sind und nur das
31:26 - 31:30

wahrscheinlichste Wort oder die
wahrscheinlichste Phrase wird richtig
31:30 - 31:35

bewertet. Wenn wir also nochmal auf das
Beispiel aus der ersten Hälfte des
31:35 - 31:40

Vortrags eingehen. Wenn wir
nun "Sie ist eine Frau. Sie ist Ärztin" in
31:40 - 31:46

das genderneutrale Türkisch übersetzen zu
"O bir kadın. O bir doktor." und dann
31:46 - 31:51

zurückübersetzen ins Deutsche, dann wird
dies mit "Sie ist eine Frau. Er ist Arzt"
31:51 - 31:55

übersetzt. Und jetzt wissen wir auch
warum. Da wir annahmen, dass Sätze
31:55 - 31:59

unabhängig sind weiß der Algorithmus gar
nichts vom Kontext, also dass wir hier
31:59 - 32:05

über eine Frau sprechen. Wenn der
Algorithmus "O bir doktor" dann übersetzt,
32:05 - 32:08

übersetzt der nur die wahrscheinlichste
Phrase und die ist "Er ist Arzt". Es
32:08 - 32:12

handelt sich hier also nicht um Bias in
den Daten oder zumindest nicht unbedingt,
32:12 - 32:20

sondern um Bias in den Annahmen die das
Modell zu sehr vereinfachen. Ein zweites
32:20 - 32:23

Beispiel führt das noch klarer vor Augen.
Wenn wir hier eben den Punkt durch ein
32:23 - 32:31

Komma ersetzen, dann kann der Algorithmus
es richtig übersetzen, weil er sich des
32:31 - 32:37

Kontexts bewusst ist. Im nächsten Beispiel
um das Phänomen Bias wollen wir zeigen wie
32:37 - 32:40

Bias in Modellen Bias in Daten verstärken
kann.
32:40 - 32:45

Dies wird besonders in sogenannten aktiven
Lernszenarien bewusst. Aktives Lernen
32:45 - 32:52

funktioniert wie folgt. Wir haben Daten,
auf deren Grundlage wir einen Algorithmus
32:52 - 32:56

lernen. Für manche Voraussagen sind wir
uns aber nicht sicher. Darum fragen wir
32:56 - 33:00

einen menschlichen Experten um Rat und der
Algorithmus fragt dann meistens die
33:00 - 33:07

folgende Frage: Habe ich diesen Datenpunkt
richtig bewertet? Und falls nicht, bitte
33:07 - 33:12

um Feedback! Das führt dazu, dass der
Algorithmus in der Zukunft mehr Daten zur
33:12 - 33:16

Verfügung gestellt bekommt, um dann besser
zu lernen und weniger oft um Hilfe fragen
33:16 - 33:22

zu müssen. Das klingt gut. Und so viel zum
störungsfreien Ablauf. Was aber nun wenn
33:22 - 33:27

ein Datenpunkt mit falschen oder
verzerrten Merkmalen beschrieben wird? Und
33:27 - 33:31

dazu kommt, dass unser Mensch vielleicht
nicht so wachsam ist, wie wir in unserem
33:31 - 33:37

Modell annehmen. Wir haben also eine
kleine Verzerrung im Datensatz, und die
33:37 - 33:43

Annahme des idealen Menschen wird verletzt
in unserem eigentlichen Phänomen. Dieser
33:43 - 33:48

falsche Datenpunkt wird also ignoriert.
Das führt dann dazu, dass, obwohl die
33:48 - 33:52

Ursache der Verzerrung nicht mehr aktiv
ist, dieser Datenpunkt nun vermehrt wird
33:52 - 33:57

aufgrund der Tatsache, dass der Mensch
nicht auf die Frage, habe ich diesen
33:57 - 34:03

Datenpunkt richtig bewertet, reagiert.
Und das führt dann wiederum dazu, wenn man
34:03 - 34:05

mehr
verzerrte Daten hat, dass diese mehr
34:05 - 34:09

verzerrten Daten sich immer weiter
vermehren können. Wann kann ich das also
34:09 - 34:14

jetzt in freier Wildbahn beobachten? Es
ist relativ schwer zu sagen, weil sich
34:14 - 34:17

natürlich solche großen Player wie Google
oder Facebook nicht immer in die Karten
34:17 - 34:21

blicken lassen. Aber ich denke ein Tweet
aus dem vergangenen Jahr lässt darauf
34:21 - 34:27

schließen, dass das vielleicht hier
passiert sein könnte. Also eine
34:27 - 34:31

Afroamerikanerin mit Kussmund, in der
Mitte unten, wird hier als Gorilla
34:31 - 34:33

bezeichnet. Das ist eine
geschichtsträchtige Bezeichnung für
34:33 - 34:37

Afroamerikaner in Amerika und hat
natürlich große Wellen geschlagen. Google
34:37 - 34:41

erklärt die Ursache des Fehlers nicht
genau genug, um genau zu wissen, was ihn
34:41 - 34:47

ausgelöst hat, aber zwei Probleme können
eine Rolle gespielt haben. Eins wäre, dass
34:47 - 34:50

die Bildbeschreibung immer von Menschen
bereitgestellt wird, und die erlauben sich
34:50 - 34:56

gerne mal zu trollen und verfälschen das
originale Datenset damit. Das kann aber
34:56 - 34:59

nicht die einzige Ursache sein. Es kommt
also mindestens noch dazu, dass gewisse
34:59 - 35:02

Gruppen von Menschen entweder einfach sehr
klein sind in einer Gesellschaft oder
35:02 - 35:06

unterrepräsentiert sind. Und vielleicht
auch drittens, man muss schon sagen dass
35:06 - 35:12

bei großen Tech-Firmen sehr wenig
Grenzszenarien oder Szenarien getestet
35:12 - 35:16

werden. Wir denken da zum Beispiel an den
Microsoft Chatbot, der ganz ähnliche
35:16 - 35:22

Phänomene gezeigt hat. Also der dann auch
sehr rassistische Chat-Nachrichten
35:22 - 35:27

geschrieben hat. Das letzte relevante
Beispiel zum Thema Bias soll aus dem
35:27 - 35:32

Bereich des übertragenden Lernens kommen.
Hierbei ist das Ziel das Lösen einer
35:32 - 35:37

Aufgabe. Und diese Aufgabe hat aber nur
wenige Datenpunkte. Und das sind nicht
35:37 - 35:41

genug, um den Algorithmus erfolgreich
lernen zu lassen. Aber es gibt eine
35:41 - 35:45

ähnliche Aufgabe, die erfolgreich gelöst
werden kann. Und die Idee ist nun, dass
35:45 - 35:50

gut funktionierende Modell zu verwenden um
unseren eigentlichen Problemen zu helfen.
35:50 - 35:57

Diese Technik führt aber wieder zu
Verzerrungen, die nur schwer bestimmt und
35:57 - 36:01

kontrolliert werden können.
Das wird klar, wenn wir ein konkretes
36:01 - 36:04

Beispiel betrachten. Wir können eine ganze
Halle voll Roboterarme stellen, um ihnen
36:04 - 36:10

bestimmte motorische Aufgaben
beizubringen. Aber selbst 1000 Roboterarme
36:10 - 36:18

lernen nur mühsam. Was also gang und gäbe
ist in der modernen Robotik, sind dass man
36:18 - 36:23

Systeme in Simulationen üben lässt.
Systeme werden also für Tausende Jahre in
36:23 - 36:27

Simulationen geübt. Das ist natürlich aber
nie Realität. Also wir denken da an
36:27 - 36:32

Gravitationssimulationen, die Fehler
enthalten kann. Lichtbedingungen, die
36:32 - 36:35

nicht ganz real sind, oder der
idealisierte Roboterarm, der hier
36:35 - 36:40

verwendet wird. In diesem Zusammenhang
möchte ich auch sagen, wie attraktiv auch
36:40 - 36:44

die Zukunft mit selbstfahrenden Autos
erscheinen mag, mit ihren Versprechen nach
36:44 - 36:48

mehr Platz in den Städten, weniger
Unfällen und effektiverer Verkehrsführung,
36:48 - 36:52

so sollte man auch sehr skeptisch sein,
denn auch diese Systeme haben die meiste
36:52 - 36:59

Lebenserfahrung in Simulationen gesammelt.
Eine ganz andere Betrachtungsweise auf
36:59 - 37:03

Daten ist die der Datendichte. Daten
können dicht beieinander liegen oder weit
37:03 - 37:09

voneinander entfernt. In Bereichen mit
vielen Daten ist es oft einfach korrekte
37:09 - 37:14

Aussagen zu treffen. Neue Datenpunkte in
diesen Bereichen zu beschreiben nennt man
37:14 - 37:19

Interpolation. Wohingegen Bereiche mit
wenigen Daten oder keinen Datenpunkten
37:19 - 37:23

sehr schwer zu beschreiben sind. Diese
Aufgabe beschreibt man mit Extrapolation.
37:23 - 37:28

Korrektes extrapolieren ist im Allgemeinen
nicht möglich oder nur möglich, wenn man
37:28 - 37:30

korrekte Annahmen über den
Entstehungsprozess der Daten macht.
37:30 - 37:36

Interpolieren, also das Wandern von einem
oder mehreren Datenpunkte zum anderen,
37:36 - 37:41

kann so wichtige Fragen des Alltags
beantworten wie: Wie würde das Kind von
37:41 - 37:47

Kim Jong-un und Donald J. Trump aussehen?
Neueste Anwendungen dieser Technik
37:47 - 37:51

beinhalten auch das gezielte Verändern von
Video in Bild und Sprache. Beispielsweise
37:51 - 37:55

wurde hier das Gesicht von der
Hauptdarstellerin des Wonder Woman Films,
37:55 - 38:02

Gal Gadot, auf einen pornografischen Film
gelegt. Und man muss nicht weit denken um
38:02 - 38:03

sich die Konsequenzen solcher Techniken,
für
38:03 - 38:07

Fake News zum
Beispiel, vorzustellen. Im extremsten Fall
38:07 - 38:12

gibt es sehr wenige oder keine Daten wo
eine Aussage getroffen werden soll. Nun
38:12 - 38:16

ist es wichtig, die richtigen Annahmen zu
treffen um extrapolieren zu können. Das
38:16 - 38:21

haben wir bereits gesagt. Das ist aber
eine extrem schwere Aufgabe, zu der auch
38:21 - 38:25

moderne Wissenschaft nur wenige und
unvollständige Antworten weiß. Was also
38:25 - 38:28

anstatt in aller Regel passiert, ist, dass
Algorithmen keine Annahmen machen. Und das
38:28 - 38:34

kann zu unvorhergesehenen Phänomenen
führen. Im schlimmsten Fall kann man
38:34 - 38:39

dieses Wissen auch nutzen zu sogenannten
feindlichen Attacken auf Algorithmen. Eine
38:39 - 38:43

Attacke verläuft beispielsweise so: Man
nehme einen Datenpunkt aus dem Datenset
38:43 - 38:47

und dessen beschreibende Merkmale, also
hier z.B. die Bilder von Verkehrsschildern
38:47 - 38:48

und die Verkehrsschilder.
38:48 - 38:49

[38:48]
38:49 - 38:54

Man suche dann fernab von den Daten einen
Punkt der sehr ähnlich ist, den aber der
38:54 - 38:59

Algorithmus mit all mit einem ganz anderen
Merkmal beschreiben würde. Und das
38:59 - 39:09

gruselige ist, dass dies auch funktioniert
mit ausgedruckten Version derselben
39:09 - 39:14

Attacke. Und wenn man nicht dieselben
Daten und nicht einmal denselben dasselbe
39:14 - 39:19

Modell kennt oder verwendet. Wen das
interessiert dem empfehle ich sehr für die
39:19 - 39:23

nächste Präsentation zu bleiben. Das wird
glaube ich ja der Kernpunkt der nächsten
39:23 - 39:28

Präsentation sein. Abschließend zum Thema
Möchte ich nochmal ganz deutlich machen,
39:28 - 39:33

dass in allen Systemen des modernen
maschinellen Lernens Korrelation evaluiert
39:33 - 39:39

wird und nicht Kausalität. Mathematische
Kausalitätsforschung, also dem Suchen nach
39:39 - 39:43

Ursache und Effekt für komplexe Systeme
ist erstens ein Kinderschuh und
39:43 - 39:47

Korrelation zu finden und zu beschreiben
ist nur einer der Schritte der dazu nötig
39:47 - 39:53

ist. Bevor ich die Frage dann- die Runde
für Fragen öffne haben Hendrik und ich
39:53 - 39:56

noch ein Anliegen. Also ich hoffe wir
haben umfassend die technischen
39:56 - 40:00

Möglichkeiten des maschinellen Lernens
dargestellt und welche Begrenzungen es
40:00 - 40:06

aufweist. Letzteres soll und wird uns als
Gesellschaft aber nicht davon abhalten
40:06 - 40:11

diese großartigen Fortschritte zu
geniessen. Also denken wir an Mediziner
40:11 - 40:15

und Molekulare Biologie in denen diese
Techniken großes Versprechen und auch
40:15 - 40:20

schon geliefert haben. Daraus ergeben sich
trotzdem große politische Fragen die uns
40:20 - 40:23

alle etwas angehen. Entscheidungen die
Wissenschaftler nicht alleine treffen
40:23 - 40:29

können, wollen oder sollten. Also wir
müssen uns Sachen fragen wie: Wer soll im
40:29 - 40:33

konkreten Fall Entscheidungen treffen,
Menschen oder Maschinen. Wer ist Schuld
40:33 - 40:38

wenn Fehler passieren: Ingenieure, Firmen,
Staat oder vielleicht gar niemand. Wie
40:38 - 40:44

können staatliche Garantien wie Gleichheit
juristisch umgesetzt werden im Angesicht
40:44 - 40:50

solcher neuen Algorithmen. Und natürlich
auch wie können Algorithmen oder sollten
40:50 - 40:53

Algorithmen reguliert werden. An der
Stelle möchte ich mich bedanken für
40:53 - 40:57

Aufmerksamkeit
und würde die Runde eröffnen für Fragen.
40:57 - 41:13

Herald-Angel: Vielen Dank Karen, vielen
41:13 - 41:19

Dank Hendrik. Wenn ihr Fragen habt, bitte
an den Mikros aufstellen. Und dann
41:19 - 41:22

entsprechend warten. Mikrophon 1
bitteschön.
41:22 - 41:24

Mikrofon 1: Ja, vielen Dank für den
41:24 - 41:31

großartigen Vortrag, war super spannend
und es ist ein sehr sehr wichtiges Thema,
41:31 - 41:36

wie gehen wir damit um, weil es wirklich
Auswirkungen hat auf die politische
41:36 - 41:42

Organisation, auf die Demokratie, all
diese Sachen. Jetzt vom Beispiel das
41:42 - 41:45

Hendrik gebracht hat, im ersten Teil
ging's ja jetzt auch zum Beispiel über die
41:45 - 41:52

Anwendung von KI für ja sagen wir
politische Propaganda, könnte man auch
41:52 - 41:58

sehen, Cambridge Analytica, die ganzen
Sachen und gleichzeitig als zweites Thema
41:58 - 42:04

die Filterbubbles die sich bilden, also wo
natürlich eine Verstärkung dieses
42:04 - 42:09

Phaenomens möglich ist. Meine Frage, die
ich mich in diesem Jahr gestellt habe, mit
42:09 - 42:20

Brexit, mit Trumpwahlen und so weiter, was
sind die Möglichkeiten die sich bieten um
42:20 - 42:27

dem entgegenzuwirken, dass sich Meinungen
so stark durch Filterbubbles polarisieren,
42:27 - 42:34

dass Leute durch Targeted Advertisement
beeinflusst werden, die mit AI generiert
42:34 - 42:41

werden und Big Data. Wie ja- habt ihr
konkrete Vorschläge?
42:41 - 42:44

Hendrik: Vielen Dank für die Frage. Es
42:44 - 42:48

geht also darum was man jetzt gegen diese
Probleme insbesondere im politischen
42:48 - 42:53

Bereich machen kann. Und es ist natürlich
eine riesige Frage, wird uns warscheinlich
42:53 - 42:57

auch noch lange Begleiten, ich glaube
kognitive Diversität im Bekannten- und
42:57 - 43:03

Freundeskreis, ganz wichtig, vor allem aber
auch in Unternehmen. Und unsere Ansätze, so
43:03 - 43:06

kommen sie ja zusammen, mir gehts ja darum
wie können wir Leute untersützten, wie
43:06 - 43:10

machen wir Visualisierungen, wie machen
wir Algorithmen sichtbar, wie helfen wir
43:10 - 43:14

den Leuten zu verstehen was da passiert.
Meine Perspektive, Karens Perspektive
43:14 - 43:17

dann: Wie können wir die ALgorithmen, die
Blackbox aufmachen, wie können wir
43:17 - 43:21

erklären, wie kann ein System auch sagen
wie sicher es ist mit seiner Vorhersage.
43:21 - 43:28

Also es gibt ja auch viel Arbeit, es gibt
die Fairness, Transparency... Fairness,
43:28 - 43:32

Accountability, and Transparency in
Machine Learning fatml.org. Da gibt es
43:32 - 43:36

eine ganz große Gruppe von Leuten die sich
damit auseinandersetzt, auch aus ganz
43:36 - 43:39

verschiedenen Richtungen, weil es gibt
viel Arbeit dazu in der Psychologie, in
43:39 - 43:44

der Soziologie, aber auch halt in der
Informatik. Genau fatml.org ist eine sehr
43:44 - 43:45

gute Addresse für sowas.
43:45 - 43:51

Herald-Angel: Eine Bitte an die, die
gerade rausgehen: Macht das bitte so leise
43:51 - 43:54

wie es geht und versucht durch die Tür zu
meiner Linken, zu eurer Rechten dort
43:54 - 44:01

hinten, den Saal zu verlassen, danke
schön.
44:01 - 44:05

Jawohl, Mikrofon 5, du hast eine Frage?
44:05 - 44:09

Mikrophon 5: Ja, eher ein kurzer Kommentar
aus dem Bereich des Machine Learnings, ist
44:09 - 44:13

das, was wir da gesehen haben bei der bei
dem Gorillabeispiel, ebenso bei dem
44:13 - 44:19

Übersetzungsbeispiel nicht eher ein Bias
in der Kostenfunktion? Dadurch, dass wir
44:19 - 44:22

dem Algorithmus gesagt haben, es ist
genauso teuer, wenn du die Klasse Gorilla
44:22 - 44:27

mit der Klasse mit einer anderen Klasse
verwechselst, versus, dass wir die
44:27 - 44:33

Oberklasse Mensch mit der Oberklasse Tier
verwechselst, oder in dem Genderbeispiel
44:33 - 44:38

dass "Er" und "Sie" als Verwechselung
eines einzelnen Worts genauso teuer sind
44:38 - 44:41

wie beliebige andere Worverwechselungen.
44:41 - 44:45

Hendrik: Sehr guter Punkt. Also man kann
natürlich in der Kostenfunktion dagegen
44:45 - 44:48

vorwirken, man kann sagen dieser Fehler
ist schlimmer für uns als der andere
44:48 - 44:53

Fehler, aber wenn wir davon ausgehen, dass
alle Klassen gleich sind und wir einfach
44:53 - 44:57

für alle Klassen gleich gute Ergebnisse
haben wollen, und das kommt ja aus Google
44:57 - 45:01

Fotos, wo wir das für alle Kategorien
machen wollen, dann ist es halt da kommt
45:01 - 45:04

der Mensch wieder rein. Das ist dann
nichtmehr allgemeines Machine Learning,
45:04 - 45:08

sondern wieder so Frickellösung. Und
dieses Problem des Bias, und darum gings
45:08 - 45:11

ja, ist einfach dem Machine Learning
inherent, und wir müssen damit umgehen.
45:11 - 45:14

Und ich glaube nicht, dass man das einfach
in die Kostenfunktion schreiben kann. Oder
45:14 - 45:16

willst du noch was dazu sagen?
45:16 - 45:22

Karen: Ja der Punkt von dem Beispiel war
ja auch quasi wie einerseits da muss ein
45:22 - 45:27

falscher Datenpunkt exestiert haben, und
wie das quasi durch die ein Bias
45:27 - 45:30

vielleicht, oder eine Annahme in der
Kostenfunktion dann eigentlich noch viel
45:30 - 45:35

verstärkt wird. Es geht ja darum wie quasi
eine Negativ-Spirale manchmal losgetreten
45:35 - 45:38

werden kann. Dadurch, dass wir einerseits
Bias in den Daten haben, aber auch andere
45:38 - 45:43

gewisse Annahmen machen, die vielleicht
die Realität zu sehr vereinfachen.
45:43 - 45:45

Das war ja der Punkt dieses Beispiels.
45:45 - 45:48

Hendrik: Und vielleicht dazu noch: Das
sind natürlich sehr offensichtliche
45:48 - 45:51

Beispiele, auch um das hier deutlich zu
machen. Es gibt natürlich auch immer diese
45:51 - 45:55

Blindstellen, Blindspots, wo halt was
passiert, von dem wir das garnicht wissen.
45:55 - 45:58

Das ist ja auf eine Art auch ein
Blindspot, der vielleicht auch damit
45:58 - 46:02

zusammenhängt, dass Google nicht divers
genug ist und nicht genug Leute derartige
46:02 - 46:05

Daten damit getestet haben, bevor sie es
public gemacht haben.
46:05 - 46:08

Herald-Angel: Mikrophon 1, deine Frage.
46:08 - 46:11

Mikrophon 1: Ja vielen Dank, euer Vortrag
46:11 - 46:15

war ja so ein bischen als Einführung
gedacht, das Thema auf die Agenda zu
46:15 - 46:18

bringen, was ich ganz großartig finde,
aber deswegen hätte ich jetzt eher so eine
46:18 - 46:22

Kommunikationsstrategische Frage. Ihr habt
ja ganz viel über Bias gesprochen, über
46:22 - 46:25

Verzerrung, wenn man das so sagt denkt man
implizit ganz oft an neutral und
46:25 - 46:30

Unverzerrt, und ich fands toll, du hattest
ja das No-Free-Lunch-Theorem da, also
46:30 - 46:33

sagen: Machine Learning ohne Bias gibt's
garnicht, du hast auch gerade gesagt, das
46:33 - 46:37

ist Machine-Learning inherent. Aber das
ist ja ganz wichtig zu sagen, deswegen
46:37 - 46:40

wollte ich einfach mal fragen wenn es um
politische Debatten geht, um öffentliche
46:40 - 46:44

Debatten geht, ob ihr dann denkt, dass
Bias und Verzerrung sozusagen der richtige
46:44 - 46:49

Header ist, um das alles zu thematisieren.
Weil es eben dieses Neutrale, Unverzerrte
46:49 - 46:53

immer mit impliziert, oder ihr denkt, dass
man das dann nochmal anders framen müsste.
46:53 - 46:55

Hendrik: Wir sind aufjedenfall keine
46:55 - 46:59

Kommunikationsstrategen. Es gibt natürlich
viele hervorragende Mediensoziologen,
46:59 - 47:03

Kommunikationswissenschaftler, die das
warscheinlich viel besser machen können.
47:03 - 47:08

Wir wollten jetzt erstmal in diesem Rahmen
zeigen, welche Probleme wir als Techniker,
47:08 - 47:12

als Informatiker - wir promovieren ja
beide zu diesen Themen - sehen. Also...
47:12 - 47:17

Also das ist wird uns ja aber auch noch
sehr lange beschäftigen, das richtig an
47:17 - 47:18

die Leute zu bringen.
47:18 - 47:23

Herald-Angel: Okay, Dankeschön. Wir haben
eine Frage aus dem IRC.
47:23 - 47:26

Signal-Angel: Ja, danke, eine Frage aus
47:26 - 47:29

dem Internet: Hat menschliches Lernen
nicht genau genommen die selben Probleme
47:29 - 47:33

wie maschienelles Lernen? Oder gibt es da
im Prinzipiellen Unterschiede?
47:33 - 47:39

Hendrik: Ich guck mal zu dir.
47:39 - 47:43

Karen: Also, das ist eine Frage, die
47:43 - 47:44

natürlich nicht nur das maschienelle
Lernen betrifft, sondern auch die
47:44 - 47:49

Psychologie, oder die Evolutionsforschung,
zu der ich mich nicht auskenne. Der
47:49 - 47:57

Algorithmus oder die Idee, die Grundidee
des maschienellen Lernens ist ja quasi
47:57 - 48:02

Fehler festzustellen, und die dann zu
kommunizieren und das Modell wird dann
48:02 - 48:06

daraufhin besser. Ob das jetzt bei uns
Menschen so funktioniert, ich bin mir
48:06 - 48:12

nicht sicher ob das jemals jemand genauso
gesagt hat. Aber ich glaube im Sinne von,
48:12 - 48:19

dass unser Gehirn optimiert, das wird,
oder das habe ich bestreiten gehört von
48:19 - 48:24

Psychologen. Also die Frage ist nicht so
sehr wie, oder das Problem, dass ich mit
48:24 - 48:27

der Frage habe ist nicht so sehr wie jetzt
das maschienelle Lernen funktioniert,
48:27 - 48:30

sondern wie wir selbst funktionieren. Ich
glaube wir sind gerade auf dem Weg das
48:30 - 48:35

herauszufinden und die Modelle des Machine
Learnings, maschienellen Lernens sind oft
48:35 - 48:39

nur grobe Vereinfachungen dafür wie wir
selbst funktioneren.
48:39 - 48:41

Hendrik: Genau, ich würde auch sagen, es
48:41 - 48:45

ist bio-inspiriert, aber es gab auch eine
Zeit wo alles Maschienen waren, der Körper
48:45 - 48:49

als Maschine. Das ist halt die Metapher
ihrer Zeit. Jetzt haben wir diese
48:49 - 48:52

künstlichen neuronalen Netzwerke und jetzt
sind das die Metaphern, die wir nutzen,
48:52 - 48:56

also ich glaube da ist ein fundamentaler
Unterschied zwischen menschlichem und
48:56 - 48:57

künstlichem Lernen.
48:57 - 49:01

Karen: Ja es gibt auch so einen zentralen
Leitsatz im maschinellen Lernen, der
49:01 - 49:05

besagt, dass alle Modelle falsch sind, und
einige vielleicht nützlich sind. Und ich
49:05 - 49:08

denke das trifft auch auf uns Menschen zu,
alle Modelle die wir verwenden, alle
49:08 - 49:12

Annahmen die wir machen, alle Stereotypen
die wir benutzen, die sind vielleicht
49:12 - 49:17

manchmal nützlich, aber in der Gesamtheit
immer falsch. Ich denke das trifft für
49:17 - 49:25

Menschen und Maschinen zu.
Applaus
49:25 - 49:28

Herald-Angel: Dankeschön. Mikrophon 4,
49:28 - 49:29

deine Frage.
49:29 - 49:37

Mikrophon 4: Vielleicht eine etwas naive
Frage, aber bestehen oder gibt es Metriken
49:37 - 49:44

um diesen Bias, der uns täglich im Netz
begegnet, zu bewerten? Also dass man das
49:44 - 49:49

schon visualisieren kann oder vermitteln
kann, dass man sich in einem hohen Bias
49:49 - 49:56

also einer hohen Verzerrung bewegt oder
auf Glatteis läuft in dem Sinne. Ein hoch
49:56 - 50:04

komplexes Thema wirklich, runtergebrochen
auf eine, ich sag mal, Bewusstbarmachung
50:04 - 50:08

von hoher statistischer Verzerrung, die
einen umgibt.
50:08 - 50:11

Hendrik: Also es gibt durchaus Forschung
50:11 - 50:15

in die Richtung es gibt z.B. die Civic
Media Group am MIT Media Lab die sich mit
50:15 - 50:18

soetwas aueinandersetzt. Das sind aber so
einzelne Beispiele wo sie z.B. Leuten
50:18 - 50:22

einfach mal zeigen, was für einen Gender-
Bias sie bei den Leuten, die sie auf
50:22 - 50:26

Twitter folgen, haben, also die folgen nur
Männern z.B..
50:26 - 50:30

Solche Bewusstbarmachungen sind wichtig
und sind glaube ich auch ein Teil des
50:30 - 50:33

Puzzels, aber ich glaube die
Medienpädagogik muss halt ernstgenommen
50:33 - 50:36

werden, den Leuten muss das bewusst sein
wenn wir diese Dinger benutzen wollen,
50:36 - 50:41

wenn wir in solchen Autos rumfahren
wollen, dann müssen wir das verstehen. Es
50:41 - 50:45

gibt halt immer diese Blindspots und man
kann einfach da nicht darauf eingehen, man
50:45 - 50:47

kann nicht jeden Spot da bedenken vorher.
50:47 - 50:54

Karen: Um die vielleicht Frage zu
kontextualisieren von den Algorithmus-
50:54 - 51:00

Wissenschaftlichen-Blickpunkt. Wir machen
jetzt nicht unbedingt den Unterschied
51:00 - 51:04

zwischen vielleicht dem was eine negative
oder positive Verzerrung ist, also
51:04 - 51:09

wahrgenommen wird, sondern für uns gibt es
halt nur Merkmale die auf gewisse andere
51:09 - 51:14

Merkmale schließen lassen und das führt
dann wieder zu der Frage der Korrelation
51:14 - 51:22

und wenn wir sagen wir haben oft ja
Merkmale die Proxys sind für andere
51:22 - 51:29

Merkmale, also wo ich wohne ist oft proxy
dafür wie ich aussehe oder woher ich
51:29 - 51:32

komme.
Was ich also im Machine Learning machen
51:32 - 51:35

kann, oder wie sich die Wissenschaft damit
auseinandersetzt ist zu sagen, ok, wenn
51:35 - 51:43

ich weiß welche Merkmale sensitiv sind,
also welche ich nicht möchte dass die mein
51:43 - 51:47

System korreliert mit der eigentlichen
Aussage die das System treffen soll, dann
51:47 - 51:54

kann quasi ich in meine Fehlerfunktion
einen extra Term reinspeisen, der sagt du
51:54 - 52:00

dekorrelierst jetzt das Ergebnis was du
hast mit dem besonderen Merkmal was du als
52:00 - 52:06

sensitiv also z.B. der Wohnort oder dein
Bildungsstatus oder dein Einkommen, dass
52:06 - 52:11

die keine Rolle spielen dafür, wie der
Algorithmus Vorraussagen macht.
52:11 - 52:16

Mikrophon 4: Was ich jetzt meinte war
52:16 - 52:20

jetzt wirklich nicht die Unterscheidung
zwischen gut und schlecht, sondern
52:20 - 52:25

wirklich eine Visualisierung, dieser
Datensatz oder dieses Ergebnis basiert auf
52:25 - 52:32

wenigen Datensichten -- klar im Kontext
kompliziert zu bewerkstelligen, aber dass
52:32 - 52:38

man eine Möglichkeit findet sowas
darzustellen dass diese Daten auf einer
52:38 - 52:41

hohen Datendichte basieren und so weiter.
52:41 - 52:46

Hendrik: Unsere Antwort is quasi, es gibt
solche Sachen, es gibt sowas zu messen
52:46 - 52:51

aber es ist immer eine Reduktion von
Komplexität und da verliert man immer was
52:51 - 52:54

und da muss man sich immer bewusst machen,
wie viel reduzieren dürfen wir, wie
52:54 - 52:56

einfach dürfen wir es machen.
52:56 - 53:00

Karen: Zur Frage der Datensichte kann
man vielleicht noch sagen, da ist wieder
53:00 - 53:05

ein andere Kernansatz, der Bayesianische
Kernansatz, der sich jetzt nicht die Frage
53:05 - 53:10

stellt, wie ist meine Hypothese aufgrund
der vorhandenen Daten zu bewerten sondern
53:10 - 53:14

wie sind meine Daten aufgrund der
verwedeten Hypothese zu bewerten. Das ist
53:14 - 53:18

also nochmal eine ganz andere Ansicht auf
die Sache und der wiederum erlaubt uns
53:18 - 53:22

dann gewisse Unsicherheiten auszudrücken
über Vorrausagen, die ich treffe. Also
53:22 - 53:26

wenn jetzt zum Beispiel ein Datenpunkt
über den ich eine Aussage treffen will
53:26 - 53:31

weitab liegt von Daten die ich habe, dann
wird dieser Ansatz oder wenn ich diesen
53:31 - 53:34

Ansatz verwende wird mir dann sagen; über
die Voraussage die ich jetzt treffe bin
53:34 - 53:38

ich sehr unsicher und das ist eine
Forschungsrichtung mit der sich viele
53:38 - 53:44

Leute beschäftigen, die jetzt aber für
diese großen, komplexen Systeme, ich würde
53:44 - 53:46

sagen, noch sehr am Anfang steht.
53:46 - 53:49

Herald-Angel: Mikrofon 1 bitte.
53:49 - 53:53

Mikrofon 1: Danke für den super-
interessanten Vortrag und danke auch an
53:53 - 53:57

die Gebärden-Dolmetscherin, die hier ohne
Unterlass die ganze Zeit übersetzt.
53:57 - 54:10

Applaus
Ich habe folgende Frage: Wie nützlich
54:10 - 54:16

würdet ihr es einschätzen, das mit einer
Qualitätskontrolle also einem
54:16 - 54:21

Qualitätsmeilenstein für das Endergebnis
zu kombinieren. Also als Beispiel; ein
54:21 - 54:27

Auto ist dann hinreichend gut, wenn es im
Verkehr weniger Leute umbringt als ein
54:27 - 54:32

durschnittlicher menschlicher Fahrer oder
sowas. Würde das einen zusätzlichen Nutzen
54:32 - 54:36

ergeben? Kann man daraus noch mehr
Rückschlüsse ziehen, oder sind das völlig
54:36 - 54:37

getrennte Sachen?
54:37 - 54:42

Karen: Also das ist eigentlich genau das
worauf wir hinaus wollten, dass das eine
54:42 - 54:44

politische Frage ist, die wir nicht
beantworten wollen.
54:44 - 54:45

Hendrik: Oder eine juristische.
54:45 - 54:47

Karen: Oder eine juristische, das müsst
54:47 - 54:49

ihr sagen, was ihr richtig findet, das ist
doch nicht unsere Aufgabe zu sagen ...
54:49 - 54:50

Hendrik: Nein also die Gesellschaft muss
54:50 - 54:54

es aushandeln, wir können Probleme
aufzeigen, aber die Antwort muss die
54:54 - 54:55

Gesellschaft als ganzes finden.
54:55 - 54:59

Mikrophon 1: Das ist klar, die Frage ist
nur, wenn man so einen Punkt definiert hat
54:59 - 55:02

und sich dann die Ergebnisse anschauen
würde, die kurz vor und kurz nach diesem
55:02 - 55:06

Punkt aufgetreten sind, ob das
Rückschlüsse zulassen würde auf
55:06 - 55:10

irgendeinen Bias oder irgendwelche anderen
Sachen, oder ob dieser Punkt völlig
55:10 - 55:11

unerheblich für euch wäre.
55:11 - 55:14

Hendrik: Kannst du nochmal den Punkt
benennen?
55:14 - 55:15

Mikrophon 1: Also man definiert
55:15 - 55:21

irgendeinen Punkt x, der ein bestimmtes
Qualitätskriterium hat. Also der Wagen
55:21 - 55:25

bringt eben nicht mehr Menschen um als ein
durchschnittlicher Fahrer sondern weniger.
55:25 - 55:33

Sind die Ergebnisse die um diesen Punkt
liegen, die man dann messen kann. Sind die
55:33 - 55:36

in irgendeiner Art relevant für den
Ausgang, kann man da irgendwelche
55:36 - 55:40

Rückschlüsse daraus ziehen, oder ist das
nur irgendein Punkt, wie jeder andere
55:40 - 55:41

auch?
55:41 - 55:44

Hendrik: Also ich finde das problematisch,
diesen Punkt zu finden, weil man ja auch
55:44 - 55:48

den ganzen Kontext sehen muss bei den
Autounfällen und warum sie passieren, also
55:48 - 55:52

welche Gründe sie haben und das ganze
datafizieren, das in einen Punkt zu
55:52 - 55:56

pressen, und den dann als
Evaluationsmetrik für was anderes
55:56 - 55:59

hochkomplexes zu nehmen halte ich für sehr
problematisch, ich glaube da ist wirklich,
55:59 - 56:02

das meint Karen, die politsche Antwort
wichtiger.
56:02 - 56:05

Karen: Beim konkreten Beispiel von
56:05 - 56:08

selbstfahrenden Autos muss man natürlich
auch sagen, dass es das echte
56:08 - 56:11

selbstfahrende Auto nie üben kann einen
Crash zu haben, also dieses Crash-Szenario
56:11 - 56:14

kann natürlich nie geübt werden, also wir
wollen da ja natürlich niemanden sterben
56:14 - 56:18

lassen oder nicht so viele Autos crashen,
das ist ein bisschen teuer. Das heißt
56:18 - 56:22

Crash-Szenarios werden eigentlich auch
immer nur in der Simulation geübt und das
56:22 - 56:26

ist genau das Problem, dass wir heute --
zumindest soweit ich das weiß -- sehr
56:26 - 56:32

wenige Szenarien haben in denen wir sagen
können; wenn wir jetzt in der Simulation
56:32 - 56:38

geübt haben, was für Annahmen übernehmen
wir denn dann in die echte Welt. Die
56:38 - 56:43

einfach nur benennen zu können würde uns
ja schon helfen eventuelle Fehlerszenarien
56:43 - 56:47

vorrauszusagen, aber selbst das Benennen
dieser Annahmen das fällt uns ja selbst
56:47 - 56:52

schon schwer, also das ist noch ein weiter
Weg.
56:52 - 56:54

Herald-Angel: Mikro 1
56:54 - 56:59

Mikrofon 1: Auch vielen Dank für den
56:59 - 57:06

Vortrag. Die ganze Diskussion über die
Biase, die ihr ja getrieben habt, besagt
57:06 - 57:09

ja letztlich, dass es darum geht die
Wahrheit zu finden, Wahrheit und letztlich
57:09 - 57:13

eine Stichprobe der Wahrheit dem Computer
zum Lernen zu geben und das bringt mich
57:13 - 57:17

dann zu der Parallele in der Wissenschaft
haben wir das ja auch, also wie sieht
57:17 - 57:21

meine Stichprobe aus, die ideale
Stichprobe, oder ist da ein Bias drin.
57:21 - 57:26

Habt ihr diese Parallele schonmal
gedanklich gezogen oder ist das ... ja.
57:26 - 57:28

Hendrik: Also wir sind ja Wissenschaftler
57:28 - 57:32

und wir müssen natürlich auch erstmal für
uns wissen, ob was wir herasugefunden
57:32 - 57:36

haben, gerade wenn wir mit Menschen
arbeiten, wir hatten ja gestern auch den
57:36 - 57:42

Vortrag "Science is broken", der da
irgendwie, also es ist immer schwierig die
57:42 - 57:46

richtige Samplesize zu haben um die
Effectsize zu berücksichtigen, um zu
57:46 - 57:49

wissen, dass man was weiß, das sind ja
epistemische Fragen.
57:49 - 57:50

Mikrophon 1: Aber gibt's da irgendwie
57:50 - 57:54

schon für neuronale Netze irgendwelche
Richtwerte, dass man dann irgendwie weiß.
57:54 - 57:59

Weil in der Psychologie lernt man, dass
die Sampelsize muss mindestens 5.000 Bla
57:59 - 58:02

betragen, keine Ahnung, oder so und so
Prozente. Gibt's Richtwerte, gibt's sowas
58:02 - 58:07

schon für neuronale Netze? In Abhängigkeit
der Layer oder der Parameter oder..?
58:07 - 58:10

Hendrik: Nicht dass ich wüsste, weisst du
58:10 - 58:11

was?
58:11 - 58:14

Karen: Die Frage geht jetzt vielleicht ein
bisschen tief. Für frühe Systeme, also
58:14 - 58:23

sehr einfache neuronale Netze, die aus den
Anfang der 90ern, so wie Boltzmann-machines oder
58:23 - 58:29

Hofman-Networks. Für solche Sachen kann
man sagen, wenn die Saturieren und mit
58:29 - 58:35

wievielen Bits an Daten man da reingeht
bis die Saturieren. Für aber diese hoch-
58:35 - 58:41

nicht-linearen Systeme, die wir jetzt
verwenden, kann man das nicht sagen, oder
58:41 - 58:47

nur asymptothisch sagen. Es gibt viel
Forschung zu dem Thema, aber nichts, was
58:47 - 58:51

jetzt besonders handfest wäre; sagen wir
mal so. Oder man jetzt im echten Leben
58:51 - 58:52

verwenden könnte.
58:52 - 58:56

Mikrophon 1: Ja gut, dann irgendwie so
eine Ausage zu haben, so und so viele
58:56 - 58:59

Testdatensampels brauchst du für dein
neuronales Netz, wenn das so und so
58:59 - 59:03

strukturiert ist. Irgendwie, das könnte
vielleicht eine Form von Verifikation oder
59:03 - 59:06

Validierung, Pre-Validierung bringen,
irgendwie.
59:06 - 59:08

Hendrik: Ja, das macht man ja. Man hat ja
59:08 - 59:12

einen großen Datensatz, einen
Trainingsdatensatz, einen Testdatensatz
59:12 - 59:16

und einen Validierungsdatensatz, mit dem
man dann nochmal guckt, was haben wir
59:16 - 59:19

wirlich gelernt und haben wir nicht
einfach nur die Eigenheiten des
59:19 - 59:22

Datensatzes auswendig gelernt. Haben wir
wirklich generalisiert. Also auf dem
59:22 - 59:26

Niveau passiert das schon. Auf dem höheren
Niveau wäre das bestimmt noch eine
59:26 - 59:28

hervorragende Doktorarbeit.
59:28 - 59:30

Herald-Angel: Mikro 5, deine Frage?
59:30 - 59:37

Mikrofon 5: Vielen Dank für den Vortrag.
Meine Frage ist: Diese Biases, die sind ja
59:37 - 59:41

jetzt nicht neu, die kennt man ja seit
Dekaden in der Statistik. Was hat sich
59:41 - 59:47

denn mit der künstlichen Intelligenz, bzw.
mit Deep Learning geändert? Und daran
59:47 - 59:52

anschließend: Kennt ihr irgendwelche
Studien, dass solche Filterblasen wirklich
59:52 - 59:55

irgendwelche tatsächlichen messbaren
Auswirkungen haben? Weil man hört
59:55 - 60:00

unglaublich viel in den Medien, aber mir
ist keine belastbare Studie bekannt, die
60:00 - 60:06

sagt, dass das da tatsächlich was
verschlimmert wird, was nicht vorher schon
60:06 - 60:07

da war.
60:07 - 60:11

Hendrik: Ich hab die erste Frage schon
wieder vergessen. Kannst du einmal noch
60:11 - 60:12

die erste sagen?
60:12 - 60:17

Mikrophon 5: Die erste Frage war, was sich
geändert hat, weil diese Biases, die sind
60:17 - 60:18

ja jetzt nicht neu.
60:18 - 60:21

Hendrik: Genau, nein, die sind natürlich
nicht neu. Und die ganzen Vorurteil sind
60:21 - 60:24

auch nicht neu. Ich glaube, es wird halt
einfach sehr, sehr viel Machine Learning
60:24 - 60:28

gerade benutzt. Auch aus sehr guten
Gründen. Also, z.B. es gibt hervoragende
60:28 - 60:32

Python Bibliotheken, es gibt hervoragende
R Bibliotheken, die das super einfach
60:32 - 60:37

machen. Die Unis lehren das fast überall.
Data Science ist der große Hypeterm, und
60:37 - 60:40

das wird einfach nur nochmal drängender,
weil Leute diese Sachen jetzt auf einmal
60:40 - 60:44

in ihre Systeme reinschmeißen, die
benutzen, um vielleicht Geld zu verdienen,
60:44 - 60:50

sich aber dann dieser Probleme gar nicht
bewusst sind. Und zur 2. Frage: Ich bin
60:50 - 60:53

mir ziemlich sicher, dass es viel zu
Echokammern gibt. Ich weiß nicht, was du
60:53 - 60:57

gefragt hast, ob man das wirklich auch
wissenschaftlich so testen kann? Also, wie
60:57 - 61:02

da quasi der Versuchsaufbau aussähe? Aber
es gibt, auch gerade in der Soziologie,
61:02 - 61:10

viel zu Echokammern. Aber mir fällt gerade
kein Autor ein dazu.
61:10 - 61:13

Herald-Angel: Vielen Dank für den Vortrag.
61:13 - 61:16

Ich sehe, dass da noch Fragen sind, aber
leider ist die Zeit rum. Seid ihr noch da?
61:16 - 61:17

Können die Leute euch noch ansprechen?
61:17 - 61:18

Hendrik: OK.
61:18 - 61:20

Herald-Angel: Super. Vielen, vielen Dank!
61:20 - 61:24

Applaus
61:24 - 61:43

Untertitel erstellt von c3subtitles.de
im Jahr 2018. Mach mit und hilf uns!

Title:: 34C3 - Beeinflussung durch Künstliche Intelligenz
Description:: more » « less
Video Language:: German
Duration:: 01:01:44

	C3Subtitles edited German subtitles for 34C3 - Beeinflussung durch Künstliche Intelligenz
	EEriksen edited German subtitles for 34C3 - Beeinflussung durch Künstliche Intelligenz
	Maximilian Marx edited German subtitles for 34C3 - Beeinflussung durch Künstliche Intelligenz
	Maximilian Marx edited German subtitles for 34C3 - Beeinflussung durch Künstliche Intelligenz
	duco edited German subtitles for 34C3 - Beeinflussung durch Künstliche Intelligenz
	C3Subtitles edited German subtitles for 34C3 - Beeinflussung durch Künstliche Intelligenz

German subtitles

Revisions

Revision 6 Edited

C3Subtitles

34C3 - Beeinflussung durch Künstliche Intelligenz

Revisions

Our website uses cookies

Operating cookies (Required)