1
00:00:00,140 --> 00:00:14,856
Intro Musik
2
00:00:14,856 --> 00:00:18,720
Herald: Ihr findet das ja wahrscheinlich
alle völlig normal mit großen Datenmengen
3
00:00:18,720 --> 00:00:23,710
umzugehen. So Typen wie ich, die
herkömmliche Journalisten sind, ich bin im
4
00:00:23,710 --> 00:00:27,339
Hauptberuf Hörfunkjournalist, die
verzweifeln regelmäßig daran. Also wir
5
00:00:27,339 --> 00:00:30,790
haben gelernt, damals, Leute zu fragen,
die sich mit irgendwas auskennen.
6
00:00:30,790 --> 00:00:33,012
Jetzt ist Leute fragen,
die sich mit großen
7
00:00:33,012 --> 00:00:34,890
Datenmengen auskennen auch nicht unbedingt
8
00:00:34,890 --> 00:00:39,800
zielführend für unserein, dafür gibts aber
neuerdings einen relativ frischen Beruf,
9
00:00:39,800 --> 00:00:43,800
dieser Beruf nennt sich Datenjournalist.
Datenjournalisten sind diese Menschen, die
10
00:00:43,800 --> 00:00:47,140
aus aberwitzig großen Datenmengen
Zusammenhänge rauspopeln und diese
11
00:00:47,140 --> 00:00:49,900
Zusammenhänge dann idealerweise auch noch
so visualisieren,
12
00:00:49,900 --> 00:00:51,610
dass solche Noobs wie ich das dann
13
00:00:51,610 --> 00:00:54,679
auch verstehen und hinterher
kompetent drüber reden können, oder
14
00:00:54,679 --> 00:00:57,829
jedenfalls so aussehen können, als würden
sie kompetent drüber reden und einer der
15
00:00:57,829 --> 00:01:01,740
so Leute wie uns sehr dabei unterstützt,
ist Datenjournalist. Das ist nämlich der
16
00:01:01,740 --> 00:01:06,341
Michael Kreil und seinen Vortrag seht ihr
jetzt. Viel Spaß.
17
00:01:06,341 --> 00:01:16,880
Applaus
Michael: Guten Morgen. Ihr habt gut
18
00:01:16,880 --> 00:01:23,209
geschlafen, ich nicht, weil erstens halte
ich jetzt einen Vortrag vor vielen Leuten
19
00:01:23,209 --> 00:01:27,010
und zum anderen werde ich mich in ein--
mit einem Thema beschäftigen, das zu sehr
20
00:01:27,010 --> 00:01:30,640
hitzigen Debatten und Shitstorms geführt
hat und da möchte ich auch nicht im
21
00:01:30,640 --> 00:01:36,860
Zentrum sein. Deswegen ist auch meine
erste Folie der Disclaimer. Ich würde mich
22
00:01:36,860 --> 00:01:40,840
politisch als links einordnen. Ich
distanziere mich hiermit ausdrücklich
23
00:01:40,840 --> 00:01:44,950
gegen jegliche Form von Rassismus,
Sexismus, Antisemitismus,
24
00:01:44,950 --> 00:01:48,430
Fremdenfeindlichkeit, Islamfeindlichkeit
und allgemein gegen jede Form von
25
00:01:48,430 --> 00:01:56,929
gruppenbezogener Menschlichkeit (Applaus)
- Menschenfeindlichkeit. Und im Rahmen
26
00:01:56,929 --> 00:02:00,229
dieses Vortrags bin ich Wissenschaftler
und Beobachter einer hitzigen
27
00:02:00,229 --> 00:02:04,080
Gesellschaftsdebatte und sehe mich somit
der Neutralität verpflichtet. Ich möchte
28
00:02:04,080 --> 00:02:07,800
die Debatte beobachten und nicht Teil von
ihr sein. Es geht also nicht um meine
29
00:02:07,800 --> 00:02:12,080
politische Position sondern um eine
neutrale Analyse von Daten. Und dafür habe
30
00:02:12,080 --> 00:02:17,090
ich mal 150 Folien vorbereitet. Ich hab
den Übersetzungsengeln schon Bier
31
00:02:17,090 --> 00:02:23,030
versprochen. Ähm ... genau, dann lass uns
direkt reinschmeißen. Das erste ist die
32
00:02:23,030 --> 00:02:27,590
Methodik. Das möchte ich gerne nochmal
vorher erzählen, damit die Leute auch
33
00:02:27,590 --> 00:02:31,658
wissen, wie es funktioniert und mir ist es
auch wichtig, dass es reproduzierbar ist.
34
00:02:31,658 --> 00:02:37,850
Es gibt ne Twitter-API, in der man Status
und Tweets abfragen kann,
35
00:02:37,850 --> 00:02:40,946
User abfragen kann,
welche Listen veröffentlicht wurden.
36
00:02:40,946 --> 00:02:43,740
Man kann danach suchen,
gucken, welche Follower sie haben
37
00:02:43,740 --> 00:02:47,164
und so weiter und so fort. Dann
setzt man sich hin und dann baut man sich
38
00:02:47,164 --> 00:02:50,650
son Interface für die API, wenn man
sich ein bisschen Mühe gibt, packt man
39
00:02:50,650 --> 00:02:54,430
auch noch einen Cache dazwischen. Das
heißt wenn ich Anfragen an die Twitter-API
40
00:02:54,430 --> 00:02:57,780
stelle und eine Anfrage kommt
zweimal, dann holt er sie aus der
41
00:02:57,780 --> 00:03:02,629
Datenbank und so weiter. Und wenn man sich
richtig Mühe gibt und vielleicht auch ein
42
00:03:02,629 --> 00:03:07,730
paar Tage oder Wochen investiert, dann
skaliert man das in einer Art und Weise,
43
00:03:07,730 --> 00:03:11,770
dass man nicht ein Interface hat, sondern
ganz viele und jedes Einzelne davon steht
44
00:03:11,770 --> 00:03:15,710
für einen anderen Twitter-Nutzer. Die Idee
ist, dass ich nicht als einzelner Nutzer
45
00:03:15,710 --> 00:03:19,489
abfrage, sondern ganz viele Nutzer können
parallel die Twitter-API abfragen. Und
46
00:03:19,489 --> 00:03:25,909
darüber gibt es so eine Art Load-Balancer,
der guckt ob-- sozusagen, wie die Last
47
00:03:25,909 --> 00:03:30,650
verteilt wird. Ziel der Aktion ist, die
Twitter API ist nämlich limitiert. Ich
48
00:03:30,650 --> 00:03:34,439
kann wenn ich zum Beispiel wissen möchte,
wer wie wem folgt, darf ich pro Minute
49
00:03:34,439 --> 00:03:39,940
durchschnittlich nur eine Anfrage stellen.
Wenn aber ich von ganz vielen Leuten die
50
00:03:39,940 --> 00:03:44,470
Autorisierung habe, in deren Namen
Anfragen zu stellen, darf ich entsprechend
51
00:03:44,470 --> 00:03:48,470
mehr Anfragen stellen. Das ist so eine Art
demokratischer Prozess, finde ich da drin,
52
00:03:48,470 --> 00:03:53,970
dass die Ressourcen von Twitter aufgeteilt
werden. Umso mehr Leute mich bei meiner
53
00:03:53,970 --> 00:03:58,010
API-Anfrage unterstützen, um so mehr
Anfragen darf ich machen und umso mehr
54
00:03:58,010 --> 00:04:02,409
Last darf ich verursachen. Finde ich sehr
spann-- sympathisch. Mein Kollege jetzt
55
00:04:02,409 --> 00:04:06,360
hat dann mal ein Interface aufgebaut, wo
man einen Token spenden kann. Da klickt
56
00:04:06,360 --> 00:04:10,120
man da halt drauf und dann kriegt man--
kriegen wir sozusagen einen langen Code,
57
00:04:10,120 --> 00:04:13,840
der uns dann ermöglicht zusätzliche
Anfragen an die API von Twitter zu
58
00:04:13,840 --> 00:04:18,880
stellen. Großes Danke geht hier nochmal an
Logbuch Netzpolitik, insbesondere Tim und
59
00:04:18,880 --> 00:04:23,460
Linus, und natürlich an die fast 700
Spender und Spenderinnen, die uns Tokens
60
00:04:23,460 --> 00:04:29,110
zur Verfügung gestellt haben. Das war not-
wendig, um große Datenmengen aus Twitter
61
00:04:29,110 --> 00:04:33,486
herauszuholen. Genau, damit kann ich dann
sozusagen ...
62
00:04:33,486 --> 00:04:41,870
Applaus
Schon bei mir zu Hause kann ich dann über
63
00:04:41,870 --> 00:04:46,390
Kabel Deutschland 10 Requests pro Sekunde
absetzen, mal zum Vergleich, wenn ich
64
00:04:46,390 --> 00:04:50,550
jetzt zum Beispiel mal die Metadaten aller
330 Millionen Twitter-Accounts abfragen
65
00:04:50,550 --> 00:04:55,530
möchte, braucht man etwa vier Tage dafür.
Das ist dann auch machbar, ohne die Tokens
66
00:04:55,530 --> 00:04:59,890
kann es sich um Monate oder sogar um Jahre
handeln. Das mal so ein bisschen erklärt,
67
00:04:59,890 --> 00:05:04,100
technisch, wie das im Hintergrund
funktioniert. Im Prinzip auch sehr stark
68
00:05:04,100 --> 00:05:10,110
auf Twitter fokussiert, die Analysen.
Genau. Erstes Thema, Fake News. Fake News
69
00:05:10,110 --> 00:05:14,730
ist ein komplexes Thema. Ich habe jetzt
mal eine Grafik übernommen von der
70
00:05:14,730 --> 00:05:18,550
Stiftung Neue Verantwortung, ich finde die
haben da die besten Kategorisierungen
71
00:05:18,550 --> 00:05:23,290
gemacht, was Fake News sind und was Fake
News nicht sind. Auf der linken Seite was
72
00:05:23,290 --> 00:05:27,260
nicht Fake News sind, ist schlechte
Politik, also Fake News als politischer
73
00:05:27,260 --> 00:05:31,550
Kampfbegriff, zum Beispiel Trump gegen die
New York Times oder so was, aber auch
74
00:05:31,550 --> 00:05:35,581
Satire sind keine Fake News, schlechter
Journalismus, Clickbaiting oder auch
75
00:05:35,581 --> 00:05:41,070
Zeitungsenten sollen eigentlich nicht zu
Fake News gezählt werden, Fake News sein--
76
00:05:41,070 --> 00:05:49,760
oder sind gezielte Desinformation, falsch
verstandene Inhalte und manipulierte
77
00:05:49,760 --> 00:05:53,320
Inhalte, also oft sieht man, dass zum
Beispiel Bilder beschnitten sind oder
78
00:05:53,320 --> 00:06:00,100
retuschiert sind und so weiter oder völlig
frei erfundene Inhalte. Ich habe leider
79
00:06:00,100 --> 00:06:03,780
nur ne Stunde Zeit, deswegen kann ich
mich jetzt nicht mit mehreren Fake News-
80
00:06:03,780 --> 00:06:07,420
Wellen auseinandersetzen. Deswegen habe
ich eine herausgenommen, die ich ganz
81
00:06:07,420 --> 00:06:14,241
typisch und eindrucksvoll fand und zwar
die Fake News über eine Reisewarnung nach
82
00:06:14,241 --> 00:06:19,270
Schweden des Auswärtigen Amtes. Hier ist
ein Tweet von der AfD Magdeburg, die sagt:
83
00:06:19,270 --> 00:06:22,780
„Das Auswärtige Amt - Erhöhte
Terrorwarnstufe für Schweden. Das hat
84
00:06:22,780 --> 00:06:26,640
natürlich nichts mit irgendwas zu tun.
Hashtag AfD wählen". Direkt danach-- naja
85
00:06:26,640 --> 00:06:32,700
nicht direkt danach, einige Stunden oder
Tage später kam ein Tweet des Auswärtigen
86
00:06:32,700 --> 00:06:37,000
Amtes, die dann die Gegendarstellung
veröffentlicht haben: „Es gibt keine
87
00:06:37,000 --> 00:06:42,360
Reisewarnung für Schweden. Hashtag Fake
News". Fast 2000 Tweets wurden zu diesem
88
00:06:42,360 --> 00:06:46,290
Thema veröffentlicht und die kann ich
jetzt nun mit diesem Twitter-Framework
89
00:06:46,290 --> 00:06:51,340
runterladen, analysieren und mir ein paar
Visualisierungen dazu ausdenken. Ich hab
90
00:06:51,340 --> 00:06:56,750
mal die Eine gemacht, das ist jetzt ein
Zeitstrahl. Auf der x-Achse sieht man die
91
00:06:56,750 --> 00:07:03,641
Zeit. Hier geht's vom 2. März bis zum-- 0
Uhr bis zum 9. März 0 Uhr. Oben, die
92
00:07:03,641 --> 00:07:08,140
Roten, das sind die Fake News-Verbreiter.
Unten, das sind diejenigen, die die
93
00:07:08,140 --> 00:07:11,962
Gegendarstellungen verbreiten. Auf dem
Zeitstrahl sind -- viel zu klein, das kann
94
00:07:11,962 --> 00:07:15,632
man jetzt drauf nicht sehen -- der
Zeitpunkt, wann ein Tweet veröffentlicht
95
00:07:15,632 --> 00:07:17,310
wurde und wenn er retweetet wurde,
96
00:07:17,310 --> 00:07:18,840
kriegt er sozusagen
einen Bogen,
97
00:07:18,840 --> 00:07:20,940
zu dem Zeitpunkt,
wohin er retweetet wurde.
98
00:07:20,940 --> 00:07:21,890
Das hat den Vorteil,
99
00:07:21,890 --> 00:07:23,450
dass ich nicht nur
sehe, wie viele Tweets
100
00:07:23,450 --> 00:07:25,180
veröffentlicht wurden,
sondern auch sehen kann,
101
00:07:25,180 --> 00:07:26,800
welchen Impact dieser Tweet hat.
102
00:07:26,800 --> 00:07:28,970
Wenn er also, zum Beispiel
veröffentlicht wird und keiner
103
00:07:28,970 --> 00:07:32,560
geht damit um, dann ist es halt nur ein
Punkt, aber wenn es viele Leute retweeten,
104
00:07:32,560 --> 00:07:38,800
gibts dann halt große Bögen dazu. Das--
Den ersten Tweet, den ich finden konnte,
105
00:07:38,800 --> 00:07:44,180
zu der Fake News, dass es eine
Reisewarnung nach Schweden gibt, war-- ist
106
00:07:44,180 --> 00:07:49,100
bereits am 28. September veröffentlicht
worden, wurde aber nicht beachtet. Keine
107
00:07:49,100 --> 00:07:55,180
Favs, keine Retweets, obwohl der Account
aktuell 481 Follower hat. Am--, im Februar
108
00:07:55,180 --> 00:08:01,960
gab es dann nochmal einen Tweet dazu. Der
Account hat jetzt aber nur einen Follower
109
00:08:01,960 --> 00:08:05,520
und der Tweet hat keine Retweets. Das
heißt also die Themen kamen schon mal
110
00:08:05,520 --> 00:08:11,650
vorher hoch, aber sie wurden nicht
weitergetragen. Noch ein Beispiel aus dem
111
00:08:11,650 --> 00:08:16,850
1. März 2017. Also jetzt gehen wir mal
rüber zu unserem Zeitstrahl, da gibt's
112
00:08:16,850 --> 00:08:24,570
dann den ersten, der dazu was twittert,
einen Screenshot von einem Bot, der
113
00:08:24,570 --> 00:08:29,540
Reisewarnungen veröffentlicht. Der Tweet
hat immerhin 6 Tweets und 6 Favs-- 6
114
00:08:29,540 --> 00:08:38,200
Retweets und 6 Favs erreicht und hat damit
sozusagen den ersten kleinen Impact. Dann
115
00:08:38,200 --> 00:08:43,970
steigert es sich immer mehr, dann gibt's
die Reisewarnung für Schweden mit 29
116
00:08:43,970 --> 00:08:48,460
Retweets. Der nächste Tweet, kann ich
leider nicht mehr anzeigen, weil der
117
00:08:48,460 --> 00:08:52,330
Account inzwischen gesperrt wurde, das ist
auch ein Phänomen, das man immer wieder
118
00:08:52,330 --> 00:08:56,311
sieht, dass in diesem Bereich Accounts
gesperrt werden von Twitter. „Trump hatte
119
00:08:56,311 --> 00:09:02,440
recht, Auswärtiges Amt gibt Reisewarnung
für Schweden heraus". Genau, und verweist
120
00:09:02,440 --> 00:09:11,380
auf einen Artikel von zuerst.de. 45
Retweets und es steigert sich immer mehr.
121
00:09:11,380 --> 00:09:20,700
„Doch nicht alles ruhig in Schweden".
Holger Ewald. „Islamterror". Und dann zum
122
00:09:20,700 --> 00:09:25,630
Schluss die AfD Magdeburg mit--, die dann
aufspringt und dann das erste AfD-Hashtag
123
00:09:25,630 --> 00:09:29,490
dran setzt und „Multikulturell scheint es
nicht so richtig zu laufen in Schweden".
124
00:09:29,490 --> 00:09:33,330
Man sieht, dass es eine Steigerung gibt
von fängt an mit Reisehinweisen und endet
125
00:09:33,330 --> 00:09:40,000
mit Islamterror. Ich springe jetzt mal
ganz weit nach vorne zu den Antworten.
126
00:09:40,000 --> 00:09:44,370
Diejenigen, die also dann die
Gegendarstellung veröffentlichen, da
127
00:09:44,370 --> 00:09:48,850
fing's, oder der Startschuss war da das
Auswärtige Amt, die in einem-- die dann
128
00:09:48,850 --> 00:09:54,080
erklären, dass es sich um Fake News
handelt und relativ schnell springen dann
129
00:09:54,080 --> 00:10:00,560
halt auch die Medien mit auf, die das
sozusagen weiterverbreiten. Und zum
130
00:10:00,560 --> 00:10:06,630
Schluss sieht man den gesamten Zeitstrahl
nochmal und das Interessante ist dabei,
131
00:10:06,630 --> 00:10:10,960
dass das Thema gar nicht sozusagen, dass
ne Fake News veröffentlicht wird und dann
132
00:10:10,960 --> 00:10:14,750
schlägt die total ein und alle sind total
empört, sondern man stottert sich
133
00:10:14,750 --> 00:10:18,710
sozusagen förmlich in die Fake News rein.
Also es fängt klein an und dann werden sie
134
00:10:18,710 --> 00:10:24,870
nochmal weiter überspitzt und man hat eher
den Eindruck, als ob da rumexperimentiert
135
00:10:24,870 --> 00:10:29,790
wird, bis das Netzwerk eine Resonanz
hervorruft. Ich würde persönlich
136
00:10:29,790 --> 00:10:34,030
behaupten, Fake News sind eigentlich Meme,
die sich im Internet verbreiten. Oft
137
00:10:34,030 --> 00:10:39,180
haben sie keine singuläre Quelle, sondern
sie bilden sich erst im Netzwerk oder
138
00:10:39,180 --> 00:10:43,120
anders formuliert, das Kern-Phänomen an
Fake News ist nicht deren Existenz,
139
00:10:43,120 --> 00:10:46,831
sondern, dass sie sich so gut verbreiten
können, also das Problem ist nicht die
140
00:10:46,831 --> 00:10:52,880
Quelle, die sie erzeugt, sondern dass sie
eine so große Resonanz im Netzwerk findet.
141
00:10:52,880 --> 00:10:57,500
Würde man also Fake-News-Quellen
verbieten, würden sie trotzdem weiterhin
142
00:10:57,500 --> 00:11:02,271
entstehen, im Netzwerk. Und das ist halt
wichtig, da Fake News als Meme eine große
143
00:11:02,271 --> 00:11:06,350
Reichweite haben, kann man aus ihnen
Kapital schlagen, politisches oder
144
00:11:06,350 --> 00:11:10,290
monetäres Kapital. Und da möchte ich mal
aus dem amerikanischen Raum, zum Beispiel
145
00:11:10,290 --> 00:11:15,680
Breitband News und-- Breitbart News und
Trump erwähnen, die monetäres Kapital oder
146
00:11:15,680 --> 00:11:20,280
politisches Kapital daraus schlagen. Aber
zurück zu den Reisewarnungen. Man kann
147
00:11:20,280 --> 00:11:25,970
sie nicht nur im zeitlichen Verlauf sich
anschauen, sondern man kann tiefer
148
00:11:25,970 --> 00:11:29,380
einsteigen. Man kann halt gucken, welche
Accounts haben denn jetzt die
149
00:11:29,380 --> 00:11:33,500
Gegendarstellungen und die Fake News
verbreitet und kann gucken, wie die sich
150
00:11:33,500 --> 00:11:41,990
gegenseitig folgen. Und daraus baut man
dann so ein Netzwerk. Die Blauen sind die
151
00:11:41,990 --> 00:11:47,000
Gegendarstellungensverbreiter und die
Roten sind die Fake-News-Verbreiter. Um so
152
00:11:47,000 --> 00:11:51,060
näher sie grafisch dargestellt werden,
umso also-- folgen die sich. Also
153
00:11:51,060 --> 00:11:54,890
sozusagen, alle Kugel stoßen sich ab und
die, die sich folgen, ziehen sich an und
154
00:11:54,890 --> 00:11:58,570
daraus kann man halt solche komplexen
Netzwerke grafisch darstellen. Das
155
00:11:58,570 --> 00:12:03,060
Interessante ist, dass die Fake-News-
Verbreiter sich in einer Gruppe fast
156
00:12:03,060 --> 00:12:10,440
außerhalb befinden und eigentlich nur noch
über die Massenmedien verbunden sind mit
157
00:12:10,440 --> 00:12:14,860
der Gesellschaft. Man sieht natürlich
auch noch Tendenzen, dass viele Fake-News-
158
00:12:14,860 --> 00:12:18,280
Verbreiter dann mit Lügenpresse usw.
versuchen sich weiter von diesen--
159
00:12:18,280 --> 00:12:23,080
von den Medien zu distanzieren. Aber
tatsächlich sind es zwei verschiedene
160
00:12:23,080 --> 00:12:28,840
Gruppen, die man hier sehen kann und das
erste Mal, als ich das Bild gesehen habe,
161
00:12:28,840 --> 00:12:32,310
habe ich gedacht: "Oh, das ist eine
Filterblase oder eine Echokammer oder
162
00:12:32,310 --> 00:12:37,930
sowas." Das Schöne ist, weil wir mit
Twitter-APIs tiefer in die Daten rein-
163
00:12:37,930 --> 00:12:44,310
gucken können, können wir von jedem ein--
die die Timeline rekonstruieren. Also ich
164
00:12:44,310 --> 00:12:49,800
hab jetzt mal so schematisch dargestellt
die Gegendarsteller und die Fake-News-
165
00:12:49,800 --> 00:12:55,830
Verbreiter und man sieht, dass von den
Fake-News-Verbreitern 89% die
166
00:12:55,830 --> 00:13:00,980
Gegendarstellungen mitbekommen haben, aber
sie nicht weiter teilen. Und nur 45%
167
00:13:00,980 --> 00:13:04,020
derjenigen, die die Gegendarstellung
verbreitet haben, haben
168
00:13:04,020 --> 00:13:07,710
die tatsächliche ursprüngliche Fake News
eigentlich mitbekommen. Das Ergebnis
169
00:13:07,710 --> 00:13:14,211
daraus ist, es gibt eine Filterblase und
zwar bekommen wir die Fake News nicht mit.
170
00:13:14,211 --> 00:13:18,400
Gelächter
Was ist jetzt eigentlich tatsächlich
171
00:13:18,400 --> 00:13:23,220
dieser Impact dieser Gruppe. Und dann
hab' ich ganz ganz schweres Geschütz
172
00:13:23,220 --> 00:13:27,780
aufgefahren und habe 1,6 Millionen
Twitter-Accounts, die angegeben haben,
173
00:13:27,780 --> 00:13:31,780
dass sie Deutsch sprechen, extrahiert und
geguckt, wie die sich gegenseitig folgen.
174
00:13:31,780 --> 00:13:35,670
Also ähnlich wie diese Filterblasengrafik
gerade sieht man hier jetzt das gesamte
175
00:13:35,670 --> 00:13:39,432
deutschsprachige Twitternetzwerk,
eingefärbt nach Herkunftsland. Also hier
176
00:13:39,432 --> 00:13:43,090
unten haben wir die Schweiz und da haben
wir Österreich, wenn man ein bisschen
177
00:13:43,090 --> 00:13:45,589
klickt, sieht man das so wer
sich dahinter befindet.
178
00:13:45,589 --> 00:13:46,836
Und das Schöne ist, ...
179
00:13:46,836 --> 00:13:50,090
das ist son Tool was ich gebastelt habe
Man kann das unterschiedlich einfärben.
180
00:13:50,090 --> 00:13:54,160
Hier kann man zum Beispiel
mal das Alter des Accounts einfärben. Rot
181
00:13:54,160 --> 00:13:57,810
sind die alten, grün sind die eher
neueren Accounts. Hier oben sind die
182
00:13:57,810 --> 00:14:02,770
Jugendlichen, da ist viel Justin Bieber
und YouTube und Let's Play dabei. Hier
183
00:14:02,770 --> 00:14:09,120
haben wir eine Blase, die sich mit Porn
beschäftigt (Lachen), nicht drauf klicken.
184
00:14:09,120 --> 00:14:13,470
Hier haben wir eine Gruppe, die sich mit
Marketing beschäftigt, so würde ich das
185
00:14:13,470 --> 00:14:19,350
mal umschreiben, größtenteils SEO und
keine Ahnung was. Und das sind die Leute,
186
00:14:19,350 --> 00:14:23,320
die sich eigentlich mit Politik und Medien
beschäftigen und vielleicht auch die, die
187
00:14:23,320 --> 00:14:26,750
jetzt hier auch hier im Raum auf Twitter
sind, wahrscheinlich am meisten
188
00:14:26,750 --> 00:14:32,220
mitbekommen. Man kann aber diese Grafik
auch anders einfärben und zwar kann ich
189
00:14:32,220 --> 00:14:38,880
mal einfärben, welche
Bundestagsabgeordneten oder Kandidaten von
190
00:14:38,880 --> 00:14:42,571
Parteien wo sich in diesem Netzwerk
befinden und entsprechend einfärben. Und
191
00:14:42,571 --> 00:14:48,460
man sieht zum Beispiel Gelb FDP, Schwarz,
Rot, Grün, Blau, Rot, Grün befinden sich
192
00:14:48,460 --> 00:14:53,541
alle so in einer verteilten Gruppe und es
gibt eine sehr enge Gruppe aus Leuten, die
193
00:14:53,541 --> 00:14:59,390
Mitglieder der AfD sind und auf Twitter
aktiv sind. Ich vergrößer das mal so ein
194
00:14:59,390 --> 00:15:03,030
bisschen. Und jetzt verändere ich wieder
diese Färbung und zwar als erstes
195
00:15:03,030 --> 00:15:06,815
die Fake-News-Verbreiter. Ja.
Gelächter
196
00:15:06,815 --> 00:15:15,029
Der Witz ist.
Applaus
197
00:15:15,029 --> 00:15:18,630
Der Witz ist, dass es nicht die AfD-
Abgeordneten selber sind, die das Fake-
198
00:15:18,630 --> 00:15:22,540
News verbreiten, aber sie befinden sich in
einer gleichen Gruppe da drin. Man kann
199
00:15:22,540 --> 00:15:26,590
auch einfärben nach Alter. Man sieht, dass
die Accounts dieser Gruppe eher jung sind,
200
00:15:26,590 --> 00:15:31,820
also relativ frisch auf Twitter. Sie haben
eine sehr hohe Aktivität. Rot heißt viele
201
00:15:31,820 --> 00:15:35,410
Tweets pro Tag veröffentlicht werden.
Und man kann von dieser Gruppe auch
202
00:15:35,410 --> 00:15:40,190
schauen, welche typischen Begriffe sie
verwenden, um zu vergleichen, mit was das
203
00:15:40,190 --> 00:15:44,161
restliche Twitter-Netzwerk für Begriffe
verwendet. Und die Begriffe, die am
204
00:15:44,161 --> 00:15:47,920
häufigsten in dieser Gruppe verwendet
werden, im Vergleich zu anderen
205
00:15:47,920 --> 00:15:52,430
Twitter-Accounts, sind Islam, Deutschland,
Migranten, Merkel, Maas, Politik,
206
00:15:52,430 --> 00:15:56,990
Freiheitskampf, Flüchtlinge, SPD,
Netzdurchsetzungsgesetz, NPD, Antifa,
207
00:15:56,990 --> 00:16:02,910
Zensur, PEGIDA, Syrer, Asylbewerber. Man
sieht relativ klar, dass diese Gruppe auch
208
00:16:02,910 --> 00:16:07,890
eher monothematisch unterwegs ist. Also,
was ist das für eine Gruppe? Und ich sehe
209
00:16:07,890 --> 00:16:13,480
wir müssen uns beeilen. Sie sind relativ
neu auf Twitter. Sie stehen der AfD nah.
210
00:16:13,480 --> 00:16:19,740
Sie teilen oft Fake News. Sie sind auf
Twitter sehr aktiv. Und sie befassen sich
211
00:16:19,740 --> 00:16:25,870
fast monothematisch mit Migrations- und
Asylpolitik. Und ich komme auf diese
212
00:16:25,870 --> 00:16:30,470
Gruppe wieder zurück, denn den ersten- die
erste Theorie, die man jetzt reinwerfen
213
00:16:30,470 --> 00:16:37,399
würde, sind Social Bots. Und da es in
diesem Vortrag auch darum geht, ist der
214
00:16:37,399 --> 00:16:42,120
nächste Block sich mal das Thema Social
Bots genauer anzuschauen. Zu Social Bots
215
00:16:42,120 --> 00:16:46,930
wurde eine Menge veröffentlicht, auch in
den Medien. „Warum Meinungsroboter die
216
00:16:46,930 --> 00:16:50,930
Gefahr für die Demokratie werden.“,
„Digitale Dreckschleudern“, „Angriff der
217
00:16:50,930 --> 00:16:57,940
Meinungsroboter“. Jeder hat da irgendwie
auch seine Meinung und seine Gefahr
218
00:16:57,940 --> 00:17:02,460
hervorgebracht. Was sind eigentlich Social
Bots? Es gibt aus dem Büro für
219
00:17:02,460 --> 00:17:06,920
Technikfolgen-Abschätzung beim Deutschen
Bundestag einen Absatz, den ich mal
220
00:17:06,920 --> 00:17:10,609
herausgegriffen habe. Social Bots, die
Computerprogramme, die uns irgendwie in
221
00:17:10,609 --> 00:17:14,769
den sozialen Medien manipulieren können.
„Echte Menschen, die mit dem Social Bot
222
00:17:14,769 --> 00:17:18,556
kommunizieren, nehmen diese nicht als
durch Algorithmen ausgelöste automatische
223
00:17:18,556 --> 00:17:22,120
Kommunikation, sondern als echte Internet-
teilnehmer wahr und sind sich der
224
00:17:22,120 --> 00:17:26,270
Manipulation nicht bewusst." Konkret, was
diese Social Bots angeblich machen sollen
225
00:17:26,270 --> 00:17:31,040
können, sind, sie können den Turing-Test
bestehen. Das heißt, Die Idee eines Turing
226
00:17:31,040 --> 00:17:35,080
Tests ist, ich interagiere mit etwas und
kann hinterher sagen,
227
00:17:35,080 --> 00:17:37,000
ob es ein Mensch,
oder ein Computer ist.
228
00:17:37,000 --> 00:17:40,420
Und diese Social Bots sollen
jetzt magischer Weise diesen Turing-Test
229
00:17:40,420 --> 00:17:44,690
bestehen können und können nicht nur so
tun als wären sie ein Mensch, sondern sie
230
00:17:44,690 --> 00:17:49,220
können angeblich sogar noch unsere Meinung
beeinflussen. Naja, zumindest hat der
231
00:17:49,220 --> 00:17:50,490
Bundestag veröffentlicht:
232
00:17:50,490 --> 00:17:53,448
"Wirkung von Social Bots ist
unter Sachverständigen strittig."
233
00:17:53,448 --> 00:17:57,800
Ich hab mal extra das vorgespult, wo
Linus Neumann zu sehen ist. Aber, da ich
234
00:17:57,800 --> 00:18:01,900
ja so ein Framework habe, kann ich jetzt
auch selber mal reinschauen. Was sind denn
235
00:18:01,900 --> 00:18:05,820
diese Social Bots? Da kommt man schnell in
so einen Teufelskreis. Wenn ich Social
236
00:18:05,820 --> 00:18:10,800
Bots auf Twitter finden möchte, dann muss
ich sie erstmal suchen. Und dazu muss ich
237
00:18:10,800 --> 00:18:14,660
erst mal wissen, wie sie denn eigentlich
aussehen. Und um zu wissen, wie sie
238
00:18:14,660 --> 00:18:18,050
aussehen, muss ich sie erst mal
analysieren können und dazu brauche ich
239
00:18:18,050 --> 00:18:21,940
erst mal welche. Also, zu sagen „Okay, da
gibts irgendwelche.", das bringt nichts.
240
00:18:21,940 --> 00:18:27,000
Ich muss entweder eine Gruppe haben, um
sie analysieren zu können, damit ich die
241
00:18:27,000 --> 00:18:30,610
Eigenschaften rauskriegen kann, oder
andersrum. Und diesen Teufelskreis
242
00:18:30,610 --> 00:18:34,210
durchbrechen, gibt unterschiedliche
Möglichkeiten. Ich habe mich mal für den
243
00:18:34,210 --> 00:18:38,670
folgenden Weg entschlossen. Ich kaufe
jetzt einfach mal Social Bots.
244
00:18:38,670 --> 00:18:39,795
Gelächter
245
00:18:40,030 --> 00:18:42,740
Kleine Anmerkung, Moment, Moment.
246
00:18:42,750 --> 00:18:45,429
Es sind nicht wirklich Social Bots
im dem engeren Sinne,
247
00:18:45,429 --> 00:18:49,920
sondern ich hab mir einfach 4.500 Bots
gekauft. Ob die jetzt tatsächlich dann
248
00:18:49,920 --> 00:18:53,620
auch mit den Leuten sozial interagieren
usw., weiß ich ja nicht. Aber im
249
00:18:53,620 --> 00:18:57,610
Kern hab ich mir einen Twitter-Account
Software Team Berlin geholt. Habe keinem
250
00:18:57,610 --> 00:19:01,309
gesagt, damit ich also weiß, dass kein
realer Mensch diesem Account folgt und
251
00:19:01,309 --> 00:19:06,530
habe dann auf Google gesucht „buy Twitter
Bots". Genau. Und dann gibt's dann 4.500
252
00:19:06,530 --> 00:19:09,870
Follower und davon sind 100% Bots.
Das ist nur um zu gucken, welche
253
00:19:09,870 --> 00:19:13,870
Technologien werden dann eingesetzt,
obs dann Follower Bots sind usw. Um zu
254
00:19:13,870 --> 00:19:17,820
gucken, sehe ich dann bestimmte
Eigenschaften, die ich bei Menschen nicht
255
00:19:17,820 --> 00:19:24,309
sehe. Also sozusagen eher eine
Trockenübung, ja. Also wieder das große
256
00:19:24,309 --> 00:19:28,220
Twitter-Framework draufgeworfen und die
Metadaten analysiert. Und raus kommt
257
00:19:28,220 --> 00:19:35,050
folgende Grafik: Jeder einzelne Punkt ist
eines dieser eingekauften Follower. 4.500
258
00:19:35,050 --> 00:19:39,190
Punkte, und ich weiß 100 % Bots
dabei. Und ich versuche die nun zu
259
00:19:39,190 --> 00:19:43,181
sortieren nach ihren Eigenschaften. Alles,
was eher wie ein Bot aussieht, ist auf der
260
00:19:43,181 --> 00:19:47,007
linken Seite und alles ,was eher wie ein
Mensch aussieht, auf der rechten Seite.
261
00:19:47,007 --> 00:19:50,280
Ich kann jetzt auf die einzelnen drauf
klicken; ich klicke jetzt mal auf den ganz
262
00:19:50,280 --> 00:19:56,370
linken unteren drauf, dann hab ich einen
Asus D5B23, und habe unterschiedliche
263
00:19:56,370 --> 00:20:00,340
Eigenschaften von dem, die ich von ihm
überprüft habe, wie zum Beispiel, ob er
264
00:20:00,340 --> 00:20:06,510
immer noch sozusagen ein Egg ist, also ob
er noch gar kein Avatar Bild hochgeladen
265
00:20:06,510 --> 00:20:12,799
hat, ob er weniger als 10 Follower hat,
wieviele Favs er hat, abgesetzt hat. Ob er
266
00:20:12,799 --> 00:20:18,640
noch gar keine Beschreibungstext für sich
angegeben hat und ob er keine Zeitzone
267
00:20:18,640 --> 00:20:21,890
angegeben hat. Also so die ganzen
Metadaten, die man halt aus Twitter
268
00:20:21,890 --> 00:20:24,010
herausbekommt zum analysieren,
um zu gucken,
269
00:20:24,010 --> 00:20:26,640
ob die sich denn irgendwie strukturieren
und gruppieren.
270
00:20:26,640 --> 00:20:29,469
Man sieht auch ganz
links, das sind so ein Bisschen die sehr
271
00:20:29,469 --> 00:20:33,380
dummen Bots. Die sind jung und teilweise
tun sie auch gar nichts, sondern folgen
272
00:20:33,380 --> 00:20:36,810
nur Leuten. Dann gibt es einen großen und
breiten Bereich, teilweise sehr
273
00:20:36,810 --> 00:20:41,620
realistische Bots dabei, teilweise sind es
sogar reale Accounts die verwaist sind,
274
00:20:41,620 --> 00:20:45,960
also die seit drei Jahren inaktiv sind und
auf irgendeiner Art, also aus irgendeinem
275
00:20:45,960 --> 00:20:49,650
Grund übernommen wurden. Wahrscheinlich
hat sich da einer mal mit Passwort
276
00:20:49,650 --> 00:20:54,950
durchprobieren massenhaft versucht
verwaiste Accounts zu übernehmen. Und
277
00:20:54,950 --> 00:20:58,570
die dritte, und das fand ich sehr
interessant, das sind Accounts die
278
00:20:58,570 --> 00:21:03,000
teilweise sogar verifizierte Menschen
sind. Also ich habe jetzt mal schonmal
279
00:21:03,000 --> 00:21:10,250
Peggy, die ist Moderatorin aus den Staaten
irgendwo, Jeff Zausch ist ein Survival
280
00:21:10,250 --> 00:21:15,430
Spezialist und Chris Glorioso. Das sind,
das sind reale Personen, die mir gefolgt
281
00:21:15,430 --> 00:21:19,570
sind weil ich dafür bezahlt habe, als Bot,
und das fand ich sehr merkwürdig. Ich habe
282
00:21:19,570 --> 00:21:22,650
versucht mit den Leuten Kontakt
aufzunehmen; nicht alle haben mir
283
00:21:22,650 --> 00:21:26,300
geantwortet. Der Grund dafür ist, dass ihr
Account gehijacked wurde und sie haben
284
00:21:26,300 --> 00:21:29,280
dann eigentlich nur noch DMs von
irgendwelchen fremden Accounts bekommen.
285
00:21:29,280 --> 00:21:32,670
Die haben auf DMS auch gar nicht mehr so
richtig reagiert. Ich habe auch versucht
286
00:21:32,670 --> 00:21:37,320
herauszubekommen, auf welchem Wege das
passiert ist – ob sie sich dort irgendwie
287
00:21:37,320 --> 00:21:42,440
einen Twitter Service eingetreten haben
der in ihrem Namen postet. Ich weiß es
288
00:21:42,440 --> 00:21:46,640
nicht. Laut eigenen Aussagen ging es dann
aber weniger um politische Inhalte,
289
00:21:46,640 --> 00:21:50,290
sondern Zitat, es war eher "Sex Scheisse"
die dann in ihren Twitter Timelines
290
00:21:50,290 --> 00:21:53,890
veröffentlicht wurde. Was ich aber
spannend finde, ist wenn man so eine CDU
291
00:21:53,890 --> 00:21:57,770
Forderung, Kennzeichnung von Social Bots.
Ja was ist denn, wenn der eigene Account
292
00:21:57,770 --> 00:22:01,940
übernommen wurde. Also der wird dann, der
eigene Account ist mit einmal halb
293
00:22:01,940 --> 00:22:06,110
automatisiert, ob man es will oder nicht.
Eine Fragestellung die ich dann auch
294
00:22:06,110 --> 00:22:10,820
nochmal jetzt kurz im Vortrag hatte weil
die Daten ja jetzt 11 Monate alt sind:
295
00:22:10,820 --> 00:22:15,640
Welche Accounts gibts denn heute noch? Und
man sieht grün, die Accounts gibt's heute
296
00:22:15,640 --> 00:22:20,090
noch, elf, gelb sind die Accounts die in
der Zwischenzeit von Twitter gesperrt
297
00:22:20,090 --> 00:22:25,350
wurden, und rot die Accounts die von sich
aus sich gelöscht haben. Genau. Also man
298
00:22:25,350 --> 00:22:29,930
sieht zumindest dass da Bewegung von
Seiten Twitter passiert. Was man jetzt an
299
00:22:29,930 --> 00:22:33,690
diesen Bots auch noch analysieren kann,
ist die Follower Netzwerke, wie die sich
300
00:22:33,700 --> 00:22:39,951
also gegenseitig folgen. Da habe ich mal
folgende Grafik gemacht. Das sind so die
301
00:22:39,951 --> 00:22:45,390
4.5 Tausend Bots und wem sie folgen und
von wem sie gefolgt werden. Rot
302
00:22:45,390 --> 00:22:52,820
Trinken rot sind die Bots, 4.5 Tausend,
und blau sind die anderen Nutzer, andere
303
00:22:52,820 --> 00:22:56,700
Accounts oder so weiter. Da kann man auch
mal ein Bisschen rein zoomen hier, sieht
304
00:22:56,700 --> 00:23:05,710
auch ganz hübsch aus. Fast wie fliegende
Spaghetti Monster, fand ich. Die Blauen,
305
00:23:05,710 --> 00:23:10,970
das scheinen mir Jugendliche zu sein, die
sich einfach Twitter-Bots oder Follower
306
00:23:10,970 --> 00:23:14,260
gekauft haben, was eigentlich ganz
interessant ist dass ich dann damit
307
00:23:14,260 --> 00:23:17,860
eigentlich die Kunden die analysieren
kann. Wobei man vorsichtig sein muss,
308
00:23:17,860 --> 00:23:22,730
jemandem 10,000 Bots oder Follower
künstlich anzuhängen ist halt relativ
309
00:23:22,730 --> 00:23:27,730
einfach zu machen und ist auch gar nicht
so teuer. 50,000 Bots gibt es so für 60
310
00:23:27,730 --> 00:23:35,230
Dollar. Wie könnte man Bots noch
erkennen? Und da gibt es halt so eine
311
00:23:35,230 --> 00:23:39,670
Tweet-App Analyse. Ich weiß nicht ob ihr
euch noch erinnern könnt, vor einigen
312
00:23:39,670 --> 00:23:44,260
Jahren stand unter jedem Tweet noch
drunter, mit welcher App man diesen Tweet
313
00:23:44,260 --> 00:23:49,040
veröffentlicht hat. Das steht leider jetzt
nicht mehr drunter, aber die Daten sind
314
00:23:49,040 --> 00:23:54,431
noch in der API drin. So sieht übrigens so
eine API Antwort von Twitter aus, und da
315
00:23:54,431 --> 00:23:59,050
steht unter anderem auch Source drin, d.h.
also mit welchem Service man das
316
00:23:59,050 --> 00:24:02,850
veröffentlicht hat. Habe ich mal über die
Bots rüber laufen lassen. Twitter für
317
00:24:02,850 --> 00:24:07,930
iPhone, Android, Web Client, aber auch
Facebook, die automatisch dann sozusagen
318
00:24:07,930 --> 00:24:12,000
das heisst den Post als Tweet
veröffentlichen und Instagram. Und
319
00:24:12,000 --> 00:24:17,620
interessant fand ich halt 350 weitere
Services, ja. So sehen die aus. Genau.
320
00:24:17,620 --> 00:24:24,730
Also es ist ein riesen Potpourri,
Koreanisch Japanisch alles dabei. Genau.
321
00:24:24,730 --> 00:24:29,410
Das war mir ja auch gar nicht so richtig
klar vorher, dass es eigentlich ein
322
00:24:29,410 --> 00:24:33,850
riesiges enormes Ökosystem gibt von
Skripten die auf Twitter Sachen
323
00:24:33,850 --> 00:24:42,461
veröffentlichen. Und wie gesagt, halt in
meiner Probe sind es allein 350. Um den
324
00:24:42,461 --> 00:24:47,049
Leuten auch zu zeigen, was das denn jetzt
eigentlich für Services sind, die dahinter
325
00:24:47,049 --> 00:24:50,530
stecken, habe ich mal so ein paar
herausgegriffen. Hier ist zum Beispiel
326
00:24:50,530 --> 00:24:54,870
FeedBlitz. Das ist eigentlich ein Bot der
nichts weiter macht als einen RSS Feed in
327
00:24:54,870 --> 00:25:00,110
Twitter zu posten. Haben wir twittbot.net,
das ist irgendwie was selber gebasteltes.
328
00:25:00,110 --> 00:25:04,170
Der twittert aber irgendwie nur Käse, das
hat sich wahrscheinlich einer mal ein
329
00:25:04,170 --> 00:25:07,900
Bisschen herumexperimentiert oder sowas.
Es gibt aber auch den Kim Kardashian:
330
00:25:07,900 --> 00:25:12,000
Hollywood Service, der dir dann
wahrscheinlich die neuen Spielestände
331
00:25:12,000 --> 00:25:17,860
veröffentlich. Interessant fand ich
auch, es gab 9 gelöschte Services, die
332
00:25:17,860 --> 00:25:21,390
dann umbenannt wurden in "Erased" und eine
lange Nummer. Ich würde mich mal
333
00:25:21,390 --> 00:25:25,090
interessieren ob die Nummer fortlaufend
ist, denn sie endet mit 5.6 Millionen.
334
00:25:25,090 --> 00:25:29,530
Sind das jetzt 5.6 Millionen gelöschte
Services, oder sind insgesamt bei Twitter
335
00:25:29,530 --> 00:25:33,410
schon 5.6 Millionen angemeldet worden. Ich
weiß es nicht. Aber wir können darüber
336
00:25:33,410 --> 00:25:37,470
sprechen oder wir können sagen, dass auf
Twitter nicht mehr nur Menschen unterwegs
337
00:25:37,470 --> 00:25:42,860
sind sondern halt auch Services die wir
nutzen. Genau. Bots sind auch nicht nur
338
00:25:42,860 --> 00:25:46,110
böse. Ich habe mal ein paar
herausgegriffen. Ich weiß nicht ob jemand
339
00:25:46,110 --> 00:25:51,840
die Rathausuhr Neukölln kennt. Applaus &
Lachen Ist der Entwickler da? Nein. Der
340
00:25:51,840 --> 00:25:56,280
Entwickler der das Rathaus Uhrwerk
Neukölln als Service benutzt, also der
341
00:25:56,280 --> 00:26:05,090
veröffentlicht sowas wie acht bämm bämm
bämm bämm bämm bämm bämm bämm.
342
00:26:05,090 --> 00:26:08,900
Vor kurzem bin ich übrigens auf den
Wichser Bot gestoßen. Wenn man einen Tweet
343
00:26:08,900 --> 00:26:12,880
veröffentlicht wo das Wort Wichser drin
vorkommt, dann retweetet der einen.
344
00:26:12,880 --> 00:26:20,170
Spiegelonline Top benutzt den Service if
this than that, zu 100%, also nicht
345
00:26:20,170 --> 00:26:26,090
normal SpiegelOnline sondern Top. Und ZEIT
ONLINE Digital hat sich auch einen Service
346
00:26:26,090 --> 00:26:30,020
gebaut, ich weiß nicht ob der eingekauft
oder selbst entwickelt ist, aber der ist
347
00:26:30,020 --> 00:26:35,711
registriert als ZEIT ONLINE. Ich fasse
zusammen: Woran könnte man Bots erkennen?
348
00:26:35,711 --> 00:26:40,669
Ist das Profil vollständig? Ist ein Avatar
Bild und Beschreibungstext dran? Ist der
349
00:26:40,669 --> 00:26:47,460
Account Teil eines Netzwerkes? Von welcher
App werden die Tweets abgeschickt und wie
350
00:26:47,460 --> 00:26:51,620
sehen die anderen Metadaten des Accounts
oder der Tweets aus? Interessant ist,
351
00:26:51,620 --> 00:26:56,240
dass das aber alles Indizien Beweise sind.
Wenn man anfängt, sich tatsächlich mal
352
00:26:56,240 --> 00:27:00,220
hinzusetzen und zu gucken, ist das nun ein
Bot oder nicht, kommt man relativ schnell
353
00:27:00,220 --> 00:27:05,070
ins Grübeln. Jegliche Bot Erscheinung
könnte auch gut menschlich erklärt sein
354
00:27:05,070 --> 00:27:07,249
und andersherum. Man kann aber auch
355
00:27:07,249 --> 00:27:09,599
rangehen, dass man jedes
menschliche Verhalten in
356
00:27:09,599 --> 00:27:14,830
die Sphäre, das könnte und natürlich auch
ein hochintelligente KI sein schien.
357
00:27:14,830 --> 00:27:18,471
Egal, auf jeden Fall mit diesem
Kenntnisstand sag ich mal lasst uns jetzt
358
00:27:18,471 --> 00:27:22,440
mal Bots finden. Ich habe gesucht. Ich hab
lange lange lange gesucht und ich kürz es
359
00:27:22,440 --> 00:27:28,480
mal ab mit: ich habe gefunden inaktive
Accounts, Service Accounts, Trolle welche
360
00:27:28,480 --> 00:27:32,940
Teenager, Rassisten und Hater und Spam mit
links zu YouTube Polen und Bitcoin schickt
361
00:27:32,940 --> 00:27:37,330
und so weiter. Aber was ich nicht gefunden
habe ist diese politisch aktiven Social
362
00:27:37,330 --> 00:27:41,230
Bot Netzwerke, und dafür gibt es zwei
Erklärungen: Entweder die gibts nicht oder
363
00:27:41,230 --> 00:27:49,640
Ich bin zu doof. Also fragen wir mal die
Profis wie machen die das denn. Und einer
364
00:27:49,640 --> 00:27:55,160
davon ist zum Beispiel Professor Dr. Simon
Hegelich, Forschungsfeld Political Data
365
00:27:55,160 --> 00:28:02,360
Science, Forschungsmethoden Machine
Learning plus X. Ist das VELTINS, die mit
366
00:28:02,360 --> 00:28:07,429
plus X ist Alkohol, ne, ich weiß nicht,
keine Ahnung. Der veröffentlicht Studien
367
00:28:07,429 --> 00:28:10,950
zum Beispiel für die Konrad-Adenauer-
Stiftung mit dem Titel "Invasion der
368
00:28:10,950 --> 00:28:16,429
Meinungs-Roboter". Leider wird in dieser
Studie die Methodik nicht beschrieben.
369
00:28:16,429 --> 00:28:21,299
Hegelich hatte selber damals mit Professor
Dietmar Jaresko eine Studie veröffentlicht
370
00:28:21,299 --> 00:28:26,190
wo sie tatsächlich ein Bot-Netzwerk
gefunden haben in der Ukraine. Was sie
371
00:28:26,190 --> 00:28:30,261
dabei identifizieren konnten ist dass
diese Accounts unter einem Service
372
00:28:30,261 --> 00:28:36,210
"twifarm" prorussische Meldungen
veröffentlicht haben, insgesamt 1740 Bots
373
00:28:36,210 --> 00:28:42,180
haben sie darunter gefunden. Und genau das
ist auf jeden Fall, das kann man glaube
374
00:28:42,180 --> 00:28:46,690
ich sagen, ein Bot-Netzwerk, was dort in
der Ukraine gefunden wurde. Aber wie sieht
375
00:28:46,690 --> 00:28:50,650
das eigentlich mit der deutschen Debatte
aus? Und dazu hab ich, vielleicht habs ich
376
00:28:50,650 --> 00:28:54,200
auch nicht gefunden aber ich habe
zumindest keine Studie von Prof. Hegelich
377
00:28:54,200 --> 00:28:58,030
dazu gefunden, mit einer nachprüfbaren
Methodik. Was ich aber gefunden habe ist
378
00:28:58,030 --> 00:29:04,230
ein ZDF Bericht, ZDF Zoom "Alles nur Lüge?
Wie im Netz getäuscht wird". Professor
379
00:29:04,230 --> 00:29:09,630
Simon Hegelich hatte hier die Aufgabe, aus
Gigabytes an Daten Social Bots zu suchen.
380
00:29:09,630 --> 00:29:15,380
Und er hatte einen möglichen Kandidaten
gefunden, und zwar Egon Dombrowski, der
381
00:29:15,380 --> 00:29:22,570
136 Posts am Tag veröffentlich mit ganz
klarer Tendenz zu Pegida und AfD. Nun ist
382
00:29:22,570 --> 00:29:26,710
natürlich spannend: Ist das vielleicht ein
gesteuerter Bot? Oder handelt es sich
383
00:29:26,710 --> 00:29:30,160
dabei um einen realen Menschen? Die
Redaktion hat ihn einfach mal
384
00:29:30,160 --> 00:29:37,270
angeschrieben, und der potenzielle Social
Bot heißt Egon Dombrowski. Ist 50 Jahre
385
00:29:37,270 --> 00:29:42,800
alt, berufsunfähig Rentner, lebt in Erfurt
und war in einem Gemeinderat für die SPD.
386
00:29:42,800 --> 00:29:50,220
Und jetzt ist er auf Facebook sehr aktiv.
Medien bezeichnet er als Propaganda-
387
00:29:50,220 --> 00:29:55,350
Presse, und er macht Werbung für die AfD
und wird laut eigener Aussage nicht von
388
00:29:55,350 --> 00:30:00,400
der AfD oder anderen bezahlt, er macht das
aus eigener überzeugung. Gut, also der
389
00:30:00,400 --> 00:30:04,370
Versuch, hier einen Social Bot zu finden,
ist missglückt, wir haben leider nur eine
390
00:30:04,370 --> 00:30:08,600
reale Person gefunden. Aber es gibt auch
andere die sich damit beschäftigen,
391
00:30:08,600 --> 00:30:14,130
beispielsweise botswatch.de, die
versuchen, parallel zu wichtigen Events in
392
00:30:14,130 --> 00:30:19,890
Deutschland zu gucken, wie viel sich auf
Twitter nun Social Bots einmischen,
393
00:30:19,890 --> 00:30:24,490
veröffentlichen auch das Bot-Barometer und
so weiter. Und da gibts auch einen Link
394
00:30:24,490 --> 00:30:27,910
zur Methode wie sie das machen, und da
steht dann drin "Accounts die
395
00:30:27,910 --> 00:30:31,710
durchschnittlich gleich oder mehr als 50
Tweets am Tag veröffentlichen". Hab ich
396
00:30:31,710 --> 00:30:38,080
ihnen gesagt "Naja, Dombrowski schafft 136
Posts am Tag." Ich hatte, weil
397
00:30:38,080 --> 00:30:42,830
wir die Bundestagswahl beobachtet haben
eine lange Liste von Accounts
398
00:30:42,830 --> 00:30:46,070
zusammengestellt, die irgendwie beim
Thema Bundestagswahl mitmischten
399
00:30:46,070 --> 00:30:48,010
und bin die einfach mal durchgegangen,
400
00:30:48,010 --> 00:30:51,229
an welchen Tagen haben die
mehr als 50 Tweets abgesetzt und hier ist
401
00:30:51,229 --> 00:30:55,850
mal so ein bisschen Zusammenfassung: sogar
eine CDU/CSU und FDP haben das geschafft.
402
00:30:55,850 --> 00:31:03,270
Genau. Also, 50 Tweets am Tag und schon
ist man Social Bot, mit drunter sind
403
00:31:03,270 --> 00:31:10,490
Medien wie Welt, die schaffen 190 am Tag,
Focus Online 97 am Tag. Auch Christopher
404
00:31:10,490 --> 00:31:15,559
Lauer 72. Anja Schillhaneck von den
Bündnes 90 / Die Grünen im Berliner
405
00:31:15,559 --> 00:31:19,250
Abgeordnetenhaus schafft fast die Grenze
mit 50 am Tag. Und natürlich auch die
406
00:31:19,250 --> 00:31:23,090
Parteien vor den Bundestagswahlen, die
dann natürlich in den sozialen Netzwerken
407
00:31:23,090 --> 00:31:27,860
besonders aktiv sind, schaffen mehr als
50, und dann noch Hipster, Aktivisten,
408
00:31:27,860 --> 00:31:32,429
AfD-Anhänger darunter geschrieben. Also 50
Tweets am Tag als Kriterium für Social
409
00:31:32,429 --> 00:31:37,190
Bots ist wissenschaftlich unseriös. Da
frage ich mich natürlich: Wie kommen die
410
00:31:37,190 --> 00:31:41,390
da drauf? Und davor steht es auch: Das sei
das Social Bot-Kriterium der Oxford-
411
00:31:41,390 --> 00:31:47,030
Universität. Das finde ich natürlich
spannend, und habe dann angefangen, die
412
00:31:47,030 --> 00:31:53,650
ganzen Studien und wissenschaftlichen
Paper dazu durchgelesen wie deren Methode
413
00:31:53,650 --> 00:31:59,720
ist. Und ich hab nur zwei herausgegriffen,
weil es wirklich eine Menge ist, die
414
00:31:59,720 --> 00:32:09,049
besonders das deutlich machen. Social Bots
bei den US-Wahlen. Das ist ein Paper was
415
00:32:09,049 --> 00:32:13,400
veröffentlicht wurde mit dem Titel "Bots
and Automation over Twitter during the
416
00:32:13,400 --> 00:32:18,809
U.S. Election" und ich spule mal vor was
an welcher Stelle Sie das definieren. Da
417
00:32:18,809 --> 00:32:24,910
muss ich mal kurz sagen: Sie fangen halt
an, von Social Bots zu reden. Dann heißt
418
00:32:24,910 --> 00:32:28,750
es irgendwann "Social Bot like" und dann
steht dann so etwas wie "Heavy Automated
419
00:32:28,750 --> 00:32:33,539
Bots". Und dann steht dann zum Schluss "we
define a high level of automation as
420
00:32:33,539 --> 00:32:37,659
accounts that post at least 50 times a day
using one of these election-related
421
00:32:37,659 --> 00:32:43,780
hashtags". Das heißt also, wer mehr als 50
Mal am Tag ein bestimmtes Hashtag
422
00:32:43,780 --> 00:32:47,580
veröffentlicht, wird als social Bot
kategorisiert. Die Hashtags sind die hier.
423
00:32:47,580 --> 00:32:52,669
Der erste Block sind die pro-Trump-
Hashtags, zweite Block die pro-Clinton-
424
00:32:52,669 --> 00:32:56,390
Hashtags, und der dritte Block sind
Hashtags, die sich generell um die
425
00:32:56,390 --> 00:33:01,710
amerikanische Wahl beschäftigen. Aber zu
dieser Definition von Social Bots habe ich
426
00:33:01,710 --> 00:33:06,870
mal ein paar Fragen: Also erstens, warum
sind das 50 und nicht 30 oder 100 Tweets
427
00:33:06,870 --> 00:33:13,140
am Tag? Und gilt das dann für alle Länder,
also kann man jetzt dieses Kriterium aus
428
00:33:13,140 --> 00:33:16,840
Amerika eins zu eins übernehmen für
Deutschland? Und was für Accounts sind das
429
00:33:16,840 --> 00:33:20,700
eigentlich? Ich meine wenn ich die wenn
ich die identifizieren kann, dann kann ich
430
00:33:20,700 --> 00:33:24,440
die ja auch mal genauer anschauen, wie
viele Follower haben die? Wie viele Favs
431
00:33:24,440 --> 00:33:27,910
und retweets haben sie? Vielleicht
veröffentlichen sie ja wahnsinnig viele
432
00:33:27,910 --> 00:33:31,630
Tweets aber keiner liest es. Und über
welches Service posten sie? Das hatte ich
433
00:33:31,630 --> 00:33:36,330
vorhin gezeigt, dass man das nachschauen
kann. Und klar kann ich verstehen, dass es
434
00:33:36,330 --> 00:33:38,690
halt eine Menge Accounts sind,
aber es gibt eine
435
00:33:38,690 --> 00:33:40,861
wissenschaftlich statistisch
saubere Methode:
436
00:33:40,861 --> 00:33:42,970
Man nimmt einfach eine
Stichprobe, man wählt einfach mal zufällig
437
00:33:42,970 --> 00:33:46,120
100 aus und guckt sich halt an, was das
für Accounts sind, um zu gucken, ob sie
438
00:33:46,120 --> 00:33:50,600
tatsächlichen politischen Einfluss haben.
Dazu gibts aber in dieser Studie keine und
439
00:33:50,600 --> 00:33:55,100
auch den anderen keine Antwort. Leider
kann ich das auch nicht überprüfen, weil
440
00:33:55,100 --> 00:33:58,850
die Universität Oxford die Daten dazu
nicht veröffentlicht hat. Das liegt
441
00:33:58,850 --> 00:34:04,850
teilweise an der Developer API von, oder
den Guidelines von Twitter. Das liegt aber
442
00:34:04,850 --> 00:34:10,109
auch daran, oder gibt es einen Ausweg da
drauß: Und zwar kann man nämlich die Liste
443
00:34:10,109 --> 00:34:14,469
der Twitter IDs veröffentlichen, das darf
man nämlich, und kann sich dann sozusagen
444
00:34:14,469 --> 00:34:18,899
nachträglich den Tweet nochmal holen und
genauer analysieren. Zum Glück gibt es von
445
00:34:18,899 --> 00:34:24,799
der George Washington Universität eine
Veröffentlichung "2016 United States
446
00:34:24,799 --> 00:34:28,690
Presidential Election Tweet IDs". Da gibt
es unter anderem auch eine Liste von
447
00:34:28,690 --> 00:34:34,018
Tweets, die den Hashtag "Election Day"
verwendet haben. Das heißt ich hab jetzt
448
00:34:34,018 --> 00:34:37,839
leider nicht die gleiche Datenbasis wie
die Universität Oxford. Ich kann aber
449
00:34:37,839 --> 00:34:42,168
einen kleinen Ausschnitt rausnehmen und
zwar mir nur angucken, wer hat am Wahltag
450
00:34:42,168 --> 00:34:48,109
mehr als 100 mal eines von diesen Hashtags
verwendet plus den Hashtag "Election Day".
451
00:34:48,109 --> 00:34:56,869
Und diejenigen, die sogar mehr als 100 Mal
am Wahltag getwittert haben sind diese 12,
452
00:34:56,869 --> 00:35:01,680
das sind sozusagen die laut Social Both
Kriterien die die am deutlichsten als
453
00:35:01,680 --> 00:35:08,499
Social Bots sich definieren. Und wenn ihr
jetzt mal wissen wollt, wer denn dieses
454
00:35:08,499 --> 00:35:12,390
Social Bots wirklich sind: Nehmen wir uns
mal Zeit und gucken uns jeden einzelnen
455
00:35:12,390 --> 00:35:21,950
von diesen 12 an. Das erste ist ein
@dreamedofdust, der 437 Tweets am Wahltag
456
00:35:21,950 --> 00:35:25,759
veröffentlicht hat (mit diesen erwähnten
Hashtags), und was er macht: er twittert
457
00:35:25,759 --> 00:35:31,109
Links zu reddit.com/r/The_Donald zu diesen
einzelnen Kommentaren. Und er benutzt
458
00:35:31,109 --> 00:35:37,920
dabei If This Then That. Und bot: klares
Ja, auf jeden Fall. Was er aber dabei tut
459
00:35:37,920 --> 00:35:41,930
ist bereits veröffentlichte Kommentare im
Reddit-Forum einfach nochmal in diesem
460
00:35:41,930 --> 00:35:45,460
Account zu spiegeln, und ich lehne mich
mal aus dem Fenster wenn ich sage:
461
00:35:45,460 --> 00:35:50,170
Einfluss? Kaum. Also völlig kommentarlos,
wie gesagt, spiegelt einfach nur Reddit-
462
00:35:50,170 --> 00:35:55,640
Kommentare. Der nächste Account, ITX
News, twittert Screenshots von Texten,
463
00:35:55,640 --> 00:35:59,830
völlig abgedrehter Verschwörungsquark,
also da ist, da sind Sachen dabei, die
464
00:35:59,830 --> 00:36:05,609
Queen wurde von Hindus vergiftet. Und,
also wirklich, find ich völlig abgedreht.
465
00:36:05,609 --> 00:36:10,400
Und er benutzt für seine für seine
Screenshots, die er dann veröffentlicht,
466
00:36:10,400 --> 00:36:17,549
immer die aktuellen trending Hashtags. Er
hat vier Follower, und er ist ganz klar
467
00:36:17,549 --> 00:36:24,799
kein Bot. Der nächste Account: Er ist
Trump-Supporter weil er Clinton furchtbar
468
00:36:24,799 --> 00:36:30,559
findet. Er nutzt intensiv Hashtags, lebt
auf Hawaii, schläft sechs Stunden, macht
469
00:36:30,559 --> 00:36:35,349
Mittagspause - das sieht man an den an den
Zeiten, wann er twittert. Und der ist auf
470
00:36:35,349 --> 00:36:41,529
jeden Fall kein Bot. Der nächste.
Offensichtlich liebt er Bernie Sanders, er
471
00:36:41,529 --> 00:36:45,450
hasst Donald Trump, Hillary Clinton, die
Demokraten (weil sie nämlich Hillary
472
00:36:45,450 --> 00:36:49,029
Clinton aufgestellt haben statt Bernie
Sanders), Bill und Chelsea Clinton, und er
473
00:36:49,029 --> 00:36:53,979
hasst Expedia, weil Chelsea Clinton jetzt
im Board sitzt. Aber ein Bot ist er nicht.
474
00:36:53,979 --> 00:36:59,370
Der nächste. Der sieht mir doch sehr
fischig aus. Ich vermute mal, dass es eine
475
00:36:59,370 --> 00:37:04,759
spanischsprachige Click-Farm ist, die
versucht, User auf Werbeseiten zu locken.
476
00:37:04,759 --> 00:37:10,110
Die machen dann Werbung für was weiß ich,
irgendwelche Apps oder sowas, überhaupt
477
00:37:10,110 --> 00:37:13,859
gar keine politischen Inhalte, denn sie
nutzen einfach nur Training Hashtags um
478
00:37:13,859 --> 00:37:17,671
sich in politischen Diskussionen sozusagen
da noch nochmal ihre Links zu
479
00:37:17,671 --> 00:37:23,410
veröffentlichen, haben einen Follower. Ob
es ein Bot ist oder nicht? Ich sag mal,
480
00:37:23,410 --> 00:37:28,119
vermutlich nicht. Da sind halt Tippfehler
drin, das wäre eigentlich ein schlecht
481
00:37:28,119 --> 00:37:31,559
programmierter Bot (oder besonders
schlau). Im Zweifelsfall könnt ihr ihn
482
00:37:31,559 --> 00:37:35,421
gern als Bot definieren, aber impact hat
er keinen. Jetzt wird es ein bisschen
483
00:37:35,421 --> 00:37:39,579
spannender. Ave Hurley ist eine Oma aus
Brooklyn, sie ist eine Künstlerin, malt
484
00:37:39,579 --> 00:37:43,201
Bilder, macht Schmuck, verkauft sie in
einem Shop und hat vor kurzem mit dem
485
00:37:43,201 --> 00:37:49,810
Rauchen aufgehört. An dem Wahltag hat sie
wie wild für Trump getwittert und hat ihn
486
00:37:49,810 --> 00:37:53,390
unterstützt und hat versucht, Leute zu
überzeugen. Aber ein Bot ist sie auch
487
00:37:53,390 --> 00:37:58,650
nicht. Dann hab ich hier noch den hier.
Der ist aus Tokio. Ich vermute es ist ein
488
00:37:58,650 --> 00:38:03,160
Student, der twittert auf Japanisch und ab
dem Moment war ich so ein bisschen Lost in
489
00:38:03,160 --> 00:38:07,719
Translation um herauszukriegen, was er da
möchte. Aber ich vermute, dass er Toru
490
00:38:07,719 --> 00:38:12,609
Hashimoto und Kazuma Ieri hasst, das eine
ist ein Politiker, das andere ein
491
00:38:12,609 --> 00:38:19,190
Internet Entrepreneur. Er hat am Wahlabend
auf einen Tweet zu Kazuma gefeuert, muss
492
00:38:19,190 --> 00:38:22,720
man sagen, und hat da einfach die
aktuellen Trending hashtags genommen, und
493
00:38:22,720 --> 00:38:28,869
da war natürlich auch die Election dabei,
aber ein Bot ist es nicht. Der nächste:
494
00:38:28,869 --> 00:38:34,099
Paolo. Paolo kann 13 Tweets in drei
Sekunden schicken.
495
00:38:34,099 --> 00:38:44,039
Gelächter
Applaus
496
00:38:44,039 --> 00:38:48,530
Er nutzt dafür drei unbekannte
italienische Twitter-Services, einer davon
497
00:38:48,530 --> 00:38:53,390
ist in der Zwischenzeit gesperrt. Pro
Hillary. Tweets werden so gut wie gar
498
00:38:53,390 --> 00:38:58,200
nicht gefavt und retweetet. Ein Bot ist er
auf jeden Fall, aber einen Einfluss hat
499
00:38:58,200 --> 00:39:03,220
er, glaube ich zumindest, keinen. Dann
haben wir noch den hier. Er liebt Jesus,
500
00:39:03,220 --> 00:39:07,579
Die Familie, Trump, Wikileaks, Fox News,
und Waffen.
501
00:39:07,579 --> 00:39:12,549
Gelächter
Hasst Abtreibung, Feminismus, Hillary
502
00:39:12,549 --> 00:39:19,410
Clinton, CNN, und Obamacare. Aber ein Bot
ist es nicht. Dann haben wir auch
503
00:39:19,410 --> 00:39:26,369
PresidentDrumf. Der ist ein Satire-
Account. Teilweise witzig, hat trotzdem
504
00:39:26,369 --> 00:39:28,380
nur einen Follower.
Gelächter
505
00:39:28,380 --> 00:39:35,640
Aber ein Bot ist es auch nicht. Dann haben
wir noch Maryke. Sie ist Journalistin aus
506
00:39:35,640 --> 00:39:40,819
Südafrika, arbeitet für die französische
Presseagentur AFP, und hat über Election
507
00:39:40,819 --> 00:39:47,509
Day live getwittert an dem Abend. Und sie
ist auch kein Bot. Dann haben wir noch ein
508
00:39:47,509 --> 00:39:53,349
Dr. Van Nostrand. Ich habe leider kein
Bild von ihm gefunden, aber er liebt
509
00:39:53,349 --> 00:40:00,609
Baseball, American Football, Fox News und
Trump. Er hasst Hillary und Bill Clinton,
510
00:40:00,609 --> 00:40:07,059
CNN, Islam, Feministen, und Linke. Und er
verfolgte Trumps' Sieg live. Hat den
511
00:40:07,059 --> 00:40:13,200
Wahltag intensiv verfolgt und begleitet,
aber ein Bot ist er auch nicht. So, und
512
00:40:13,200 --> 00:40:18,660
das war jetzt der zwölfte von den zwölf.
Fassen wir mal zusammen. Ich habe ja mal
513
00:40:18,660 --> 00:40:23,140
so ein kleines Tabelle gemacht,
spaltenweise pro Clinton, neutral, pro
514
00:40:23,140 --> 00:40:27,940
Trump, und zeilenweise ist es ein Mensch,
sind wir uns nicht ganz sicher, oder ist
515
00:40:27,940 --> 00:40:31,530
es ein Social Bot. Wir haben auf jeden
Fall ein Social Bot gefunden der pro-
516
00:40:31,530 --> 00:40:35,386
Clinton ist, und wir haben einen Social
Bot gefunden von pro-Trump ist, ob es sich
517
00:40:35,386 --> 00:40:39,309
tatsächlich um einen Social Bot handelt
wäre ich sehr vorsichtig denn sie haben ja
518
00:40:39,309 --> 00:40:42,907
keine soziale Interaktion bewiesen,
sondern alles was sie gemacht haben ist
519
00:40:42,907 --> 00:40:46,530
automatisiert Links und Nachrichten zu
veröffentlichen, und hatten auch dabei
520
00:40:46,530 --> 00:40:51,039
nicht wirklich einen Impact weil keiner
sie retweetet oder gefavt hat. Eine große
521
00:40:51,039 --> 00:40:58,799
Gruppe die wir gefunden haben waren pro-
Trump-Menschen, die alle, auf der pro-
522
00:40:58,799 --> 00:41:03,790
Clinton Seite haben wir nur einen Satire-
Account gefunden. Und dazwischen im
523
00:41:03,790 --> 00:41:08,259
neutralen Bereich einen Bernie Sanders-
Fan, eine Journalistin, einen Japaner und
524
00:41:08,259 --> 00:41:15,630
einen Verschwörungstheoretiker. Und dann
haben wir noch hier unsure derjenige der
525
00:41:15,630 --> 00:41:19,780
seine Links zu App-Webseiten vertreibt.
Wenn ich jetzt mal hervorhebe von denen
526
00:41:19,780 --> 00:41:23,139
Accounts von denen ich glaube dass sie
tatsächlich an einer politischen
527
00:41:23,139 --> 00:41:27,039
Diskussion teilgenommen haben... sind das
die hier und das sind alles Menschen. Ist
528
00:41:27,039 --> 00:41:41,700
nur die Hälfte, aber ja. Die Studie "Bots
and Automation over Twitter during U.S.
529
00:41:41,700 --> 00:41:45,689
Election" müsste eigentlich heißen "Highly
active Twitter users during US Election".
530
00:41:47,079 --> 00:41:51,019
Social Bots, oder als was wir sie
bezeichnet haben, sind politisch aktive
531
00:41:51,019 --> 00:41:58,450
Bürger, Hashtag-Spam, Medien und
Journalisten, und einige simple Bots. Auf
532
00:41:58,450 --> 00:42:02,900
Vollständigkeit halber habe ich versucht
noch eine Studie zu finden die eine andere
533
00:42:02,900 --> 00:42:09,209
Methodik verwendet. Und da gibt es von der
University of South California "Social
534
00:42:09,209 --> 00:42:15,710
bots distort the 2016 U.S. Presidential
election online discussion", und was sie
535
00:42:15,710 --> 00:42:20,000
zur Identifizierung von Social Bots
verwenden ist ein Service der nennt sich
536
00:42:20,000 --> 00:42:25,139
BotOrNot, in der Zwischenzeit umbenannt in
Botometer. Und ich will da nicht zu tief
537
00:42:25,139 --> 00:42:28,799
einsteigen, da gibt's auch nochmal ein
Paper dazu, aber was sie im Kern machen
538
00:42:28,799 --> 00:42:32,370
ist im Prinzip das was ich am Anfang
gemacht habe – sie versuchen die ganzen
539
00:42:32,370 --> 00:42:36,420
Metadaten rund um einen Account zu
kategorisieren, und dann kommt da Machine
540
00:42:36,420 --> 00:42:39,839
Learning oben drauf, und dann wird
versucht mit einer Wahrscheinlichkeit
541
00:42:39,839 --> 00:42:44,130
abzuschätzen ob nun ein Account nun ein
Bot ist oder nicht, und das ist die Basis
542
00:42:44,130 --> 00:42:48,329
dieser Studie. Ich hab das mal... Unten
ist noch mal der Link dazu, falls einer da
543
00:42:48,329 --> 00:42:52,640
selber mit spielen möchte. Vorsichtig, man
muss dazu seinen Twitter-Account
544
00:42:52,640 --> 00:42:56,419
autorisieren und das ist dann... der im
Gegensatz zu uns keine Leserechte haben
545
00:42:56,419 --> 00:42:59,720
möchte, sondern er möchte auch
Schreibrechte haben; für den Fall falls
546
00:42:59,720 --> 00:43:03,499
die gehackt werden, werdet ihr also auch
irgendwie Scheiße twittern. Ich hab
547
00:43:03,499 --> 00:43:06,079
einfach mal ein paar Accounts rein
geworfen um zu gucken wie vertrauenswürdig
548
00:43:06,079 --> 00:43:09,859
das ist; da habe ich jetzt einfach mal
einen erdgeist und einen Frank Rieger und
549
00:43:09,859 --> 00:43:13,970
einen Linuzifer rein geworfen. Das
Kriterium übrigens der Studie ist 50%,
550
00:43:13,970 --> 00:43:17,450
alle die unter 50% sind,
sind Menschen, alle die über 50%
551
00:43:17,450 --> 00:43:23,450
sind, sind Bots. Gegenübergestellt hab ich
nochmal das BMVI, das Bundesministerium
552
00:43:23,450 --> 00:43:32,299
für Justiz und Verbraucherschutz – 55
Prozent, das BKA ist ein Social Bot.
553
00:43:32,299 --> 00:43:36,509
Applaus
Und vielleicht liegt das an den deutschen
554
00:43:36,509 --> 00:43:40,630
Accounts, da die Studie sich im Speziellen
mit den US-Wahlen beschäftigt haben, hab
555
00:43:40,630 --> 00:43:44,680
ich da mal stichprobenartig ein paar rein
geworfen. Da haben wir das Wall Street
556
00:43:44,680 --> 00:43:48,849
Journal, LA Times ist ein Bot, CNN und Fox
News ist ein Bot, realDonaldTrump ist ein
557
00:43:48,849 --> 00:43:51,869
Bot, und der amerikanische Präsident.
Lachen
558
00:43:51,869 --> 00:43:59,989
Applaus
Das könnt ihr ja auch alles selber
559
00:43:59,989 --> 00:44:04,140
ausprobieren. Also wissenschaftlich ist
das alles nicht haltbar.
560
00:44:05,319 --> 00:44:06,972
Und wen das noch nicht überzeugt,
561
00:44:06,972 --> 00:44:12,602
Hegelich erwartet keine große
Gefahr durch Social Bots im Wahlkampf.
562
00:44:13,410 --> 00:44:20,309
Zusammenfassung. Social Bot,
Filterblasen, Fake News. Ich versuche
563
00:44:20,309 --> 00:44:24,070
versuch's mal vorsichtig zu formulieren:
die Forschung ist noch in den Anfängen.
564
00:44:24,070 --> 00:44:28,369
Die Methodiken sind neu, teilweise
experimentell, und müssen noch überprüft
565
00:44:28,369 --> 00:44:32,319
werden. Und im Speziellen müssen die
wissenschaftlichen Publikation überprüft
566
00:44:32,319 --> 00:44:37,299
werden. Falls einer irgendwie in dem Thema
gerade arbeitet, den kann ich das ans Herz
567
00:44:37,299 --> 00:44:42,119
legen, als Bachelor- oder Masterarbeit mal
ans Herz zu legen, diese Studien
568
00:44:42,119 --> 00:44:45,789
tatsächlich zu überprüfen. Was ich bei
Social Bots, Filterblase und Fake News
569
00:44:45,789 --> 00:44:53,180
gefunden habe sind exemplarisch: Egon
Dombrowski und Ave Hurley. Wir haben in
570
00:44:53,180 --> 00:44:59,039
den Diskursen die Leute als Nazis,
bildungsfern, sozial abgehängt,
571
00:44:59,039 --> 00:45:04,219
Mittelschicht mit Verlustängsten und jetzt
auch neu als Social Bots bezeichnet.
572
00:45:04,219 --> 00:45:05,989
Aber was sie alle gemeinsam haben:
573
00:45:05,989 --> 00:45:07,750
Sie haben Angst und sie sind wütend.
574
00:45:07,750 --> 00:45:10,370
Und sie haben Vertrauensverlust
in die Institutionen.
575
00:45:10,370 --> 00:45:12,519
Und was wir beobachten ist das neue
576
00:45:12,519 --> 00:45:18,180
gesellschaftliche Gruppen in die sozialen
Netzwerke betreten, und sie nutzen ihr
577
00:45:18,180 --> 00:45:23,119
Recht und die Möglichkeit ihrer
Meinungsäußerung. Und im Zweifelsfall
578
00:45:23,119 --> 00:45:29,511
greifen sie auch auf Fake News zurück wenn
es ihre Ansichten bestätigt.
579
00:45:29,511 --> 00:45:33,330
Was wir aber beobachten ist, dass die
sozialen Netzwerke nicht geeignet sind, um
580
00:45:33,330 --> 00:45:37,319
gesellschaftliche Lösungen zu entwickeln.
Vielleicht gibt es irgendwann technische
581
00:45:37,319 --> 00:45:42,339
Lösungen. Wer weiß. Vielleicht gehört es
aber in Zukunft auch zur Medienkompetenz,
582
00:45:42,339 --> 00:45:47,859
eine gewisse Debattenkultur zu entwickeln.
Ich weiß es nicht. Das ist auf jeden Fall,
583
00:45:47,859 --> 00:45:51,229
ich will jetzt den Begriff "Neuland" nicht
verwenden, das auf jeden Fall ein neues
584
00:45:51,229 --> 00:45:55,630
Forschungsgebiet. Wir sehen glaube ich
dass hier eine neue Wissenschaft beginnt
585
00:45:55,630 --> 00:45:59,609
zu entstehen. Sie steckt noch in den
Kinderschuhen, aber sie macht gerade einen
586
00:45:59,609 --> 00:46:03,819
fundamentalen Wandel mit, von einer
ideographischen Wissenschaft, also einer
587
00:46:03,819 --> 00:46:07,529
reinen Phänomen beschreibenden, wie
Sozialwissenschaft, Kulturwissenschaft
588
00:46:07,529 --> 00:46:11,680
oder Politikwissenschaften, hin zu einer
nomothetischen Wissenschaft, die versucht
589
00:46:11,680 --> 00:46:16,160
Regeln zu erkennen, Gesetze zu entdecken,
reproduzierbare Ergebnisse zu entwickeln,
590
00:46:16,160 --> 00:46:20,750
so wie man das aus den Naturwissenschaften
kennt. Ähnliche Entwicklungen haben wir
591
00:46:20,750 --> 00:46:25,249
auch gesehen, die Astrologie, das war die
Lehre von den Sternen, bis dann das
592
00:46:25,249 --> 00:46:29,110
Teleskop erfunden wurde und wir nun
anfangen konnten, Gesetze in der Bewegung
593
00:46:29,110 --> 00:46:32,650
von Planeten und Sternen zu entdecken, die
reproduzierbar sind. Und aus der
594
00:46:32,650 --> 00:46:38,700
Astrologie wurde dann die Astronomie. Ich
sehe, dass wir in den Debatten, die jetzt
595
00:46:38,700 --> 00:46:44,209
in den sozialen Netzwerken stattfinden,
eine neue Wissenschaft haben können die
596
00:46:44,209 --> 00:46:49,049
sich mit diesem Thema beschäftigt. Und ich
glaube das ist nicht nur möglich ist,
597
00:46:49,049 --> 00:46:53,020
sozusagen als Teleskop oder Mikroskop die
für die Gesellschaft, sondern dass es auch
598
00:46:53,020 --> 00:46:58,090
notwendig ist. Und dazu ist viel Forschung
nötig und ich animiere jeden, der nicht so
599
00:46:58,090 --> 00:47:01,900
richtig weiß ob er jetzt in dem
geisteswissenschaftlichen Bereich oder im
600
00:47:01,900 --> 00:47:05,299
Data Science-Bereich arbeiten möchte,
diese beiden Welten miteinander zu
601
00:47:05,299 --> 00:47:12,180
verbinden. Bachelor und Master sind,
Arbeiten sind da gut definitiv
602
00:47:12,180 --> 00:47:17,469
prädestiniert um diese wissenschaftlichen
Ausarbeitungen zu reproduzieren. Und diese
603
00:47:17,469 --> 00:47:21,649
Studien von der Oxford-Universität oder
von South California zu reproduzieren
604
00:47:21,649 --> 00:47:25,630
und zu validieren. Und ich würde das gerne
unterstützen, und ich hoffe, die nächsten
605
00:47:25,630 --> 00:47:29,380
zweieinhalb Tage noch Zeit zu finden,
Teile meines Frameworks und auch der
606
00:47:29,380 --> 00:47:36,509
Rohdaten zu veröffentlichen. Ansonsten bin
ich die nächsten zweieinhalb Tage zu
607
00:47:36,509 --> 00:47:41,170
erreichen: DECT Telefonnummer 360, 3600
Entschuldigung, und Twitter-Account,
608
00:47:41,170 --> 00:47:45,839
@michaelkreil. Ich würde gerne andere
Leute, die in dem Bereich forschen oder
609
00:47:45,839 --> 00:47:53,049
sowas zusammenbringen um zu gucken ob wir
zum Thema Social Bot da nicht mal eine
610
00:47:53,049 --> 00:48:09,869
Wissenschaftssprache Debatte starten
können. Danke schön.
611
00:48:09,869 --> 00:48:16,200
Applaus
Herald: Mindestens das will ich nachher
612
00:48:16,200 --> 00:48:19,839
nochmal hören. Jetzt haben wir noch, ja,
etwas über ne Viertelstunde Zeit für
613
00:48:19,839 --> 00:48:24,599
Fragen und Antworten. Habt ihr Fragen an
Michael Kreil? Positioniert euch bitte an
614
00:48:24,599 --> 00:48:29,709
den Mikrophonen, ich versuche einigermaßen
ausgeglichen auszuwählen. Falls schon
615
00:48:29,709 --> 00:48:33,339
irgendwo jemand steht, steht schon
irgendwo jemand, hebt mal die Hand? Ah, da
616
00:48:33,339 --> 00:48:37,390
hinten. Mikrophon 4, fang an.
Mikrophon 4: Jawohl. Ich hab eine Frage
617
00:48:37,390 --> 00:48:45,549
bezüglich State-sponsored Propaganda, also
die sind wirklich Leute, die bezahlt
618
00:48:45,549 --> 00:48:52,320
werden von Staaten, damit die Propaganda
betreiben. Habt ihr auch in der Forschung
619
00:48:52,320 --> 00:48:55,609
diebezüglich was rausgefunden, oder habt
ihr das überhaupt untersucht?
620
00:48:55,609 --> 00:49:01,199
MK: Wir haben versucht, Leute zu finden,
die an den Bots, die an den politischen
621
00:49:01,199 --> 00:49:04,660
Diskursen teilnehmen. Ob sie jetzt
tatsächlich dafür bezahlt werden oder
622
00:49:04,660 --> 00:49:09,589
nicht ist unmöglich festzustellen. Wir
sehen aber, wenn jetzt zum Beispiel jemand
623
00:49:09,589 --> 00:49:15,129
bei der US-Wahl was postet und dann aber
in den nächsten Monaten bis heute noch
624
00:49:15,129 --> 00:49:18,680
ganz normales Leben auf den, in den
sozialen Netzwerken führt, und parallel
625
00:49:18,680 --> 00:49:22,400
dann auch noch auf Facebook oder sowas,
gehen wir eher davon aus, dass es sich
626
00:49:22,400 --> 00:49:27,040
nicht um einen bezahlten Akteur oder
Akteure handelt. Die große Frage, die ich
627
00:49:27,040 --> 00:49:30,759
mir eigentlich auch stelle ist dabei: Was
ist der tatsächliche impact, also die
628
00:49:30,759 --> 00:49:35,749
Unterstellung mit jemand bezahlt da
irgendwie, kann ich wirklich auf Twitter
629
00:49:35,749 --> 00:49:39,329
durch soziale Interaktion Leute davon
überzeugen, die politische Richtung zu
630
00:49:39,329 --> 00:49:43,049
wechseln? Das ist eine bisherige
Unterstellung, die noch nicht überprüft
631
00:49:43,049 --> 00:49:46,780
wurde, und deswegen finde ich das
vorsichtig, bin ich da vorsichtig, sowas
632
00:49:46,780 --> 00:49:50,009
anzunehmen.
H: Mikro 2.
633
00:49:50,009 --> 00:49:54,220
M2: Vielen, vielen Dank für den
großartigen Vortrag, ich fand' das super
634
00:49:54,220 --> 00:49:57,550
wichtig, anhand von dem kann man
eigentlich sehen, was sich wirklich an
635
00:49:57,550 --> 00:50:01,309
wissenschaftlichen Methodiken verändern
muss, und von daher vielen, vielen Dank.
636
00:50:01,309 --> 00:50:05,079
Ich habe eine Frage, ich habe mich gerade
gefragt, ob man wirklich von Fake News
637
00:50:05,079 --> 00:50:08,791
sprechen sollte, weil offensichtlich
spiegeln diese Nachrichten ja nur, was die
638
00:50:08,791 --> 00:50:14,309
Verbreiter und weiteren Re-tweeter der
Nachrichten hören oder sehen oder wissen
639
00:50:14,309 --> 00:50:18,319
wollen, also das, was sie eigentlich schon
denken, wird quasi nur gespiegelt. Und ich
640
00:50:18,319 --> 00:50:22,229
hab mich gefragt, ob es nicht irreführend
ist, dieses Wort "News", und ob man nicht
641
00:50:22,229 --> 00:50:25,760
ein neues Wort dafür finden müsste.
MK: Auf jeden Fall, auf jeden Fall. Wir
642
00:50:25,760 --> 00:50:30,699
haben auch zum Beispiel gesehen, dass bei
der US-Wahl relativ viele Fake News aus
643
00:50:30,699 --> 00:50:34,650
einer Stadt aus Osteuropa kommt, die aber
gar keine politische Agenda haben, sondern
644
00:50:34,650 --> 00:50:38,309
einfach nur Geld damit verdient haben,
dass ihre Posts sich so weit verbreitet
645
00:50:38,309 --> 00:50:42,459
haben, und damit klick-Werbung, verstanden
haben, Geld gewonnen haben. Da war
646
00:50:42,459 --> 00:50:47,829
überhaupt kein politischer, gar kein
politisches Ziel dahinter, im Gegenteil,
647
00:50:47,829 --> 00:50:51,550
laut eigener Aussage haben sie erst pro-
Clinton probiert, aber das hat einfach
648
00:50:51,550 --> 00:50:56,019
nicht so gut eingeschlagen wie pro-Trump-
Sachen. Deswegen halte ich auch den
649
00:50:56,019 --> 00:51:00,440
Begriff von Fake News dann auch nicht mehr
für angebracht.
650
00:51:00,440 --> 00:51:03,809
H: So, aus dem Internet haben wir auch
eine Frage.
651
00:51:03,809 --> 00:51:08,229
Signal-Engel: Ja, zuerst auch aus dem IRC
großes Lob an den Vortrag, es wurde
652
00:51:08,229 --> 00:51:12,529
angemerkt, es sei sehr interessant, mal
den Hashtag #34c3 zu analysieren und
653
00:51:12,529 --> 00:51:18,050
Trolle aufzudecken. Cyberrichter und Afdex
lässt fragen: Gibt es schon schlaue Bots
654
00:51:18,050 --> 00:51:21,769
mit Einfluss, ist irgendwas über die
Interaktion untereinander bekannt, gibt es
655
00:51:21,769 --> 00:51:33,180
bald Bot Wars?
MK: Äh. Flame-Bots, ja, äh. Das sind alles
656
00:51:33,180 --> 00:51:38,879
theoretische Konzepte. Wenn man sich die
Studien dazu durchliest, das sind alles
657
00:51:38,879 --> 00:51:42,539
Konzepte "es könne irgendwann mal so
sein". Ich stehe auch nicht hier und sage
658
00:51:42,539 --> 00:51:46,549
"sowas wird nie passieren" oder sowas.
Keine Ahnung, was es für Entwicklungen mit
659
00:51:46,549 --> 00:51:52,450
KI in den nächsten Tagen oder Monaten oder
so gibt. Aber das, was wir jetzt bisher
660
00:51:52,450 --> 00:51:56,709
sehen konnten, waren jetzt nicht
irgendwelche KI's, die durchs Internet
661
00:51:56,709 --> 00:52:00,239
laufen.
H: Die 3.
662
00:52:00,239 --> 00:52:07,039
M3: Servus. Wunderbar, funktioniert. Das
erste harte Kriterium, das mir einfallen
663
00:52:07,039 --> 00:52:11,059
würde, um Bot-Accounts von Menschen-
Accounts zu trennen wäre die posting-
664
00:52:11,059 --> 00:52:14,720
Frequenz, und die hat jetzt hier nur
einmal Einfluss gefunden - woran liegt
665
00:52:14,720 --> 00:52:17,289
das?
MK: Weil sie tatsächlich auch nur einmal
666
00:52:17,289 --> 00:52:25,729
auffällig war. Also, die anderen Accounts,
also ich meine, wenn ich jetzt nen Social
667
00:52:25,729 --> 00:52:29,809
Bot entwickle, dann wäre ich jetzt auch
schlau zu sagen okay, dann haut der jetzt
668
00:52:29,809 --> 00:52:35,450
nicht alle halbe Sekunde nen tweet raus,
wenn ich sowas bauen würde. Aber in diesem
669
00:52:35,450 --> 00:52:39,250
Fall ist es tatsächlich nur einmal
aufgetreten, das ein Bot sozusagen den Bug
670
00:52:39,250 --> 00:52:43,410
hatte, das zu tun.
M3: Okay, taugt also nicht. Super, danke.
671
00:52:43,410 --> 00:52:47,609
H: Und MIkro 1.
M1: Hallo erstmal, ja, jetzt geht's. Ich
672
00:52:47,609 --> 00:52:51,049
wollte fragen ob, weil du ja gesagt
hattest dass bei den Social Bots ja
673
00:52:51,049 --> 00:52:54,949
eigentlich der Einfluss sich verliert, ob
das dann wiederum heißen könnte, dass die
674
00:52:54,949 --> 00:52:59,349
eigentliche Gefahr von Filterblasen, dass
kein Meinungsdiskurs entsteht, oder dass
675
00:52:59,349 --> 00:53:03,789
der halt eingedämmt wird, ob das sich dann
verliert oder ob du in den Forschungen
676
00:53:03,789 --> 00:53:07,459
gesehen hast, dass die Gefahr gar nicht so
da ist, wie sie irgendwie überall
677
00:53:07,459 --> 00:53:12,009
propagiert wird? Ja.
MK: Also, zum Einen: Ich glaube, es gibt
678
00:53:12,009 --> 00:53:15,600
so einen Satz, den man in den letzten 10
Jahren immer wieder gehört hat, das
679
00:53:15,600 --> 00:53:18,460
Internet ist nicht an bestimmten Sachen
schuld, sondern das Internet macht nur
680
00:53:18,460 --> 00:53:22,339
einfach wieder Sachen sichtbar. Und ich
glaube, dass es eine Menge Leute gibt, die
681
00:53:22,339 --> 00:53:27,231
sich gerne an einem politischen Diskurs
beteiligen wollen und nicht die
682
00:53:27,231 --> 00:53:31,319
Möglichkeit hatten, und jetzt nun mit den
sozialen Netzen diese Möglichkeit haben,
683
00:53:31,319 --> 00:53:34,479
und dann als Bots klassifiziert werden.
Problem ist, dass ich deine Frage
684
00:53:34,479 --> 00:53:35,780
vergessen habe.
685
00:53:35,780 --> 00:53:37,690
M1: Ich wollte eigentlich nur wissen, ob
686
00:53:37,690 --> 00:53:41,079
diese Gefahr, dass man halt sagt, der
Diskurs ist so ein bisschen eingedämmt,
687
00:53:41,079 --> 00:53:44,891
weil jeder in seiner eigenen Blase lebt,
ob sich das nicht dadurch verliert, weil
688
00:53:44,891 --> 00:53:49,309
du ja gesagt hattest, Social Bots sind
unwirksam so wirklich, ob das nicht dann
689
00:53:49,309 --> 00:53:52,839
sich auch sozusagen auf das andere
übertragen lässt für unsere, für unseren
690
00:53:52,839 --> 00:53:56,701
normane Gebrauch.
MK: Genau, also, ich, kann ich, kann ich
691
00:53:56,701 --> 00:54:01,290
keine abschließende Meinung zu abgeben.
Ich weiß aber dass, oder man merkt es
692
00:54:01,290 --> 00:54:05,180
halt, dass die sozialen Netze oft, oder
fast immer nicht dazu geeignet sind,
693
00:54:05,180 --> 00:54:08,510
tatsächlich einen Diskurs zu führen,
sondern es gibt halt, es ist halt,
694
00:54:08,510 --> 00:54:12,139
endet immer in einem Flame War, sind
sozusagen, "du bist, ihr seid die Bösen,
695
00:54:12,139 --> 00:54:15,808
und wir sind die Guten." Aber tatsächlich
irgendwie eine Lösung zu entwickeln,
696
00:54:15,808 --> 00:54:18,029
eignet sich nicht dafür, vielleicht ist
der Mensch auch nicht dafür gemacht.
697
00:54:18,029 --> 00:54:22,279
Vielleicht haben Netzwerke nen, nen
bestimmten flaw, den wir halt noch nicht
698
00:54:22,279 --> 00:54:24,979
kennen, man darf ja auch nicht vergessen,
das ist eine extrem experimentelle
699
00:54:24,979 --> 00:54:29,930
Technologie. Noch nie gab es ein Netzwerk,
das weltübergreifend so vielen Menschen
700
00:54:29,930 --> 00:54:32,819
die Möglichkeit gibt, miteinander zu
kommunizieren und Diskurse zu führen.
701
00:54:32,819 --> 00:54:35,369
M1: Danke.
H: Mikro 4.
702
00:54:35,369 --> 00:54:40,789
M4: Ja, Hallo. Erstmal Kompliment für
diesen superwichtigen und sehr coolen
703
00:54:40,789 --> 00:54:44,730
Vortrag. Meine Frage: Du hattest ja jetzt
ausschließlich über Twitter gesprochen -
704
00:54:44,730 --> 00:54:48,420
habt ihr mal Analysen gefahren über andere
soziale Netze, die ja durchaus auch
705
00:54:48,420 --> 00:54:54,340
Verbreitung haben, speziell dazu, auch
nicht nur über die Anzahl der Tweets
706
00:54:54,340 --> 00:54:58,069
sondern auch über den Impact, weil die
Frage ist ja, die hattest du ja mehrfach
707
00:54:58,069 --> 00:55:01,450
aufgeworfen, was wirkt eigentlich eine
Tweet, wenn die, wenn die einen
708
00:55:01,450 --> 00:55:05,369
veröffentlichen, also ein Tweet auf 10.000
Follower könnte möglicherweise wichtiger
709
00:55:05,369 --> 00:55:10,170
sein als 10.000 Tweets mit einem Follower.
MK: Genau, da kann man sich halt Metriken
710
00:55:10,170 --> 00:55:14,790
überlegen. Normalerweise ist es für mich
halt ein Ausschlusskriterium, wenn ein
711
00:55:14,790 --> 00:55:19,009
Tweet nur, nicht gefavt wird und nicht
retweetet wird, das ist für mich, das ist
712
00:55:19,009 --> 00:55:22,349
ein Ausschlusskriterium. Was der
tatsächliche Impact ist, obs dafür ne
713
00:55:22,349 --> 00:55:27,920
Metrik gibt, weiß ich nicht. Kann man sich
überlegen, wie gesagt, neue Wissenschaft.
714
00:55:27,920 --> 00:55:33,190
Das andere ist, andere soziale Netzwerke.
Man sieht, dass auf YouTube ne Menge
715
00:55:33,190 --> 00:55:37,819
passiert. Ganz viele Leute packen im
Wohnzimmer die Kamera aus und teilen ihre
716
00:55:37,819 --> 00:55:42,180
politischen Meinungen im Wohnzimmer und
veröffentlichen das auf YouTube, es gibt
717
00:55:42,180 --> 00:55:47,839
auch dieses russische Social Network, wie
heißt das? VKan... VKan-irgendwas, ja.
718
00:55:47,839 --> 00:55:54,279
Genau, da gibt es - VKontakte, genau - da
gibt es auch, kenne ich eine Gruppe die
719
00:55:54,279 --> 00:55:57,980
sich damit beschäftigt hat, wie das da
aussieht, das ist aber ein sehr kleiner
720
00:55:57,980 --> 00:56:04,459
Teil, der große Brocken ist natürlich
Facebook, und Facebook hat zwei Probleme:
721
00:56:04,459 --> 00:56:08,720
Erstens gibt es eine Menge geschlossene
Gruppen wo viel stattfindet, da habe ich
722
00:56:08,720 --> 00:56:12,310
mal rein geguckt, sind die gleichen
Themen, es geht halt auch um Asylpolitik
723
00:56:12,310 --> 00:56:16,250
und so weiter. Und das andere Problem mit
Facebook ist, die API ist leider nicht so
724
00:56:16,250 --> 00:56:20,380
offen. Es gibt Schwierigkeiten, da große
Mengen an Daten rauszuholen. Ich glaube
725
00:56:20,380 --> 00:56:25,749
dass Facebook in diesem Bereich wahnsinnig
viel Datenmaterial hat und Forschung dazu
726
00:56:25,749 --> 00:56:29,680
betreiben könnte, aber leider halt nur
innerhalb eines Konzerns und nicht
727
00:56:29,680 --> 00:56:32,439
innerhalb der Forschungsgemeindschaft.
M4: Okay, danke.
728
00:56:32,439 --> 00:56:36,089
H: Unser Social Bot hat auch noch eine
Frage.
729
00:56:36,089 --> 00:56:41,170
Signal: Mie lässt fragen, ob es Studien zu
dem realen Ausmaß und dem realen Impact
730
00:56:41,170 --> 00:56:45,089
von Fake News in den sozialen Medien, und
wurden die eventuell zur Legitimation des
731
00:56:45,089 --> 00:56:49,079
NetzDGs herangezogen?
MK: Habe ich akustisch nicht verstanden.
732
00:56:49,079 --> 00:56:54,089
Signal: Gibt es Studien über das reale
Ausmaß von Fake News und wurden die
733
00:56:54,089 --> 00:56:56,219
herangezogen zur Legitimisierung des
NetzDGs?
734
00:56:56,219 --> 00:57:03,219
MK: Soweit ich weiß ist mir, mir ist keine
Studie bekannt, aus meiner Erfahrung würde
735
00:57:03,219 --> 00:57:07,250
ich sagen: Sie haben keinen Einfluss, weil
sie halt erstmal nicht Leute überzeugen,
736
00:57:07,250 --> 00:57:10,849
ich glaube die Leute kommen schon mit
einer Überzeugung in die Netzwerke und
737
00:57:10,849 --> 00:57:15,279
werden einfach nur noch weiter zusätzlich
bestätigt. Ich glaube, dass es einen
738
00:57:15,279 --> 00:57:20,019
gewissen Impact gibt mit Leuten, die
sozusagen Latent ne Sorge um
739
00:57:20,019 --> 00:57:24,650
Flüchtlingspolitik haben und dann nur noch
in einer Filterblase stecken und nur noch
740
00:57:24,650 --> 00:57:28,519
mit Flüchtlingskriminalität bombardiert
werden. Dass sie dazu dann auch neigen,
741
00:57:28,519 --> 00:57:32,429
eine Angst gegen beispielsweise Migranten
zu entwickeln. Aber eine Studie dazu ist
742
00:57:32,429 --> 00:57:35,529
mir noch nicht bekannt, wie das
tatsächlich, ob das psychologische
743
00:57:35,529 --> 00:57:39,220
Auswirkungen auf die Menschen hat.
H: Und die 2.
744
00:57:39,220 --> 00:57:45,910
Frage M2: Ja hallo, danke für den Vortrag.
Du hattest am Anfang so einen schöne
745
00:57:45,910 --> 00:57:49,539
Karte, wo verschiedene Gruppen aus dem
Twitternetzwerk aufgezeigt wurden, und
746
00:57:49,539 --> 00:57:53,690
dann hast du gezeigt, da sitzt die AfD und
dann kam der Switch und da sind die
747
00:57:53,690 --> 00:57:57,949
Fakenews. Wie hast du denn ermittelt, dass
diese Tweets Fakenews waren?
748
00:57:57,949 --> 00:58:01,619
Antwort: Also konkret, ich habe mir
Fakenews ausgesucht und hab geguckt wer
749
00:58:01,619 --> 00:58:05,949
sie auf Twitter teilt. Also andersrum, ich
hab mir sozusagen Geschichten rausgesucht,
750
00:58:05,949 --> 00:58:09,880
von denen ich weiß dass es Fakenews sind
und habe dann beispielsweise Blogpost und
751
00:58:09,880 --> 00:58:14,029
so weiter die es verbreitet haben und
diese URL... also wer twittert im Prinzip
752
00:58:14,029 --> 00:58:18,369
Fakenews und genau, dadurch kam dann diese
Einfärbung zustande.
753
00:58:18,369 --> 00:58:22,829
H: Mikro 3.
M3: Ja ich hab noch ein Frage zu
754
00:58:22,829 --> 00:58:26,889
Antworten, also ich hab oft gehört von
Journalisten die sich beschwert haben,
755
00:58:26,889 --> 00:58:30,510
wenn sie über ein bestimmtes Thema
berichtet haben, dass da irgendwelche Bots
756
00:58:30,510 --> 00:58:34,239
sie mit Antworten zumüllen oder sowas.
Hast du sowas beobachten können wird das
757
00:58:34,239 --> 00:58:37,959
irgendwie als Megafon eingesetzt um dann
einfach nochmal ein bisschen mehr Bums
758
00:58:37,959 --> 00:58:41,449
oder Druck zu machen auf solche Accounts?
Gibt's das was oder ist das auch
759
00:58:41,449 --> 00:58:44,809
eigentlich alles echte Menschen die
wirklich wütend sind?
760
00:58:44,809 --> 00:58:49,499
MK: Ich sag noch nicht, dass das alles
echte Menschen sind, also ich kann mit
761
00:58:49,499 --> 00:58:57,330
einem Bot zum Beispiel immer einen Hashtag
unbenutzbar machen. Ich kann mir einen
762
00:58:57,330 --> 00:59:00,890
Hashtag raussuchen und kann das dann mit
Bots vollmüllen, aber das ist dann
763
00:59:00,890 --> 00:59:05,670
eigentlich mehr ein Spam oder um den
Diskurs zu stören, aber nicht wirklich
764
00:59:05,670 --> 00:59:13,380
einen Einfluss zu haben dabei. Zu den
Journalisten, ich kenne da einige
765
00:59:13,380 --> 00:59:20,140
Journalisten, die auf Twitter aktiv sind
und dann immer wieder mit einer großen
766
00:59:20,140 --> 00:59:24,049
Anzahl Accounts konfrontiert werden. Ich
bin mir da auch nicht sicher,
767
00:59:24,049 --> 00:59:27,488
ob es tatsächlich sich um Botnetzwerke
handelt, denn es sind immer wieder
768
00:59:27,488 --> 00:59:31,209
vereinzelt Leute die unterschiedliche
Tweets machen, es ist ja schon wahnsinnig
769
00:59:31,209 --> 00:59:35,429
schwierig 100.000 künstliche Tweets zu
erzeugen mit einer künstlichen Intelligenz
770
00:59:35,429 --> 00:59:39,019
zu erzeugen, die aber unterschiedlich
sind. Das ist schon ein relativ hartes
771
00:59:39,019 --> 00:59:42,589
Problem, ich weiß nicht ob das bereits
gelöst ist, ich glaube nämlich nicht.
772
00:59:42,589 --> 00:59:48,469
H: Nummer 4 bitte.
M4: Eine Frage zu einem Kriterium, bei dem
773
00:59:48,469 --> 00:59:52,720
ich nicht weiß, ob es aufgetaucht ist oder
nicht, oder ob ich nur nicht aufmerksam
774
00:59:52,720 --> 00:59:58,400
genug war. Und zwar geht es um
gleichlautende Nachrichten in Tweets zum
775
00:59:58,400 --> 01:00:03,819
Beispiel. Also ich weiß, dass bei Fakenews
teilweise ganze absatzweise Texte 1 zu 1
776
01:00:03,819 --> 01:00:10,189
kopiert werden und auch manuell sozusagen,
trotzdem kommt mir das auch als ein
777
01:00:10,189 --> 01:00:14,709
wichtiges Kriterium vor um, wie gesagt,
einen Einflussfaktor, ist es ein Bot oder
778
01:00:14,709 --> 01:00:19,920
nicht festzustellen. Spielt das in den
Studien irgend eine Rolle, die Du
779
01:00:19,920 --> 01:00:24,849
untersucht hast oder für Deine Arbeit?
MK: In den Studien kann ich es nicht
780
01:00:24,849 --> 01:00:29,250
sagen, die hatten jetzt immer nur ihre
Kriterien mit den Hashtags und so weiter.
781
01:00:29,250 --> 01:00:35,550
Was in meiner Arbeit aufgefallen ist, dass
ist immer wieder, zum einen es gibt
782
01:00:35,550 --> 01:00:39,379
natürlich Leute die sagen, ich will das
jetzt nicht retweeten sondern ich kopiere
783
01:00:39,379 --> 01:00:43,189
den Tweet und sage sozusagen, dass das
mein Eigener ist. Aber es gibt tatsächlich
784
01:00:43,189 --> 01:00:48,220
bestimmte Formulierungen die zu
10.000-en identisch auftauchen, aber es
785
01:00:48,220 --> 01:00:53,429
sind tatsächlich nur Textdatenbanken, die
da einfach abgespielt werden, auch nicht
786
01:00:53,429 --> 01:00:57,210
mit politischen Inhalten, sondern ... ich
weiß nicht vielleicht sind die dormant
787
01:00:57,210 --> 01:01:01,680
oder sowas, aber keinerlei politische
Aktivität zu sehen dort.
788
01:01:01,680 --> 01:01:04,869
H: Und die 2 bitte.
Lachen
789
01:01:04,869 --> 01:01:12,109
M2: Ja hallo, auch nochmal vielen Dank für
den Vortrag. Eine Frage zu dem Thema
790
01:01:12,109 --> 01:01:20,149
Schweden-Reisewarnung, was am Anfang kam.
Wie viel Handarbeit war dabei die Tweets
791
01:01:20,149 --> 01:01:23,770
quasi rauszufinden, die zu dieser Story
gehören, und wie kannst Du Dir sicher
792
01:01:23,770 --> 01:01:27,269
sein, dass Du alle gefunden hast?
MK: Ich kann mir nicht sicher sein, dass
793
01:01:27,269 --> 01:01:31,131
ich alle gefunden habe, insbesondere weil
immer wieder Tweets gelöscht werden oder
794
01:01:31,131 --> 01:01:34,889
ganze Accounts. Das hat man auch gesehen,
wenn man sich die Daten mal ein halbes
795
01:01:34,889 --> 01:01:38,648
Jahr später anschaut, oder wie viele
Accounts in der Zwischenzeit weg sind. Ich
796
01:01:38,648 --> 01:01:41,990
kann mir nicht sicher sein, dass ich alle
Tweets gefunden habe, natürlich nicht. Was
797
01:01:41,990 --> 01:01:44,840
man halt machen kann ist sich
durchzuhangeln. Man fängt dann an mit
798
01:01:44,840 --> 01:01:48,789
sowas wie "Schweden Reisewarnung" und dann
sieht man die ersten, und dann kommen da
799
01:01:48,789 --> 01:01:52,600
aber auch noch andere Begriffe zusammen
und hier finde ich nochmal einen Link auf
800
01:01:52,600 --> 01:01:55,579
einen Blogpost und dann suche ich mal nach
dem und so weiter, und so wird die
801
01:01:55,579 --> 01:01:59,759
Datenbank immer größer und so habe ich
glaube ich 1800 Tweets oder sowas gefunden
802
01:01:59,759 --> 01:02:03,469
und versuch die dann so halbautomatisiert
zu kategorisieren mit Fakenews und so
803
01:02:03,469 --> 01:02:07,249
weiter. Das ist sozusagen die Methodik,
das ist eigentlich so halbautomatisierte
804
01:02:07,249 --> 01:02:10,119
Handarbeit.
H: Jetzt aber, Fefe.
805
01:02:10,119 --> 01:02:14,239
Frage M1 [???]: Ich hab eine
H: Die eins ist das bitte.
806
01:02:14,239 --> 01:02:19,159
Frage M1: Hallo, hallo. Also ich hab eine
kurze Frage und eine Bitte um weitere
807
01:02:19,159 --> 01:02:22,490
Daten. Erstens würde ich gerne wissen, wie
viele von Deinen Rohdaten Du
808
01:02:22,490 --> 01:02:26,760
veröffentlichen kannst und tust. Und
zweitens Dein Beispiel am Anfang mit der
809
01:02:26,760 --> 01:02:31,309
Twitter-Timeline da ging's irgendwie um
2.000 Tweets oder 2.000 Leute und das ist
810
01:02:31,309 --> 01:02:35,219
eine Größenordnung, die man häufiger sieht
in diesen Debatten und da frage ich mich
811
01:02:35,219 --> 01:02:39,230
immer, ich hab mehr ungelesene Mails in
meiner Inbox, wieso interessieren mich
812
01:02:39,230 --> 01:02:43,749
2000 Leute? Ist das irgendwie, wieso ist
das jetzt eine relevante Größenordnung?
813
01:02:43,749 --> 01:02:46,799
Kannst du da vielleicht noch etwas dazu
sagen?
814
01:02:46,799 --> 01:02:50,739
A: Okay, also das erste war, ob ich meine
Daten veröffentlichen kann. Es gibt
815
01:02:50,739 --> 01:02:54,529
tatsächlich eine Guideline von Twitter,
die es mir nicht erlaubt beispielsweise
816
01:02:54,529 --> 01:02:58,389
von einem bestimmten Account zehntausende
von Tweets zu veröffentlichen. Es gibt
817
01:02:58,389 --> 01:03:02,209
bestimmte Sachen, die man machen darf. Da
würde ich mich halt, sonst hätte ich es
818
01:03:02,209 --> 01:03:06,119
jetzt einfach mal so "Rechtsklick
veröffentlichen" gemacht. Ich würde es mir
819
01:03:06,119 --> 01:03:11,089
jetzt mal nochmal genauer anschauen, was
ich machen darf und so weiter. Gerade
820
01:03:11,089 --> 01:03:14,630
"hydrated Tweets" heißt das, also
sozusagen nicht nur Twitter-IDs zu haben,
821
01:03:14,630 --> 01:03:17,469
sondern wirklich eine große csv-Datei oder
sowas, die man dann sich in Excel mal
822
01:03:17,469 --> 01:03:20,930
durchklicken kann, kann glaube ich bei dem
ein oder anderen, der da frisch mit dem
823
01:03:20,930 --> 01:03:25,339
Thema ist schon weiterhelfen. Muss ich
halt mal kucken in den nächsten Tagen. Und
824
01:03:25,339 --> 01:03:29,329
die zweite Frage war, inwieweit
zweitausend Accounts einen Einfluss haben?
825
01:03:29,329 --> 01:03:33,150
F: Genau, vielleicht ein bisschen Kontext
geben. Ist das irgendwie besonders viel
826
01:03:33,150 --> 01:03:37,439
oder ist das üblich oder findest du das
eine relavante Größe? Wieso müssen wir
827
01:03:37,439 --> 01:03:41,029
über 2.000 reden, weil mir kommt es
intuitiv nicht so viel vor, frage ich
828
01:03:41,029 --> 01:03:44,299
mich. Bei 80 Millionen Leuten sind 2.000
Leute nicht so.
829
01:03:44,299 --> 01:03:48,620
A: Das ist halt auch ein klassisches
wichtiges Argument. Ich meine, erstens es
830
01:03:48,620 --> 01:03:51,920
sind nicht alle Leute in sozialen
Netzwerken, dann sind eine Menge Leute in
831
01:03:51,920 --> 01:03:55,829
Facebook. Es ist nur ein winzig kleiner
Teil davon auf Twitter und inwieweit da
832
01:03:55,829 --> 01:04:00,150
dann irgendwie 2.000 Leute tatsächlich
einen Impact haben auf einen politischen
833
01:04:00,150 --> 01:04:04,819
Diskurs in Deutschand, da wird dann immer
gesagt: ja aber in den sozialen Netzwerken
834
01:04:04,819 --> 01:04:09,500
sind aber die Aktivisten, die Journalisten
usw. und wenn die beeinflusst werden,
835
01:04:09,500 --> 01:04:16,230
irgendwie sowas. Tatsächlich halte ich die
Twitter-Diskussion nicht für politisch,
836
01:04:16,230 --> 01:04:18,679
gesellschaftlich relevant in Deutschland.
F: Lachen
837
01:04:18,679 --> 01:04:21,069
H: So, eine Frage schaffen wir noch. Das
ist die 4.
838
01:04:21,069 --> 01:04:30,269
Frage M4: Hallo! Erst kurz Danke, weil
Dein Projekt mir im Studium, mich ziemlich
839
01:04:30,269 --> 01:04:40,269
gerettet hat, also Danke. Und dann ist mir
halt aufgefallen, gerade bei diesen Troll-
840
01:04:40,269 --> 01:04:46,959
Armeen, keine Ahnung, diese bezahlten, ob
Du mal gekuckt hast in den Accounts, wie
841
01:04:46,959 --> 01:04:52,509
oft sich besitmmte Sachen wiederholen? Zum
Beispiel haben die ja oft dasselbe
842
01:04:52,509 --> 01:04:58,729
Profilbild und dann Accounts mit
fortlaufenden Nummern, wenn der erste
843
01:04:58,729 --> 01:05:02,629
gelöscht wird oder gesperrt?
A: Dieses Phänomen sieht man auch
844
01:05:02,629 --> 01:05:06,469
generell. Das sieht man auch bei wütenden
Bürgern, die in den sozialen Netzwerken
845
01:05:06,469 --> 01:05:10,199
sind. Dann von beispielsweise Twitter
gesperrt werden, dann wieder rauf kommen
846
01:05:10,199 --> 01:05:13,789
und dann packen sie sich hinter ihren
alten Usernamen einfach noch eine Zahl
847
01:05:13,789 --> 01:05:17,739
hinten dran. Aber ob die Leute tatsächlich
bezahlt werden oder nicht, das kriege ich
848
01:05:17,739 --> 01:05:21,510
über eine Twitter-API auch nicht heraus.
Eigentlich müsste man dann fast wie ein
849
01:05:21,510 --> 01:05:26,059
Ethnologe sich mit den Leuten unterhalten
und kucken, was sie da für eine Agenda
850
01:05:26,059 --> 01:05:31,660
haben. Ich finde es aber gefährlich dann
von vornherein zu sagen, die sind bezaht
851
01:05:31,660 --> 01:05:35,729
oder sind vom Kreml gesteuert oder sind
künstliche Intelligenzen oder keine Ahnung
852
01:05:35,729 --> 01:05:39,459
was. Das muss auf jeden Fall wieder eine
Debatte sein, die auf evidenzbasierter
853
01:05:39,459 --> 01:05:42,323
Forschung basiert.
F: Ja ich hab die auch nur. Bin ich noch
854
01:05:42,323 --> 01:05:44,150
da?
H: Ja.
855
01:05:44,150 --> 01:05:52,219
F: Ich hab die auch nur zufällig gefunden,
weil ich das halt gemacht hab damals zur
856
01:05:52,219 --> 01:05:58,920
Türkei-Wahl und es halt sehr viele
Accounts gab, die immer so türkischen Spam
857
01:05:58,920 --> 01:06:03,309
gepostet haben, sich dann aber plötzlich
in sehr schlechtem Deutsch in deutsche
858
01:06:03,309 --> 01:06:06,600
Debatten eingemischt hatten.
A: Super, dann sollten wir auf jeden Fall
859
01:06:06,600 --> 01:06:09,679
mal unterhalten, ich glaube da können wir
uns gegenseitig helfen.
860
01:06:09,679 --> 01:06:13,440
H: Unterhalten könnt ihr euch gleich neben
der Bühne, die Zeit ist nämlich jetzt
861
01:06:13,440 --> 01:06:17,563
leider um. Vielen Dank Michael Kreil! Da
geht mehr!
862
01:06:17,563 --> 01:06:25,709
Applaus
863
01:06:25,709 --> 01:06:30,999
Abspannmusik
864
01:06:30,999 --> 01:06:42,769
Untertitel erstellt von c3subtitles.de
im Jahr 2019. Mach mit und hilf uns!