1
00:00:00,140 --> 00:00:14,856
<i>Intro Musik</i>

2
00:00:14,856 --> 00:00:18,720
Herald: Ihr findet das ja wahrscheinlich
alle völlig normal mit großen Datenmengen

3
00:00:18,720 --> 00:00:23,710
umzugehen. So Typen wie ich, die
herkömmliche Journalisten sind, ich bin im

4
00:00:23,710 --> 00:00:27,339
Hauptberuf Hörfunkjournalist, die
verzweifeln regelmäßig daran. Also wir

5
00:00:27,339 --> 00:00:30,790
haben gelernt, damals, Leute zu fragen,
die sich mit irgendwas auskennen.

6
00:00:30,790 --> 00:00:33,012
Jetzt ist Leute fragen, 
die sich mit großen

7
00:00:33,012 --> 00:00:34,890
Datenmengen auskennen auch nicht unbedingt

8
00:00:34,890 --> 00:00:39,800
zielführend für unserein, dafür gibts aber
neuerdings einen relativ frischen Beruf,

9
00:00:39,800 --> 00:00:43,800
dieser Beruf nennt sich Datenjournalist.
Datenjournalisten sind diese Menschen, die

10
00:00:43,800 --> 00:00:47,140
aus aberwitzig großen Datenmengen
Zusammenhänge rauspopeln und diese

11
00:00:47,140 --> 00:00:49,900
Zusammenhänge dann idealerweise auch noch
so visualisieren,

12
00:00:49,900 --> 00:00:51,610
dass solche Noobs wie ich das dann

13
00:00:51,610 --> 00:00:54,679
auch verstehen und hinterher
kompetent drüber reden können, oder

14
00:00:54,679 --> 00:00:57,829
jedenfalls so aussehen können, als würden
sie kompetent drüber reden und einer der

15
00:00:57,829 --> 00:01:01,740
so Leute wie uns sehr dabei unterstützt,
ist Datenjournalist. Das ist nämlich der

16
00:01:01,740 --> 00:01:06,341
Michael Kreil und seinen Vortrag seht ihr
jetzt. Viel Spaß.

17
00:01:06,341 --> 00:01:16,880
<i>Applaus</i>
Michael: Guten Morgen. Ihr habt gut

18
00:01:16,880 --> 00:01:23,209
geschlafen, ich nicht, weil erstens halte
ich jetzt einen Vortrag vor vielen Leuten

19
00:01:23,209 --> 00:01:27,010
und zum anderen werde ich mich in ein--
mit einem Thema beschäftigen, das zu sehr

20
00:01:27,010 --> 00:01:30,640
hitzigen Debatten und Shitstorms geführt
hat und da möchte ich auch nicht im

21
00:01:30,640 --> 00:01:36,860
Zentrum sein. Deswegen ist auch meine
erste Folie der Disclaimer. Ich würde mich

22
00:01:36,860 --> 00:01:40,840
politisch als links einordnen. Ich
distanziere mich hiermit ausdrücklich

23
00:01:40,840 --> 00:01:44,950
gegen jegliche Form von Rassismus,
Sexismus, Antisemitismus,

24
00:01:44,950 --> 00:01:48,430
Fremdenfeindlichkeit, Islamfeindlichkeit
und allgemein gegen jede Form von

25
00:01:48,430 --> 00:01:56,929
gruppenbezogener Menschlichkeit (<i>Applaus</i>)
- Menschenfeindlichkeit. Und im Rahmen

26
00:01:56,929 --> 00:02:00,229
dieses Vortrags bin ich Wissenschaftler
und Beobachter einer hitzigen

27
00:02:00,229 --> 00:02:04,080
Gesellschaftsdebatte und sehe mich somit
der Neutralität verpflichtet. Ich möchte

28
00:02:04,080 --> 00:02:07,800
die Debatte beobachten und nicht Teil von
ihr sein. Es geht also nicht um meine

29
00:02:07,800 --> 00:02:12,080
politische Position sondern um eine
neutrale Analyse von Daten. Und dafür habe

30
00:02:12,080 --> 00:02:17,090
ich mal 150 Folien vorbereitet. Ich hab
den Übersetzungsengeln schon Bier

31
00:02:17,090 --> 00:02:23,030
versprochen. Ähm ... genau, dann lass uns
direkt reinschmeißen. Das erste ist die

32
00:02:23,030 --> 00:02:27,590
Methodik. Das möchte ich gerne nochmal
vorher erzählen, damit die Leute auch

33
00:02:27,590 --> 00:02:31,658
wissen, wie es funktioniert und mir ist es
auch wichtig, dass es reproduzierbar ist.

34
00:02:31,658 --> 00:02:37,850
Es gibt ne Twitter-API, in der man Status
und Tweets abfragen kann,

35
00:02:37,850 --> 00:02:40,946
User abfragen kann, 
welche Listen veröffentlicht wurden.

36
00:02:40,946 --> 00:02:43,740
Man kann danach suchen, 
gucken, welche Follower sie haben

37
00:02:43,740 --> 00:02:47,164
und so weiter und so fort. Dann
setzt man sich hin und dann baut man sich

38
00:02:47,164 --> 00:02:50,650
son Interface für die API, wenn man
sich ein bisschen Mühe gibt, packt man

39
00:02:50,650 --> 00:02:54,430
auch noch einen Cache dazwischen. Das
heißt wenn ich Anfragen an die Twitter-API

40
00:02:54,430 --> 00:02:57,780
stelle und eine Anfrage kommt
zweimal, dann holt er sie aus der

41
00:02:57,780 --> 00:03:02,629
Datenbank und so weiter. Und wenn man sich
richtig Mühe gibt und vielleicht auch ein

42
00:03:02,629 --> 00:03:07,730
paar Tage oder Wochen investiert, dann
skaliert man das in einer Art und Weise,

43
00:03:07,730 --> 00:03:11,770
dass man nicht ein Interface hat, sondern
ganz viele und jedes Einzelne davon steht

44
00:03:11,770 --> 00:03:15,710
für einen anderen Twitter-Nutzer. Die Idee
ist, dass ich nicht als einzelner Nutzer

45
00:03:15,710 --> 00:03:19,489
abfrage, sondern ganz viele Nutzer können
parallel die Twitter-API abfragen. Und

46
00:03:19,489 --> 00:03:25,909
darüber gibt es so eine Art Load-Balancer,
der guckt ob-- sozusagen, wie die Last

47
00:03:25,909 --> 00:03:30,650
verteilt wird. Ziel der Aktion ist, die
Twitter API ist nämlich limitiert. Ich

48
00:03:30,650 --> 00:03:34,439
kann wenn ich zum Beispiel wissen möchte,
wer wie wem folgt, darf ich pro Minute

49
00:03:34,439 --> 00:03:39,940
durchschnittlich nur eine Anfrage stellen.
Wenn aber ich von ganz vielen Leuten die

50
00:03:39,940 --> 00:03:44,470
Autorisierung habe, in deren Namen
Anfragen zu stellen, darf ich entsprechend

51
00:03:44,470 --> 00:03:48,470
mehr Anfragen stellen. Das ist so eine Art
demokratischer Prozess, finde ich da drin,

52
00:03:48,470 --> 00:03:53,970
dass die Ressourcen von Twitter aufgeteilt
werden. Umso mehr Leute mich bei meiner

53
00:03:53,970 --> 00:03:58,010
API-Anfrage unterstützen, um so mehr
Anfragen darf ich machen und umso mehr

54
00:03:58,010 --> 00:04:02,409
Last darf ich verursachen. Finde ich sehr
spann-- sympathisch. Mein Kollege jetzt

55
00:04:02,409 --> 00:04:06,360
hat dann mal ein Interface aufgebaut, wo
man einen Token spenden kann. Da klickt

56
00:04:06,360 --> 00:04:10,120
man da halt drauf und dann kriegt man--
kriegen wir sozusagen einen langen Code,

57
00:04:10,120 --> 00:04:13,840
der uns dann ermöglicht zusätzliche
Anfragen an die API von Twitter zu

58
00:04:13,840 --> 00:04:18,880
stellen. Großes Danke geht hier nochmal an
Logbuch Netzpolitik, insbesondere Tim und

59
00:04:18,880 --> 00:04:23,460
Linus, und natürlich an die fast 700
Spender und Spenderinnen, die uns Tokens

60
00:04:23,460 --> 00:04:29,110
zur Verfügung gestellt haben. Das war not-
wendig, um große Datenmengen aus Twitter

61
00:04:29,110 --> 00:04:33,486
herauszuholen. Genau, damit kann ich dann
sozusagen ...

62
00:04:33,486 --> 00:04:41,870
<i>Applaus</i>
Schon bei mir zu Hause kann ich dann über

63
00:04:41,870 --> 00:04:46,390
Kabel Deutschland 10 Requests pro Sekunde
absetzen, mal zum Vergleich, wenn ich

64
00:04:46,390 --> 00:04:50,550
jetzt zum Beispiel mal die Metadaten aller
330 Millionen Twitter-Accounts abfragen

65
00:04:50,550 --> 00:04:55,530
möchte, braucht man etwa vier Tage dafür.
Das ist dann auch machbar, ohne die Tokens

66
00:04:55,530 --> 00:04:59,890
kann es sich um Monate oder sogar um Jahre
handeln. Das mal so ein bisschen erklärt,

67
00:04:59,890 --> 00:05:04,100
technisch, wie das im Hintergrund
funktioniert. Im Prinzip auch sehr stark

68
00:05:04,100 --> 00:05:10,110
auf Twitter fokussiert, die Analysen.
Genau. Erstes Thema, Fake News. Fake News

69
00:05:10,110 --> 00:05:14,730
ist ein komplexes Thema. Ich habe jetzt
mal eine Grafik übernommen von der

70
00:05:14,730 --> 00:05:18,550
Stiftung Neue Verantwortung, ich finde die
haben da die besten Kategorisierungen

71
00:05:18,550 --> 00:05:23,290
gemacht, was Fake News sind und was Fake
News nicht sind. Auf der linken Seite was

72
00:05:23,290 --> 00:05:27,260
nicht Fake News sind, ist schlechte
Politik, also Fake News als politischer

73
00:05:27,260 --> 00:05:31,550
Kampfbegriff, zum Beispiel Trump gegen die
New York Times oder so was, aber auch

74
00:05:31,550 --> 00:05:35,581
Satire sind keine Fake News, schlechter
Journalismus, Clickbaiting oder auch

75
00:05:35,581 --> 00:05:41,070
Zeitungsenten sollen eigentlich nicht zu
Fake News gezählt werden, Fake News sein--

76
00:05:41,070 --> 00:05:49,760
oder sind gezielte Desinformation, falsch
verstandene Inhalte und manipulierte

77
00:05:49,760 --> 00:05:53,320
Inhalte, also oft sieht man, dass zum
Beispiel Bilder beschnitten sind oder

78
00:05:53,320 --> 00:06:00,100
retuschiert sind und so weiter oder völlig
frei erfundene Inhalte. Ich habe leider

79
00:06:00,100 --> 00:06:03,780
nur ne Stunde Zeit, deswegen kann ich
mich jetzt nicht mit mehreren Fake News-

80
00:06:03,780 --> 00:06:07,420
Wellen auseinandersetzen. Deswegen habe
ich eine herausgenommen, die ich ganz

81
00:06:07,420 --> 00:06:14,241
typisch und eindrucksvoll fand und zwar
die Fake News über eine Reisewarnung nach

82
00:06:14,241 --> 00:06:19,270
Schweden des Auswärtigen Amtes. Hier ist
ein Tweet von der AfD Magdeburg, die sagt:

83
00:06:19,270 --> 00:06:22,780
„Das Auswärtige Amt - Erhöhte
Terrorwarnstufe für Schweden. Das hat

84
00:06:22,780 --> 00:06:26,640
natürlich nichts mit irgendwas zu tun.
Hashtag AfD wählen". Direkt danach-- naja

85
00:06:26,640 --> 00:06:32,700
nicht direkt danach, einige Stunden oder
Tage später kam ein Tweet des Auswärtigen

86
00:06:32,700 --> 00:06:37,000
Amtes, die dann die Gegendarstellung
veröffentlicht haben: „Es gibt keine

87
00:06:37,000 --> 00:06:42,360
Reisewarnung für Schweden. Hashtag Fake
News". Fast 2000 Tweets wurden zu diesem

88
00:06:42,360 --> 00:06:46,290
Thema veröffentlicht und die kann ich
jetzt nun mit diesem Twitter-Framework

89
00:06:46,290 --> 00:06:51,340
runterladen, analysieren und mir ein paar
Visualisierungen dazu ausdenken. Ich hab

90
00:06:51,340 --> 00:06:56,750
mal die Eine gemacht, das ist jetzt ein
Zeitstrahl. Auf der x-Achse sieht man die

91
00:06:56,750 --> 00:07:03,641
Zeit. Hier geht's vom 2. März bis zum-- 0
Uhr bis zum 9. März 0 Uhr. Oben, die

92
00:07:03,641 --> 00:07:08,140
Roten, das sind die Fake News-Verbreiter.
Unten, das sind diejenigen, die die

93
00:07:08,140 --> 00:07:11,962
Gegendarstellungen verbreiten. Auf dem
Zeitstrahl sind -- viel zu klein, das kann

94
00:07:11,962 --> 00:07:15,632
man jetzt drauf nicht sehen -- der
Zeitpunkt, wann ein Tweet veröffentlicht

95
00:07:15,632 --> 00:07:17,310
wurde und wenn er retweetet wurde,

96
00:07:17,310 --> 00:07:18,840
kriegt er sozusagen 
einen Bogen,

97
00:07:18,840 --> 00:07:20,940
zu dem Zeitpunkt,
wohin er retweetet wurde.

98
00:07:20,940 --> 00:07:21,890
Das hat den Vorteil,

99
00:07:21,890 --> 00:07:23,450
dass ich nicht nur 
sehe, wie viele Tweets

100
00:07:23,450 --> 00:07:25,180
veröffentlicht wurden,
sondern auch sehen kann,

101
00:07:25,180 --> 00:07:26,800
welchen Impact dieser Tweet hat.

102
00:07:26,800 --> 00:07:28,970
Wenn er also, zum Beispiel
veröffentlicht wird und keiner

103
00:07:28,970 --> 00:07:32,560
geht damit um, dann ist es halt nur ein
Punkt, aber wenn es viele Leute retweeten,

104
00:07:32,560 --> 00:07:38,800
gibts dann halt große Bögen dazu. Das--
Den ersten Tweet, den ich finden konnte,

105
00:07:38,800 --> 00:07:44,180
zu der Fake News, dass es eine
Reisewarnung nach Schweden gibt, war-- ist

106
00:07:44,180 --> 00:07:49,100
bereits am 28. September veröffentlicht
worden, wurde aber nicht beachtet. Keine

107
00:07:49,100 --> 00:07:55,180
Favs, keine Retweets, obwohl der Account
aktuell 481 Follower hat. Am--, im Februar

108
00:07:55,180 --> 00:08:01,960
gab es dann nochmal einen Tweet dazu. Der
Account hat jetzt aber nur einen Follower

109
00:08:01,960 --> 00:08:05,520
und der Tweet hat keine Retweets. Das
heißt also die Themen kamen schon mal

110
00:08:05,520 --> 00:08:11,650
vorher hoch, aber sie wurden nicht
weitergetragen. Noch ein Beispiel aus dem

111
00:08:11,650 --> 00:08:16,850
1. März 2017. Also jetzt gehen wir mal
rüber zu unserem Zeitstrahl, da gibt's

112
00:08:16,850 --> 00:08:24,570
dann den ersten, der dazu was twittert,
einen Screenshot von einem Bot, der

113
00:08:24,570 --> 00:08:29,540
Reisewarnungen veröffentlicht. Der Tweet
hat immerhin 6 Tweets und 6 Favs-- 6

114
00:08:29,540 --> 00:08:38,200
Retweets und 6 Favs erreicht und hat damit
sozusagen den ersten kleinen Impact. Dann

115
00:08:38,200 --> 00:08:43,970
steigert es sich immer mehr, dann gibt's
die Reisewarnung für Schweden mit 29

116
00:08:43,970 --> 00:08:48,460
Retweets. Der nächste Tweet, kann ich
leider nicht mehr anzeigen, weil der

117
00:08:48,460 --> 00:08:52,330
Account inzwischen gesperrt wurde, das ist
auch ein Phänomen, das man immer wieder

118
00:08:52,330 --> 00:08:56,311
sieht, dass in diesem Bereich Accounts
gesperrt werden von Twitter. „Trump hatte

119
00:08:56,311 --> 00:09:02,440
recht, Auswärtiges Amt gibt Reisewarnung
für Schweden heraus". Genau, und verweist

120
00:09:02,440 --> 00:09:11,380
auf einen Artikel von zuerst.de. 45
Retweets und es steigert sich immer mehr.

121
00:09:11,380 --> 00:09:20,700
„Doch nicht alles ruhig in Schweden".
Holger Ewald. „Islamterror". Und dann zum

122
00:09:20,700 --> 00:09:25,630
Schluss die AfD Magdeburg mit--, die dann
aufspringt und dann das erste AfD-Hashtag

123
00:09:25,630 --> 00:09:29,490
dran setzt und „Multikulturell scheint es
nicht so richtig zu laufen in Schweden".

124
00:09:29,490 --> 00:09:33,330
Man sieht, dass es eine Steigerung gibt
von fängt an mit Reisehinweisen und endet

125
00:09:33,330 --> 00:09:40,000
mit Islamterror. Ich springe jetzt mal
ganz weit nach vorne zu den Antworten.

126
00:09:40,000 --> 00:09:44,370
Diejenigen, die also dann die
Gegendarstellung veröffentlichen, da

127
00:09:44,370 --> 00:09:48,850
fing's, oder der Startschuss war da das
Auswärtige Amt, die in einem-- die dann

128
00:09:48,850 --> 00:09:54,080
erklären, dass es sich um Fake News
handelt und relativ schnell springen dann

129
00:09:54,080 --> 00:10:00,560
halt auch die Medien mit auf, die das
sozusagen weiterverbreiten. Und zum

130
00:10:00,560 --> 00:10:06,630
Schluss sieht man den gesamten Zeitstrahl
nochmal und das Interessante ist dabei,

131
00:10:06,630 --> 00:10:10,960
dass das Thema gar nicht sozusagen, dass
ne Fake News veröffentlicht wird und dann

132
00:10:10,960 --> 00:10:14,750
schlägt die total ein und alle sind total
empört, sondern man stottert sich

133
00:10:14,750 --> 00:10:18,710
sozusagen förmlich in die Fake News rein.
Also es fängt klein an und dann werden sie

134
00:10:18,710 --> 00:10:24,870
nochmal weiter überspitzt und man hat eher
den Eindruck, als ob da rumexperimentiert

135
00:10:24,870 --> 00:10:29,790
wird, bis das Netzwerk eine Resonanz
hervorruft. Ich würde persönlich

136
00:10:29,790 --> 00:10:34,030
behaupten, Fake News sind eigentlich Meme,
die sich im Internet verbreiten. Oft

137
00:10:34,030 --> 00:10:39,180
haben sie keine singuläre Quelle, sondern
sie bilden sich erst im Netzwerk oder

138
00:10:39,180 --> 00:10:43,120
anders formuliert, das Kern-Phänomen an
Fake News ist nicht deren Existenz,

139
00:10:43,120 --> 00:10:46,831
sondern, dass sie sich so gut verbreiten
können, also das Problem ist nicht die

140
00:10:46,831 --> 00:10:52,880
Quelle, die sie erzeugt, sondern dass sie
eine so große Resonanz im Netzwerk findet.

141
00:10:52,880 --> 00:10:57,500
Würde man also Fake-News-Quellen
verbieten, würden sie trotzdem weiterhin

142
00:10:57,500 --> 00:11:02,271
entstehen, im Netzwerk. Und das ist halt
wichtig, da Fake News als Meme eine große

143
00:11:02,271 --> 00:11:06,350
Reichweite haben, kann man aus ihnen
Kapital schlagen, politisches oder

144
00:11:06,350 --> 00:11:10,290
monetäres Kapital. Und da möchte ich mal
aus dem amerikanischen Raum, zum Beispiel

145
00:11:10,290 --> 00:11:15,680
Breitband News und-- Breitbart News und
Trump erwähnen, die monetäres Kapital oder

146
00:11:15,680 --> 00:11:20,280
politisches Kapital daraus schlagen. Aber
zurück zu den Reisewarnungen. Man kann

147
00:11:20,280 --> 00:11:25,970
sie nicht nur im zeitlichen Verlauf sich
anschauen, sondern man kann tiefer

148
00:11:25,970 --> 00:11:29,380
einsteigen. Man kann halt gucken, welche
Accounts haben denn jetzt die

149
00:11:29,380 --> 00:11:33,500
Gegendarstellungen und die Fake News
verbreitet und kann gucken, wie die sich

150
00:11:33,500 --> 00:11:41,990
gegenseitig folgen. Und daraus baut man
dann so ein Netzwerk. Die Blauen sind die

151
00:11:41,990 --> 00:11:47,000
Gegendarstellungensverbreiter und die
Roten sind die Fake-News-Verbreiter. Um so

152
00:11:47,000 --> 00:11:51,060
näher sie grafisch dargestellt werden,
umso also-- folgen die sich. Also

153
00:11:51,060 --> 00:11:54,890
sozusagen, alle Kugel stoßen sich ab und
die, die sich folgen, ziehen sich an und

154
00:11:54,890 --> 00:11:58,570
daraus kann man halt solche komplexen
Netzwerke grafisch darstellen. Das

155
00:11:58,570 --> 00:12:03,060
Interessante ist, dass die Fake-News-
Verbreiter sich in einer Gruppe fast

156
00:12:03,060 --> 00:12:10,440
außerhalb befinden und eigentlich nur noch
über die Massenmedien verbunden sind mit

157
00:12:10,440 --> 00:12:14,860
der Gesellschaft. Man sieht natürlich
auch noch Tendenzen, dass viele Fake-News-

158
00:12:14,860 --> 00:12:18,280
Verbreiter dann mit Lügenpresse usw.
versuchen sich weiter von diesen--

159
00:12:18,280 --> 00:12:23,080
von den Medien zu distanzieren. Aber
tatsächlich sind es zwei verschiedene

160
00:12:23,080 --> 00:12:28,840
Gruppen, die man hier sehen kann und das
erste Mal, als ich das Bild gesehen habe,

161
00:12:28,840 --> 00:12:32,310
habe ich gedacht: "Oh, das ist eine
Filterblase oder eine Echokammer oder

162
00:12:32,310 --> 00:12:37,930
sowas." Das Schöne ist, weil wir mit
Twitter-APIs tiefer in die Daten rein-

163
00:12:37,930 --> 00:12:44,310
gucken können, können wir von jedem ein--
die die Timeline rekonstruieren. Also ich

164
00:12:44,310 --> 00:12:49,800
hab jetzt mal so schematisch dargestellt
die Gegendarsteller und die Fake-News-

165
00:12:49,800 --> 00:12:55,830
Verbreiter und man sieht, dass von den 
Fake-News-Verbreitern 89% die

166
00:12:55,830 --> 00:13:00,980
Gegendarstellungen mitbekommen haben, aber
sie nicht weiter teilen. Und nur 45%

167
00:13:00,980 --> 00:13:04,020
derjenigen, die die Gegendarstellung 
verbreitet haben, haben

168
00:13:04,020 --> 00:13:07,710
die tatsächliche ursprüngliche Fake News
eigentlich mitbekommen. Das Ergebnis

169
00:13:07,710 --> 00:13:14,211
daraus ist, es gibt eine Filterblase und
zwar bekommen wir die Fake News nicht mit.

170
00:13:14,211 --> 00:13:18,400
<i>Gelächter</i>
Was ist jetzt eigentlich tatsächlich

171
00:13:18,400 --> 00:13:23,220
dieser Impact dieser Gruppe. Und dann
hab' ich ganz ganz schweres Geschütz

172
00:13:23,220 --> 00:13:27,780
aufgefahren und habe 1,6 Millionen
Twitter-Accounts, die angegeben haben,

173
00:13:27,780 --> 00:13:31,780
dass sie Deutsch sprechen, extrahiert und
geguckt, wie die sich gegenseitig folgen.

174
00:13:31,780 --> 00:13:35,670
Also ähnlich wie diese Filterblasengrafik
gerade sieht man hier jetzt das gesamte

175
00:13:35,670 --> 00:13:39,432
deutschsprachige Twitternetzwerk,
eingefärbt nach Herkunftsland. Also hier

176
00:13:39,432 --> 00:13:43,090
unten haben wir die Schweiz und da haben
wir Österreich, wenn man ein bisschen

177
00:13:43,090 --> 00:13:45,589
klickt, sieht man das so wer 
sich dahinter befindet.

178
00:13:45,589 --> 00:13:46,836
Und das Schöne ist, ...

179
00:13:46,836 --> 00:13:50,090
das ist son Tool was ich gebastelt habe
Man kann das unterschiedlich einfärben.

180
00:13:50,090 --> 00:13:54,160
Hier kann man zum Beispiel
mal das Alter des Accounts einfärben. Rot

181
00:13:54,160 --> 00:13:57,810
sind die alten, grün sind die eher
neueren Accounts. Hier oben sind die

182
00:13:57,810 --> 00:14:02,770
Jugendlichen, da ist viel Justin Bieber
und YouTube und Let's Play dabei. Hier

183
00:14:02,770 --> 00:14:09,120
haben wir eine Blase, die sich mit Porn
beschäftigt (<i>Lachen</i>), nicht drauf klicken.

184
00:14:09,120 --> 00:14:13,470
Hier haben wir eine Gruppe, die sich mit
Marketing beschäftigt, so würde ich das

185
00:14:13,470 --> 00:14:19,350
mal umschreiben, größtenteils SEO und
keine Ahnung was. Und das sind die Leute,

186
00:14:19,350 --> 00:14:23,320
die sich eigentlich mit Politik und Medien
beschäftigen und vielleicht auch die, die

187
00:14:23,320 --> 00:14:26,750
jetzt hier auch hier im Raum auf Twitter
sind, wahrscheinlich am meisten

188
00:14:26,750 --> 00:14:32,220
mitbekommen. Man kann aber diese Grafik
auch anders einfärben und zwar kann ich

189
00:14:32,220 --> 00:14:38,880
mal einfärben, welche
Bundestagsabgeordneten oder Kandidaten von

190
00:14:38,880 --> 00:14:42,571
Parteien wo sich in diesem Netzwerk
befinden und entsprechend einfärben. Und

191
00:14:42,571 --> 00:14:48,460
man sieht zum Beispiel Gelb FDP, Schwarz,
Rot, Grün, Blau, Rot, Grün befinden sich

192
00:14:48,460 --> 00:14:53,541
alle so in einer verteilten Gruppe und es
gibt eine sehr enge Gruppe aus Leuten, die

193
00:14:53,541 --> 00:14:59,390
Mitglieder der AfD sind und auf Twitter
aktiv sind. Ich vergrößer das mal so ein

194
00:14:59,390 --> 00:15:03,030
bisschen. Und jetzt verändere ich wieder
diese Färbung und zwar als erstes

195
00:15:03,030 --> 00:15:06,815
die Fake-News-Verbreiter. Ja.
<i>Gelächter</i>

196
00:15:06,815 --> 00:15:15,029
Der Witz ist.
<i>Applaus</i>

197
00:15:15,029 --> 00:15:18,630
Der Witz ist, dass es nicht die AfD-
Abgeordneten selber sind, die das Fake-

198
00:15:18,630 --> 00:15:22,540
News verbreiten, aber sie befinden sich in
einer gleichen Gruppe da drin. Man kann

199
00:15:22,540 --> 00:15:26,590
auch einfärben nach Alter. Man sieht, dass
die Accounts dieser Gruppe eher jung sind,

200
00:15:26,590 --> 00:15:31,820
also relativ frisch auf Twitter. Sie haben
eine sehr hohe Aktivität. Rot heißt viele

201
00:15:31,820 --> 00:15:35,410
Tweets pro Tag veröffentlicht werden.
Und man kann von dieser Gruppe auch

202
00:15:35,410 --> 00:15:40,190
schauen, welche typischen Begriffe sie
verwenden, um zu vergleichen, mit was das

203
00:15:40,190 --> 00:15:44,161
restliche Twitter-Netzwerk für Begriffe
verwendet. Und die Begriffe, die am

204
00:15:44,161 --> 00:15:47,920
häufigsten in dieser Gruppe verwendet
werden, im Vergleich zu anderen

205
00:15:47,920 --> 00:15:52,430
Twitter-Accounts, sind Islam, Deutschland,
Migranten, Merkel, Maas, Politik,

206
00:15:52,430 --> 00:15:56,990
Freiheitskampf, Flüchtlinge, SPD,
Netzdurchsetzungsgesetz, NPD, Antifa,

207
00:15:56,990 --> 00:16:02,910
Zensur, PEGIDA, Syrer, Asylbewerber. Man
sieht relativ klar, dass diese Gruppe auch

208
00:16:02,910 --> 00:16:07,890
eher monothematisch unterwegs ist. Also,
was ist das für eine Gruppe? Und ich sehe

209
00:16:07,890 --> 00:16:13,480
wir müssen uns beeilen. Sie sind relativ
neu auf Twitter. Sie stehen der AfD nah.

210
00:16:13,480 --> 00:16:19,740
Sie teilen oft Fake News. Sie sind auf
Twitter sehr aktiv. Und sie befassen sich

211
00:16:19,740 --> 00:16:25,870
fast monothematisch mit Migrations- und
Asylpolitik. Und ich komme auf diese

212
00:16:25,870 --> 00:16:30,470
Gruppe wieder zurück, denn den ersten- die
erste Theorie, die man jetzt reinwerfen

213
00:16:30,470 --> 00:16:37,399
würde, sind Social Bots. Und da es in
diesem Vortrag auch darum geht, ist der

214
00:16:37,399 --> 00:16:42,120
nächste Block sich mal das Thema Social
Bots genauer anzuschauen. Zu Social Bots

215
00:16:42,120 --> 00:16:46,930
wurde eine Menge veröffentlicht, auch in
den Medien. „Warum Meinungsroboter die

216
00:16:46,930 --> 00:16:50,930
Gefahr für die Demokratie werden.“,
„Digitale Dreckschleudern“, „Angriff der

217
00:16:50,930 --> 00:16:57,940
Meinungsroboter“. Jeder hat da irgendwie
auch seine Meinung und seine Gefahr

218
00:16:57,940 --> 00:17:02,460
hervorgebracht. Was sind eigentlich Social
Bots? Es gibt aus dem Büro für

219
00:17:02,460 --> 00:17:06,920
Technikfolgen-Abschätzung beim Deutschen
Bundestag einen Absatz, den ich mal

220
00:17:06,920 --> 00:17:10,609
herausgegriffen habe. Social Bots, die
Computerprogramme, die uns irgendwie in

221
00:17:10,609 --> 00:17:14,769
den sozialen Medien manipulieren können.
„Echte Menschen, die mit dem Social Bot

222
00:17:14,769 --> 00:17:18,556
kommunizieren, nehmen diese nicht als
durch Algorithmen ausgelöste automatische

223
00:17:18,556 --> 00:17:22,120
Kommunikation, sondern als echte Internet-
teilnehmer wahr und sind sich der

224
00:17:22,120 --> 00:17:26,270
Manipulation nicht bewusst." Konkret, was
diese Social Bots angeblich machen sollen

225
00:17:26,270 --> 00:17:31,040
können, sind, sie können den Turing-Test
bestehen. Das heißt, Die Idee eines Turing

226
00:17:31,040 --> 00:17:35,080
Tests ist, ich interagiere mit etwas und 
kann hinterher sagen,

227
00:17:35,080 --> 00:17:37,000
ob es ein Mensch,
oder ein Computer ist.

228
00:17:37,000 --> 00:17:40,420
Und diese Social Bots sollen
jetzt magischer Weise diesen Turing-Test

229
00:17:40,420 --> 00:17:44,690
bestehen können und können nicht nur so
tun als wären sie ein Mensch, sondern sie

230
00:17:44,690 --> 00:17:49,220
können angeblich sogar noch unsere Meinung
beeinflussen. Naja, zumindest hat der

231
00:17:49,220 --> 00:17:50,490
Bundestag veröffentlicht:

232
00:17:50,490 --> 00:17:53,448
"Wirkung von Social Bots ist 
unter Sachverständigen strittig."

233
00:17:53,448 --> 00:17:57,800
Ich hab mal extra das vorgespult, wo
Linus Neumann zu sehen ist. Aber, da ich

234
00:17:57,800 --> 00:18:01,900
ja so ein Framework habe, kann ich jetzt
auch selber mal reinschauen. Was sind denn

235
00:18:01,900 --> 00:18:05,820
diese Social Bots? Da kommt man schnell in
so einen Teufelskreis. Wenn ich Social

236
00:18:05,820 --> 00:18:10,800
Bots auf Twitter finden möchte, dann muss
ich sie erstmal suchen. Und dazu muss ich

237
00:18:10,800 --> 00:18:14,660
erst mal wissen, wie sie denn eigentlich
aussehen. Und um zu wissen, wie sie

238
00:18:14,660 --> 00:18:18,050
aussehen, muss ich sie erst mal
analysieren können und dazu brauche ich

239
00:18:18,050 --> 00:18:21,940
erst mal welche. Also, zu sagen „Okay, da
gibts irgendwelche.", das bringt nichts.

240
00:18:21,940 --> 00:18:27,000
Ich muss entweder eine Gruppe haben, um
sie analysieren zu können, damit ich die

241
00:18:27,000 --> 00:18:30,610
Eigenschaften rauskriegen kann, oder
andersrum. Und diesen Teufelskreis

242
00:18:30,610 --> 00:18:34,210
durchbrechen, gibt unterschiedliche
Möglichkeiten. Ich habe mich mal für den

243
00:18:34,210 --> 00:18:38,670
folgenden Weg entschlossen. Ich kaufe
jetzt einfach mal Social Bots.

244
00:18:38,670 --> 00:18:39,795
<i>Gelächter</i>

245
00:18:40,030 --> 00:18:42,740
Kleine Anmerkung, Moment, Moment.

246
00:18:42,750 --> 00:18:45,429
Es sind nicht wirklich Social Bots
im dem engeren Sinne,

247
00:18:45,429 --> 00:18:49,920
sondern ich hab mir einfach 4.500 Bots
gekauft. Ob die jetzt tatsächlich dann

248
00:18:49,920 --> 00:18:53,620
auch mit den Leuten sozial interagieren
usw., weiß ich ja nicht. Aber im

249
00:18:53,620 --> 00:18:57,610
Kern hab ich mir einen Twitter-Account
Software Team Berlin geholt. Habe keinem

250
00:18:57,610 --> 00:19:01,309
gesagt, damit ich also weiß, dass kein
realer Mensch diesem Account folgt und

251
00:19:01,309 --> 00:19:06,530
habe dann auf Google gesucht „buy Twitter
Bots". Genau. Und dann gibt's dann 4.500

252
00:19:06,530 --> 00:19:09,870
Follower und davon sind 100% Bots.
Das ist nur um zu gucken, welche

253
00:19:09,870 --> 00:19:13,870
Technologien werden dann eingesetzt, 
obs dann Follower Bots sind usw. Um zu

254
00:19:13,870 --> 00:19:17,820
gucken, sehe ich dann bestimmte
Eigenschaften, die ich bei Menschen nicht

255
00:19:17,820 --> 00:19:24,309
sehe. Also sozusagen eher eine
Trockenübung, ja. Also wieder das große

256
00:19:24,309 --> 00:19:28,220
Twitter-Framework draufgeworfen und die
Metadaten analysiert. Und raus kommt

257
00:19:28,220 --> 00:19:35,050
folgende Grafik: Jeder einzelne Punkt ist
eines dieser eingekauften Follower. 4.500

258
00:19:35,050 --> 00:19:39,190
Punkte, und ich weiß 100 % Bots
dabei. Und ich versuche die nun zu

259
00:19:39,190 --> 00:19:43,181
sortieren nach ihren Eigenschaften. Alles,
was eher wie ein Bot aussieht, ist auf der

260
00:19:43,181 --> 00:19:47,007
linken Seite und alles ,was eher wie ein
Mensch aussieht, auf der rechten Seite.

261
00:19:47,007 --> 00:19:50,280
Ich kann jetzt auf die einzelnen drauf
klicken; ich klicke jetzt mal auf den ganz

262
00:19:50,280 --> 00:19:56,370
linken unteren drauf, dann hab ich einen
Asus D5B23, und habe unterschiedliche

263
00:19:56,370 --> 00:20:00,340
Eigenschaften von dem, die ich von ihm
überprüft habe, wie zum Beispiel, ob er

264
00:20:00,340 --> 00:20:06,510
immer noch sozusagen ein Egg ist, also ob
er noch gar kein Avatar Bild hochgeladen

265
00:20:06,510 --> 00:20:12,799
hat, ob er weniger als 10 Follower hat,
wieviele Favs er hat, abgesetzt hat. Ob er

266
00:20:12,799 --> 00:20:18,640
noch gar keine Beschreibungstext für sich
angegeben hat und ob er keine Zeitzone

267
00:20:18,640 --> 00:20:21,890
angegeben hat. Also so die ganzen
Metadaten, die man halt aus Twitter

268
00:20:21,890 --> 00:20:24,010
herausbekommt zum analysieren, 
um zu gucken,

269
00:20:24,010 --> 00:20:26,640
ob die sich denn irgendwie strukturieren
und gruppieren.

270
00:20:26,640 --> 00:20:29,469
Man sieht auch ganz
links, das sind so ein Bisschen die sehr

271
00:20:29,469 --> 00:20:33,380
dummen Bots. Die sind jung und teilweise
tun sie auch gar nichts, sondern folgen

272
00:20:33,380 --> 00:20:36,810
nur Leuten. Dann gibt es einen großen und
breiten Bereich, teilweise sehr

273
00:20:36,810 --> 00:20:41,620
realistische Bots dabei, teilweise sind es
sogar reale Accounts die verwaist sind,

274
00:20:41,620 --> 00:20:45,960
also die seit drei Jahren inaktiv sind und
auf irgendeiner Art, also aus irgendeinem

275
00:20:45,960 --> 00:20:49,650
Grund übernommen wurden. Wahrscheinlich
hat sich da einer mal mit Passwort

276
00:20:49,650 --> 00:20:54,950
durchprobieren massenhaft versucht
verwaiste Accounts zu übernehmen. Und

277
00:20:54,950 --> 00:20:58,570
die dritte, und das fand ich sehr
interessant, das sind Accounts die

278
00:20:58,570 --> 00:21:03,000
teilweise sogar verifizierte Menschen
sind. Also ich habe jetzt mal schonmal

279
00:21:03,000 --> 00:21:10,250
Peggy, die ist Moderatorin aus den Staaten
irgendwo, Jeff Zausch ist ein Survival

280
00:21:10,250 --> 00:21:15,430
Spezialist und Chris Glorioso. Das sind,
das sind reale Personen, die mir gefolgt

281
00:21:15,430 --> 00:21:19,570
sind weil ich dafür bezahlt habe, als Bot,
und das fand ich sehr merkwürdig. Ich habe

282
00:21:19,570 --> 00:21:22,650
versucht mit den Leuten Kontakt
aufzunehmen; nicht alle haben mir

283
00:21:22,650 --> 00:21:26,300
geantwortet. Der Grund dafür ist, dass ihr
Account gehijacked wurde und sie haben

284
00:21:26,300 --> 00:21:29,280
dann eigentlich nur noch DMs von
irgendwelchen fremden Accounts bekommen.

285
00:21:29,280 --> 00:21:32,670
Die haben auf DMS auch gar nicht mehr so
richtig reagiert. Ich habe auch versucht

286
00:21:32,670 --> 00:21:37,320
herauszubekommen, auf welchem Wege das
passiert ist – ob sie sich dort irgendwie

287
00:21:37,320 --> 00:21:42,440
einen Twitter Service eingetreten haben
der in ihrem Namen postet. Ich weiß es

288
00:21:42,440 --> 00:21:46,640
nicht. Laut eigenen Aussagen ging es dann
aber weniger um politische Inhalte,

289
00:21:46,640 --> 00:21:50,290
sondern Zitat, es war eher "Sex Scheisse"
die dann in ihren Twitter Timelines

290
00:21:50,290 --> 00:21:53,890
veröffentlicht wurde. Was ich aber
spannend finde, ist wenn man so eine CDU

291
00:21:53,890 --> 00:21:57,770
Forderung, Kennzeichnung von Social Bots.
Ja was ist denn, wenn der eigene Account

292
00:21:57,770 --> 00:22:01,940
übernommen wurde. Also der wird dann, der
eigene Account ist mit einmal halb

293
00:22:01,940 --> 00:22:06,110
automatisiert, ob man es will oder nicht.
Eine Fragestellung die ich dann auch

294
00:22:06,110 --> 00:22:10,820
nochmal jetzt kurz im Vortrag hatte weil
die Daten ja jetzt 11 Monate alt sind:

295
00:22:10,820 --> 00:22:15,640
Welche Accounts gibts denn heute noch? Und
man sieht grün, die Accounts gibt's heute

296
00:22:15,640 --> 00:22:20,090
noch, elf, gelb sind die Accounts die in
der Zwischenzeit von Twitter gesperrt

297
00:22:20,090 --> 00:22:25,350
wurden, und rot die Accounts die von sich
aus sich gelöscht haben. Genau. Also man

298
00:22:25,350 --> 00:22:29,930
sieht zumindest dass da Bewegung von
Seiten Twitter passiert. Was man jetzt an

299
00:22:29,930 --> 00:22:33,690
diesen Bots auch noch analysieren kann,
ist die Follower Netzwerke, wie die sich

300
00:22:33,700 --> 00:22:39,951
also gegenseitig folgen. Da habe ich mal
folgende Grafik gemacht. Das sind so die

301
00:22:39,951 --> 00:22:45,390
4.5 Tausend Bots und wem sie folgen und
von wem sie gefolgt werden. Rot

302
00:22:45,390 --> 00:22:52,820
<i>Trinken</i> rot sind die Bots, 4.5 Tausend,
und blau sind die anderen Nutzer, andere

303
00:22:52,820 --> 00:22:56,700
Accounts oder so weiter. Da kann man auch
mal ein Bisschen rein zoomen hier, sieht

304
00:22:56,700 --> 00:23:05,710
auch ganz hübsch aus. Fast wie fliegende
Spaghetti Monster, fand ich. Die Blauen,

305
00:23:05,710 --> 00:23:10,970
das scheinen mir Jugendliche zu sein, die
sich einfach Twitter-Bots oder Follower

306
00:23:10,970 --> 00:23:14,260
gekauft haben, was eigentlich ganz
interessant ist dass ich dann damit

307
00:23:14,260 --> 00:23:17,860
eigentlich die Kunden die analysieren
kann. Wobei man vorsichtig sein muss,

308
00:23:17,860 --> 00:23:22,730
jemandem 10,000 Bots oder Follower
künstlich anzuhängen ist halt relativ

309
00:23:22,730 --> 00:23:27,730
einfach zu machen und ist auch gar nicht
so teuer. 50,000 Bots gibt es so für 60

310
00:23:27,730 --> 00:23:35,230
Dollar. Wie könnte man Bots noch
erkennen? Und da gibt es halt so eine

311
00:23:35,230 --> 00:23:39,670
Tweet-App Analyse. Ich weiß nicht ob ihr
euch noch erinnern könnt, vor einigen

312
00:23:39,670 --> 00:23:44,260
Jahren stand unter jedem Tweet noch
drunter, mit welcher App man diesen Tweet

313
00:23:44,260 --> 00:23:49,040
veröffentlicht hat. Das steht leider jetzt
nicht mehr drunter, aber die Daten sind

314
00:23:49,040 --> 00:23:54,431
noch in der API drin. So sieht übrigens so
eine API Antwort von Twitter aus, und da

315
00:23:54,431 --> 00:23:59,050
steht unter anderem auch Source drin, d.h.
also mit welchem Service man das

316
00:23:59,050 --> 00:24:02,850
veröffentlicht hat. Habe ich mal über die
Bots rüber laufen lassen. Twitter für

317
00:24:02,850 --> 00:24:07,930
iPhone, Android, Web Client, aber auch
Facebook, die automatisch dann sozusagen

318
00:24:07,930 --> 00:24:12,000
das heisst den Post als Tweet
veröffentlichen und Instagram. Und

319
00:24:12,000 --> 00:24:17,620
interessant fand ich halt 350 weitere
Services, ja. So sehen die aus. Genau.

320
00:24:17,620 --> 00:24:24,730
Also es ist ein riesen Potpourri,
Koreanisch Japanisch alles dabei. Genau.

321
00:24:24,730 --> 00:24:29,410
Das war mir ja auch gar nicht so richtig
klar vorher, dass es eigentlich ein

322
00:24:29,410 --> 00:24:33,850
riesiges enormes Ökosystem gibt von
Skripten die auf Twitter Sachen

323
00:24:33,850 --> 00:24:42,461
veröffentlichen. Und wie gesagt, halt in
meiner Probe sind es allein 350. Um den

324
00:24:42,461 --> 00:24:47,049
Leuten auch zu zeigen, was das denn jetzt
eigentlich für Services sind, die dahinter

325
00:24:47,049 --> 00:24:50,530
stecken, habe ich mal so ein paar
herausgegriffen. Hier ist zum Beispiel

326
00:24:50,530 --> 00:24:54,870
FeedBlitz. Das ist eigentlich ein Bot der
nichts weiter macht als einen RSS Feed in

327
00:24:54,870 --> 00:25:00,110
Twitter zu posten. Haben wir twittbot.net,
das ist irgendwie was selber gebasteltes.

328
00:25:00,110 --> 00:25:04,170
Der twittert aber irgendwie nur Käse, das
hat sich wahrscheinlich einer mal ein

329
00:25:04,170 --> 00:25:07,900
Bisschen herumexperimentiert oder sowas.
Es gibt aber auch den Kim Kardashian:

330
00:25:07,900 --> 00:25:12,000
Hollywood Service, der dir dann
wahrscheinlich die neuen Spielestände

331
00:25:12,000 --> 00:25:17,860
veröffentlich. Interessant fand ich
auch, es gab 9 gelöschte Services, die

332
00:25:17,860 --> 00:25:21,390
dann umbenannt wurden in "Erased" und eine
lange Nummer. Ich würde mich mal

333
00:25:21,390 --> 00:25:25,090
interessieren ob die Nummer fortlaufend
ist, denn sie endet mit 5.6 Millionen.

334
00:25:25,090 --> 00:25:29,530
Sind das jetzt 5.6 Millionen gelöschte
Services, oder sind insgesamt bei Twitter

335
00:25:29,530 --> 00:25:33,410
schon 5.6 Millionen angemeldet worden. Ich
weiß es nicht. Aber wir können darüber

336
00:25:33,410 --> 00:25:37,470
sprechen oder wir können sagen, dass auf
Twitter nicht mehr nur Menschen unterwegs

337
00:25:37,470 --> 00:25:42,860
sind sondern halt auch Services die wir
nutzen. Genau. Bots sind auch nicht nur

338
00:25:42,860 --> 00:25:46,110
böse. Ich habe mal ein paar
herausgegriffen. Ich weiß nicht ob jemand

339
00:25:46,110 --> 00:25:51,840
die Rathausuhr Neukölln kennt. <i>Applaus</i> &
<i>Lachen</i> Ist der Entwickler da? Nein. Der

340
00:25:51,840 --> 00:25:56,280
Entwickler der das Rathaus Uhrwerk
Neukölln als Service benutzt, also der

341
00:25:56,280 --> 00:26:05,090
veröffentlicht sowas wie acht bämm bämm
bämm bämm bämm bämm bämm bämm.

342
00:26:05,090 --> 00:26:08,900
Vor kurzem bin ich übrigens auf den 
Wichser Bot gestoßen. Wenn man einen Tweet

343
00:26:08,900 --> 00:26:12,880
veröffentlicht wo das Wort Wichser drin
vorkommt, dann retweetet der einen.

344
00:26:12,880 --> 00:26:20,170
Spiegelonline Top benutzt den Service if
this than that, zu 100%, also nicht

345
00:26:20,170 --> 00:26:26,090
normal SpiegelOnline sondern Top. Und ZEIT
ONLINE Digital hat sich auch einen Service

346
00:26:26,090 --> 00:26:30,020
gebaut, ich weiß nicht ob der eingekauft
oder selbst entwickelt ist, aber der ist

347
00:26:30,020 --> 00:26:35,711
registriert als ZEIT ONLINE. Ich fasse
zusammen: Woran könnte man Bots erkennen?

348
00:26:35,711 --> 00:26:40,669
Ist das Profil vollständig? Ist ein Avatar
Bild und Beschreibungstext dran? Ist der

349
00:26:40,669 --> 00:26:47,460
Account Teil eines Netzwerkes? Von welcher
App werden die Tweets abgeschickt und wie

350
00:26:47,460 --> 00:26:51,620
sehen die anderen Metadaten des Accounts
oder der Tweets aus? Interessant ist,

351
00:26:51,620 --> 00:26:56,240
dass das aber alles Indizien Beweise sind.
Wenn man anfängt, sich tatsächlich mal

352
00:26:56,240 --> 00:27:00,220
hinzusetzen und zu gucken, ist das nun ein
Bot oder nicht, kommt man relativ schnell

353
00:27:00,220 --> 00:27:05,070
ins Grübeln. Jegliche Bot Erscheinung 
könnte auch gut menschlich erklärt sein

354
00:27:05,070 --> 00:27:07,249
und andersherum. Man kann aber auch

355
00:27:07,249 --> 00:27:09,599
rangehen, dass man jedes 
menschliche Verhalten in

356
00:27:09,599 --> 00:27:14,830
die Sphäre, das könnte und natürlich auch
ein hochintelligente KI sein schien.

357
00:27:14,830 --> 00:27:18,471
Egal, auf jeden Fall mit diesem
Kenntnisstand sag ich mal lasst uns jetzt

358
00:27:18,471 --> 00:27:22,440
mal Bots finden. Ich habe gesucht. Ich hab
lange lange lange gesucht und ich kürz es

359
00:27:22,440 --> 00:27:28,480
mal ab mit: ich habe gefunden inaktive
Accounts, Service Accounts, Trolle welche

360
00:27:28,480 --> 00:27:32,940
Teenager, Rassisten und Hater und Spam mit
links zu YouTube Polen und Bitcoin schickt

361
00:27:32,940 --> 00:27:37,330
und so weiter. Aber was ich nicht gefunden
habe ist diese politisch aktiven Social

362
00:27:37,330 --> 00:27:41,230
Bot Netzwerke, und dafür gibt es zwei
Erklärungen: Entweder die gibts nicht oder

363
00:27:41,230 --> 00:27:49,640
Ich bin zu doof. Also fragen wir mal die
Profis wie machen die das denn. Und einer

364
00:27:49,640 --> 00:27:55,160
davon ist zum Beispiel Professor Dr. Simon
Hegelich, Forschungsfeld Political Data

365
00:27:55,160 --> 00:28:02,360
Science, Forschungsmethoden Machine
Learning plus X. Ist das VELTINS, die mit

366
00:28:02,360 --> 00:28:07,429
plus X ist Alkohol, ne, ich weiß nicht,
keine Ahnung. Der veröffentlicht Studien

367
00:28:07,429 --> 00:28:10,950
zum Beispiel für die Konrad-Adenauer-
Stiftung mit dem Titel "Invasion der

368
00:28:10,950 --> 00:28:16,429
Meinungs-Roboter". Leider wird in dieser
Studie die Methodik nicht beschrieben.

369
00:28:16,429 --> 00:28:21,299
Hegelich hatte selber damals mit Professor
Dietmar Jaresko eine Studie veröffentlicht

370
00:28:21,299 --> 00:28:26,190
wo sie tatsächlich ein Bot-Netzwerk
gefunden haben in der Ukraine. Was sie

371
00:28:26,190 --> 00:28:30,261
dabei identifizieren konnten ist dass
diese Accounts unter einem Service

372
00:28:30,261 --> 00:28:36,210
"twifarm" prorussische Meldungen
veröffentlicht haben, insgesamt 1740 Bots

373
00:28:36,210 --> 00:28:42,180
haben sie darunter gefunden. Und genau das
ist auf jeden Fall, das kann man glaube

374
00:28:42,180 --> 00:28:46,690
ich sagen, ein Bot-Netzwerk, was dort in
der Ukraine gefunden wurde. Aber wie sieht

375
00:28:46,690 --> 00:28:50,650
das eigentlich mit der deutschen Debatte 
aus? Und dazu hab ich, vielleicht habs ich

376
00:28:50,650 --> 00:28:54,200
auch nicht gefunden aber ich habe
zumindest keine Studie von Prof. Hegelich

377
00:28:54,200 --> 00:28:58,030
dazu gefunden, mit einer nachprüfbaren
Methodik. Was ich aber gefunden habe ist

378
00:28:58,030 --> 00:29:04,230
ein ZDF Bericht, ZDF Zoom "Alles nur Lüge?
Wie im Netz getäuscht wird". Professor

379
00:29:04,230 --> 00:29:09,630
Simon Hegelich hatte hier die Aufgabe, aus
Gigabytes an Daten Social Bots zu suchen.

380
00:29:09,630 --> 00:29:15,380
Und er hatte einen möglichen Kandidaten
gefunden, und zwar Egon Dombrowski, der

381
00:29:15,380 --> 00:29:22,570
136 Posts am Tag veröffentlich mit ganz
klarer Tendenz zu Pegida und AfD. Nun ist

382
00:29:22,570 --> 00:29:26,710
natürlich spannend: Ist das vielleicht ein
gesteuerter Bot? Oder handelt es sich

383
00:29:26,710 --> 00:29:30,160
dabei um einen realen Menschen? Die
Redaktion hat ihn einfach mal

384
00:29:30,160 --> 00:29:37,270
angeschrieben, und der potenzielle Social
Bot heißt Egon Dombrowski. Ist 50 Jahre

385
00:29:37,270 --> 00:29:42,800
alt, berufsunfähig Rentner, lebt in Erfurt
und war in einem Gemeinderat für die SPD.

386
00:29:42,800 --> 00:29:50,220
Und jetzt ist er auf Facebook sehr aktiv.
Medien bezeichnet er als Propaganda-

387
00:29:50,220 --> 00:29:55,350
Presse, und er macht Werbung für die AfD
und wird laut eigener Aussage nicht von

388
00:29:55,350 --> 00:30:00,400
der AfD oder anderen bezahlt, er macht das
aus eigener überzeugung. Gut, also der

389
00:30:00,400 --> 00:30:04,370
Versuch, hier einen Social Bot zu finden,
ist missglückt, wir haben leider nur eine

390
00:30:04,370 --> 00:30:08,600
reale Person gefunden. Aber es gibt auch
andere die sich damit beschäftigen,

391
00:30:08,600 --> 00:30:14,130
beispielsweise botswatch.de, die
versuchen, parallel zu wichtigen Events in

392
00:30:14,130 --> 00:30:19,890
Deutschland zu gucken, wie viel sich auf
Twitter nun Social Bots einmischen,

393
00:30:19,890 --> 00:30:24,490
veröffentlichen auch das Bot-Barometer und
so weiter. Und da gibts auch einen Link

394
00:30:24,490 --> 00:30:27,910
zur Methode wie sie das machen, und da
steht dann drin "Accounts die

395
00:30:27,910 --> 00:30:31,710
durchschnittlich gleich oder mehr als 50
Tweets am Tag veröffentlichen". Hab ich

396
00:30:31,710 --> 00:30:38,080
ihnen gesagt "Naja, Dombrowski schafft 136
Posts am Tag." Ich hatte, weil

397
00:30:38,080 --> 00:30:42,830
wir die Bundestagswahl beobachtet haben 
eine lange Liste von Accounts

398
00:30:42,830 --> 00:30:46,070
zusammengestellt, die irgendwie beim
Thema Bundestagswahl mitmischten

399
00:30:46,070 --> 00:30:48,010
und bin die einfach mal durchgegangen,

400
00:30:48,010 --> 00:30:51,229
an welchen Tagen haben die
mehr als 50 Tweets abgesetzt und hier ist

401
00:30:51,229 --> 00:30:55,850
mal so ein bisschen Zusammenfassung: sogar
eine CDU/CSU und FDP haben das geschafft.

402
00:30:55,850 --> 00:31:03,270
Genau. Also, 50 Tweets am Tag und schon
ist man Social Bot, mit drunter sind

403
00:31:03,270 --> 00:31:10,490
Medien wie Welt, die schaffen 190 am Tag,
Focus Online 97 am Tag. Auch Christopher

404
00:31:10,490 --> 00:31:15,559
Lauer 72. Anja Schillhaneck von den
Bündnes 90 / Die Grünen im Berliner

405
00:31:15,559 --> 00:31:19,250
Abgeordnetenhaus schafft fast die Grenze
mit 50 am Tag. Und natürlich auch die

406
00:31:19,250 --> 00:31:23,090
Parteien vor den Bundestagswahlen, die
dann natürlich in den sozialen Netzwerken

407
00:31:23,090 --> 00:31:27,860
besonders aktiv sind, schaffen mehr als
50, und dann noch Hipster, Aktivisten,

408
00:31:27,860 --> 00:31:32,429
AfD-Anhänger darunter geschrieben. Also 50
Tweets am Tag als Kriterium für Social

409
00:31:32,429 --> 00:31:37,190
Bots ist wissenschaftlich unseriös. Da
frage ich mich natürlich: Wie kommen die

410
00:31:37,190 --> 00:31:41,390
da drauf? Und davor steht es auch: Das sei
das Social Bot-Kriterium der Oxford-

411
00:31:41,390 --> 00:31:47,030
Universität. Das finde ich natürlich
spannend, und habe dann angefangen, die

412
00:31:47,030 --> 00:31:53,650
ganzen Studien und wissenschaftlichen
Paper dazu durchgelesen wie deren Methode

413
00:31:53,650 --> 00:31:59,720
ist. Und ich hab nur zwei herausgegriffen,
weil es wirklich eine Menge ist, die

414
00:31:59,720 --> 00:32:09,049
besonders das deutlich machen. Social Bots
bei den US-Wahlen. Das ist ein Paper was

415
00:32:09,049 --> 00:32:13,400
veröffentlicht wurde mit dem Titel "Bots
and Automation over Twitter during the

416
00:32:13,400 --> 00:32:18,809
U.S. Election" und ich spule mal vor was
an welcher Stelle Sie das definieren. Da

417
00:32:18,809 --> 00:32:24,910
muss ich mal kurz sagen: Sie fangen halt
an, von Social Bots zu reden. Dann heißt

418
00:32:24,910 --> 00:32:28,750
es irgendwann "Social Bot like" und dann
steht dann so etwas wie "Heavy Automated

419
00:32:28,750 --> 00:32:33,539
Bots". Und dann steht dann zum Schluss "we
define a high level of automation as

420
00:32:33,539 --> 00:32:37,659
accounts that post at least 50 times a day
using one of these election-related

421
00:32:37,659 --> 00:32:43,780
hashtags". Das heißt also, wer mehr als 50
Mal am Tag ein bestimmtes Hashtag

422
00:32:43,780 --> 00:32:47,580
veröffentlicht, wird als social Bot
kategorisiert. Die Hashtags sind die hier.

423
00:32:47,580 --> 00:32:52,669
Der erste Block sind die pro-Trump-
Hashtags, zweite Block die pro-Clinton-

424
00:32:52,669 --> 00:32:56,390
Hashtags, und der dritte Block sind
Hashtags, die sich generell um die

425
00:32:56,390 --> 00:33:01,710
amerikanische Wahl beschäftigen. Aber zu
dieser Definition von Social Bots habe ich

426
00:33:01,710 --> 00:33:06,870
mal ein paar Fragen: Also erstens, warum
sind das 50 und nicht 30 oder 100 Tweets

427
00:33:06,870 --> 00:33:13,140
am Tag? Und gilt das dann für alle Länder,
also kann man jetzt dieses Kriterium aus

428
00:33:13,140 --> 00:33:16,840
Amerika eins zu eins übernehmen für
Deutschland? Und was für Accounts sind das

429
00:33:16,840 --> 00:33:20,700
eigentlich? Ich meine wenn ich die wenn
ich die identifizieren kann, dann kann ich

430
00:33:20,700 --> 00:33:24,440
die ja auch mal genauer anschauen, wie
viele Follower haben die? Wie viele Favs

431
00:33:24,440 --> 00:33:27,910
und retweets haben sie? Vielleicht
veröffentlichen sie ja wahnsinnig viele

432
00:33:27,910 --> 00:33:31,630
Tweets aber keiner liest es. Und über
welches Service posten sie? Das hatte ich

433
00:33:31,630 --> 00:33:36,330
vorhin gezeigt, dass man das nachschauen
kann. Und klar kann ich verstehen, dass es

434
00:33:36,330 --> 00:33:38,690
halt eine Menge Accounts sind, 
aber es gibt eine

435
00:33:38,690 --> 00:33:40,861
wissenschaftlich statistisch
saubere Methode:

436
00:33:40,861 --> 00:33:42,970
Man nimmt einfach eine
Stichprobe, man wählt einfach mal zufällig

437
00:33:42,970 --> 00:33:46,120
100 aus und guckt sich halt an, was das
für Accounts sind, um zu gucken, ob sie

438
00:33:46,120 --> 00:33:50,600
tatsächlichen politischen Einfluss haben.
Dazu gibts aber in dieser Studie keine und

439
00:33:50,600 --> 00:33:55,100
auch den anderen keine Antwort. Leider
kann ich das auch nicht überprüfen, weil

440
00:33:55,100 --> 00:33:58,850
die Universität Oxford die Daten dazu
nicht veröffentlicht hat. Das liegt

441
00:33:58,850 --> 00:34:04,850
teilweise an der Developer API von, oder
den Guidelines von Twitter. Das liegt aber

442
00:34:04,850 --> 00:34:10,109
auch daran, oder gibt es einen Ausweg da
drauß: Und zwar kann man nämlich die Liste

443
00:34:10,109 --> 00:34:14,469
der Twitter IDs veröffentlichen, das darf
man nämlich, und kann sich dann sozusagen

444
00:34:14,469 --> 00:34:18,899
nachträglich den Tweet nochmal holen und
genauer analysieren. Zum Glück gibt es von

445
00:34:18,899 --> 00:34:24,799
der George Washington Universität eine
Veröffentlichung "2016 United States

446
00:34:24,799 --> 00:34:28,690
Presidential Election Tweet IDs". Da gibt
es unter anderem auch eine Liste von

447
00:34:28,690 --> 00:34:34,018
Tweets, die den Hashtag "Election Day"
verwendet haben. Das heißt ich hab jetzt

448
00:34:34,018 --> 00:34:37,839
leider nicht die gleiche Datenbasis wie
die Universität Oxford. Ich kann aber

449
00:34:37,839 --> 00:34:42,168
einen kleinen Ausschnitt rausnehmen und
zwar mir nur angucken, wer hat am Wahltag

450
00:34:42,168 --> 00:34:48,109
mehr als 100 mal eines von diesen Hashtags
verwendet plus den Hashtag "Election Day".

451
00:34:48,109 --> 00:34:56,869
Und diejenigen, die sogar mehr als 100 Mal
am Wahltag getwittert haben sind diese 12,

452
00:34:56,869 --> 00:35:01,680
das sind sozusagen die laut Social Both
Kriterien die die am deutlichsten als

453
00:35:01,680 --> 00:35:08,499
Social Bots sich definieren. Und wenn ihr
jetzt mal wissen wollt, wer denn dieses

454
00:35:08,499 --> 00:35:12,390
Social Bots wirklich sind: Nehmen wir uns
mal Zeit und gucken uns jeden einzelnen

455
00:35:12,390 --> 00:35:21,950
von diesen 12 an. Das erste ist ein
@dreamedofdust, der 437 Tweets am Wahltag

456
00:35:21,950 --> 00:35:25,759
veröffentlicht hat (mit diesen erwähnten
Hashtags), und was er macht: er twittert

457
00:35:25,759 --> 00:35:31,109
Links zu reddit.com/r/The_Donald zu diesen
einzelnen Kommentaren. Und er benutzt

458
00:35:31,109 --> 00:35:37,920
dabei If This Then That. Und bot: klares
Ja, auf jeden Fall. Was er aber dabei tut

459
00:35:37,920 --> 00:35:41,930
ist bereits veröffentlichte Kommentare im
Reddit-Forum einfach nochmal in diesem

460
00:35:41,930 --> 00:35:45,460
Account zu spiegeln, und ich lehne mich
mal aus dem Fenster wenn ich sage:

461
00:35:45,460 --> 00:35:50,170
Einfluss? Kaum. Also völlig kommentarlos,
wie gesagt, spiegelt einfach nur Reddit-

462
00:35:50,170 --> 00:35:55,640
Kommentare. Der nächste Account, ITX
News, twittert Screenshots von Texten,

463
00:35:55,640 --> 00:35:59,830
völlig abgedrehter Verschwörungsquark,
also da ist, da sind Sachen dabei, die

464
00:35:59,830 --> 00:36:05,609
Queen wurde von Hindus vergiftet. Und,
also wirklich, find ich völlig abgedreht.

465
00:36:05,609 --> 00:36:10,400
Und er benutzt für seine für seine
Screenshots, die er dann veröffentlicht,

466
00:36:10,400 --> 00:36:17,549
immer die aktuellen trending Hashtags. Er
hat vier Follower, und er ist ganz klar

467
00:36:17,549 --> 00:36:24,799
kein Bot. Der nächste Account: Er ist
Trump-Supporter weil er Clinton furchtbar

468
00:36:24,799 --> 00:36:30,559
findet. Er nutzt intensiv Hashtags, lebt
auf Hawaii, schläft sechs Stunden, macht

469
00:36:30,559 --> 00:36:35,349
Mittagspause - das sieht man an den an den
Zeiten, wann er twittert. Und der ist auf

470
00:36:35,349 --> 00:36:41,529
jeden Fall kein Bot. Der nächste.
Offensichtlich liebt er Bernie Sanders, er

471
00:36:41,529 --> 00:36:45,450
hasst Donald Trump, Hillary Clinton, die
Demokraten (weil sie nämlich Hillary

472
00:36:45,450 --> 00:36:49,029
Clinton aufgestellt haben statt Bernie
Sanders), Bill und Chelsea Clinton, und er

473
00:36:49,029 --> 00:36:53,979
hasst Expedia, weil Chelsea Clinton jetzt
im Board sitzt. Aber ein Bot ist er nicht.

474
00:36:53,979 --> 00:36:59,370
Der nächste. Der sieht mir doch sehr
fischig aus. Ich vermute mal, dass es eine

475
00:36:59,370 --> 00:37:04,759
spanischsprachige Click-Farm ist, die
versucht, User auf Werbeseiten zu locken.

476
00:37:04,759 --> 00:37:10,110
Die machen dann Werbung für was weiß ich,
irgendwelche Apps oder sowas, überhaupt

477
00:37:10,110 --> 00:37:13,859
gar keine politischen Inhalte, denn sie
nutzen einfach nur Training Hashtags um

478
00:37:13,859 --> 00:37:17,671
sich in politischen Diskussionen sozusagen
da noch nochmal ihre Links zu

479
00:37:17,671 --> 00:37:23,410
veröffentlichen, haben einen Follower. Ob
es ein Bot ist oder nicht? Ich sag mal,

480
00:37:23,410 --> 00:37:28,119
vermutlich nicht. Da sind halt Tippfehler
drin, das wäre eigentlich ein schlecht

481
00:37:28,119 --> 00:37:31,559
programmierter Bot (oder besonders
schlau). Im Zweifelsfall könnt ihr ihn

482
00:37:31,559 --> 00:37:35,421
gern als Bot definieren, aber impact hat
er keinen. Jetzt wird es ein bisschen

483
00:37:35,421 --> 00:37:39,579
spannender. Ave Hurley ist eine Oma aus
Brooklyn, sie ist eine Künstlerin, malt

484
00:37:39,579 --> 00:37:43,201
Bilder, macht Schmuck, verkauft sie in
einem Shop und hat vor kurzem mit dem

485
00:37:43,201 --> 00:37:49,810
Rauchen aufgehört. An dem Wahltag hat sie
wie wild für Trump getwittert und hat ihn

486
00:37:49,810 --> 00:37:53,390
unterstützt und hat versucht, Leute zu
überzeugen. Aber ein Bot ist sie auch

487
00:37:53,390 --> 00:37:58,650
nicht. Dann hab ich hier noch den hier.
Der ist aus Tokio. Ich vermute es ist ein

488
00:37:58,650 --> 00:38:03,160
Student, der twittert auf Japanisch und ab
dem Moment war ich so ein bisschen Lost in

489
00:38:03,160 --> 00:38:07,719
Translation um herauszukriegen, was er da
möchte. Aber ich vermute, dass er Toru

490
00:38:07,719 --> 00:38:12,609
Hashimoto und Kazuma Ieri hasst, das eine
ist ein Politiker, das andere ein

491
00:38:12,609 --> 00:38:19,190
Internet Entrepreneur. Er hat am Wahlabend
auf einen Tweet zu Kazuma gefeuert, muss

492
00:38:19,190 --> 00:38:22,720
man sagen, und hat da einfach die
aktuellen Trending hashtags genommen, und

493
00:38:22,720 --> 00:38:28,869
da war natürlich auch die Election dabei,
aber ein Bot ist es nicht. Der nächste:

494
00:38:28,869 --> 00:38:34,099
Paolo. Paolo kann 13 Tweets in drei
Sekunden schicken.

495
00:38:34,099 --> 00:38:44,039
<i>Gelächter</i>
<i>Applaus</i>

496
00:38:44,039 --> 00:38:48,530
Er nutzt dafür drei unbekannte
italienische Twitter-Services, einer davon

497
00:38:48,530 --> 00:38:53,390
ist in der Zwischenzeit gesperrt. Pro
Hillary. Tweets werden so gut wie gar

498
00:38:53,390 --> 00:38:58,200
nicht gefavt und retweetet. Ein Bot ist er
auf jeden Fall, aber einen Einfluss hat

499
00:38:58,200 --> 00:39:03,220
er, glaube ich zumindest, keinen. Dann
haben wir noch den hier. Er liebt Jesus,

500
00:39:03,220 --> 00:39:07,579
Die Familie, Trump, Wikileaks, Fox News,
und Waffen.

501
00:39:07,579 --> 00:39:12,549
<i>Gelächter</i>
Hasst Abtreibung, Feminismus, Hillary

502
00:39:12,549 --> 00:39:19,410
Clinton, CNN, und Obamacare. Aber ein Bot
ist es nicht. Dann haben wir auch

503
00:39:19,410 --> 00:39:26,369
PresidentDrumf. Der ist ein Satire-
Account. Teilweise witzig, hat trotzdem

504
00:39:26,369 --> 00:39:28,380
nur einen Follower.
<i>Gelächter</i>

505
00:39:28,380 --> 00:39:35,640
Aber ein Bot ist es auch nicht. Dann haben
wir noch Maryke. Sie ist Journalistin aus

506
00:39:35,640 --> 00:39:40,819
Südafrika, arbeitet für die französische
Presseagentur AFP, und hat über Election

507
00:39:40,819 --> 00:39:47,509
Day live getwittert an dem Abend. Und sie
ist auch kein Bot. Dann haben wir noch ein

508
00:39:47,509 --> 00:39:53,349
Dr. Van Nostrand. Ich habe leider kein
Bild von ihm gefunden, aber er liebt

509
00:39:53,349 --> 00:40:00,609
Baseball, American Football, Fox News und
Trump. Er hasst Hillary und Bill Clinton,

510
00:40:00,609 --> 00:40:07,059
CNN, Islam, Feministen, und Linke. Und er
verfolgte Trumps' Sieg live. Hat den

511
00:40:07,059 --> 00:40:13,200
Wahltag intensiv verfolgt und begleitet,
aber ein Bot ist er auch nicht. So, und

512
00:40:13,200 --> 00:40:18,660
das war jetzt der zwölfte von den zwölf.
Fassen wir mal zusammen. Ich habe ja mal

513
00:40:18,660 --> 00:40:23,140
so ein kleines Tabelle gemacht,
spaltenweise pro Clinton, neutral, pro

514
00:40:23,140 --> 00:40:27,940
Trump, und zeilenweise ist es ein Mensch,
sind wir uns nicht ganz sicher, oder ist

515
00:40:27,940 --> 00:40:31,530
es ein Social Bot. Wir haben auf jeden
Fall ein Social Bot gefunden der pro-

516
00:40:31,530 --> 00:40:35,386
Clinton ist, und wir haben einen Social
Bot gefunden von pro-Trump ist, ob es sich

517
00:40:35,386 --> 00:40:39,309
tatsächlich um einen Social Bot handelt
wäre ich sehr vorsichtig denn sie haben ja

518
00:40:39,309 --> 00:40:42,907
keine soziale Interaktion bewiesen,
sondern alles was sie gemacht haben ist

519
00:40:42,907 --> 00:40:46,530
automatisiert Links und Nachrichten zu
veröffentlichen, und hatten auch dabei

520
00:40:46,530 --> 00:40:51,039
nicht wirklich einen Impact weil keiner
sie retweetet oder gefavt hat. Eine große

521
00:40:51,039 --> 00:40:58,799
Gruppe die wir gefunden haben waren pro-
Trump-Menschen, die alle, auf der pro-

522
00:40:58,799 --> 00:41:03,790
Clinton Seite haben wir nur einen Satire-
Account gefunden. Und dazwischen im

523
00:41:03,790 --> 00:41:08,259
neutralen Bereich einen Bernie Sanders-
Fan, eine Journalistin, einen Japaner und

524
00:41:08,259 --> 00:41:15,630
einen Verschwörungstheoretiker. Und dann
haben wir noch hier unsure derjenige der

525
00:41:15,630 --> 00:41:19,780
seine Links zu App-Webseiten vertreibt.
Wenn ich jetzt mal hervorhebe von denen

526
00:41:19,780 --> 00:41:23,139
Accounts von denen ich glaube dass sie
tatsächlich an einer politischen

527
00:41:23,139 --> 00:41:27,039
Diskussion teilgenommen haben... sind das
die hier und das sind alles Menschen. Ist

528
00:41:27,039 --> 00:41:41,700
nur die Hälfte, aber ja. Die Studie "Bots
and Automation over Twitter during U.S.

529
00:41:41,700 --> 00:41:45,689
Election" müsste eigentlich heißen "Highly
active Twitter users during US Election".

530
00:41:47,079 --> 00:41:51,019
Social Bots, oder als was wir sie
bezeichnet haben, sind politisch aktive

531
00:41:51,019 --> 00:41:58,450
Bürger, Hashtag-Spam, Medien und
Journalisten, und einige simple Bots. Auf

532
00:41:58,450 --> 00:42:02,900
Vollständigkeit halber habe ich versucht
noch eine Studie zu finden die eine andere

533
00:42:02,900 --> 00:42:09,209
Methodik verwendet. Und da gibt es von der
University of South California "Social

534
00:42:09,209 --> 00:42:15,710
bots distort the 2016 U.S. Presidential
election online discussion", und was sie

535
00:42:15,710 --> 00:42:20,000
zur Identifizierung von Social Bots
verwenden ist ein Service der nennt sich

536
00:42:20,000 --> 00:42:25,139
BotOrNot, in der Zwischenzeit umbenannt in
Botometer. Und ich will da nicht zu tief

537
00:42:25,139 --> 00:42:28,799
einsteigen, da gibt's auch nochmal ein
Paper dazu, aber was sie im Kern machen

538
00:42:28,799 --> 00:42:32,370
ist im Prinzip das was ich am Anfang
gemacht habe – sie versuchen die ganzen

539
00:42:32,370 --> 00:42:36,420
Metadaten rund um einen Account zu
kategorisieren, und dann kommt da Machine

540
00:42:36,420 --> 00:42:39,839
Learning oben drauf, und dann wird
versucht mit einer Wahrscheinlichkeit

541
00:42:39,839 --> 00:42:44,130
abzuschätzen ob nun ein Account nun ein
Bot ist oder nicht, und das ist die Basis

542
00:42:44,130 --> 00:42:48,329
dieser Studie. Ich hab das mal... Unten
ist noch mal der Link dazu, falls einer da

543
00:42:48,329 --> 00:42:52,640
selber mit spielen möchte. Vorsichtig, man
muss dazu seinen Twitter-Account

544
00:42:52,640 --> 00:42:56,419
autorisieren und das ist dann... der im
Gegensatz zu uns keine Leserechte haben

545
00:42:56,419 --> 00:42:59,720
möchte, sondern er möchte auch
Schreibrechte haben; für den Fall falls

546
00:42:59,720 --> 00:43:03,499
die gehackt werden, werdet ihr also auch
irgendwie Scheiße twittern. Ich hab

547
00:43:03,499 --> 00:43:06,079
einfach mal ein paar Accounts rein
geworfen um zu gucken wie vertrauenswürdig

548
00:43:06,079 --> 00:43:09,859
das ist; da habe ich jetzt einfach mal
einen erdgeist und einen Frank Rieger und

549
00:43:09,859 --> 00:43:13,970
einen Linuzifer rein geworfen. Das
Kriterium übrigens der Studie ist 50%,

550
00:43:13,970 --> 00:43:17,450
alle die unter 50% sind,
sind Menschen, alle die über 50%

551
00:43:17,450 --> 00:43:23,450
sind, sind Bots. Gegenübergestellt hab ich
nochmal das BMVI, das Bundesministerium

552
00:43:23,450 --> 00:43:32,299
für Justiz und Verbraucherschutz – 55
Prozent, das BKA ist ein Social Bot.

553
00:43:32,299 --> 00:43:36,509
<i>Applaus</i>
Und vielleicht liegt das an den deutschen

554
00:43:36,509 --> 00:43:40,630
Accounts, da die Studie sich im Speziellen
mit den US-Wahlen beschäftigt haben, hab

555
00:43:40,630 --> 00:43:44,680
ich da mal stichprobenartig ein paar rein
geworfen. Da haben wir das Wall Street

556
00:43:44,680 --> 00:43:48,849
Journal, LA Times ist ein Bot, CNN und Fox
News ist ein Bot, realDonaldTrump ist ein

557
00:43:48,849 --> 00:43:51,869
Bot, und der amerikanische Präsident.
<i>Lachen</i>

558
00:43:51,869 --> 00:43:59,989
<i>Applaus</i>
Das könnt ihr ja auch alles selber

559
00:43:59,989 --> 00:44:04,140
ausprobieren. Also wissenschaftlich ist
das alles nicht haltbar.

560
00:44:05,319 --> 00:44:06,972
Und wen das noch nicht überzeugt,

561
00:44:06,972 --> 00:44:12,602
Hegelich erwartet keine große 
Gefahr durch Social Bots im Wahlkampf.

562
00:44:13,410 --> 00:44:20,309
Zusammenfassung. Social Bot,
Filterblasen, Fake News. Ich versuche

563
00:44:20,309 --> 00:44:24,070
versuch's mal vorsichtig zu formulieren:
die Forschung ist noch in den Anfängen.

564
00:44:24,070 --> 00:44:28,369
Die Methodiken sind neu, teilweise
experimentell, und müssen noch überprüft

565
00:44:28,369 --> 00:44:32,319
werden. Und im Speziellen müssen die
wissenschaftlichen Publikation überprüft

566
00:44:32,319 --> 00:44:37,299
werden. Falls einer irgendwie in dem Thema
gerade arbeitet, den kann ich das ans Herz

567
00:44:37,299 --> 00:44:42,119
legen, als Bachelor- oder Masterarbeit mal
ans Herz zu legen, diese Studien

568
00:44:42,119 --> 00:44:45,789
tatsächlich zu überprüfen. Was ich bei
Social Bots, Filterblase und Fake News

569
00:44:45,789 --> 00:44:53,180
gefunden habe sind exemplarisch: Egon
Dombrowski und Ave Hurley. Wir haben in

570
00:44:53,180 --> 00:44:59,039
den Diskursen die Leute als Nazis,
bildungsfern, sozial abgehängt,

571
00:44:59,039 --> 00:45:04,219
Mittelschicht mit Verlustängsten und jetzt
auch neu als Social Bots bezeichnet.

572
00:45:04,219 --> 00:45:05,989
Aber was sie alle gemeinsam haben:

573
00:45:05,989 --> 00:45:07,750
Sie haben Angst und sie sind wütend.

574
00:45:07,750 --> 00:45:10,370
Und sie haben Vertrauensverlust 
in die Institutionen.

575
00:45:10,370 --> 00:45:12,519

Und was wir beobachten ist das neue

576
00:45:12,519 --> 00:45:18,180
gesellschaftliche Gruppen in die sozialen
Netzwerke betreten, und sie nutzen ihr

577
00:45:18,180 --> 00:45:23,119
Recht und die Möglichkeit ihrer
Meinungsäußerung. Und im Zweifelsfall

578
00:45:23,119 --> 00:45:29,511
greifen sie auch auf Fake News zurück wenn
es ihre Ansichten bestätigt.

579
00:45:29,511 --> 00:45:33,330
Was wir aber beobachten ist, dass die 
sozialen Netzwerke nicht geeignet sind, um

580
00:45:33,330 --> 00:45:37,319
gesellschaftliche Lösungen zu entwickeln.
Vielleicht gibt es irgendwann technische

581
00:45:37,319 --> 00:45:42,339
Lösungen. Wer weiß. Vielleicht gehört es
aber in Zukunft auch zur Medienkompetenz,

582
00:45:42,339 --> 00:45:47,859
eine gewisse Debattenkultur zu entwickeln.
Ich weiß es nicht. Das ist auf jeden Fall,

583
00:45:47,859 --> 00:45:51,229
ich will jetzt den Begriff "Neuland" nicht
verwenden, das auf jeden Fall ein neues

584
00:45:51,229 --> 00:45:55,630
Forschungsgebiet. Wir sehen glaube ich
dass hier eine neue Wissenschaft beginnt

585
00:45:55,630 --> 00:45:59,609
zu entstehen. Sie steckt noch in den
Kinderschuhen, aber sie macht gerade einen

586
00:45:59,609 --> 00:46:03,819
fundamentalen Wandel mit, von einer
ideographischen Wissenschaft, also einer

587
00:46:03,819 --> 00:46:07,529
reinen Phänomen beschreibenden, wie
Sozialwissenschaft, Kulturwissenschaft

588
00:46:07,529 --> 00:46:11,680
oder Politikwissenschaften, hin zu einer
nomothetischen Wissenschaft, die versucht

589
00:46:11,680 --> 00:46:16,160
Regeln zu erkennen, Gesetze zu entdecken,
reproduzierbare Ergebnisse zu entwickeln,

590
00:46:16,160 --> 00:46:20,750
so wie man das aus den Naturwissenschaften
kennt. Ähnliche Entwicklungen haben wir

591
00:46:20,750 --> 00:46:25,249
auch gesehen, die Astrologie, das war die
Lehre von den Sternen, bis dann das

592
00:46:25,249 --> 00:46:29,110
Teleskop erfunden wurde und wir nun
anfangen konnten, Gesetze in der Bewegung

593
00:46:29,110 --> 00:46:32,650
von Planeten und Sternen zu entdecken, die
reproduzierbar sind. Und aus der

594
00:46:32,650 --> 00:46:38,700
Astrologie wurde dann die Astronomie. Ich
sehe, dass wir in den Debatten, die jetzt

595
00:46:38,700 --> 00:46:44,209
in den sozialen Netzwerken stattfinden,
eine neue Wissenschaft haben können die

596
00:46:44,209 --> 00:46:49,049
sich mit diesem Thema beschäftigt. Und ich
glaube das ist nicht nur möglich ist,

597
00:46:49,049 --> 00:46:53,020
sozusagen als Teleskop oder Mikroskop die
für die Gesellschaft, sondern dass es auch

598
00:46:53,020 --> 00:46:58,090
notwendig ist. Und dazu ist viel Forschung
nötig und ich animiere jeden, der nicht so

599
00:46:58,090 --> 00:47:01,900
richtig weiß ob er jetzt in dem
geisteswissenschaftlichen Bereich oder im

600
00:47:01,900 --> 00:47:05,299
Data Science-Bereich arbeiten möchte,
diese beiden Welten miteinander zu

601
00:47:05,299 --> 00:47:12,180
verbinden. Bachelor und Master sind,
Arbeiten sind da gut definitiv

602
00:47:12,180 --> 00:47:17,469
prädestiniert um diese wissenschaftlichen
Ausarbeitungen zu reproduzieren. Und diese

603
00:47:17,469 --> 00:47:21,649
Studien von der Oxford-Universität oder
von South California zu reproduzieren

604
00:47:21,649 --> 00:47:25,630
und zu validieren. Und ich würde das gerne
unterstützen, und ich hoffe, die nächsten

605
00:47:25,630 --> 00:47:29,380
zweieinhalb Tage noch Zeit zu finden,
Teile meines Frameworks und auch der

606
00:47:29,380 --> 00:47:36,509
Rohdaten zu veröffentlichen. Ansonsten bin
ich die nächsten zweieinhalb Tage zu

607
00:47:36,509 --> 00:47:41,170
erreichen: DECT Telefonnummer 360, 3600
Entschuldigung, und Twitter-Account,

608
00:47:41,170 --> 00:47:45,839
@michaelkreil. Ich würde gerne andere
Leute, die in dem Bereich forschen oder

609
00:47:45,839 --> 00:47:53,049
sowas zusammenbringen um zu gucken ob wir
zum Thema Social Bot da nicht mal eine

610
00:47:53,049 --> 00:48:09,869
Wissenschaftssprache Debatte starten
können. Danke schön.

611
00:48:09,869 --> 00:48:16,200
<i>Applaus</i>
Herald: Mindestens das will ich nachher

612
00:48:16,200 --> 00:48:19,839
nochmal hören. Jetzt haben wir noch, ja,
etwas über ne Viertelstunde Zeit für

613
00:48:19,839 --> 00:48:24,599
Fragen und Antworten. Habt ihr Fragen an
Michael Kreil? Positioniert euch bitte an

614
00:48:24,599 --> 00:48:29,709
den Mikrophonen, ich versuche einigermaßen
ausgeglichen auszuwählen. Falls schon

615
00:48:29,709 --> 00:48:33,339
irgendwo jemand steht, steht schon
irgendwo jemand, hebt mal die Hand? Ah, da

616
00:48:33,339 --> 00:48:37,390
hinten. Mikrophon 4, fang an.
Mikrophon 4: Jawohl. Ich hab eine Frage

617
00:48:37,390 --> 00:48:45,549
bezüglich State-sponsored Propaganda, also
die sind wirklich Leute, die bezahlt

618
00:48:45,549 --> 00:48:52,320
werden von Staaten, damit die Propaganda
betreiben. Habt ihr auch in der Forschung

619
00:48:52,320 --> 00:48:55,609
diebezüglich was rausgefunden, oder habt
ihr das überhaupt untersucht?

620
00:48:55,609 --> 00:49:01,199
MK: Wir haben versucht, Leute zu finden,
die an den Bots, die an den politischen

621
00:49:01,199 --> 00:49:04,660
Diskursen teilnehmen. Ob sie jetzt
tatsächlich dafür bezahlt werden oder

622
00:49:04,660 --> 00:49:09,589
nicht ist unmöglich festzustellen. Wir
sehen aber, wenn jetzt zum Beispiel jemand

623
00:49:09,589 --> 00:49:15,129
bei der US-Wahl was postet und dann aber
in den nächsten Monaten bis heute noch

624
00:49:15,129 --> 00:49:18,680
ganz normales Leben auf den, in den
sozialen Netzwerken führt, und parallel

625
00:49:18,680 --> 00:49:22,400
dann auch noch auf Facebook oder sowas,
gehen wir eher davon aus, dass es sich

626
00:49:22,400 --> 00:49:27,040
nicht um einen bezahlten Akteur oder
Akteure handelt. Die große Frage, die ich

627
00:49:27,040 --> 00:49:30,759
mir eigentlich auch stelle ist dabei: Was
ist der tatsächliche impact, also die

628
00:49:30,759 --> 00:49:35,749
Unterstellung mit jemand bezahlt da
irgendwie, kann ich wirklich auf Twitter

629
00:49:35,749 --> 00:49:39,329
durch soziale Interaktion Leute davon
überzeugen, die politische Richtung zu

630
00:49:39,329 --> 00:49:43,049
wechseln? Das ist eine bisherige
Unterstellung, die noch nicht überprüft

631
00:49:43,049 --> 00:49:46,780
wurde, und deswegen finde ich das
vorsichtig, bin ich da vorsichtig, sowas

632
00:49:46,780 --> 00:49:50,009
anzunehmen.
H: Mikro 2.

633
00:49:50,009 --> 00:49:54,220
M2: Vielen, vielen Dank für den
großartigen Vortrag, ich fand' das super

634
00:49:54,220 --> 00:49:57,550
wichtig, anhand von dem kann man
eigentlich sehen, was sich wirklich an

635
00:49:57,550 --> 00:50:01,309
wissenschaftlichen Methodiken verändern
muss, und von daher vielen, vielen Dank.

636
00:50:01,309 --> 00:50:05,079
Ich habe eine Frage, ich habe mich gerade
gefragt, ob man wirklich von Fake News

637
00:50:05,079 --> 00:50:08,791
sprechen sollte, weil offensichtlich
spiegeln diese Nachrichten ja nur, was die

638
00:50:08,791 --> 00:50:14,309
Verbreiter und weiteren Re-tweeter der
Nachrichten hören oder sehen oder wissen

639
00:50:14,309 --> 00:50:18,319
wollen, also das, was sie eigentlich schon
denken, wird quasi nur gespiegelt. Und ich

640
00:50:18,319 --> 00:50:22,229
hab mich gefragt, ob es nicht irreführend
ist, dieses Wort "News", und ob man nicht

641
00:50:22,229 --> 00:50:25,760
ein neues Wort dafür finden müsste.
MK: Auf jeden Fall, auf jeden Fall. Wir

642
00:50:25,760 --> 00:50:30,699
haben auch zum Beispiel gesehen, dass bei
der US-Wahl relativ viele Fake News aus

643
00:50:30,699 --> 00:50:34,650
einer Stadt aus Osteuropa kommt, die aber
gar keine politische Agenda haben, sondern

644
00:50:34,650 --> 00:50:38,309
einfach nur Geld damit verdient haben,
dass ihre Posts sich so weit verbreitet

645
00:50:38,309 --> 00:50:42,459
haben, und damit klick-Werbung, verstanden
haben, Geld gewonnen haben. Da war

646
00:50:42,459 --> 00:50:47,829
überhaupt kein politischer, gar kein
politisches Ziel dahinter, im Gegenteil,

647
00:50:47,829 --> 00:50:51,550
laut eigener Aussage haben sie erst pro-
Clinton probiert, aber das hat einfach

648
00:50:51,550 --> 00:50:56,019
nicht so gut eingeschlagen wie pro-Trump-
Sachen. Deswegen halte ich auch den

649
00:50:56,019 --> 00:51:00,440
Begriff von Fake News dann auch nicht mehr
für angebracht.

650
00:51:00,440 --> 00:51:03,809
H: So, aus dem Internet haben wir auch
eine Frage.

651
00:51:03,809 --> 00:51:08,229
Signal-Engel: Ja, zuerst auch aus dem IRC
großes Lob an den Vortrag, es wurde

652
00:51:08,229 --> 00:51:12,529
angemerkt, es sei sehr interessant, mal
den Hashtag #34c3 zu analysieren und

653
00:51:12,529 --> 00:51:18,050
Trolle aufzudecken. Cyberrichter und Afdex
lässt fragen: Gibt es schon schlaue Bots

654
00:51:18,050 --> 00:51:21,769
mit Einfluss, ist irgendwas über die
Interaktion untereinander bekannt, gibt es

655
00:51:21,769 --> 00:51:33,180
bald Bot Wars?
MK: Äh. Flame-Bots, ja, äh. Das sind alles

656
00:51:33,180 --> 00:51:38,879
theoretische Konzepte. Wenn man sich die
Studien dazu durchliest, das sind alles

657
00:51:38,879 --> 00:51:42,539
Konzepte "es könne irgendwann mal so
sein". Ich stehe auch nicht hier und sage

658
00:51:42,539 --> 00:51:46,549
"sowas wird nie passieren" oder sowas.
Keine Ahnung, was es für Entwicklungen mit

659
00:51:46,549 --> 00:51:52,450
KI in den nächsten Tagen oder Monaten oder
so gibt. Aber das, was wir jetzt bisher

660
00:51:52,450 --> 00:51:56,709
sehen konnten, waren jetzt nicht
irgendwelche KI's, die durchs Internet

661
00:51:56,709 --> 00:52:00,239
laufen.
H: Die 3.

662
00:52:00,239 --> 00:52:07,039
M3: Servus. Wunderbar, funktioniert. Das
erste harte Kriterium, das mir einfallen

663
00:52:07,039 --> 00:52:11,059
würde, um Bot-Accounts von Menschen-
Accounts zu trennen wäre die posting-

664
00:52:11,059 --> 00:52:14,720
Frequenz, und die hat jetzt hier nur
einmal Einfluss gefunden - woran liegt

665
00:52:14,720 --> 00:52:17,289
das?
MK: Weil sie tatsächlich auch nur einmal

666
00:52:17,289 --> 00:52:25,729
auffällig war. Also, die anderen Accounts,
also ich meine, wenn ich jetzt nen Social

667
00:52:25,729 --> 00:52:29,809
Bot entwickle, dann wäre ich jetzt auch
schlau zu sagen okay, dann haut der jetzt

668
00:52:29,809 --> 00:52:35,450
nicht alle halbe Sekunde nen tweet raus,
wenn ich sowas bauen würde. Aber in diesem

669
00:52:35,450 --> 00:52:39,250
Fall ist es tatsächlich nur einmal
aufgetreten, das ein Bot sozusagen den Bug

670
00:52:39,250 --> 00:52:43,410
hatte, das zu tun.
M3: Okay, taugt also nicht. Super, danke.

671
00:52:43,410 --> 00:52:47,609
H: Und MIkro 1.
M1: Hallo erstmal, ja, jetzt geht's. Ich

672
00:52:47,609 --> 00:52:51,049
wollte fragen ob, weil du ja gesagt
hattest dass bei den Social Bots ja

673
00:52:51,049 --> 00:52:54,949
eigentlich der Einfluss sich verliert, ob
das dann wiederum heißen könnte, dass die

674
00:52:54,949 --> 00:52:59,349
eigentliche Gefahr von Filterblasen, dass
kein Meinungsdiskurs entsteht, oder dass

675
00:52:59,349 --> 00:53:03,789
der halt eingedämmt wird, ob das sich dann
verliert oder ob du in den Forschungen

676
00:53:03,789 --> 00:53:07,459
gesehen hast, dass die Gefahr gar nicht so
da ist, wie sie irgendwie überall

677
00:53:07,459 --> 00:53:12,009
propagiert wird? Ja.
MK: Also, zum Einen: Ich glaube, es gibt

678
00:53:12,009 --> 00:53:15,600
so einen Satz, den man in den letzten 10
Jahren immer wieder gehört hat, das

679
00:53:15,600 --> 00:53:18,460
Internet ist nicht an bestimmten Sachen
schuld, sondern das Internet macht nur

680
00:53:18,460 --> 00:53:22,339
einfach wieder Sachen sichtbar. Und ich
glaube, dass es eine Menge Leute gibt, die

681
00:53:22,339 --> 00:53:27,231
sich gerne an einem politischen Diskurs
beteiligen wollen und nicht die

682
00:53:27,231 --> 00:53:31,319
Möglichkeit hatten, und jetzt nun mit den
sozialen Netzen diese Möglichkeit haben,

683
00:53:31,319 --> 00:53:34,479
und dann als Bots klassifiziert werden.
Problem ist, dass ich deine Frage

684
00:53:34,479 --> 00:53:35,780
vergessen habe.

685
00:53:35,780 --> 00:53:37,690
M1: Ich wollte eigentlich nur wissen, ob

686
00:53:37,690 --> 00:53:41,079
diese Gefahr, dass man halt sagt, der
Diskurs ist so ein bisschen eingedämmt,

687
00:53:41,079 --> 00:53:44,891
weil jeder in seiner eigenen Blase lebt,
ob sich das nicht dadurch verliert, weil

688
00:53:44,891 --> 00:53:49,309
du ja gesagt hattest, Social Bots sind
unwirksam so wirklich, ob das nicht dann

689
00:53:49,309 --> 00:53:52,839
sich auch sozusagen auf das andere
übertragen lässt für unsere, für unseren

690
00:53:52,839 --> 00:53:56,701
normane Gebrauch.
MK: Genau, also, ich, kann ich, kann ich

691
00:53:56,701 --> 00:54:01,290
keine abschließende Meinung zu abgeben.
Ich weiß aber dass, oder man merkt es

692
00:54:01,290 --> 00:54:05,180
halt, dass die sozialen Netze oft, oder
fast immer nicht dazu geeignet sind,

693
00:54:05,180 --> 00:54:08,510
tatsächlich einen Diskurs zu führen,
sondern es gibt halt, es ist halt,

694
00:54:08,510 --> 00:54:12,139
endet immer in einem Flame War, sind
sozusagen, "du bist, ihr seid die Bösen,

695
00:54:12,139 --> 00:54:15,808
und wir sind die Guten." Aber tatsächlich
irgendwie eine Lösung zu entwickeln,

696
00:54:15,808 --> 00:54:18,029
eignet sich nicht dafür, vielleicht ist
der Mensch auch nicht dafür gemacht.

697
00:54:18,029 --> 00:54:22,279
Vielleicht haben Netzwerke nen, nen
bestimmten flaw, den wir halt noch nicht

698
00:54:22,279 --> 00:54:24,979
kennen, man darf ja auch nicht vergessen,
das ist eine extrem experimentelle

699
00:54:24,979 --> 00:54:29,930
Technologie. Noch nie gab es ein Netzwerk,
das weltübergreifend so vielen Menschen

700
00:54:29,930 --> 00:54:32,819
die Möglichkeit gibt, miteinander zu
kommunizieren und Diskurse zu führen.

701
00:54:32,819 --> 00:54:35,369
M1: Danke.
H: Mikro 4.

702
00:54:35,369 --> 00:54:40,789
M4: Ja, Hallo. Erstmal Kompliment für
diesen superwichtigen und sehr coolen

703
00:54:40,789 --> 00:54:44,730
Vortrag. Meine Frage: Du hattest ja jetzt
ausschließlich über Twitter gesprochen -

704
00:54:44,730 --> 00:54:48,420
habt ihr mal Analysen gefahren über andere
soziale Netze, die ja durchaus auch

705
00:54:48,420 --> 00:54:54,340
Verbreitung haben, speziell dazu, auch
nicht nur über die Anzahl der Tweets

706
00:54:54,340 --> 00:54:58,069
sondern auch über den Impact, weil die
Frage ist ja, die hattest du ja mehrfach

707
00:54:58,069 --> 00:55:01,450
aufgeworfen, was wirkt eigentlich eine
Tweet, wenn die, wenn die einen

708
00:55:01,450 --> 00:55:05,369
veröffentlichen, also ein Tweet auf 10.000
Follower könnte möglicherweise wichtiger

709
00:55:05,369 --> 00:55:10,170
sein als 10.000 Tweets mit einem Follower.
MK: Genau, da kann man sich halt Metriken

710
00:55:10,170 --> 00:55:14,790
überlegen. Normalerweise ist es für mich
halt ein Ausschlusskriterium, wenn ein

711
00:55:14,790 --> 00:55:19,009
Tweet nur, nicht gefavt wird und nicht
retweetet wird, das ist für mich, das ist

712
00:55:19,009 --> 00:55:22,349
ein Ausschlusskriterium. Was der
tatsächliche Impact ist, obs dafür ne

713
00:55:22,349 --> 00:55:27,920
Metrik gibt, weiß ich nicht. Kann man sich
überlegen, wie gesagt, neue Wissenschaft.

714
00:55:27,920 --> 00:55:33,190
Das andere ist, andere soziale Netzwerke.
Man sieht, dass auf YouTube ne Menge

715
00:55:33,190 --> 00:55:37,819
passiert. Ganz viele Leute packen im
Wohnzimmer die Kamera aus und teilen ihre

716
00:55:37,819 --> 00:55:42,180
politischen Meinungen im Wohnzimmer und
veröffentlichen das auf YouTube, es gibt

717
00:55:42,180 --> 00:55:47,839
auch dieses russische Social Network, wie
heißt das? VKan... VKan-irgendwas, ja.

718
00:55:47,839 --> 00:55:54,279
Genau, da gibt es - VKontakte, genau - da
gibt es auch, kenne ich eine Gruppe die

719
00:55:54,279 --> 00:55:57,980
sich damit beschäftigt hat, wie das da
aussieht, das ist aber ein sehr kleiner

720
00:55:57,980 --> 00:56:04,459
Teil, der große Brocken ist natürlich
Facebook, und Facebook hat zwei Probleme:

721
00:56:04,459 --> 00:56:08,720
Erstens gibt es eine Menge geschlossene
Gruppen wo viel stattfindet, da habe ich

722
00:56:08,720 --> 00:56:12,310
mal rein geguckt, sind die gleichen
Themen, es geht halt auch um Asylpolitik

723
00:56:12,310 --> 00:56:16,250
und so weiter. Und das andere Problem mit
Facebook ist, die API ist leider nicht so

724
00:56:16,250 --> 00:56:20,380
offen. Es gibt Schwierigkeiten, da große
Mengen an Daten rauszuholen. Ich glaube

725
00:56:20,380 --> 00:56:25,749
dass Facebook in diesem Bereich wahnsinnig
viel Datenmaterial hat und Forschung dazu

726
00:56:25,749 --> 00:56:29,680
betreiben könnte, aber leider halt nur
innerhalb eines Konzerns und nicht

727
00:56:29,680 --> 00:56:32,439
innerhalb der Forschungsgemeindschaft.
M4: Okay, danke.

728
00:56:32,439 --> 00:56:36,089
H: Unser Social Bot hat auch noch eine
Frage.

729
00:56:36,089 --> 00:56:41,170
Signal: Mie lässt fragen, ob es Studien zu
dem realen Ausmaß und dem realen Impact

730
00:56:41,170 --> 00:56:45,089
von Fake News in den sozialen Medien, und
wurden die eventuell zur Legitimation des

731
00:56:45,089 --> 00:56:49,079
NetzDGs herangezogen?
MK: Habe ich akustisch nicht verstanden.

732
00:56:49,079 --> 00:56:54,089
Signal: Gibt es Studien über das reale
Ausmaß von Fake News und wurden die

733
00:56:54,089 --> 00:56:56,219
herangezogen zur Legitimisierung des
NetzDGs?

734
00:56:56,219 --> 00:57:03,219
MK: Soweit ich weiß ist mir, mir ist keine
Studie bekannt, aus meiner Erfahrung würde

735
00:57:03,219 --> 00:57:07,250
ich sagen: Sie haben keinen Einfluss, weil
sie halt erstmal nicht Leute überzeugen,

736
00:57:07,250 --> 00:57:10,849
ich glaube die Leute kommen schon mit
einer Überzeugung in die Netzwerke und

737
00:57:10,849 --> 00:57:15,279
werden einfach nur noch weiter zusätzlich
bestätigt. Ich glaube, dass es einen

738
00:57:15,279 --> 00:57:20,019
gewissen Impact gibt mit Leuten, die
sozusagen Latent ne Sorge um

739
00:57:20,019 --> 00:57:24,650
Flüchtlingspolitik haben und dann nur noch
in einer Filterblase stecken und nur noch

740
00:57:24,650 --> 00:57:28,519
mit Flüchtlingskriminalität bombardiert
werden. Dass sie dazu dann auch neigen,

741
00:57:28,519 --> 00:57:32,429
eine Angst gegen beispielsweise Migranten
zu entwickeln. Aber eine Studie dazu ist

742
00:57:32,429 --> 00:57:35,529
mir noch nicht bekannt, wie das
tatsächlich, ob das psychologische

743
00:57:35,529 --> 00:57:39,220
Auswirkungen auf die Menschen hat.
H: Und die 2.

744
00:57:39,220 --> 00:57:45,910
Frage M2: Ja hallo, danke für den Vortrag.
Du hattest am Anfang so einen schöne

745
00:57:45,910 --> 00:57:49,539
Karte, wo verschiedene Gruppen aus dem
Twitternetzwerk aufgezeigt wurden, und

746
00:57:49,539 --> 00:57:53,690
dann hast du gezeigt, da sitzt die AfD und
dann kam der Switch und da sind die

747
00:57:53,690 --> 00:57:57,949
Fakenews. Wie hast du denn ermittelt, dass
diese Tweets Fakenews waren?

748
00:57:57,949 --> 00:58:01,619
Antwort: Also konkret, ich habe mir
Fakenews ausgesucht und hab geguckt wer

749
00:58:01,619 --> 00:58:05,949
sie auf Twitter teilt. Also andersrum, ich
hab mir sozusagen Geschichten rausgesucht,

750
00:58:05,949 --> 00:58:09,880
von denen ich weiß dass es Fakenews sind
und habe dann beispielsweise Blogpost und

751
00:58:09,880 --> 00:58:14,029
so weiter die es verbreitet haben und
diese URL... also wer twittert im Prinzip

752
00:58:14,029 --> 00:58:18,369
Fakenews und genau, dadurch kam dann diese
Einfärbung zustande.

753
00:58:18,369 --> 00:58:22,829
H: Mikro 3.
M3: Ja ich hab noch ein Frage zu

754
00:58:22,829 --> 00:58:26,889
Antworten, also ich hab oft gehört von
Journalisten die sich beschwert haben,

755
00:58:26,889 --> 00:58:30,510
wenn sie über ein bestimmtes Thema
berichtet haben, dass da irgendwelche Bots

756
00:58:30,510 --> 00:58:34,239
sie mit Antworten zumüllen oder sowas.
Hast du sowas beobachten können wird das

757
00:58:34,239 --> 00:58:37,959
irgendwie als Megafon eingesetzt um dann
einfach nochmal ein bisschen mehr Bums

758
00:58:37,959 --> 00:58:41,449
oder Druck zu machen auf solche Accounts?
Gibt's das was oder ist das auch

759
00:58:41,449 --> 00:58:44,809
eigentlich alles echte Menschen die
wirklich wütend sind?

760
00:58:44,809 --> 00:58:49,499
MK: Ich sag noch nicht, dass das alles
echte Menschen sind, also ich kann mit

761
00:58:49,499 --> 00:58:57,330
einem Bot zum Beispiel immer einen Hashtag
unbenutzbar machen. Ich kann mir einen

762
00:58:57,330 --> 00:59:00,890
Hashtag raussuchen und kann das dann mit
Bots vollmüllen, aber das ist dann

763
00:59:00,890 --> 00:59:05,670
eigentlich mehr ein Spam oder um den
Diskurs zu stören, aber nicht wirklich

764
00:59:05,670 --> 00:59:13,380
einen Einfluss zu haben dabei. Zu den
Journalisten, ich kenne da einige

765
00:59:13,380 --> 00:59:20,140
Journalisten, die auf Twitter aktiv sind
und dann immer wieder mit einer großen

766
00:59:20,140 --> 00:59:24,049
Anzahl Accounts konfrontiert werden. Ich
bin mir da auch nicht sicher,

767
00:59:24,049 --> 00:59:27,488
ob es tatsächlich sich um Botnetzwerke
handelt, denn es sind immer wieder

768
00:59:27,488 --> 00:59:31,209
vereinzelt Leute die unterschiedliche
Tweets machen, es ist ja schon wahnsinnig

769
00:59:31,209 --> 00:59:35,429
schwierig 100.000 künstliche Tweets zu
erzeugen mit einer künstlichen Intelligenz

770
00:59:35,429 --> 00:59:39,019
zu erzeugen, die aber unterschiedlich
sind. Das ist schon ein relativ hartes

771
00:59:39,019 --> 00:59:42,589
Problem, ich weiß nicht ob das bereits
gelöst ist, ich glaube nämlich nicht.

772
00:59:42,589 --> 00:59:48,469
H: Nummer 4 bitte.
M4: Eine Frage zu einem Kriterium, bei dem

773
00:59:48,469 --> 00:59:52,720
ich nicht weiß, ob es aufgetaucht ist oder
nicht, oder ob ich nur nicht aufmerksam

774
00:59:52,720 --> 00:59:58,400
genug war. Und zwar geht es um
gleichlautende Nachrichten in Tweets zum

775
00:59:58,400 --> 01:00:03,819
Beispiel. Also ich weiß, dass bei Fakenews
teilweise ganze absatzweise Texte 1 zu 1

776
01:00:03,819 --> 01:00:10,189
kopiert werden und auch manuell sozusagen,
trotzdem kommt mir das auch als ein

777
01:00:10,189 --> 01:00:14,709
wichtiges Kriterium vor um, wie gesagt,
einen Einflussfaktor, ist es ein Bot oder

778
01:00:14,709 --> 01:00:19,920
nicht festzustellen. Spielt das in den
Studien irgend eine Rolle, die Du

779
01:00:19,920 --> 01:00:24,849
untersucht hast oder für Deine Arbeit?
MK: In den Studien kann ich es nicht

780
01:00:24,849 --> 01:00:29,250
sagen, die hatten jetzt immer nur ihre
Kriterien mit den Hashtags und so weiter.

781
01:00:29,250 --> 01:00:35,550
Was in meiner Arbeit aufgefallen ist, dass
ist immer wieder, zum einen es gibt

782
01:00:35,550 --> 01:00:39,379
natürlich Leute die sagen, ich will das
jetzt nicht retweeten sondern ich kopiere

783
01:00:39,379 --> 01:00:43,189
den Tweet und sage sozusagen, dass das
mein Eigener ist. Aber es gibt tatsächlich

784
01:00:43,189 --> 01:00:48,220
bestimmte Formulierungen die zu
10.000-en identisch auftauchen, aber es

785
01:00:48,220 --> 01:00:53,429
sind tatsächlich nur Textdatenbanken, die
da einfach abgespielt werden, auch nicht

786
01:00:53,429 --> 01:00:57,210
mit politischen Inhalten, sondern ... ich
weiß nicht vielleicht sind die dormant

787
01:00:57,210 --> 01:01:01,680
oder sowas, aber keinerlei politische
Aktivität zu sehen dort.

788
01:01:01,680 --> 01:01:04,869
H: Und die 2 bitte.
<i> Lachen </i>

789
01:01:04,869 --> 01:01:12,109
M2: Ja hallo, auch nochmal vielen Dank für
den Vortrag. Eine Frage zu dem Thema

790
01:01:12,109 --> 01:01:20,149
Schweden-Reisewarnung, was am Anfang kam.
Wie viel Handarbeit war dabei die Tweets

791
01:01:20,149 --> 01:01:23,770
quasi rauszufinden, die zu dieser Story
gehören, und wie kannst Du Dir sicher

792
01:01:23,770 --> 01:01:27,269
sein, dass Du alle gefunden hast?
MK: Ich kann mir nicht sicher sein, dass

793
01:01:27,269 --> 01:01:31,131
ich alle gefunden habe, insbesondere weil
immer wieder Tweets gelöscht werden oder

794
01:01:31,131 --> 01:01:34,889
ganze Accounts. Das hat man auch gesehen,
wenn man sich die Daten mal ein halbes

795
01:01:34,889 --> 01:01:38,648
Jahr später anschaut, oder wie viele
Accounts in der Zwischenzeit weg sind. Ich

796
01:01:38,648 --> 01:01:41,990
kann mir nicht sicher sein, dass ich alle
Tweets gefunden habe, natürlich nicht. Was

797
01:01:41,990 --> 01:01:44,840
man halt machen kann ist sich
durchzuhangeln. Man fängt dann an mit

798
01:01:44,840 --> 01:01:48,789
sowas wie "Schweden Reisewarnung" und dann
sieht man die ersten, und dann kommen da

799
01:01:48,789 --> 01:01:52,600
aber auch noch andere Begriffe zusammen
und hier finde ich nochmal einen Link auf

800
01:01:52,600 --> 01:01:55,579
einen Blogpost und dann suche ich mal nach
dem und so weiter, und so wird die

801
01:01:55,579 --> 01:01:59,759
Datenbank immer größer und so habe ich
glaube ich 1800 Tweets oder sowas gefunden

802
01:01:59,759 --> 01:02:03,469
und versuch die dann so halbautomatisiert
zu kategorisieren mit Fakenews und so

803
01:02:03,469 --> 01:02:07,249
weiter. Das ist sozusagen die Methodik,
das ist eigentlich so halbautomatisierte

804
01:02:07,249 --> 01:02:10,119
Handarbeit.
H: Jetzt aber, Fefe.

805
01:02:10,119 --> 01:02:14,239
Frage M1 [???]: Ich hab eine
H: Die eins ist das bitte.

806
01:02:14,239 --> 01:02:19,159
Frage M1: Hallo, hallo. Also ich hab eine
kurze Frage und eine Bitte um weitere

807
01:02:19,159 --> 01:02:22,490
Daten. Erstens würde ich gerne wissen, wie
viele von Deinen Rohdaten Du

808
01:02:22,490 --> 01:02:26,760
veröffentlichen kannst und tust. Und
zweitens Dein Beispiel am Anfang mit der

809
01:02:26,760 --> 01:02:31,309
Twitter-Timeline da ging's irgendwie um
2.000 Tweets oder 2.000 Leute und das ist

810
01:02:31,309 --> 01:02:35,219
eine Größenordnung, die man häufiger sieht
in diesen Debatten und da frage ich mich

811
01:02:35,219 --> 01:02:39,230
immer, ich hab mehr ungelesene Mails in
meiner Inbox, wieso interessieren mich

812
01:02:39,230 --> 01:02:43,749
2000 Leute? Ist das irgendwie, wieso ist
das jetzt eine relevante Größenordnung?

813
01:02:43,749 --> 01:02:46,799
Kannst du da vielleicht noch etwas dazu
sagen?

814
01:02:46,799 --> 01:02:50,739
A: Okay, also das erste war, ob ich meine
Daten veröffentlichen kann. Es gibt

815
01:02:50,739 --> 01:02:54,529
tatsächlich eine Guideline von Twitter,
die es mir nicht erlaubt beispielsweise

816
01:02:54,529 --> 01:02:58,389
von einem bestimmten Account zehntausende
von Tweets zu veröffentlichen. Es gibt

817
01:02:58,389 --> 01:03:02,209
bestimmte Sachen, die man machen darf. Da
würde ich mich halt, sonst hätte ich es

818
01:03:02,209 --> 01:03:06,119
jetzt einfach mal so "Rechtsklick
veröffentlichen" gemacht. Ich würde es mir

819
01:03:06,119 --> 01:03:11,089
jetzt mal nochmal genauer anschauen, was
ich machen darf und so weiter. Gerade

820
01:03:11,089 --> 01:03:14,630
"hydrated Tweets" heißt das, also
sozusagen nicht nur Twitter-IDs zu haben,

821
01:03:14,630 --> 01:03:17,469
sondern wirklich eine große csv-Datei oder
sowas, die man dann sich in Excel mal

822
01:03:17,469 --> 01:03:20,930
durchklicken kann, kann glaube ich bei dem
ein oder anderen, der da frisch mit dem

823
01:03:20,930 --> 01:03:25,339
Thema ist schon weiterhelfen. Muss ich
halt mal kucken in den nächsten Tagen. Und

824
01:03:25,339 --> 01:03:29,329
die zweite Frage war, inwieweit
zweitausend Accounts einen Einfluss haben?

825
01:03:29,329 --> 01:03:33,150
F: Genau, vielleicht ein bisschen Kontext
geben. Ist das irgendwie besonders viel

826
01:03:33,150 --> 01:03:37,439
oder ist das üblich oder findest du das
eine relavante Größe? Wieso müssen wir

827
01:03:37,439 --> 01:03:41,029
über 2.000 reden, weil mir kommt es
intuitiv nicht so viel vor, frage ich

828
01:03:41,029 --> 01:03:44,299
mich. Bei 80 Millionen Leuten sind 2.000
Leute nicht so.

829
01:03:44,299 --> 01:03:48,620
A: Das ist halt auch ein klassisches
wichtiges Argument. Ich meine, erstens es

830
01:03:48,620 --> 01:03:51,920
sind nicht alle Leute in sozialen
Netzwerken, dann sind eine Menge Leute in

831
01:03:51,920 --> 01:03:55,829
Facebook. Es ist nur ein winzig kleiner
Teil davon auf Twitter und inwieweit da

832
01:03:55,829 --> 01:04:00,150
dann irgendwie 2.000 Leute tatsächlich
einen Impact haben auf einen politischen

833
01:04:00,150 --> 01:04:04,819
Diskurs in Deutschand, da wird dann immer
gesagt: ja aber in den sozialen Netzwerken

834
01:04:04,819 --> 01:04:09,500
sind aber die Aktivisten, die Journalisten
usw. und wenn die beeinflusst werden,

835
01:04:09,500 --> 01:04:16,230
irgendwie sowas. Tatsächlich halte ich die
Twitter-Diskussion nicht für politisch,

836
01:04:16,230 --> 01:04:18,679
gesellschaftlich relevant in Deutschland.
F: <i>Lachen</i>

837
01:04:18,679 --> 01:04:21,069
H: So, eine Frage schaffen wir noch. Das
ist die 4.

838
01:04:21,069 --> 01:04:30,269
Frage M4: Hallo! Erst kurz Danke, weil
Dein Projekt mir im Studium, mich ziemlich

839
01:04:30,269 --> 01:04:40,269
gerettet hat, also Danke. Und dann ist mir
halt aufgefallen, gerade bei diesen Troll-

840
01:04:40,269 --> 01:04:46,959
Armeen, keine Ahnung, diese bezahlten, ob
Du mal gekuckt hast in den Accounts, wie

841
01:04:46,959 --> 01:04:52,509
oft sich besitmmte Sachen wiederholen? Zum
Beispiel haben die ja oft dasselbe

842
01:04:52,509 --> 01:04:58,729
Profilbild und dann Accounts mit
fortlaufenden Nummern, wenn der erste

843
01:04:58,729 --> 01:05:02,629
gelöscht wird oder gesperrt?
A: Dieses Phänomen sieht man auch

844
01:05:02,629 --> 01:05:06,469
generell. Das sieht man auch bei wütenden
Bürgern, die in den sozialen Netzwerken

845
01:05:06,469 --> 01:05:10,199
sind. Dann von beispielsweise Twitter
gesperrt werden, dann wieder rauf kommen

846
01:05:10,199 --> 01:05:13,789
und dann packen sie sich hinter ihren
alten Usernamen einfach noch eine Zahl

847
01:05:13,789 --> 01:05:17,739
hinten dran. Aber ob die Leute tatsächlich
bezahlt werden oder nicht, das kriege ich

848
01:05:17,739 --> 01:05:21,510
über eine Twitter-API auch nicht heraus.
Eigentlich müsste man dann fast wie ein

849
01:05:21,510 --> 01:05:26,059
Ethnologe sich mit den Leuten unterhalten
und kucken, was sie da für eine Agenda

850
01:05:26,059 --> 01:05:31,660
haben. Ich finde es aber gefährlich dann
von vornherein zu sagen, die sind bezaht

851
01:05:31,660 --> 01:05:35,729
oder sind vom Kreml gesteuert oder sind
künstliche Intelligenzen oder keine Ahnung

852
01:05:35,729 --> 01:05:39,459
was. Das muss auf jeden Fall wieder eine
Debatte sein, die auf evidenzbasierter

853
01:05:39,459 --> 01:05:42,323
Forschung basiert.
F: Ja ich hab die auch nur. Bin ich noch

854
01:05:42,323 --> 01:05:44,150
da?
H: Ja.

855
01:05:44,150 --> 01:05:52,219
F: Ich hab die auch nur zufällig gefunden,
weil ich das halt gemacht hab damals zur

856
01:05:52,219 --> 01:05:58,920
Türkei-Wahl und es halt sehr viele
Accounts gab, die immer so türkischen Spam

857
01:05:58,920 --> 01:06:03,309
gepostet haben, sich dann aber plötzlich
in sehr schlechtem Deutsch in deutsche

858
01:06:03,309 --> 01:06:06,600
Debatten eingemischt hatten.
A: Super, dann sollten wir auf jeden Fall

859
01:06:06,600 --> 01:06:09,679
mal unterhalten, ich glaube da können wir
uns gegenseitig helfen.

860
01:06:09,679 --> 01:06:13,440
H: Unterhalten könnt ihr euch gleich neben
der Bühne, die Zeit ist nämlich jetzt

861
01:06:13,440 --> 01:06:17,563
leider um. Vielen Dank Michael Kreil! Da
geht mehr!

862
01:06:17,563 --> 01:06:25,709
<i>Applaus</i>

863
01:06:25,709 --> 01:06:30,999
<i>Abspannmusik</i>

864
01:06:30,999 --> 01:06:42,769
Untertitel erstellt von c3subtitles.de
im Jahr 2019. Mach mit und hilf uns!