WEBVTT
00:00:00.140 --> 00:00:14.856
Intro Musik
00:00:14.856 --> 00:00:18.720
Herald: Ihr findet das ja wahrscheinlich
alle völlig normal mit großen Datenmengen
00:00:18.720 --> 00:00:23.710
umzugehen. So Typen wie ich, die
herkömmliche Journalisten sind, ich bin im
00:00:23.710 --> 00:00:27.339
Hauptberuf Hörfunkjournalist, die
verzweifeln regelmäßig daran. Also wir
00:00:27.339 --> 00:00:30.790
haben gelernt, damals, Leute zu fragen,
die sich mit irgendwas auskennen.
00:00:30.790 --> 00:00:33.012
Jetzt ist Leute fragen,
die sich mit großen
00:00:33.012 --> 00:00:34.890
Datenmengen auskennen auch nicht unbedingt
00:00:34.890 --> 00:00:39.800
zielführend für unserein, dafür gibts aber
neuerdings einen relativ frischen Beruf,
00:00:39.800 --> 00:00:43.800
dieser Beruf nennt sich Datenjournalist.
Datenjournalisten sind diese Menschen, die
00:00:43.800 --> 00:00:47.140
aus aberwitzig großen Datenmengen
Zusammenhänge rauspopeln und diese
00:00:47.140 --> 00:00:49.900
Zusammenhänge dann idealerweise auch noch
so visualisieren,
00:00:49.900 --> 00:00:51.610
dass solche Noobs wie ich das dann
00:00:51.610 --> 00:00:54.679
auch verstehen und hinterher
kompetent drüber reden können, oder
00:00:54.679 --> 00:00:57.829
jedenfalls so aussehen können, als würden
sie kompetent drüber reden und einer der
00:00:57.829 --> 00:01:01.740
so Leute wie uns sehr dabei unterstützt,
ist Datenjournalist. Das ist nämlich der
00:01:01.740 --> 00:01:06.341
Michael Kreil und seinen Vortrag seht ihr
jetzt. Viel Spaß.
00:01:06.341 --> 00:01:16.880
Applaus
Michael: Guten Morgen. Ihr habt gut
00:01:16.880 --> 00:01:23.209
geschlafen, ich nicht, weil erstens halte
ich jetzt einen Vortrag vor vielen Leuten
00:01:23.209 --> 00:01:27.010
und zum anderen werde ich mich in ein--
mit einem Thema beschäftigen, das zu sehr
00:01:27.010 --> 00:01:30.640
hitzigen Debatten und Shitstorms geführt
hat und da möchte ich auch nicht im
00:01:30.640 --> 00:01:36.860
Zentrum sein. Deswegen ist auch meine
erste Folie der Disclaimer. Ich würde mich
00:01:36.860 --> 00:01:40.840
politisch als links einordnen. Ich
distanziere mich hiermit ausdrücklich
00:01:40.840 --> 00:01:44.950
gegen jegliche Form von Rassismus,
Sexismus, Antisemitismus,
00:01:44.950 --> 00:01:48.430
Fremdenfeindlichkeit, Islamfeindlichkeit
und allgemein gegen jede Form von
00:01:48.430 --> 00:01:56.929
gruppenbezogener Menschlichkeit (Applaus)
- Menschenfeindlichkeit. Und im Rahmen
00:01:56.929 --> 00:02:00.229
dieses Vortrags bin ich Wissenschaftler
und Beobachter einer hitzigen
00:02:00.229 --> 00:02:04.080
Gesellschaftsdebatte und sehe mich somit
der Neutralität verpflichtet. Ich möchte
00:02:04.080 --> 00:02:07.800
die Debatte beobachten und nicht Teil von
ihr sein. Es geht also nicht um meine
00:02:07.800 --> 00:02:12.080
politische Position sondern um eine
neutrale Analyse von Daten. Und dafür habe
00:02:12.080 --> 00:02:17.090
ich mal 150 Folien vorbereitet. Ich hab
den Übersetzungsengeln schon Bier
00:02:17.090 --> 00:02:23.030
versprochen. Ähm ... genau, dann lass uns
direkt reinschmeißen. Das erste ist die
00:02:23.030 --> 00:02:27.590
Methodik. Das möchte ich gerne nochmal
vorher erzählen, damit die Leute auch
00:02:27.590 --> 00:02:31.658
wissen, wie es funktioniert und mir ist es
auch wichtig, dass es reproduzierbar ist.
00:02:31.658 --> 00:02:37.850
Es gibt ne Twitter-API, in der man Status
und Tweets abfragen kann,
00:02:37.850 --> 00:02:40.946
User abfragen kann,
welche Listen veröffentlicht wurden.
00:02:40.946 --> 00:02:43.740
Man kann danach suchen,
gucken, welche Follower sie haben
00:02:43.740 --> 00:02:47.164
und so weiter und so fort. Dann
setzt man sich hin und dann baut man sich
00:02:47.164 --> 00:02:50.650
son Interface für die API, wenn man
sich ein bisschen Mühe gibt, packt man
00:02:50.650 --> 00:02:54.430
auch noch einen Cache dazwischen. Das
heißt wenn ich Anfragen an die Twitter-API
00:02:54.430 --> 00:02:57.780
stelle und eine Anfrage kommt
zweimal, dann holt er sie aus der
00:02:57.780 --> 00:03:02.629
Datenbank und so weiter. Und wenn man sich
richtig Mühe gibt und vielleicht auch ein
00:03:02.629 --> 00:03:07.730
paar Tage oder Wochen investiert, dann
skaliert man das in einer Art und Weise,
00:03:07.730 --> 00:03:11.770
dass man nicht ein Interface hat, sondern
ganz viele und jedes Einzelne davon steht
00:03:11.770 --> 00:03:15.710
für einen anderen Twitter-Nutzer. Die Idee
ist, dass ich nicht als einzelner Nutzer
00:03:15.710 --> 00:03:19.489
abfrage, sondern ganz viele Nutzer können
parallel die Twitter-API abfragen. Und
00:03:19.489 --> 00:03:25.909
darüber gibt es so eine Art Load-Balancer,
der guckt ob-- sozusagen, wie die Last
00:03:25.909 --> 00:03:30.650
verteilt wird. Ziel der Aktion ist, die
Twitter API ist nämlich limitiert. Ich
00:03:30.650 --> 00:03:34.439
kann wenn ich zum Beispiel wissen möchte,
wer wie wem folgt, darf ich pro Minute
00:03:34.439 --> 00:03:39.940
durchschnittlich nur eine Anfrage stellen.
Wenn aber ich von ganz vielen Leuten die
00:03:39.940 --> 00:03:44.470
Autorisierung habe, in deren Namen
Anfragen zu stellen, darf ich entsprechend
00:03:44.470 --> 00:03:48.470
mehr Anfragen stellen. Das ist so eine Art
demokratischer Prozess, finde ich da drin,
00:03:48.470 --> 00:03:53.970
dass die Ressourcen von Twitter aufgeteilt
werden. Umso mehr Leute mich bei meiner
00:03:53.970 --> 00:03:58.010
API-Anfrage unterstützen, um so mehr
Anfragen darf ich machen und umso mehr
00:03:58.010 --> 00:04:02.409
Last darf ich verursachen. Finde ich sehr
spann-- sympathisch. Mein Kollege jetzt
00:04:02.409 --> 00:04:06.360
hat dann mal ein Interface aufgebaut, wo
man einen Token spenden kann. Da klickt
00:04:06.360 --> 00:04:10.120
man da halt drauf und dann kriegt man--
kriegen wir sozusagen einen langen Code,
00:04:10.120 --> 00:04:13.840
der uns dann ermöglicht zusätzliche
Anfragen an die API von Twitter zu
00:04:13.840 --> 00:04:18.880
stellen. Großes Danke geht hier nochmal an
Logbuch Netzpolitik, insbesondere Tim und
00:04:18.880 --> 00:04:23.460
Linus, und natürlich an die fast 700
Spender und Spenderinnen, die uns Tokens
00:04:23.460 --> 00:04:29.110
zur Verfügung gestellt haben. Das war not-
wendig, um große Datenmengen aus Twitter
00:04:29.110 --> 00:04:33.486
herauszuholen. Genau, damit kann ich dann
sozusagen ...
00:04:33.486 --> 00:04:41.870
Applaus
Schon bei mir zu Hause kann ich dann über
00:04:41.870 --> 00:04:46.390
Kabel Deutschland 10 Requests pro Sekunde
absetzen, mal zum Vergleich, wenn ich
00:04:46.390 --> 00:04:50.550
jetzt zum Beispiel mal die Metadaten aller
330 Millionen Twitter-Accounts abfragen
00:04:50.550 --> 00:04:55.530
möchte, braucht man etwa vier Tage dafür.
Das ist dann auch machbar, ohne die Tokens
00:04:55.530 --> 00:04:59.890
kann es sich um Monate oder sogar um Jahre
handeln. Das mal so ein bisschen erklärt,
00:04:59.890 --> 00:05:04.100
technisch, wie das im Hintergrund
funktioniert. Im Prinzip auch sehr stark
00:05:04.100 --> 00:05:10.110
auf Twitter fokussiert, die Analysen.
Genau. Erstes Thema, Fake News. Fake News
00:05:10.110 --> 00:05:14.730
ist ein komplexes Thema. Ich habe jetzt
mal eine Grafik übernommen von der
00:05:14.730 --> 00:05:18.550
Stiftung Neue Verantwortung, ich finde die
haben da die besten Kategorisierungen
00:05:18.550 --> 00:05:23.290
gemacht, was Fake News sind und was Fake
News nicht sind. Auf der linken Seite was
00:05:23.290 --> 00:05:27.260
nicht Fake News sind, ist schlechte
Politik, also Fake News als politischer
00:05:27.260 --> 00:05:31.550
Kampfbegriff, zum Beispiel Trump gegen die
New York Times oder so was, aber auch
00:05:31.550 --> 00:05:35.581
Satire sind keine Fake News, schlechter
Journalismus, Clickbaiting oder auch
00:05:35.581 --> 00:05:41.070
Zeitungsenten sollen eigentlich nicht zu
Fake News gezählt werden, Fake News sein--
00:05:41.070 --> 00:05:49.760
oder sind gezielte Desinformation, falsch
verstandene Inhalte und manipulierte
00:05:49.760 --> 00:05:53.320
Inhalte, also oft sieht man, dass zum
Beispiel Bilder beschnitten sind oder
00:05:53.320 --> 00:06:00.100
retuschiert sind und so weiter oder völlig
frei erfundene Inhalte. Ich habe leider
00:06:00.100 --> 00:06:03.780
nur ne Stunde Zeit, deswegen kann ich
mich jetzt nicht mit mehreren Fake News-
00:06:03.780 --> 00:06:07.420
Wellen auseinandersetzen. Deswegen habe
ich eine herausgenommen, die ich ganz
00:06:07.420 --> 00:06:14.241
typisch und eindrucksvoll fand und zwar
die Fake News über eine Reisewarnung nach
00:06:14.241 --> 00:06:19.270
Schweden des Auswärtigen Amtes. Hier ist
ein Tweet von der AfD Magdeburg, die sagt:
00:06:19.270 --> 00:06:22.780
„Das Auswärtige Amt - Erhöhte
Terrorwarnstufe für Schweden. Das hat
00:06:22.780 --> 00:06:26.640
natürlich nichts mit irgendwas zu tun.
Hashtag AfD wählen". Direkt danach-- naja
00:06:26.640 --> 00:06:32.700
nicht direkt danach, einige Stunden oder
Tage später kam ein Tweet des Auswärtigen
00:06:32.700 --> 00:06:37.000
Amtes, die dann die Gegendarstellung
veröffentlicht haben: „Es gibt keine
00:06:37.000 --> 00:06:42.360
Reisewarnung für Schweden. Hashtag Fake
News". Fast 2000 Tweets wurden zu diesem
00:06:42.360 --> 00:06:46.290
Thema veröffentlicht und die kann ich
jetzt nun mit diesem Twitter-Framework
00:06:46.290 --> 00:06:51.340
runterladen, analysieren und mir ein paar
Visualisierungen dazu ausdenken. Ich hab
00:06:51.340 --> 00:06:56.750
mal die Eine gemacht, das ist jetzt ein
Zeitstrahl. Auf der x-Achse sieht man die
00:06:56.750 --> 00:07:03.641
Zeit. Hier geht's vom 2. März bis zum-- 0
Uhr bis zum 9. März 0 Uhr. Oben, die
00:07:03.641 --> 00:07:08.140
Roten, das sind die Fake News-Verbreiter.
Unten, das sind diejenigen, die die
00:07:08.140 --> 00:07:11.962
Gegendarstellungen verbreiten. Auf dem
Zeitstrahl sind -- viel zu klein, das kann
00:07:11.962 --> 00:07:15.632
man jetzt drauf nicht sehen -- der
Zeitpunkt, wann ein Tweet veröffentlicht
00:07:15.632 --> 00:07:17.310
wurde und wenn er retweetet wurde,
00:07:17.310 --> 00:07:18.840
kriegt er sozusagen
einen Bogen,
00:07:18.840 --> 00:07:20.940
zu dem Zeitpunkt,
wohin er retweetet wurde.
00:07:20.940 --> 00:07:21.890
Das hat den Vorteil,
00:07:21.890 --> 00:07:23.450
dass ich nicht nur
sehe, wie viele Tweets
00:07:23.450 --> 00:07:25.180
veröffentlicht wurden,
sondern auch sehen kann,
00:07:25.180 --> 00:07:26.800
welchen Impact dieser Tweet hat.
00:07:26.800 --> 00:07:28.970
Wenn er also, zum Beispiel
veröffentlicht wird und keiner
00:07:28.970 --> 00:07:32.560
geht damit um, dann ist es halt nur ein
Punkt, aber wenn es viele Leute retweeten,
00:07:32.560 --> 00:07:38.800
gibts dann halt große Bögen dazu. Das--
Den ersten Tweet, den ich finden konnte,
00:07:38.800 --> 00:07:44.180
zu der Fake News, dass es eine
Reisewarnung nach Schweden gibt, war-- ist
00:07:44.180 --> 00:07:49.100
bereits am 28. September veröffentlicht
worden, wurde aber nicht beachtet. Keine
00:07:49.100 --> 00:07:55.180
Favs, keine Retweets, obwohl der Account
aktuell 481 Follower hat. Am--, im Februar
00:07:55.180 --> 00:08:01.960
gab es dann nochmal einen Tweet dazu. Der
Account hat jetzt aber nur einen Follower
00:08:01.960 --> 00:08:05.520
und der Tweet hat keine Retweets. Das
heißt also die Themen kamen schon mal
00:08:05.520 --> 00:08:11.650
vorher hoch, aber sie wurden nicht
weitergetragen. Noch ein Beispiel aus dem
00:08:11.650 --> 00:08:16.850
1. März 2017. Also jetzt gehen wir mal
rüber zu unserem Zeitstrahl, da gibt's
00:08:16.850 --> 00:08:24.570
dann den ersten, der dazu was twittert,
einen Screenshot von einem Bot, der
00:08:24.570 --> 00:08:29.540
Reisewarnungen veröffentlicht. Der Tweet
hat immerhin 6 Tweets und 6 Favs-- 6
00:08:29.540 --> 00:08:38.200
Retweets und 6 Favs erreicht und hat damit
sozusagen den ersten kleinen Impact. Dann
00:08:38.200 --> 00:08:43.970
steigert es sich immer mehr, dann gibt's
die Reisewarnung für Schweden mit 29
00:08:43.970 --> 00:08:48.460
Retweets. Der nächste Tweet, kann ich
leider nicht mehr anzeigen, weil der
00:08:48.460 --> 00:08:52.330
Account inzwischen gesperrt wurde, das ist
auch ein Phänomen, das man immer wieder
00:08:52.330 --> 00:08:56.311
sieht, dass in diesem Bereich Accounts
gesperrt werden von Twitter. „Trump hatte
00:08:56.311 --> 00:09:02.440
recht, Auswärtiges Amt gibt Reisewarnung
für Schweden heraus". Genau, und verweist
00:09:02.440 --> 00:09:11.380
auf einen Artikel von zuerst.de. 45
Retweets und es steigert sich immer mehr.
00:09:11.380 --> 00:09:20.700
„Doch nicht alles ruhig in Schweden".
Holger Ewald. „Islamterror". Und dann zum
00:09:20.700 --> 00:09:25.630
Schluss die AfD Magdeburg mit--, die dann
aufspringt und dann das erste AfD-Hashtag
00:09:25.630 --> 00:09:29.490
dran setzt und „Multikulturell scheint es
nicht so richtig zu laufen in Schweden".
00:09:29.490 --> 00:09:33.330
Man sieht, dass es eine Steigerung gibt
von fängt an mit Reisehinweisen und endet
00:09:33.330 --> 00:09:40.000
mit Islamterror. Ich springe jetzt mal
ganz weit nach vorne zu den Antworten.
00:09:40.000 --> 00:09:44.370
Diejenigen, die also dann die
Gegendarstellung veröffentlichen, da
00:09:44.370 --> 00:09:48.850
fing's, oder der Startschuss war da das
Auswärtige Amt, die in einem-- die dann
00:09:48.850 --> 00:09:54.080
erklären, dass es sich um Fake News
handelt und relativ schnell springen dann
00:09:54.080 --> 00:10:00.560
halt auch die Medien mit auf, die das
sozusagen weiterverbreiten. Und zum
00:10:00.560 --> 00:10:06.630
Schluss sieht man den gesamten Zeitstrahl
nochmal und das Interessante ist dabei,
00:10:06.630 --> 00:10:10.960
dass das Thema gar nicht sozusagen, dass
ne Fake News veröffentlicht wird und dann
00:10:10.960 --> 00:10:14.750
schlägt die total ein und alle sind total
empört, sondern man stottert sich
00:10:14.750 --> 00:10:18.710
sozusagen förmlich in die Fake News rein.
Also es fängt klein an und dann werden sie
00:10:18.710 --> 00:10:24.870
nochmal weiter überspitzt und man hat eher
den Eindruck, als ob da rumexperimentiert
00:10:24.870 --> 00:10:29.790
wird, bis das Netzwerk eine Resonanz
hervorruft. Ich würde persönlich
00:10:29.790 --> 00:10:34.030
behaupten, Fake News sind eigentlich Meme,
die sich im Internet verbreiten. Oft
00:10:34.030 --> 00:10:39.180
haben sie keine singuläre Quelle, sondern
sie bilden sich erst im Netzwerk oder
00:10:39.180 --> 00:10:43.120
anders formuliert, das Kern-Phänomen an
Fake News ist nicht deren Existenz,
00:10:43.120 --> 00:10:46.831
sondern, dass sie sich so gut verbreiten
können, also das Problem ist nicht die
00:10:46.831 --> 00:10:52.880
Quelle, die sie erzeugt, sondern dass sie
eine so große Resonanz im Netzwerk findet.
00:10:52.880 --> 00:10:57.500
Würde man also Fake-News-Quellen
verbieten, würden sie trotzdem weiterhin
00:10:57.500 --> 00:11:02.271
entstehen, im Netzwerk. Und das ist halt
wichtig, da Fake News als Meme eine große
00:11:02.271 --> 00:11:06.350
Reichweite haben, kann man aus ihnen
Kapital schlagen, politisches oder
00:11:06.350 --> 00:11:10.290
monetäres Kapital. Und da möchte ich mal
aus dem amerikanischen Raum, zum Beispiel
00:11:10.290 --> 00:11:15.680
Breitband News und-- Breitbart News und
Trump erwähnen, die monetäres Kapital oder
00:11:15.680 --> 00:11:20.280
politisches Kapital daraus schlagen. Aber
zurück zu den Reisewarnungen. Man kann
00:11:20.280 --> 00:11:25.970
sie nicht nur im zeitlichen Verlauf sich
anschauen, sondern man kann tiefer
00:11:25.970 --> 00:11:29.380
einsteigen. Man kann halt gucken, welche
Accounts haben denn jetzt die
00:11:29.380 --> 00:11:33.500
Gegendarstellungen und die Fake News
verbreitet und kann gucken, wie die sich
00:11:33.500 --> 00:11:41.990
gegenseitig folgen. Und daraus baut man
dann so ein Netzwerk. Die Blauen sind die
00:11:41.990 --> 00:11:47.000
Gegendarstellungensverbreiter und die
Roten sind die Fake-News-Verbreiter. Um so
00:11:47.000 --> 00:11:51.060
näher sie grafisch dargestellt werden,
umso also-- folgen die sich. Also
00:11:51.060 --> 00:11:54.890
sozusagen, alle Kugel stoßen sich ab und
die, die sich folgen, ziehen sich an und
00:11:54.890 --> 00:11:58.570
daraus kann man halt solche komplexen
Netzwerke grafisch darstellen. Das
00:11:58.570 --> 00:12:03.060
Interessante ist, dass die Fake-News-
Verbreiter sich in einer Gruppe fast
00:12:03.060 --> 00:12:10.440
außerhalb befinden und eigentlich nur noch
über die Massenmedien verbunden sind mit
00:12:10.440 --> 00:12:14.860
der Gesellschaft. Man sieht natürlich
auch noch Tendenzen, dass viele Fake-News-
00:12:14.860 --> 00:12:18.280
Verbreiter dann mit Lügenpresse usw.
versuchen sich weiter von diesen--
00:12:18.280 --> 00:12:23.080
von den Medien zu distanzieren. Aber
tatsächlich sind es zwei verschiedene
00:12:23.080 --> 00:12:28.840
Gruppen, die man hier sehen kann und das
erste Mal, als ich das Bild gesehen habe,
00:12:28.840 --> 00:12:32.310
habe ich gedacht: "Oh, das ist eine
Filterblase oder eine Echokammer oder
00:12:32.310 --> 00:12:37.930
sowas." Das Schöne ist, weil wir mit
Twitter-APIs tiefer in die Daten rein-
00:12:37.930 --> 00:12:44.310
gucken können, können wir von jedem ein--
die die Timeline rekonstruieren. Also ich
00:12:44.310 --> 00:12:49.800
hab jetzt mal so schematisch dargestellt
die Gegendarsteller und die Fake-News-
00:12:49.800 --> 00:12:55.830
Verbreiter und man sieht, dass von den
Fake-News-Verbreitern 89% die
00:12:55.830 --> 00:13:00.980
Gegendarstellungen mitbekommen haben, aber
sie nicht weiter teilen. Und nur 45%
00:13:00.980 --> 00:13:04.020
derjenigen, die die Gegendarstellung
verbreitet haben, haben
00:13:04.020 --> 00:13:07.710
die tatsächliche ursprüngliche Fake News
eigentlich mitbekommen. Das Ergebnis
00:13:07.710 --> 00:13:14.211
daraus ist, es gibt eine Filterblase und
zwar bekommen wir die Fake News nicht mit.
00:13:14.211 --> 00:13:18.400
Gelächter
Was ist jetzt eigentlich tatsächlich
00:13:18.400 --> 00:13:23.220
dieser Impact dieser Gruppe. Und dann
hab' ich ganz ganz schweres Geschütz
00:13:23.220 --> 00:13:27.780
aufgefahren und habe 1,6 Millionen
Twitter-Accounts, die angegeben haben,
00:13:27.780 --> 00:13:31.780
dass sie Deutsch sprechen, extrahiert und
geguckt, wie die sich gegenseitig folgen.
00:13:31.780 --> 00:13:35.670
Also ähnlich wie diese Filterblasengrafik
gerade sieht man hier jetzt das gesamte
00:13:35.670 --> 00:13:39.432
deutschsprachige Twitternetzwerk,
eingefärbt nach Herkunftsland. Also hier
00:13:39.432 --> 00:13:43.090
unten haben wir die Schweiz und da haben
wir Österreich, wenn man ein bisschen
00:13:43.090 --> 00:13:45.589
klickt, sieht man das so wer
sich dahinter befindet.
00:13:45.589 --> 00:13:46.836
Und das Schöne ist, ...
00:13:46.836 --> 00:13:50.090
das ist son Tool was ich gebastelt habe
Man kann das unterschiedlich einfärben.
00:13:50.090 --> 00:13:54.160
Hier kann man zum Beispiel
mal das Alter des Accounts einfärben. Rot
00:13:54.160 --> 00:13:57.810
sind die alten, grün sind die eher
neueren Accounts. Hier oben sind die
00:13:57.810 --> 00:14:02.770
Jugendlichen, da ist viel Justin Bieber
und YouTube und Let's Play dabei. Hier
00:14:02.770 --> 00:14:09.120
haben wir eine Blase, die sich mit Porn
beschäftigt (Lachen), nicht drauf klicken.
00:14:09.120 --> 00:14:13.470
Hier haben wir eine Gruppe, die sich mit
Marketing beschäftigt, so würde ich das
00:14:13.470 --> 00:14:19.350
mal umschreiben, größtenteils SEO und
keine Ahnung was. Und das sind die Leute,
00:14:19.350 --> 00:14:23.320
die sich eigentlich mit Politik und Medien
beschäftigen und vielleicht auch die, die
00:14:23.320 --> 00:14:26.750
jetzt hier auch hier im Raum auf Twitter
sind, wahrscheinlich am meisten
00:14:26.750 --> 00:14:32.220
mitbekommen. Man kann aber diese Grafik
auch anders einfärben und zwar kann ich
00:14:32.220 --> 00:14:38.880
mal einfärben, welche
Bundestagsabgeordneten oder Kandidaten von
00:14:38.880 --> 00:14:42.571
Parteien wo sich in diesem Netzwerk
befinden und entsprechend einfärben. Und
00:14:42.571 --> 00:14:48.460
man sieht zum Beispiel Gelb FDP, Schwarz,
Rot, Grün, Blau, Rot, Grün befinden sich
00:14:48.460 --> 00:14:53.541
alle so in einer verteilten Gruppe und es
gibt eine sehr enge Gruppe aus Leuten, die
00:14:53.541 --> 00:14:59.390
Mitglieder der AfD sind und auf Twitter
aktiv sind. Ich vergrößer das mal so ein
00:14:59.390 --> 00:15:03.030
bisschen. Und jetzt verändere ich wieder
diese Färbung und zwar als erstes
00:15:03.030 --> 00:15:06.815
die Fake-News-Verbreiter. Ja.
Gelächter
00:15:06.815 --> 00:15:15.029
Der Witz ist.
Applaus
00:15:15.029 --> 00:15:18.630
Der Witz ist, dass es nicht die AfD-
Abgeordneten selber sind, die das Fake-
00:15:18.630 --> 00:15:22.540
News verbreiten, aber sie befinden sich in
einer gleichen Gruppe da drin. Man kann
00:15:22.540 --> 00:15:26.590
auch einfärben nach Alter. Man sieht, dass
die Accounts dieser Gruppe eher jung sind,
00:15:26.590 --> 00:15:31.820
also relativ frisch auf Twitter. Sie haben
eine sehr hohe Aktivität. Rot heißt viele
00:15:31.820 --> 00:15:35.410
Tweets pro Tag veröffentlicht werden.
Und man kann von dieser Gruppe auch
00:15:35.410 --> 00:15:40.190
schauen, welche typischen Begriffe sie
verwenden, um zu vergleichen, mit was das
00:15:40.190 --> 00:15:44.161
restliche Twitter-Netzwerk für Begriffe
verwendet. Und die Begriffe, die am
00:15:44.161 --> 00:15:47.920
häufigsten in dieser Gruppe verwendet
werden, im Vergleich zu anderen
00:15:47.920 --> 00:15:52.430
Twitter-Accounts, sind Islam, Deutschland,
Migranten, Merkel, Maas, Politik,
00:15:52.430 --> 00:15:56.990
Freiheitskampf, Flüchtlinge, SPD,
Netzdurchsetzungsgesetz, NPD, Antifa,
00:15:56.990 --> 00:16:02.910
Zensur, PEGIDA, Syrer, Asylbewerber. Man
sieht relativ klar, dass diese Gruppe auch
00:16:02.910 --> 00:16:07.890
eher monothematisch unterwegs ist. Also,
was ist das für eine Gruppe? Und ich sehe
00:16:07.890 --> 00:16:13.480
wir müssen uns beeilen. Sie sind relativ
neu auf Twitter. Sie stehen der AfD nah.
00:16:13.480 --> 00:16:19.740
Sie teilen oft Fake News. Sie sind auf
Twitter sehr aktiv. Und sie befassen sich
00:16:19.740 --> 00:16:25.870
fast monothematisch mit Migrations- und
Asylpolitik. Und ich komme auf diese
00:16:25.870 --> 00:16:30.470
Gruppe wieder zurück, denn den ersten- die
erste Theorie, die man jetzt reinwerfen
00:16:30.470 --> 00:16:37.399
würde, sind Social Bots. Und da es in
diesem Vortrag auch darum geht, ist der
00:16:37.399 --> 00:16:42.120
nächste Block sich mal das Thema Social
Bots genauer anzuschauen. Zu Social Bots
00:16:42.120 --> 00:16:46.930
wurde eine Menge veröffentlicht, auch in
den Medien. „Warum Meinungsroboter die
00:16:46.930 --> 00:16:50.930
Gefahr für die Demokratie werden.“,
„Digitale Dreckschleudern“, „Angriff der
00:16:50.930 --> 00:16:57.940
Meinungsroboter“. Jeder hat da irgendwie
auch seine Meinung und seine Gefahr
00:16:57.940 --> 00:17:02.460
hervorgebracht. Was sind eigentlich Social
Bots? Es gibt aus dem Büro für
00:17:02.460 --> 00:17:06.920
Technikfolgen-Abschätzung beim Deutschen
Bundestag einen Absatz, den ich mal
00:17:06.920 --> 00:17:10.609
herausgegriffen habe. Social Bots, die
Computerprogramme, die uns irgendwie in
00:17:10.609 --> 00:17:14.769
den sozialen Medien manipulieren können.
„Echte Menschen, die mit dem Social Bot
00:17:14.769 --> 00:17:18.556
kommunizieren, nehmen diese nicht als
durch Algorithmen ausgelöste automatische
00:17:18.556 --> 00:17:22.120
Kommunikation, sondern als echte Internet-
teilnehmer wahr und sind sich der
00:17:22.120 --> 00:17:26.270
Manipulation nicht bewusst." Konkret, was
diese Social Bots angeblich machen sollen
00:17:26.270 --> 00:17:31.040
können, sind, sie können den Turing-Test
bestehen. Das heißt, Die Idee eines Turing
00:17:31.040 --> 00:17:35.080
Tests ist, ich interagiere mit etwas und
kann hinterher sagen,
00:17:35.080 --> 00:17:37.000
ob es ein Mensch,
oder ein Computer ist.
00:17:37.000 --> 00:17:40.420
Und diese Social Bots sollen
jetzt magischer Weise diesen Turing-Test
00:17:40.420 --> 00:17:44.690
bestehen können und können nicht nur so
tun als wären sie ein Mensch, sondern sie
00:17:44.690 --> 00:17:49.220
können angeblich sogar noch unsere Meinung
beeinflussen. Naja, zumindest hat der
00:17:49.220 --> 00:17:50.490
Bundestag veröffentlicht:
00:17:50.490 --> 00:17:53.448
"Wirkung von Social Bots ist
unter Sachverständigen strittig."
00:17:53.448 --> 00:17:57.800
Ich hab mal extra das vorgespult, wo
Linus Neumann zu sehen ist. Aber, da ich
00:17:57.800 --> 00:18:01.900
ja so ein Framework habe, kann ich jetzt
auch selber mal reinschauen. Was sind denn
00:18:01.900 --> 00:18:05.820
diese Social Bots? Da kommt man schnell in
so einen Teufelskreis. Wenn ich Social
00:18:05.820 --> 00:18:10.800
Bots auf Twitter finden möchte, dann muss
ich sie erstmal suchen. Und dazu muss ich
00:18:10.800 --> 00:18:14.660
erst mal wissen, wie sie denn eigentlich
aussehen. Und um zu wissen, wie sie
00:18:14.660 --> 00:18:18.050
aussehen, muss ich sie erst mal
analysieren können und dazu brauche ich
00:18:18.050 --> 00:18:21.940
erst mal welche. Also, zu sagen „Okay, da
gibts irgendwelche.", das bringt nichts.
00:18:21.940 --> 00:18:27.000
Ich muss entweder eine Gruppe haben, um
sie analysieren zu können, damit ich die
00:18:27.000 --> 00:18:30.610
Eigenschaften rauskriegen kann, oder
andersrum. Und diesen Teufelskreis
00:18:30.610 --> 00:18:34.210
durchbrechen, gibt unterschiedliche
Möglichkeiten. Ich habe mich mal für den
00:18:34.210 --> 00:18:38.670
folgenden Weg entschlossen. Ich kaufe
jetzt einfach mal Social Bots.
00:18:38.670 --> 00:18:39.795
Gelächter
00:18:40.030 --> 00:18:42.740
Kleine Anmerkung, Moment, Moment.
00:18:42.750 --> 00:18:45.429
Es sind nicht wirklich Social Bots
im dem engeren Sinne,
00:18:45.429 --> 00:18:49.920
sondern ich hab mir einfach 4.500 Bots
gekauft. Ob die jetzt tatsächlich dann
00:18:49.920 --> 00:18:53.620
auch mit den Leuten sozial interagieren
usw., weiß ich ja nicht. Aber im
00:18:53.620 --> 00:18:57.610
Kern hab ich mir einen Twitter-Account
Software Team Berlin geholt. Habe keinem
00:18:57.610 --> 00:19:01.309
gesagt, damit ich also weiß, dass kein
realer Mensch diesem Account folgt und
00:19:01.309 --> 00:19:06.530
habe dann auf Google gesucht „buy Twitter
Bots". Genau. Und dann gibt's dann 4.500
00:19:06.530 --> 00:19:09.870
Follower und davon sind 100% Bots.
Das ist nur um zu gucken, welche
00:19:09.870 --> 00:19:13.870
Technologien werden dann eingesetzt,
obs dann Follower Bots sind usw. Um zu
00:19:13.870 --> 00:19:17.820
gucken, sehe ich dann bestimmte
Eigenschaften, die ich bei Menschen nicht
00:19:17.820 --> 00:19:24.309
sehe. Also sozusagen eher eine
Trockenübung, ja. Also wieder das große
00:19:24.309 --> 00:19:28.220
Twitter-Framework draufgeworfen und die
Metadaten analysiert. Und raus kommt
00:19:28.220 --> 00:19:35.050
folgende Grafik: Jeder einzelne Punkt ist
eines dieser eingekauften Follower. 4.500
00:19:35.050 --> 00:19:39.190
Punkte, und ich weiß 100 % Bots
dabei. Und ich versuche die nun zu
00:19:39.190 --> 00:19:43.181
sortieren nach ihren Eigenschaften. Alles,
was eher wie ein Bot aussieht, ist auf der
00:19:43.181 --> 00:19:47.007
linken Seite und alles ,was eher wie ein
Mensch aussieht, auf der rechten Seite.
00:19:47.007 --> 00:19:50.280
Ich kann jetzt auf die einzelnen drauf
klicken; ich klicke jetzt mal auf den ganz
00:19:50.280 --> 00:19:56.370
linken unteren drauf, dann hab ich einen
Asus D5B23, und habe unterschiedliche
00:19:56.370 --> 00:20:00.340
Eigenschaften von dem, die ich von ihm
überprüft habe, wie zum Beispiel, ob er
00:20:00.340 --> 00:20:06.510
immer noch sozusagen ein Egg ist, also ob
er noch gar kein Avatar Bild hochgeladen
00:20:06.510 --> 00:20:12.799
hat, ob er weniger als 10 Follower hat,
wieviele Favs er hat, abgesetzt hat. Ob er
00:20:12.799 --> 00:20:18.640
noch gar keine Beschreibungstext für sich
angegeben hat und ob er keine Zeitzone
00:20:18.640 --> 00:20:21.890
angegeben hat. Also so die ganzen
Metadaten, die man halt aus Twitter
00:20:21.890 --> 00:20:24.010
herausbekommt zum analysieren,
um zu gucken,
00:20:24.010 --> 00:20:26.640
ob die sich denn irgendwie strukturieren
und gruppieren.
00:20:26.640 --> 00:20:29.469
Man sieht auch ganz
links, das sind so ein Bisschen die sehr
00:20:29.469 --> 00:20:33.380
dummen Bots. Die sind jung und teilweise
tun sie auch gar nichts, sondern folgen
00:20:33.380 --> 00:20:36.810
nur Leuten. Dann gibt es einen großen und
breiten Bereich, teilweise sehr
00:20:36.810 --> 00:20:41.620
realistische Bots dabei, teilweise sind es
sogar reale Accounts die verwaist sind,
00:20:41.620 --> 00:20:45.960
also die seit drei Jahren inaktiv sind und
auf irgendeiner Art, also aus irgendeinem
00:20:45.960 --> 00:20:49.650
Grund übernommen wurden. Wahrscheinlich
hat sich da einer mal mit Passwort
00:20:49.650 --> 00:20:54.950
durchprobieren massenhaft versucht
verwaiste Accounts zu übernehmen. Und
00:20:54.950 --> 00:20:58.570
die dritte, und das fand ich sehr
interessant, das sind Accounts die
00:20:58.570 --> 00:21:03.000
teilweise sogar verifizierte Menschen
sind. Also ich habe jetzt mal schonmal
00:21:03.000 --> 00:21:10.250
Peggy, die ist Moderatorin aus den Staaten
irgendwo, Jeff Zausch ist ein Survival
00:21:10.250 --> 00:21:15.430
Spezialist und Chris Glorioso. Das sind,
das sind reale Personen, die mir gefolgt
00:21:15.430 --> 00:21:19.570
sind weil ich dafür bezahlt habe, als Bot,
und das fand ich sehr merkwürdig. Ich habe
00:21:19.570 --> 00:21:22.650
versucht mit den Leuten Kontakt
aufzunehmen; nicht alle haben mir
00:21:22.650 --> 00:21:26.300
geantwortet. Der Grund dafür ist, dass ihr
Account gehijacked wurde und sie haben
00:21:26.300 --> 00:21:29.280
dann eigentlich nur noch DMs von
irgendwelchen fremden Accounts bekommen.
00:21:29.280 --> 00:21:32.670
Die haben auf DMS auch gar nicht mehr so
richtig reagiert. Ich habe auch versucht
00:21:32.670 --> 00:21:37.320
herauszubekommen, auf welchem Wege das
passiert ist – ob sie sich dort irgendwie
00:21:37.320 --> 00:21:42.440
einen Twitter Service eingetreten haben
der in ihrem Namen postet. Ich weiß es
00:21:42.440 --> 00:21:46.640
nicht. Laut eigenen Aussagen ging es dann
aber weniger um politische Inhalte,
00:21:46.640 --> 00:21:50.290
sondern Zitat, es war eher "Sex Scheisse"
die dann in ihren Twitter Timelines
00:21:50.290 --> 00:21:53.890
veröffentlicht wurde. Was ich aber
spannend finde, ist wenn man so eine CDU
00:21:53.890 --> 00:21:57.770
Forderung, Kennzeichnung von Social Bots.
Ja was ist denn, wenn der eigene Account
00:21:57.770 --> 00:22:01.940
übernommen wurde. Also der wird dann, der
eigene Account ist mit einmal halb
00:22:01.940 --> 00:22:06.110
automatisiert, ob man es will oder nicht.
Eine Fragestellung die ich dann auch
00:22:06.110 --> 00:22:10.820
nochmal jetzt kurz im Vortrag hatte weil
die Daten ja jetzt 11 Monate alt sind:
00:22:10.820 --> 00:22:15.640
Welche Accounts gibts denn heute noch? Und
man sieht grün, die Accounts gibt's heute
00:22:15.640 --> 00:22:20.090
noch, elf, gelb sind die Accounts die in
der Zwischenzeit von Twitter gesperrt
00:22:20.090 --> 00:22:25.350
wurden, und rot die Accounts die von sich
aus sich gelöscht haben. Genau. Also man
00:22:25.350 --> 00:22:29.930
sieht zumindest dass da Bewegung von
Seiten Twitter passiert. Was man jetzt an
00:22:29.930 --> 00:22:33.690
diesen Bots auch noch analysieren kann,
ist die Follower Netzwerke, wie die sich
00:22:33.700 --> 00:22:39.951
also gegenseitig folgen. Da habe ich mal
folgende Grafik gemacht. Das sind so die
00:22:39.951 --> 00:22:45.390
4.5 Tausend Bots und wem sie folgen und
von wem sie gefolgt werden. Rot
00:22:45.390 --> 00:22:52.820
Trinken rot sind die Bots, 4.5 Tausend,
und blau sind die anderen Nutzer, andere
00:22:52.820 --> 00:22:56.700
Accounts oder so weiter. Da kann man auch
mal ein Bisschen rein zoomen hier, sieht
00:22:56.700 --> 00:23:05.710
auch ganz hübsch aus. Fast wie fliegende
Spaghetti Monster, fand ich. Die Blauen,
00:23:05.710 --> 00:23:10.970
das scheinen mir Jugendliche zu sein, die
sich einfach Twitter-Bots oder Follower
00:23:10.970 --> 00:23:14.260
gekauft haben, was eigentlich ganz
interessant ist dass ich dann damit
00:23:14.260 --> 00:23:17.860
eigentlich die Kunden die analysieren
kann. Wobei man vorsichtig sein muss,
00:23:17.860 --> 00:23:22.730
jemandem 10,000 Bots oder Follower
künstlich anzuhängen ist halt relativ
00:23:22.730 --> 00:23:27.730
einfach zu machen und ist auch gar nicht
so teuer. 50,000 Bots gibt es so für 60
00:23:27.730 --> 00:23:35.230
Dollar. Wie könnte man Bots noch
erkennen? Und da gibt es halt so eine
00:23:35.230 --> 00:23:39.670
Tweet-App Analyse. Ich weiß nicht ob ihr
euch noch erinnern könnt, vor einigen
00:23:39.670 --> 00:23:44.260
Jahren stand unter jedem Tweet noch
drunter, mit welcher App man diesen Tweet
00:23:44.260 --> 00:23:49.040
veröffentlicht hat. Das steht leider jetzt
nicht mehr drunter, aber die Daten sind
00:23:49.040 --> 00:23:54.431
noch in der API drin. So sieht übrigens so
eine API Antwort von Twitter aus, und da
00:23:54.431 --> 00:23:59.050
steht unter anderem auch Source drin, d.h.
also mit welchem Service man das
00:23:59.050 --> 00:24:02.850
veröffentlicht hat. Habe ich mal über die
Bots rüber laufen lassen. Twitter für
00:24:02.850 --> 00:24:07.930
iPhone, Android, Web Client, aber auch
Facebook, die automatisch dann sozusagen
00:24:07.930 --> 00:24:12.000
das heisst den Post als Tweet
veröffentlichen und Instagram. Und
00:24:12.000 --> 00:24:17.620
interessant fand ich halt 350 weitere
Services, ja. So sehen die aus. Genau.
00:24:17.620 --> 00:24:24.730
Also es ist ein riesen Potpourri,
Koreanisch Japanisch alles dabei. Genau.
00:24:24.730 --> 00:24:29.410
Das war mir ja auch gar nicht so richtig
klar vorher, dass es eigentlich ein
00:24:29.410 --> 00:24:33.850
riesiges enormes Ökosystem gibt von
Skripten die auf Twitter Sachen
00:24:33.850 --> 00:24:42.461
veröffentlichen. Und wie gesagt, halt in
meiner Probe sind es allein 350. Um den
00:24:42.461 --> 00:24:47.049
Leuten auch zu zeigen, was das denn jetzt
eigentlich für Services sind, die dahinter
00:24:47.049 --> 00:24:50.530
stecken, habe ich mal so ein paar
herausgegriffen. Hier ist zum Beispiel
00:24:50.530 --> 00:24:54.870
FeedBlitz. Das ist eigentlich ein Bot der
nichts weiter macht als einen RSS Feed in
00:24:54.870 --> 00:25:00.110
Twitter zu posten. Haben wir twittbot.net,
das ist irgendwie was selber gebasteltes.
00:25:00.110 --> 00:25:04.170
Der twittert aber irgendwie nur Käse, das
hat sich wahrscheinlich einer mal ein
00:25:04.170 --> 00:25:07.900
Bisschen herumexperimentiert oder sowas.
Es gibt aber auch den Kim Kardashian:
00:25:07.900 --> 00:25:12.000
Hollywood Service, der dir dann
wahrscheinlich die neuen Spielestände
00:25:12.000 --> 00:25:17.860
veröffentlich. Interessant fand ich
auch, es gab 9 gelöschte Services, die
00:25:17.860 --> 00:25:21.390
dann umbenannt wurden in "Erased" und eine
lange Nummer. Ich würde mich mal
00:25:21.390 --> 00:25:25.090
interessieren ob die Nummer fortlaufend
ist, denn sie endet mit 5.6 Millionen.
00:25:25.090 --> 00:25:29.530
Sind das jetzt 5.6 Millionen gelöschte
Services, oder sind insgesamt bei Twitter
00:25:29.530 --> 00:25:33.410
schon 5.6 Millionen angemeldet worden. Ich
weiß es nicht. Aber wir können darüber
00:25:33.410 --> 00:25:37.470
sprechen oder wir können sagen, dass auf
Twitter nicht mehr nur Menschen unterwegs
00:25:37.470 --> 00:25:42.860
sind sondern halt auch Services die wir
nutzen. Genau. Bots sind auch nicht nur
00:25:42.860 --> 00:25:46.110
böse. Ich habe mal ein paar
herausgegriffen. Ich weiß nicht ob jemand
00:25:46.110 --> 00:25:51.840
die Rathausuhr Neukölln kennt. Applaus &
Lachen Ist der Entwickler da? Nein. Der
00:25:51.840 --> 00:25:56.280
Entwickler der das Rathaus Uhrwerk
Neukölln als Service benutzt, also der
00:25:56.280 --> 00:26:05.090
veröffentlicht sowas wie acht bämm bämm
bämm bämm bämm bämm bämm bämm.
00:26:05.090 --> 00:26:08.900
Vor kurzem bin ich übrigens auf den
Wichser Bot gestoßen. Wenn man einen Tweet
00:26:08.900 --> 00:26:12.880
veröffentlicht wo das Wort Wichser drin
vorkommt, dann retweetet der einen.
00:26:12.880 --> 00:26:20.170
Spiegelonline Top benutzt den Service if
this than that, zu 100%, also nicht
00:26:20.170 --> 00:26:26.090
normal SpiegelOnline sondern Top. Und ZEIT
ONLINE Digital hat sich auch einen Service
00:26:26.090 --> 00:26:30.020
gebaut, ich weiß nicht ob der eingekauft
oder selbst entwickelt ist, aber der ist
00:26:30.020 --> 00:26:35.711
registriert als ZEIT ONLINE. Ich fasse
zusammen: Woran könnte man Bots erkennen?
00:26:35.711 --> 00:26:40.669
Ist das Profil vollständig? Ist ein Avatar
Bild und Beschreibungstext dran? Ist der
00:26:40.669 --> 00:26:47.460
Account Teil eines Netzwerkes? Von welcher
App werden die Tweets abgeschickt und wie
00:26:47.460 --> 00:26:51.620
sehen die anderen Metadaten des Accounts
oder der Tweets aus? Interessant ist,
00:26:51.620 --> 00:26:56.240
dass das aber alles Indizien Beweise sind.
Wenn man anfängt, sich tatsächlich mal
00:26:56.240 --> 00:27:00.220
hinzusetzen und zu gucken, ist das nun ein
Bot oder nicht, kommt man relativ schnell
00:27:00.220 --> 00:27:05.070
ins Grübeln. Jegliche Bot Erscheinung
könnte auch gut menschlich erklärt sein
00:27:05.070 --> 00:27:07.249
und andersherum. Man kann aber auch
00:27:07.249 --> 00:27:09.599
rangehen, dass man jedes
menschliche Verhalten in
00:27:09.599 --> 00:27:14.830
die Sphäre, das könnte und natürlich auch
ein hochintelligente KI sein schien.
00:27:14.830 --> 00:27:18.471
Egal, auf jeden Fall mit diesem
Kenntnisstand sag ich mal lasst uns jetzt
00:27:18.471 --> 00:27:22.440
mal Bots finden. Ich habe gesucht. Ich hab
lange lange lange gesucht und ich kürz es
00:27:22.440 --> 00:27:28.480
mal ab mit: ich habe gefunden inaktive
Accounts, Service Accounts, Trolle welche
00:27:28.480 --> 00:27:32.940
Teenager, Rassisten und Hater und Spam mit
links zu YouTube Polen und Bitcoin schickt
00:27:32.940 --> 00:27:37.330
und so weiter. Aber was ich nicht gefunden
habe ist diese politisch aktiven Social
00:27:37.330 --> 00:27:41.230
Bot Netzwerke, und dafür gibt es zwei
Erklärungen: Entweder die gibts nicht oder
00:27:41.230 --> 00:27:49.640
Ich bin zu doof. Also fragen wir mal die
Profis wie machen die das denn. Und einer
00:27:49.640 --> 00:27:55.160
davon ist zum Beispiel Professor Dr. Simon
Hegelich, Forschungsfeld Political Data
00:27:55.160 --> 00:28:02.360
Science, Forschungsmethoden Machine
Learning plus X. Ist das VELTINS, die mit
00:28:02.360 --> 00:28:07.429
plus X ist Alkohol, ne, ich weiß nicht,
keine Ahnung. Der veröffentlicht Studien
00:28:07.429 --> 00:28:10.950
zum Beispiel für die Konrad-Adenauer-
Stiftung mit dem Titel "Invasion der
00:28:10.950 --> 00:28:16.429
Meinungs-Roboter". Leider wird in dieser
Studie die Methodik nicht beschrieben.
00:28:16.429 --> 00:28:21.299
Hegelich hatte selber damals mit Professor
Dietmar Jaresko eine Studie veröffentlicht
00:28:21.299 --> 00:28:26.190
wo sie tatsächlich ein Bot-Netzwerk
gefunden haben in der Ukraine. Was sie
00:28:26.190 --> 00:28:30.261
dabei identifizieren konnten ist dass
diese Accounts unter einem Service
00:28:30.261 --> 00:28:36.210
"twifarm" prorussische Meldungen
veröffentlicht haben, insgesamt 1740 Bots
00:28:36.210 --> 00:28:42.180
haben sie darunter gefunden. Und genau das
ist auf jeden Fall, das kann man glaube
00:28:42.180 --> 00:28:46.690
ich sagen, ein Bot-Netzwerk, was dort in
der Ukraine gefunden wurde. Aber wie sieht
00:28:46.690 --> 00:28:50.650
das eigentlich mit der deutschen Debatte
aus? Und dazu hab ich, vielleicht habs ich
00:28:50.650 --> 00:28:54.200
auch nicht gefunden aber ich habe
zumindest keine Studie von Prof. Hegelich
00:28:54.200 --> 00:28:58.030
dazu gefunden, mit einer nachprüfbaren
Methodik. Was ich aber gefunden habe ist
00:28:58.030 --> 00:29:04.230
ein ZDF Bericht, ZDF Zoom "Alles nur Lüge?
Wie im Netz getäuscht wird". Professor
00:29:04.230 --> 00:29:09.630
Simon Hegelich hatte hier die Aufgabe, aus
Gigabytes an Daten Social Bots zu suchen.
00:29:09.630 --> 00:29:15.380
Und er hatte einen möglichen Kandidaten
gefunden, und zwar Egon Dombrowski, der
00:29:15.380 --> 00:29:22.570
136 Posts am Tag veröffentlich mit ganz
klarer Tendenz zu Pegida und AfD. Nun ist
00:29:22.570 --> 00:29:26.710
natürlich spannend: Ist das vielleicht ein
gesteuerter Bot? Oder handelt es sich
00:29:26.710 --> 00:29:30.160
dabei um einen realen Menschen? Die
Redaktion hat ihn einfach mal
00:29:30.160 --> 00:29:37.270
angeschrieben, und der potenzielle Social
Bot heißt Egon Dombrowski. Ist 50 Jahre
00:29:37.270 --> 00:29:42.800
alt, berufsunfähig Rentner, lebt in Erfurt
und war in einem Gemeinderat für die SPD.
00:29:42.800 --> 00:29:50.220
Und jetzt ist er auf Facebook sehr aktiv.
Medien bezeichnet er als Propaganda-
00:29:50.220 --> 00:29:55.350
Presse, und er macht Werbung für die AfD
und wird laut eigener Aussage nicht von
00:29:55.350 --> 00:30:00.400
der AfD oder anderen bezahlt, er macht das
aus eigener überzeugung. Gut, also der
00:30:00.400 --> 00:30:04.370
Versuch, hier einen Social Bot zu finden,
ist missglückt, wir haben leider nur eine
00:30:04.370 --> 00:30:08.600
reale Person gefunden. Aber es gibt auch
andere die sich damit beschäftigen,
00:30:08.600 --> 00:30:14.130
beispielsweise botswatch.de, die
versuchen, parallel zu wichtigen Events in
00:30:14.130 --> 00:30:19.890
Deutschland zu gucken, wie viel sich auf
Twitter nun Social Bots einmischen,
00:30:19.890 --> 00:30:24.490
veröffentlichen auch das Bot-Barometer und
so weiter. Und da gibts auch einen Link
00:30:24.490 --> 00:30:27.910
zur Methode wie sie das machen, und da
steht dann drin "Accounts die
00:30:27.910 --> 00:30:31.710
durchschnittlich gleich oder mehr als 50
Tweets am Tag veröffentlichen". Hab ich
00:30:31.710 --> 00:30:38.080
ihnen gesagt "Naja, Dombrowski schafft 136
Posts am Tag." Ich hatte, weil
00:30:38.080 --> 00:30:42.830
wir die Bundestagswahl beobachtet haben
eine lange Liste von Accounts
00:30:42.830 --> 00:30:46.070
zusammengestellt, die irgendwie beim
Thema Bundestagswahl mitmischten
00:30:46.070 --> 00:30:48.010
und bin die einfach mal durchgegangen,
00:30:48.010 --> 00:30:51.229
an welchen Tagen haben die
mehr als 50 Tweets abgesetzt und hier ist
00:30:51.229 --> 00:30:55.850
mal so ein bisschen Zusammenfassung: sogar
eine CDU/CSU und FDP haben das geschafft.
00:30:55.850 --> 00:31:03.270
Genau. Also, 50 Tweets am Tag und schon
ist man Social Bot, mit drunter sind
00:31:03.270 --> 00:31:10.490
Medien wie Welt, die schaffen 190 am Tag,
Focus Online 97 am Tag. Auch Christopher
00:31:10.490 --> 00:31:15.559
Lauer 72. Anja Schillhaneck von den
Bündnes 90 / Die Grünen im Berliner
00:31:15.559 --> 00:31:19.250
Abgeordnetenhaus schafft fast die Grenze
mit 50 am Tag. Und natürlich auch die
00:31:19.250 --> 00:31:23.090
Parteien vor den Bundestagswahlen, die
dann natürlich in den sozialen Netzwerken
00:31:23.090 --> 00:31:27.860
besonders aktiv sind, schaffen mehr als
50, und dann noch Hipster, Aktivisten,
00:31:27.860 --> 00:31:32.429
AfD-Anhänger darunter geschrieben. Also 50
Tweets am Tag als Kriterium für Social
00:31:32.429 --> 00:31:37.190
Bots ist wissenschaftlich unseriös. Da
frage ich mich natürlich: Wie kommen die
00:31:37.190 --> 00:31:41.390
da drauf? Und davor steht es auch: Das sei
das Social Bot-Kriterium der Oxford-
00:31:41.390 --> 00:31:47.030
Universität. Das finde ich natürlich
spannend, und habe dann angefangen, die
00:31:47.030 --> 00:31:53.650
ganzen Studien und wissenschaftlichen
Paper dazu durchgelesen wie deren Methode
00:31:53.650 --> 00:31:59.720
ist. Und ich hab nur zwei herausgegriffen,
weil es wirklich eine Menge ist, die
00:31:59.720 --> 00:32:09.049
besonders das deutlich machen. Social Bots
bei den US-Wahlen. Das ist ein Paper was
00:32:09.049 --> 00:32:13.400
veröffentlicht wurde mit dem Titel "Bots
and Automation over Twitter during the
00:32:13.400 --> 00:32:18.809
U.S. Election" und ich spule mal vor was
an welcher Stelle Sie das definieren. Da
00:32:18.809 --> 00:32:24.910
muss ich mal kurz sagen: Sie fangen halt
an, von Social Bots zu reden. Dann heißt
00:32:24.910 --> 00:32:28.750
es irgendwann "Social Bot like" und dann
steht dann so etwas wie "Heavy Automated
00:32:28.750 --> 00:32:33.539
Bots". Und dann steht dann zum Schluss "we
define a high level of automation as
00:32:33.539 --> 00:32:37.659
accounts that post at least 50 times a day
using one of these election-related
00:32:37.659 --> 00:32:43.780
hashtags". Das heißt also, wer mehr als 50
Mal am Tag ein bestimmtes Hashtag
00:32:43.780 --> 00:32:47.580
veröffentlicht, wird als social Bot
kategorisiert. Die Hashtags sind die hier.
00:32:47.580 --> 00:32:52.669
Der erste Block sind die pro-Trump-
Hashtags, zweite Block die pro-Clinton-
00:32:52.669 --> 00:32:56.390
Hashtags, und der dritte Block sind
Hashtags, die sich generell um die
00:32:56.390 --> 00:33:01.710
amerikanische Wahl beschäftigen. Aber zu
dieser Definition von Social Bots habe ich
00:33:01.710 --> 00:33:06.870
mal ein paar Fragen: Also erstens, warum
sind das 50 und nicht 30 oder 100 Tweets
00:33:06.870 --> 00:33:13.140
am Tag? Und gilt das dann für alle Länder,
also kann man jetzt dieses Kriterium aus
00:33:13.140 --> 00:33:16.840
Amerika eins zu eins übernehmen für
Deutschland? Und was für Accounts sind das
00:33:16.840 --> 00:33:20.700
eigentlich? Ich meine wenn ich die wenn
ich die identifizieren kann, dann kann ich
00:33:20.700 --> 00:33:24.440
die ja auch mal genauer anschauen, wie
viele Follower haben die? Wie viele Favs
00:33:24.440 --> 00:33:27.910
und retweets haben sie? Vielleicht
veröffentlichen sie ja wahnsinnig viele
00:33:27.910 --> 00:33:31.630
Tweets aber keiner liest es. Und über
welches Service posten sie? Das hatte ich
00:33:31.630 --> 00:33:36.330
vorhin gezeigt, dass man das nachschauen
kann. Und klar kann ich verstehen, dass es
00:33:36.330 --> 00:33:38.690
halt eine Menge Accounts sind,
aber es gibt eine
00:33:38.690 --> 00:33:40.861
wissenschaftlich statistisch
saubere Methode:
00:33:40.861 --> 00:33:42.970
Man nimmt einfach eine
Stichprobe, man wählt einfach mal zufällig
00:33:42.970 --> 00:33:46.120
100 aus und guckt sich halt an, was das
für Accounts sind, um zu gucken, ob sie
00:33:46.120 --> 00:33:50.600
tatsächlichen politischen Einfluss haben.
Dazu gibts aber in dieser Studie keine und
00:33:50.600 --> 00:33:55.100
auch den anderen keine Antwort. Leider
kann ich das auch nicht überprüfen, weil
00:33:55.100 --> 00:33:58.850
die Universität Oxford die Daten dazu
nicht veröffentlicht hat. Das liegt
00:33:58.850 --> 00:34:04.850
teilweise an der Developer API von, oder
den Guidelines von Twitter. Das liegt aber
00:34:04.850 --> 00:34:10.109
auch daran, oder gibt es einen Ausweg da
drauß: Und zwar kann man nämlich die Liste
00:34:10.109 --> 00:34:14.469
der Twitter IDs veröffentlichen, das darf
man nämlich, und kann sich dann sozusagen
00:34:14.469 --> 00:34:18.899
nachträglich den Tweet nochmal holen und
genauer analysieren. Zum Glück gibt es von
00:34:18.899 --> 00:34:24.799
der George Washington Universität eine
Veröffentlichung "2016 United States
00:34:24.799 --> 00:34:28.690
Presidential Election Tweet IDs". Da gibt
es unter anderem auch eine Liste von
00:34:28.690 --> 00:34:34.018
Tweets, die den Hashtag "Election Day"
verwendet haben. Das heißt ich hab jetzt
00:34:34.018 --> 00:34:37.839
leider nicht die gleiche Datenbasis wie
die Universität Oxford. Ich kann aber
00:34:37.839 --> 00:34:42.168
einen kleinen Ausschnitt rausnehmen und
zwar mir nur angucken, wer hat am Wahltag
00:34:42.168 --> 00:34:48.109
mehr als 100 mal eines von diesen Hashtags
verwendet plus den Hashtag "Election Day".
00:34:48.109 --> 00:34:56.869
Und diejenigen, die sogar mehr als 100 Mal
am Wahltag getwittert haben sind diese 12,
00:34:56.869 --> 00:35:01.680
das sind sozusagen die laut Social Both
Kriterien die die am deutlichsten als
00:35:01.680 --> 00:35:08.499
Social Bots sich definieren. Und wenn ihr
jetzt mal wissen wollt, wer denn dieses
00:35:08.499 --> 00:35:12.390
Social Bots wirklich sind: Nehmen wir uns
mal Zeit und gucken uns jeden einzelnen
00:35:12.390 --> 00:35:21.950
von diesen 12 an. Das erste ist ein
@dreamedofdust, der 437 Tweets am Wahltag
00:35:21.950 --> 00:35:25.759
veröffentlicht hat (mit diesen erwähnten
Hashtags), und was er macht: er twittert
00:35:25.759 --> 00:35:31.109
Links zu reddit.com/r/The_Donald zu diesen
einzelnen Kommentaren. Und er benutzt
00:35:31.109 --> 00:35:37.920
dabei If This Then That. Und bot: klares
Ja, auf jeden Fall. Was er aber dabei tut
00:35:37.920 --> 00:35:41.930
ist bereits veröffentlichte Kommentare im
Reddit-Forum einfach nochmal in diesem
00:35:41.930 --> 00:35:45.460
Account zu spiegeln, und ich lehne mich
mal aus dem Fenster wenn ich sage:
00:35:45.460 --> 00:35:50.170
Einfluss? Kaum. Also völlig kommentarlos,
wie gesagt, spiegelt einfach nur Reddit-
00:35:50.170 --> 00:35:55.640
Kommentare. Der nächste Account, ITX
News, twittert Screenshots von Texten,
00:35:55.640 --> 00:35:59.830
völlig abgedrehter Verschwörungsquark,
also da ist, da sind Sachen dabei, die
00:35:59.830 --> 00:36:05.609
Queen wurde von Hindus vergiftet. Und,
also wirklich, find ich völlig abgedreht.
00:36:05.609 --> 00:36:10.400
Und er benutzt für seine für seine
Screenshots, die er dann veröffentlicht,
00:36:10.400 --> 00:36:17.549
immer die aktuellen trending Hashtags. Er
hat vier Follower, und er ist ganz klar
00:36:17.549 --> 00:36:24.799
kein Bot. Der nächste Account: Er ist
Trump-Supporter weil er Clinton furchtbar
00:36:24.799 --> 00:36:30.559
findet. Er nutzt intensiv Hashtags, lebt
auf Hawaii, schläft sechs Stunden, macht
00:36:30.559 --> 00:36:35.349
Mittagspause - das sieht man an den an den
Zeiten, wann er twittert. Und der ist auf
00:36:35.349 --> 00:36:41.529
jeden Fall kein Bot. Der nächste.
Offensichtlich liebt er Bernie Sanders, er
00:36:41.529 --> 00:36:45.450
hasst Donald Trump, Hillary Clinton, die
Demokraten (weil sie nämlich Hillary
00:36:45.450 --> 00:36:49.029
Clinton aufgestellt haben statt Bernie
Sanders), Bill und Chelsea Clinton, und er
00:36:49.029 --> 00:36:53.979
hasst Expedia, weil Chelsea Clinton jetzt
im Board sitzt. Aber ein Bot ist er nicht.
00:36:53.979 --> 00:36:59.370
Der nächste. Der sieht mir doch sehr
fischig aus. Ich vermute mal, dass es eine
00:36:59.370 --> 00:37:04.759
spanischsprachige Click-Farm ist, die
versucht, User auf Werbeseiten zu locken.
00:37:04.759 --> 00:37:10.110
Die machen dann Werbung für was weiß ich,
irgendwelche Apps oder sowas, überhaupt
00:37:10.110 --> 00:37:13.859
gar keine politischen Inhalte, denn sie
nutzen einfach nur Training Hashtags um
00:37:13.859 --> 00:37:17.671
sich in politischen Diskussionen sozusagen
da noch nochmal ihre Links zu
00:37:17.671 --> 00:37:23.410
veröffentlichen, haben einen Follower. Ob
es ein Bot ist oder nicht? Ich sag mal,
00:37:23.410 --> 00:37:28.119
vermutlich nicht. Da sind halt Tippfehler
drin, das wäre eigentlich ein schlecht
00:37:28.119 --> 00:37:31.559
programmierter Bot (oder besonders
schlau). Im Zweifelsfall könnt ihr ihn
00:37:31.559 --> 00:37:35.421
gern als Bot definieren, aber impact hat
er keinen. Jetzt wird es ein bisschen
00:37:35.421 --> 00:37:39.579
spannender. Ave Hurley ist eine Oma aus
Brooklyn, sie ist eine Künstlerin, malt
00:37:39.579 --> 00:37:43.201
Bilder, macht Schmuck, verkauft sie in
einem Shop und hat vor kurzem mit dem
00:37:43.201 --> 00:37:49.810
Rauchen aufgehört. An dem Wahltag hat sie
wie wild für Trump getwittert und hat ihn
00:37:49.810 --> 00:37:53.390
unterstützt und hat versucht, Leute zu
überzeugen. Aber ein Bot ist sie auch
00:37:53.390 --> 00:37:58.650
nicht. Dann hab ich hier noch den hier.
Der ist aus Tokio. Ich vermute es ist ein
00:37:58.650 --> 00:38:03.160
Student, der twittert auf Japanisch und ab
dem Moment war ich so ein bisschen Lost in
00:38:03.160 --> 00:38:07.719
Translation um herauszukriegen, was er da
möchte. Aber ich vermute, dass er Toru
00:38:07.719 --> 00:38:12.609
Hashimoto und Kazuma Ieri hasst, das eine
ist ein Politiker, das andere ein
00:38:12.609 --> 00:38:19.190
Internet Entrepreneur. Er hat am Wahlabend
auf einen Tweet zu Kazuma gefeuert, muss
00:38:19.190 --> 00:38:22.720
man sagen, und hat da einfach die
aktuellen Trending hashtags genommen, und
00:38:22.720 --> 00:38:28.869
da war natürlich auch die Election dabei,
aber ein Bot ist es nicht. Der nächste:
00:38:28.869 --> 00:38:34.099
Paolo. Paolo kann 13 Tweets in drei
Sekunden schicken.
00:38:34.099 --> 00:38:44.039
Gelächter
Applaus
00:38:44.039 --> 00:38:48.530
Er nutzt dafür drei unbekannte
italienische Twitter-Services, einer davon
00:38:48.530 --> 00:38:53.390
ist in der Zwischenzeit gesperrt. Pro
Hillary. Tweets werden so gut wie gar
00:38:53.390 --> 00:38:58.200
nicht gefavt und retweetet. Ein Bot ist er
auf jeden Fall, aber einen Einfluss hat
00:38:58.200 --> 00:39:03.220
er, glaube ich zumindest, keinen. Dann
haben wir noch den hier. Er liebt Jesus,
00:39:03.220 --> 00:39:07.579
Die Familie, Trump, Wikileaks, Fox News,
und Waffen.
00:39:07.579 --> 00:39:12.549
Gelächter
Hasst Abtreibung, Feminismus, Hillary
00:39:12.549 --> 00:39:19.410
Clinton, CNN, und Obamacare. Aber ein Bot
ist es nicht. Dann haben wir auch
00:39:19.410 --> 00:39:26.369
PresidentDrumf. Der ist ein Satire-
Account. Teilweise witzig, hat trotzdem
00:39:26.369 --> 00:39:28.380
nur einen Follower.
Gelächter
00:39:28.380 --> 00:39:35.640
Aber ein Bot ist es auch nicht. Dann haben
wir noch Maryke. Sie ist Journalistin aus
00:39:35.640 --> 00:39:40.819
Südafrika, arbeitet für die französische
Presseagentur AFP, und hat über Election
00:39:40.819 --> 00:39:47.509
Day live getwittert an dem Abend. Und sie
ist auch kein Bot. Dann haben wir noch ein
00:39:47.509 --> 00:39:53.349
Dr. Van Nostrand. Ich habe leider kein
Bild von ihm gefunden, aber er liebt
00:39:53.349 --> 00:40:00.609
Baseball, American Football, Fox News und
Trump. Er hasst Hillary und Bill Clinton,
00:40:00.609 --> 00:40:07.059
CNN, Islam, Feministen, und Linke. Und er
verfolgte Trumps' Sieg live. Hat den
00:40:07.059 --> 00:40:13.200
Wahltag intensiv verfolgt und begleitet,
aber ein Bot ist er auch nicht. So, und
00:40:13.200 --> 00:40:18.660
das war jetzt der zwölfte von den zwölf.
Fassen wir mal zusammen. Ich habe ja mal
00:40:18.660 --> 00:40:23.140
so ein kleines Tabelle gemacht,
spaltenweise pro Clinton, neutral, pro
00:40:23.140 --> 00:40:27.940
Trump, und zeilenweise ist es ein Mensch,
sind wir uns nicht ganz sicher, oder ist
00:40:27.940 --> 00:40:31.530
es ein Social Bot. Wir haben auf jeden
Fall ein Social Bot gefunden der pro-
00:40:31.530 --> 00:40:35.386
Clinton ist, und wir haben einen Social
Bot gefunden von pro-Trump ist, ob es sich
00:40:35.386 --> 00:40:39.309
tatsächlich um einen Social Bot handelt
wäre ich sehr vorsichtig denn sie haben ja
00:40:39.309 --> 00:40:42.907
keine soziale Interaktion bewiesen,
sondern alles was sie gemacht haben ist
00:40:42.907 --> 00:40:46.530
automatisiert Links und Nachrichten zu
veröffentlichen, und hatten auch dabei
00:40:46.530 --> 00:40:51.039
nicht wirklich einen Impact weil keiner
sie retweetet oder gefavt hat. Eine große
00:40:51.039 --> 00:40:58.799
Gruppe die wir gefunden haben waren pro-
Trump-Menschen, die alle, auf der pro-
00:40:58.799 --> 00:41:03.790
Clinton Seite haben wir nur einen Satire-
Account gefunden. Und dazwischen im
00:41:03.790 --> 00:41:08.259
neutralen Bereich einen Bernie Sanders-
Fan, eine Journalistin, einen Japaner und
00:41:08.259 --> 00:41:15.630
einen Verschwörungstheoretiker. Und dann
haben wir noch hier unsure derjenige der
00:41:15.630 --> 00:41:19.780
seine Links zu App-Webseiten vertreibt.
Wenn ich jetzt mal hervorhebe von denen
00:41:19.780 --> 00:41:23.139
Accounts von denen ich glaube dass sie
tatsächlich an einer politischen
00:41:23.139 --> 00:41:27.039
Diskussion teilgenommen haben... sind das
die hier und das sind alles Menschen. Ist
00:41:27.039 --> 00:41:41.700
nur die Hälfte, aber ja. Die Studie "Bots
and Automation over Twitter during U.S.
00:41:41.700 --> 00:41:45.689
Election" müsste eigentlich heißen "Highly
active Twitter users during US Election".
00:41:47.079 --> 00:41:51.019
Social Bots, oder als was wir sie
bezeichnet haben, sind politisch aktive
00:41:51.019 --> 00:41:58.450
Bürger, Hashtag-Spam, Medien und
Journalisten, und einige simple Bots. Auf
00:41:58.450 --> 00:42:02.900
Vollständigkeit halber habe ich versucht
noch eine Studie zu finden die eine andere
00:42:02.900 --> 00:42:09.209
Methodik verwendet. Und da gibt es von der
University of South California "Social
00:42:09.209 --> 00:42:15.710
bots distort the 2016 U.S. Presidential
election online discussion", und was sie
00:42:15.710 --> 00:42:20.000
zur Identifizierung von Social Bots
verwenden ist ein Service der nennt sich
00:42:20.000 --> 00:42:25.139
BotOrNot, in der Zwischenzeit umbenannt in
Botometer. Und ich will da nicht zu tief
00:42:25.139 --> 00:42:28.799
einsteigen, da gibt's auch nochmal ein
Paper dazu, aber was sie im Kern machen
00:42:28.799 --> 00:42:32.370
ist im Prinzip das was ich am Anfang
gemacht habe – sie versuchen die ganzen
00:42:32.370 --> 00:42:36.420
Metadaten rund um einen Account zu
kategorisieren, und dann kommt da Machine
00:42:36.420 --> 00:42:39.839
Learning oben drauf, und dann wird
versucht mit einer Wahrscheinlichkeit
00:42:39.839 --> 00:42:44.130
abzuschätzen ob nun ein Account nun ein
Bot ist oder nicht, und das ist die Basis
00:42:44.130 --> 00:42:48.329
dieser Studie. Ich hab das mal... Unten
ist noch mal der Link dazu, falls einer da
00:42:48.329 --> 00:42:52.640
selber mit spielen möchte. Vorsichtig, man
muss dazu seinen Twitter-Account
00:42:52.640 --> 00:42:56.419
autorisieren und das ist dann... der im
Gegensatz zu uns keine Leserechte haben
00:42:56.419 --> 00:42:59.720
möchte, sondern er möchte auch
Schreibrechte haben; für den Fall falls
00:42:59.720 --> 00:43:03.499
die gehackt werden, werdet ihr also auch
irgendwie Scheiße twittern. Ich hab
00:43:03.499 --> 00:43:06.079
einfach mal ein paar Accounts rein
geworfen um zu gucken wie vertrauenswürdig
00:43:06.079 --> 00:43:09.859
das ist; da habe ich jetzt einfach mal
einen erdgeist und einen Frank Rieger und
00:43:09.859 --> 00:43:13.970
einen Linuzifer rein geworfen. Das
Kriterium übrigens der Studie ist 50%,
00:43:13.970 --> 00:43:17.450
alle die unter 50% sind,
sind Menschen, alle die über 50%
00:43:17.450 --> 00:43:23.450
sind, sind Bots. Gegenübergestellt hab ich
nochmal das BMVI, das Bundesministerium
00:43:23.450 --> 00:43:32.299
für Justiz und Verbraucherschutz – 55
Prozent, das BKA ist ein Social Bot.
00:43:32.299 --> 00:43:36.509
Applaus
Und vielleicht liegt das an den deutschen
00:43:36.509 --> 00:43:40.630
Accounts, da die Studie sich im Speziellen
mit den US-Wahlen beschäftigt haben, hab
00:43:40.630 --> 00:43:44.680
ich da mal stichprobenartig ein paar rein
geworfen. Da haben wir das Wall Street
00:43:44.680 --> 00:43:48.849
Journal, LA Times ist ein Bot, CNN und Fox
News ist ein Bot, realDonaldTrump ist ein
00:43:48.849 --> 00:43:51.869
Bot, und der amerikanische Präsident.
Lachen
00:43:51.869 --> 00:43:59.989
Applaus
Das könnt ihr ja auch alles selber
00:43:59.989 --> 00:44:04.140
ausprobieren. Also wissenschaftlich ist
das alles nicht haltbar.
00:44:05.319 --> 00:44:06.972
Und wen das noch nicht überzeugt,
00:44:06.972 --> 00:44:12.602
Hegelich erwartet keine große
Gefahr durch Social Bots im Wahlkampf.
00:44:13.410 --> 00:44:20.309
Zusammenfassung. Social Bot,
Filterblasen, Fake News. Ich versuche
00:44:20.309 --> 00:44:24.070
versuch's mal vorsichtig zu formulieren:
die Forschung ist noch in den Anfängen.
00:44:24.070 --> 00:44:28.369
Die Methodiken sind neu, teilweise
experimentell, und müssen noch überprüft
00:44:28.369 --> 00:44:32.319
werden. Und im Speziellen müssen die
wissenschaftlichen Publikation überprüft
00:44:32.319 --> 00:44:37.299
werden. Falls einer irgendwie in dem Thema
gerade arbeitet, den kann ich das ans Herz
00:44:37.299 --> 00:44:42.119
legen, als Bachelor- oder Masterarbeit mal
ans Herz zu legen, diese Studien
00:44:42.119 --> 00:44:45.789
tatsächlich zu überprüfen. Was ich bei
Social Bots, Filterblase und Fake News
00:44:45.789 --> 00:44:53.180
gefunden habe sind exemplarisch: Egon
Dombrowski und Ave Hurley. Wir haben in
00:44:53.180 --> 00:44:59.039
den Diskursen die Leute als Nazis,
bildungsfern, sozial abgehängt,
00:44:59.039 --> 00:45:04.219
Mittelschicht mit Verlustängsten und jetzt
auch neu als Social Bots bezeichnet.
00:45:04.219 --> 00:45:05.989
Aber was sie alle gemeinsam haben:
00:45:05.989 --> 00:45:07.750
Sie haben Angst und sie sind wütend.
00:45:07.750 --> 00:45:10.370
Und sie haben Vertrauensverlust
in die Institutionen.
00:45:10.370 --> 00:45:12.519
Und was wir beobachten ist das neue
00:45:12.519 --> 00:45:18.180
gesellschaftliche Gruppen in die sozialen
Netzwerke betreten, und sie nutzen ihr
00:45:18.180 --> 00:45:23.119
Recht und die Möglichkeit ihrer
Meinungsäußerung. Und im Zweifelsfall
00:45:23.119 --> 00:45:29.511
greifen sie auch auf Fake News zurück wenn
es ihre Ansichten bestätigt.
00:45:29.511 --> 00:45:33.330
Was wir aber beobachten ist, dass die
sozialen Netzwerke nicht geeignet sind, um
00:45:33.330 --> 00:45:37.319
gesellschaftliche Lösungen zu entwickeln.
Vielleicht gibt es irgendwann technische
00:45:37.319 --> 00:45:42.339
Lösungen. Wer weiß. Vielleicht gehört es
aber in Zukunft auch zur Medienkompetenz,
00:45:42.339 --> 00:45:47.859
eine gewisse Debattenkultur zu entwickeln.
Ich weiß es nicht. Das ist auf jeden Fall,
00:45:47.859 --> 00:45:51.229
ich will jetzt den Begriff "Neuland" nicht
verwenden, das auf jeden Fall ein neues
00:45:51.229 --> 00:45:55.630
Forschungsgebiet. Wir sehen glaube ich
dass hier eine neue Wissenschaft beginnt
00:45:55.630 --> 00:45:59.609
zu entstehen. Sie steckt noch in den
Kinderschuhen, aber sie macht gerade einen
00:45:59.609 --> 00:46:03.819
fundamentalen Wandel mit, von einer
ideographischen Wissenschaft, also einer
00:46:03.819 --> 00:46:07.529
reinen Phänomen beschreibenden, wie
Sozialwissenschaft, Kulturwissenschaft
00:46:07.529 --> 00:46:11.680
oder Politikwissenschaften, hin zu einer
nomothetischen Wissenschaft, die versucht
00:46:11.680 --> 00:46:16.160
Regeln zu erkennen, Gesetze zu entdecken,
reproduzierbare Ergebnisse zu entwickeln,
00:46:16.160 --> 00:46:20.750
so wie man das aus den Naturwissenschaften
kennt. Ähnliche Entwicklungen haben wir
00:46:20.750 --> 00:46:25.249
auch gesehen, die Astrologie, das war die
Lehre von den Sternen, bis dann das
00:46:25.249 --> 00:46:29.110
Teleskop erfunden wurde und wir nun
anfangen konnten, Gesetze in der Bewegung
00:46:29.110 --> 00:46:32.650
von Planeten und Sternen zu entdecken, die
reproduzierbar sind. Und aus der
00:46:32.650 --> 00:46:38.700
Astrologie wurde dann die Astronomie. Ich
sehe, dass wir in den Debatten, die jetzt
00:46:38.700 --> 00:46:44.209
in den sozialen Netzwerken stattfinden,
eine neue Wissenschaft haben können die
00:46:44.209 --> 00:46:49.049
sich mit diesem Thema beschäftigt. Und ich
glaube das ist nicht nur möglich ist,
00:46:49.049 --> 00:46:53.020
sozusagen als Teleskop oder Mikroskop die
für die Gesellschaft, sondern dass es auch
00:46:53.020 --> 00:46:58.090
notwendig ist. Und dazu ist viel Forschung
nötig und ich animiere jeden, der nicht so
00:46:58.090 --> 00:47:01.900
richtig weiß ob er jetzt in dem
geisteswissenschaftlichen Bereich oder im
00:47:01.900 --> 00:47:05.299
Data Science-Bereich arbeiten möchte,
diese beiden Welten miteinander zu
00:47:05.299 --> 00:47:12.180
verbinden. Bachelor und Master sind,
Arbeiten sind da gut definitiv
00:47:12.180 --> 00:47:17.469
prädestiniert um diese wissenschaftlichen
Ausarbeitungen zu reproduzieren. Und diese
00:47:17.469 --> 00:47:21.649
Studien von der Oxford-Universität oder
von South California zu reproduzieren
00:47:21.649 --> 00:47:25.630
und zu validieren. Und ich würde das gerne
unterstützen, und ich hoffe, die nächsten
00:47:25.630 --> 00:47:29.380
zweieinhalb Tage noch Zeit zu finden,
Teile meines Frameworks und auch der
00:47:29.380 --> 00:47:36.509
Rohdaten zu veröffentlichen. Ansonsten bin
ich die nächsten zweieinhalb Tage zu
00:47:36.509 --> 00:47:41.170
erreichen: DECT Telefonnummer 360, 3600
Entschuldigung, und Twitter-Account,
00:47:41.170 --> 00:47:45.839
@michaelkreil. Ich würde gerne andere
Leute, die in dem Bereich forschen oder
00:47:45.839 --> 00:47:53.049
sowas zusammenbringen um zu gucken ob wir
zum Thema Social Bot da nicht mal eine
00:47:53.049 --> 00:48:09.869
Wissenschaftssprache Debatte starten
können. Danke schön.
00:48:09.869 --> 00:48:16.200
Applaus
Herald: Mindestens das will ich nachher
00:48:16.200 --> 00:48:19.839
nochmal hören. Jetzt haben wir noch, ja,
etwas über ne Viertelstunde Zeit für
00:48:19.839 --> 00:48:24.599
Fragen und Antworten. Habt ihr Fragen an
Michael Kreil? Positioniert euch bitte an
00:48:24.599 --> 00:48:29.709
den Mikrophonen, ich versuche einigermaßen
ausgeglichen auszuwählen. Falls schon
00:48:29.709 --> 00:48:33.339
irgendwo jemand steht, steht schon
irgendwo jemand, hebt mal die Hand? Ah, da
00:48:33.339 --> 00:48:37.390
hinten. Mikrophon 4, fang an.
Mikrophon 4: Jawohl. Ich hab eine Frage
00:48:37.390 --> 00:48:45.549
bezüglich State-sponsored Propaganda, also
die sind wirklich Leute, die bezahlt
00:48:45.549 --> 00:48:52.320
werden von Staaten, damit die Propaganda
betreiben. Habt ihr auch in der Forschung
00:48:52.320 --> 00:48:55.609
diebezüglich was rausgefunden, oder habt
ihr das überhaupt untersucht?
00:48:55.609 --> 00:49:01.199
MK: Wir haben versucht, Leute zu finden,
die an den Bots, die an den politischen
00:49:01.199 --> 00:49:04.660
Diskursen teilnehmen. Ob sie jetzt
tatsächlich dafür bezahlt werden oder
00:49:04.660 --> 00:49:09.589
nicht ist unmöglich festzustellen. Wir
sehen aber, wenn jetzt zum Beispiel jemand
00:49:09.589 --> 00:49:15.129
bei der US-Wahl was postet und dann aber
in den nächsten Monaten bis heute noch
00:49:15.129 --> 00:49:18.680
ganz normales Leben auf den, in den
sozialen Netzwerken führt, und parallel
00:49:18.680 --> 00:49:22.400
dann auch noch auf Facebook oder sowas,
gehen wir eher davon aus, dass es sich
00:49:22.400 --> 00:49:27.040
nicht um einen bezahlten Akteur oder
Akteure handelt. Die große Frage, die ich
00:49:27.040 --> 00:49:30.759
mir eigentlich auch stelle ist dabei: Was
ist der tatsächliche impact, also die
00:49:30.759 --> 00:49:35.749
Unterstellung mit jemand bezahlt da
irgendwie, kann ich wirklich auf Twitter
00:49:35.749 --> 00:49:39.329
durch soziale Interaktion Leute davon
überzeugen, die politische Richtung zu
00:49:39.329 --> 00:49:43.049
wechseln? Das ist eine bisherige
Unterstellung, die noch nicht überprüft
00:49:43.049 --> 00:49:46.780
wurde, und deswegen finde ich das
vorsichtig, bin ich da vorsichtig, sowas
00:49:46.780 --> 00:49:50.009
anzunehmen.
H: Mikro 2.
00:49:50.009 --> 00:49:54.220
M2: Vielen, vielen Dank für den
großartigen Vortrag, ich fand' das super
00:49:54.220 --> 00:49:57.550
wichtig, anhand von dem kann man
eigentlich sehen, was sich wirklich an
00:49:57.550 --> 00:50:01.309
wissenschaftlichen Methodiken verändern
muss, und von daher vielen, vielen Dank.
00:50:01.309 --> 00:50:05.079
Ich habe eine Frage, ich habe mich gerade
gefragt, ob man wirklich von Fake News
00:50:05.079 --> 00:50:08.791
sprechen sollte, weil offensichtlich
spiegeln diese Nachrichten ja nur, was die
00:50:08.791 --> 00:50:14.309
Verbreiter und weiteren Re-tweeter der
Nachrichten hören oder sehen oder wissen
00:50:14.309 --> 00:50:18.319
wollen, also das, was sie eigentlich schon
denken, wird quasi nur gespiegelt. Und ich
00:50:18.319 --> 00:50:22.229
hab mich gefragt, ob es nicht irreführend
ist, dieses Wort "News", und ob man nicht
00:50:22.229 --> 00:50:25.760
ein neues Wort dafür finden müsste.
MK: Auf jeden Fall, auf jeden Fall. Wir
00:50:25.760 --> 00:50:30.699
haben auch zum Beispiel gesehen, dass bei
der US-Wahl relativ viele Fake News aus
00:50:30.699 --> 00:50:34.650
einer Stadt aus Osteuropa kommt, die aber
gar keine politische Agenda haben, sondern
00:50:34.650 --> 00:50:38.309
einfach nur Geld damit verdient haben,
dass ihre Posts sich so weit verbreitet
00:50:38.309 --> 00:50:42.459
haben, und damit klick-Werbung, verstanden
haben, Geld gewonnen haben. Da war
00:50:42.459 --> 00:50:47.829
überhaupt kein politischer, gar kein
politisches Ziel dahinter, im Gegenteil,
00:50:47.829 --> 00:50:51.550
laut eigener Aussage haben sie erst pro-
Clinton probiert, aber das hat einfach
00:50:51.550 --> 00:50:56.019
nicht so gut eingeschlagen wie pro-Trump-
Sachen. Deswegen halte ich auch den
00:50:56.019 --> 00:51:00.440
Begriff von Fake News dann auch nicht mehr
für angebracht.
00:51:00.440 --> 00:51:03.809
H: So, aus dem Internet haben wir auch
eine Frage.
00:51:03.809 --> 00:51:08.229
Signal-Engel: Ja, zuerst auch aus dem IRC
großes Lob an den Vortrag, es wurde
00:51:08.229 --> 00:51:12.529
angemerkt, es sei sehr interessant, mal
den Hashtag #34c3 zu analysieren und
00:51:12.529 --> 00:51:18.050
Trolle aufzudecken. Cyberrichter und Afdex
lässt fragen: Gibt es schon schlaue Bots
00:51:18.050 --> 00:51:21.769
mit Einfluss, ist irgendwas über die
Interaktion untereinander bekannt, gibt es
00:51:21.769 --> 00:51:33.180
bald Bot Wars?
MK: Äh. Flame-Bots, ja, äh. Das sind alles
00:51:33.180 --> 00:51:38.879
theoretische Konzepte. Wenn man sich die
Studien dazu durchliest, das sind alles
00:51:38.879 --> 00:51:42.539
Konzepte "es könne irgendwann mal so
sein". Ich stehe auch nicht hier und sage
00:51:42.539 --> 00:51:46.549
"sowas wird nie passieren" oder sowas.
Keine Ahnung, was es für Entwicklungen mit
00:51:46.549 --> 00:51:52.450
KI in den nächsten Tagen oder Monaten oder
so gibt. Aber das, was wir jetzt bisher
00:51:52.450 --> 00:51:56.709
sehen konnten, waren jetzt nicht
irgendwelche KI's, die durchs Internet
00:51:56.709 --> 00:52:00.239
laufen.
H: Die 3.
00:52:00.239 --> 00:52:07.039
M3: Servus. Wunderbar, funktioniert. Das
erste harte Kriterium, das mir einfallen
00:52:07.039 --> 00:52:11.059
würde, um Bot-Accounts von Menschen-
Accounts zu trennen wäre die posting-
00:52:11.059 --> 00:52:14.720
Frequenz, und die hat jetzt hier nur
einmal Einfluss gefunden - woran liegt
00:52:14.720 --> 00:52:17.289
das?
MK: Weil sie tatsächlich auch nur einmal
00:52:17.289 --> 00:52:25.729
auffällig war. Also, die anderen Accounts,
also ich meine, wenn ich jetzt nen Social
00:52:25.729 --> 00:52:29.809
Bot entwickle, dann wäre ich jetzt auch
schlau zu sagen okay, dann haut der jetzt
00:52:29.809 --> 00:52:35.450
nicht alle halbe Sekunde nen tweet raus,
wenn ich sowas bauen würde. Aber in diesem
00:52:35.450 --> 00:52:39.250
Fall ist es tatsächlich nur einmal
aufgetreten, das ein Bot sozusagen den Bug
00:52:39.250 --> 00:52:43.410
hatte, das zu tun.
M3: Okay, taugt also nicht. Super, danke.
00:52:43.410 --> 00:52:47.609
H: Und MIkro 1.
M1: Hallo erstmal, ja, jetzt geht's. Ich
00:52:47.609 --> 00:52:51.049
wollte fragen ob, weil du ja gesagt
hattest dass bei den Social Bots ja
00:52:51.049 --> 00:52:54.949
eigentlich der Einfluss sich verliert, ob
das dann wiederum heißen könnte, dass die
00:52:54.949 --> 00:52:59.349
eigentliche Gefahr von Filterblasen, dass
kein Meinungsdiskurs entsteht, oder dass
00:52:59.349 --> 00:53:03.789
der halt eingedämmt wird, ob das sich dann
verliert oder ob du in den Forschungen
00:53:03.789 --> 00:53:07.459
gesehen hast, dass die Gefahr gar nicht so
da ist, wie sie irgendwie überall
00:53:07.459 --> 00:53:12.009
propagiert wird? Ja.
MK: Also, zum Einen: Ich glaube, es gibt
00:53:12.009 --> 00:53:15.600
so einen Satz, den man in den letzten 10
Jahren immer wieder gehört hat, das
00:53:15.600 --> 00:53:18.460
Internet ist nicht an bestimmten Sachen
schuld, sondern das Internet macht nur
00:53:18.460 --> 00:53:22.339
einfach wieder Sachen sichtbar. Und ich
glaube, dass es eine Menge Leute gibt, die
00:53:22.339 --> 00:53:27.231
sich gerne an einem politischen Diskurs
beteiligen wollen und nicht die
00:53:27.231 --> 00:53:31.319
Möglichkeit hatten, und jetzt nun mit den
sozialen Netzen diese Möglichkeit haben,
00:53:31.319 --> 00:53:34.479
und dann als Bots klassifiziert werden.
Problem ist, dass ich deine Frage
00:53:34.479 --> 00:53:35.780
vergessen habe.
00:53:35.780 --> 00:53:37.690
M1: Ich wollte eigentlich nur wissen, ob
00:53:37.690 --> 00:53:41.079
diese Gefahr, dass man halt sagt, der
Diskurs ist so ein bisschen eingedämmt,
00:53:41.079 --> 00:53:44.891
weil jeder in seiner eigenen Blase lebt,
ob sich das nicht dadurch verliert, weil
00:53:44.891 --> 00:53:49.309
du ja gesagt hattest, Social Bots sind
unwirksam so wirklich, ob das nicht dann
00:53:49.309 --> 00:53:52.839
sich auch sozusagen auf das andere
übertragen lässt für unsere, für unseren
00:53:52.839 --> 00:53:56.701
normane Gebrauch.
MK: Genau, also, ich, kann ich, kann ich
00:53:56.701 --> 00:54:01.290
keine abschließende Meinung zu abgeben.
Ich weiß aber dass, oder man merkt es
00:54:01.290 --> 00:54:05.180
halt, dass die sozialen Netze oft, oder
fast immer nicht dazu geeignet sind,
00:54:05.180 --> 00:54:08.510
tatsächlich einen Diskurs zu führen,
sondern es gibt halt, es ist halt,
00:54:08.510 --> 00:54:12.139
endet immer in einem Flame War, sind
sozusagen, "du bist, ihr seid die Bösen,
00:54:12.139 --> 00:54:15.808
und wir sind die Guten." Aber tatsächlich
irgendwie eine Lösung zu entwickeln,
00:54:15.808 --> 00:54:18.029
eignet sich nicht dafür, vielleicht ist
der Mensch auch nicht dafür gemacht.
00:54:18.029 --> 00:54:22.279
Vielleicht haben Netzwerke nen, nen
bestimmten flaw, den wir halt noch nicht
00:54:22.279 --> 00:54:24.979
kennen, man darf ja auch nicht vergessen,
das ist eine extrem experimentelle
00:54:24.979 --> 00:54:29.930
Technologie. Noch nie gab es ein Netzwerk,
das weltübergreifend so vielen Menschen
00:54:29.930 --> 00:54:32.819
die Möglichkeit gibt, miteinander zu
kommunizieren und Diskurse zu führen.
00:54:32.819 --> 00:54:35.369
M1: Danke.
H: Mikro 4.
00:54:35.369 --> 00:54:40.789
M4: Ja, Hallo. Erstmal Kompliment für
diesen superwichtigen und sehr coolen
00:54:40.789 --> 00:54:44.730
Vortrag. Meine Frage: Du hattest ja jetzt
ausschließlich über Twitter gesprochen -
00:54:44.730 --> 00:54:48.420
habt ihr mal Analysen gefahren über andere
soziale Netze, die ja durchaus auch
00:54:48.420 --> 00:54:54.340
Verbreitung haben, speziell dazu, auch
nicht nur über die Anzahl der Tweets
00:54:54.340 --> 00:54:58.069
sondern auch über den Impact, weil die
Frage ist ja, die hattest du ja mehrfach
00:54:58.069 --> 00:55:01.450
aufgeworfen, was wirkt eigentlich eine
Tweet, wenn die, wenn die einen
00:55:01.450 --> 00:55:05.369
veröffentlichen, also ein Tweet auf 10.000
Follower könnte möglicherweise wichtiger
00:55:05.369 --> 00:55:10.170
sein als 10.000 Tweets mit einem Follower.
MK: Genau, da kann man sich halt Metriken
00:55:10.170 --> 00:55:14.790
überlegen. Normalerweise ist es für mich
halt ein Ausschlusskriterium, wenn ein
00:55:14.790 --> 00:55:19.009
Tweet nur, nicht gefavt wird und nicht
retweetet wird, das ist für mich, das ist
00:55:19.009 --> 00:55:22.349
ein Ausschlusskriterium. Was der
tatsächliche Impact ist, obs dafür ne
00:55:22.349 --> 00:55:27.920
Metrik gibt, weiß ich nicht. Kann man sich
überlegen, wie gesagt, neue Wissenschaft.
00:55:27.920 --> 00:55:33.190
Das andere ist, andere soziale Netzwerke.
Man sieht, dass auf YouTube ne Menge
00:55:33.190 --> 00:55:37.819
passiert. Ganz viele Leute packen im
Wohnzimmer die Kamera aus und teilen ihre
00:55:37.819 --> 00:55:42.180
politischen Meinungen im Wohnzimmer und
veröffentlichen das auf YouTube, es gibt
00:55:42.180 --> 00:55:47.839
auch dieses russische Social Network, wie
heißt das? VKan... VKan-irgendwas, ja.
00:55:47.839 --> 00:55:54.279
Genau, da gibt es - VKontakte, genau - da
gibt es auch, kenne ich eine Gruppe die
00:55:54.279 --> 00:55:57.980
sich damit beschäftigt hat, wie das da
aussieht, das ist aber ein sehr kleiner
00:55:57.980 --> 00:56:04.459
Teil, der große Brocken ist natürlich
Facebook, und Facebook hat zwei Probleme:
00:56:04.459 --> 00:56:08.720
Erstens gibt es eine Menge geschlossene
Gruppen wo viel stattfindet, da habe ich
00:56:08.720 --> 00:56:12.310
mal rein geguckt, sind die gleichen
Themen, es geht halt auch um Asylpolitik
00:56:12.310 --> 00:56:16.250
und so weiter. Und das andere Problem mit
Facebook ist, die API ist leider nicht so
00:56:16.250 --> 00:56:20.380
offen. Es gibt Schwierigkeiten, da große
Mengen an Daten rauszuholen. Ich glaube
00:56:20.380 --> 00:56:25.749
dass Facebook in diesem Bereich wahnsinnig
viel Datenmaterial hat und Forschung dazu
00:56:25.749 --> 00:56:29.680
betreiben könnte, aber leider halt nur
innerhalb eines Konzerns und nicht
00:56:29.680 --> 00:56:32.439
innerhalb der Forschungsgemeindschaft.
M4: Okay, danke.
00:56:32.439 --> 00:56:36.089
H: Unser Social Bot hat auch noch eine
Frage.
00:56:36.089 --> 00:56:41.170
Signal: Mie lässt fragen, ob es Studien zu
dem realen Ausmaß und dem realen Impact
00:56:41.170 --> 00:56:45.089
von Fake News in den sozialen Medien, und
wurden die eventuell zur Legitimation des
00:56:45.089 --> 00:56:49.079
NetzDGs herangezogen?
MK: Habe ich akustisch nicht verstanden.
00:56:49.079 --> 00:56:54.089
Signal: Gibt es Studien über das reale
Ausmaß von Fake News und wurden die
00:56:54.089 --> 00:56:56.219
herangezogen zur Legitimisierung des
NetzDGs?
00:56:56.219 --> 00:57:03.219
MK: Soweit ich weiß ist mir, mir ist keine
Studie bekannt, aus meiner Erfahrung würde
00:57:03.219 --> 00:57:07.250
ich sagen: Sie haben keinen Einfluss, weil
sie halt erstmal nicht Leute überzeugen,
00:57:07.250 --> 00:57:10.849
ich glaube die Leute kommen schon mit
einer Überzeugung in die Netzwerke und
00:57:10.849 --> 00:57:15.279
werden einfach nur noch weiter zusätzlich
bestätigt. Ich glaube, dass es einen
00:57:15.279 --> 00:57:20.019
gewissen Impact gibt mit Leuten, die
sozusagen Latent ne Sorge um
00:57:20.019 --> 00:57:24.650
Flüchtlingspolitik haben und dann nur noch
in einer Filterblase stecken und nur noch
00:57:24.650 --> 00:57:28.519
mit Flüchtlingskriminalität bombardiert
werden. Dass sie dazu dann auch neigen,
00:57:28.519 --> 00:57:32.429
eine Angst gegen beispielsweise Migranten
zu entwickeln. Aber eine Studie dazu ist
00:57:32.429 --> 00:57:35.529
mir noch nicht bekannt, wie das
tatsächlich, ob das psychologische
00:57:35.529 --> 00:57:39.220
Auswirkungen auf die Menschen hat.
H: Und die 2.
00:57:39.220 --> 00:57:45.910
Frage M2: Ja hallo, danke für den Vortrag.
Du hattest am Anfang so einen schöne
00:57:45.910 --> 00:57:49.539
Karte, wo verschiedene Gruppen aus dem
Twitternetzwerk aufgezeigt wurden, und
00:57:49.539 --> 00:57:53.690
dann hast du gezeigt, da sitzt die AfD und
dann kam der Switch und da sind die
00:57:53.690 --> 00:57:57.949
Fakenews. Wie hast du denn ermittelt, dass
diese Tweets Fakenews waren?
00:57:57.949 --> 00:58:01.619
Antwort: Also konkret, ich habe mir
Fakenews ausgesucht und hab geguckt wer
00:58:01.619 --> 00:58:05.949
sie auf Twitter teilt. Also andersrum, ich
hab mir sozusagen Geschichten rausgesucht,
00:58:05.949 --> 00:58:09.880
von denen ich weiß dass es Fakenews sind
und habe dann beispielsweise Blogpost und
00:58:09.880 --> 00:58:14.029
so weiter die es verbreitet haben und
diese URL... also wer twittert im Prinzip
00:58:14.029 --> 00:58:18.369
Fakenews und genau, dadurch kam dann diese
Einfärbung zustande.
00:58:18.369 --> 00:58:22.829
H: Mikro 3.
M3: Ja ich hab noch ein Frage zu
00:58:22.829 --> 00:58:26.889
Antworten, also ich hab oft gehört von
Journalisten die sich beschwert haben,
00:58:26.889 --> 00:58:30.510
wenn sie über ein bestimmtes Thema
berichtet haben, dass da irgendwelche Bots
00:58:30.510 --> 00:58:34.239
sie mit Antworten zumüllen oder sowas.
Hast du sowas beobachten können wird das
00:58:34.239 --> 00:58:37.959
irgendwie als Megafon eingesetzt um dann
einfach nochmal ein bisschen mehr Bums
00:58:37.959 --> 00:58:41.449
oder Druck zu machen auf solche Accounts?
Gibt's das was oder ist das auch
00:58:41.449 --> 00:58:44.809
eigentlich alles echte Menschen die
wirklich wütend sind?
00:58:44.809 --> 00:58:49.499
MK: Ich sag noch nicht, dass das alles
echte Menschen sind, also ich kann mit
00:58:49.499 --> 00:58:57.330
einem Bot zum Beispiel immer einen Hashtag
unbenutzbar machen. Ich kann mir einen
00:58:57.330 --> 00:59:00.890
Hashtag raussuchen und kann das dann mit
Bots vollmüllen, aber das ist dann
00:59:00.890 --> 00:59:05.670
eigentlich mehr ein Spam oder um den
Diskurs zu stören, aber nicht wirklich
00:59:05.670 --> 00:59:13.380
einen Einfluss zu haben dabei. Zu den
Journalisten, ich kenne da einige
00:59:13.380 --> 00:59:20.140
Journalisten, die auf Twitter aktiv sind
und dann immer wieder mit einer großen
00:59:20.140 --> 00:59:24.049
Anzahl Accounts konfrontiert werden. Ich
bin mir da auch nicht sicher,
00:59:24.049 --> 00:59:27.488
ob es tatsächlich sich um Botnetzwerke
handelt, denn es sind immer wieder
00:59:27.488 --> 00:59:31.209
vereinzelt Leute die unterschiedliche
Tweets machen, es ist ja schon wahnsinnig
00:59:31.209 --> 00:59:35.429
schwierig 100.000 künstliche Tweets zu
erzeugen mit einer künstlichen Intelligenz
00:59:35.429 --> 00:59:39.019
zu erzeugen, die aber unterschiedlich
sind. Das ist schon ein relativ hartes
00:59:39.019 --> 00:59:42.589
Problem, ich weiß nicht ob das bereits
gelöst ist, ich glaube nämlich nicht.
00:59:42.589 --> 00:59:48.469
H: Nummer 4 bitte.
M4: Eine Frage zu einem Kriterium, bei dem
00:59:48.469 --> 00:59:52.720
ich nicht weiß, ob es aufgetaucht ist oder
nicht, oder ob ich nur nicht aufmerksam
00:59:52.720 --> 00:59:58.400
genug war. Und zwar geht es um
gleichlautende Nachrichten in Tweets zum
00:59:58.400 --> 01:00:03.819
Beispiel. Also ich weiß, dass bei Fakenews
teilweise ganze absatzweise Texte 1 zu 1
01:00:03.819 --> 01:00:10.189
kopiert werden und auch manuell sozusagen,
trotzdem kommt mir das auch als ein
01:00:10.189 --> 01:00:14.709
wichtiges Kriterium vor um, wie gesagt,
einen Einflussfaktor, ist es ein Bot oder
01:00:14.709 --> 01:00:19.920
nicht festzustellen. Spielt das in den
Studien irgend eine Rolle, die Du
01:00:19.920 --> 01:00:24.849
untersucht hast oder für Deine Arbeit?
MK: In den Studien kann ich es nicht
01:00:24.849 --> 01:00:29.250
sagen, die hatten jetzt immer nur ihre
Kriterien mit den Hashtags und so weiter.
01:00:29.250 --> 01:00:35.550
Was in meiner Arbeit aufgefallen ist, dass
ist immer wieder, zum einen es gibt
01:00:35.550 --> 01:00:39.379
natürlich Leute die sagen, ich will das
jetzt nicht retweeten sondern ich kopiere
01:00:39.379 --> 01:00:43.189
den Tweet und sage sozusagen, dass das
mein Eigener ist. Aber es gibt tatsächlich
01:00:43.189 --> 01:00:48.220
bestimmte Formulierungen die zu
10.000-en identisch auftauchen, aber es
01:00:48.220 --> 01:00:53.429
sind tatsächlich nur Textdatenbanken, die
da einfach abgespielt werden, auch nicht
01:00:53.429 --> 01:00:57.210
mit politischen Inhalten, sondern ... ich
weiß nicht vielleicht sind die dormant
01:00:57.210 --> 01:01:01.680
oder sowas, aber keinerlei politische
Aktivität zu sehen dort.
01:01:01.680 --> 01:01:04.869
H: Und die 2 bitte.
Lachen
01:01:04.869 --> 01:01:12.109
M2: Ja hallo, auch nochmal vielen Dank für
den Vortrag. Eine Frage zu dem Thema
01:01:12.109 --> 01:01:20.149
Schweden-Reisewarnung, was am Anfang kam.
Wie viel Handarbeit war dabei die Tweets
01:01:20.149 --> 01:01:23.770
quasi rauszufinden, die zu dieser Story
gehören, und wie kannst Du Dir sicher
01:01:23.770 --> 01:01:27.269
sein, dass Du alle gefunden hast?
MK: Ich kann mir nicht sicher sein, dass
01:01:27.269 --> 01:01:31.131
ich alle gefunden habe, insbesondere weil
immer wieder Tweets gelöscht werden oder
01:01:31.131 --> 01:01:34.889
ganze Accounts. Das hat man auch gesehen,
wenn man sich die Daten mal ein halbes
01:01:34.889 --> 01:01:38.648
Jahr später anschaut, oder wie viele
Accounts in der Zwischenzeit weg sind. Ich
01:01:38.648 --> 01:01:41.990
kann mir nicht sicher sein, dass ich alle
Tweets gefunden habe, natürlich nicht. Was
01:01:41.990 --> 01:01:44.840
man halt machen kann ist sich
durchzuhangeln. Man fängt dann an mit
01:01:44.840 --> 01:01:48.789
sowas wie "Schweden Reisewarnung" und dann
sieht man die ersten, und dann kommen da
01:01:48.789 --> 01:01:52.600
aber auch noch andere Begriffe zusammen
und hier finde ich nochmal einen Link auf
01:01:52.600 --> 01:01:55.579
einen Blogpost und dann suche ich mal nach
dem und so weiter, und so wird die
01:01:55.579 --> 01:01:59.759
Datenbank immer größer und so habe ich
glaube ich 1800 Tweets oder sowas gefunden
01:01:59.759 --> 01:02:03.469
und versuch die dann so halbautomatisiert
zu kategorisieren mit Fakenews und so
01:02:03.469 --> 01:02:07.249
weiter. Das ist sozusagen die Methodik,
das ist eigentlich so halbautomatisierte
01:02:07.249 --> 01:02:10.119
Handarbeit.
H: Jetzt aber, Fefe.
01:02:10.119 --> 01:02:14.239
Frage M1 [???]: Ich hab eine
H: Die eins ist das bitte.
01:02:14.239 --> 01:02:19.159
Frage M1: Hallo, hallo. Also ich hab eine
kurze Frage und eine Bitte um weitere
01:02:19.159 --> 01:02:22.490
Daten. Erstens würde ich gerne wissen, wie
viele von Deinen Rohdaten Du
01:02:22.490 --> 01:02:26.760
veröffentlichen kannst und tust. Und
zweitens Dein Beispiel am Anfang mit der
01:02:26.760 --> 01:02:31.309
Twitter-Timeline da ging's irgendwie um
2.000 Tweets oder 2.000 Leute und das ist
01:02:31.309 --> 01:02:35.219
eine Größenordnung, die man häufiger sieht
in diesen Debatten und da frage ich mich
01:02:35.219 --> 01:02:39.230
immer, ich hab mehr ungelesene Mails in
meiner Inbox, wieso interessieren mich
01:02:39.230 --> 01:02:43.749
2000 Leute? Ist das irgendwie, wieso ist
das jetzt eine relevante Größenordnung?
01:02:43.749 --> 01:02:46.799
Kannst du da vielleicht noch etwas dazu
sagen?
01:02:46.799 --> 01:02:50.739
A: Okay, also das erste war, ob ich meine
Daten veröffentlichen kann. Es gibt
01:02:50.739 --> 01:02:54.529
tatsächlich eine Guideline von Twitter,
die es mir nicht erlaubt beispielsweise
01:02:54.529 --> 01:02:58.389
von einem bestimmten Account zehntausende
von Tweets zu veröffentlichen. Es gibt
01:02:58.389 --> 01:03:02.209
bestimmte Sachen, die man machen darf. Da
würde ich mich halt, sonst hätte ich es
01:03:02.209 --> 01:03:06.119
jetzt einfach mal so "Rechtsklick
veröffentlichen" gemacht. Ich würde es mir
01:03:06.119 --> 01:03:11.089
jetzt mal nochmal genauer anschauen, was
ich machen darf und so weiter. Gerade
01:03:11.089 --> 01:03:14.630
"hydrated Tweets" heißt das, also
sozusagen nicht nur Twitter-IDs zu haben,
01:03:14.630 --> 01:03:17.469
sondern wirklich eine große csv-Datei oder
sowas, die man dann sich in Excel mal
01:03:17.469 --> 01:03:20.930
durchklicken kann, kann glaube ich bei dem
ein oder anderen, der da frisch mit dem
01:03:20.930 --> 01:03:25.339
Thema ist schon weiterhelfen. Muss ich
halt mal kucken in den nächsten Tagen. Und
01:03:25.339 --> 01:03:29.329
die zweite Frage war, inwieweit
zweitausend Accounts einen Einfluss haben?
01:03:29.329 --> 01:03:33.150
F: Genau, vielleicht ein bisschen Kontext
geben. Ist das irgendwie besonders viel
01:03:33.150 --> 01:03:37.439
oder ist das üblich oder findest du das
eine relavante Größe? Wieso müssen wir
01:03:37.439 --> 01:03:41.029
über 2.000 reden, weil mir kommt es
intuitiv nicht so viel vor, frage ich
01:03:41.029 --> 01:03:44.299
mich. Bei 80 Millionen Leuten sind 2.000
Leute nicht so.
01:03:44.299 --> 01:03:48.620
A: Das ist halt auch ein klassisches
wichtiges Argument. Ich meine, erstens es
01:03:48.620 --> 01:03:51.920
sind nicht alle Leute in sozialen
Netzwerken, dann sind eine Menge Leute in
01:03:51.920 --> 01:03:55.829
Facebook. Es ist nur ein winzig kleiner
Teil davon auf Twitter und inwieweit da
01:03:55.829 --> 01:04:00.150
dann irgendwie 2.000 Leute tatsächlich
einen Impact haben auf einen politischen
01:04:00.150 --> 01:04:04.819
Diskurs in Deutschand, da wird dann immer
gesagt: ja aber in den sozialen Netzwerken
01:04:04.819 --> 01:04:09.500
sind aber die Aktivisten, die Journalisten
usw. und wenn die beeinflusst werden,
01:04:09.500 --> 01:04:16.230
irgendwie sowas. Tatsächlich halte ich die
Twitter-Diskussion nicht für politisch,
01:04:16.230 --> 01:04:18.679
gesellschaftlich relevant in Deutschland.
F: Lachen
01:04:18.679 --> 01:04:21.069
H: So, eine Frage schaffen wir noch. Das
ist die 4.
01:04:21.069 --> 01:04:30.269
Frage M4: Hallo! Erst kurz Danke, weil
Dein Projekt mir im Studium, mich ziemlich
01:04:30.269 --> 01:04:40.269
gerettet hat, also Danke. Und dann ist mir
halt aufgefallen, gerade bei diesen Troll-
01:04:40.269 --> 01:04:46.959
Armeen, keine Ahnung, diese bezahlten, ob
Du mal gekuckt hast in den Accounts, wie
01:04:46.959 --> 01:04:52.509
oft sich besitmmte Sachen wiederholen? Zum
Beispiel haben die ja oft dasselbe
01:04:52.509 --> 01:04:58.729
Profilbild und dann Accounts mit
fortlaufenden Nummern, wenn der erste
01:04:58.729 --> 01:05:02.629
gelöscht wird oder gesperrt?
A: Dieses Phänomen sieht man auch
01:05:02.629 --> 01:05:06.469
generell. Das sieht man auch bei wütenden
Bürgern, die in den sozialen Netzwerken
01:05:06.469 --> 01:05:10.199
sind. Dann von beispielsweise Twitter
gesperrt werden, dann wieder rauf kommen
01:05:10.199 --> 01:05:13.789
und dann packen sie sich hinter ihren
alten Usernamen einfach noch eine Zahl
01:05:13.789 --> 01:05:17.739
hinten dran. Aber ob die Leute tatsächlich
bezahlt werden oder nicht, das kriege ich
01:05:17.739 --> 01:05:21.510
über eine Twitter-API auch nicht heraus.
Eigentlich müsste man dann fast wie ein
01:05:21.510 --> 01:05:26.059
Ethnologe sich mit den Leuten unterhalten
und kucken, was sie da für eine Agenda
01:05:26.059 --> 01:05:31.660
haben. Ich finde es aber gefährlich dann
von vornherein zu sagen, die sind bezaht
01:05:31.660 --> 01:05:35.729
oder sind vom Kreml gesteuert oder sind
künstliche Intelligenzen oder keine Ahnung
01:05:35.729 --> 01:05:39.459
was. Das muss auf jeden Fall wieder eine
Debatte sein, die auf evidenzbasierter
01:05:39.459 --> 01:05:42.323
Forschung basiert.
F: Ja ich hab die auch nur. Bin ich noch
01:05:42.323 --> 01:05:44.150
da?
H: Ja.
01:05:44.150 --> 01:05:52.219
F: Ich hab die auch nur zufällig gefunden,
weil ich das halt gemacht hab damals zur
01:05:52.219 --> 01:05:58.920
Türkei-Wahl und es halt sehr viele
Accounts gab, die immer so türkischen Spam
01:05:58.920 --> 01:06:03.309
gepostet haben, sich dann aber plötzlich
in sehr schlechtem Deutsch in deutsche
01:06:03.309 --> 01:06:06.600
Debatten eingemischt hatten.
A: Super, dann sollten wir auf jeden Fall
01:06:06.600 --> 01:06:09.679
mal unterhalten, ich glaube da können wir
uns gegenseitig helfen.
01:06:09.679 --> 01:06:13.440
H: Unterhalten könnt ihr euch gleich neben
der Bühne, die Zeit ist nämlich jetzt
01:06:13.440 --> 01:06:17.563
leider um. Vielen Dank Michael Kreil! Da
geht mehr!
01:06:17.563 --> 01:06:25.709
Applaus
01:06:25.709 --> 01:06:30.999
Abspannmusik
01:06:30.999 --> 01:06:42.769
Untertitel erstellt von c3subtitles.de
im Jahr 2019. Mach mit und hilf uns!