WEBVTT 00:00:00.140 --> 00:00:14.856 Intro Musik 00:00:14.856 --> 00:00:18.720 Herald: Ihr findet das ja wahrscheinlich alle völlig normal mit großen Datenmengen 00:00:18.720 --> 00:00:23.710 umzugehen. So Typen wie ich, die herkömmliche Journalisten sind, ich bin im 00:00:23.710 --> 00:00:27.339 Hauptberuf Hörfunkjournalist, die verzweifeln regelmäßig daran. Also wir 00:00:27.339 --> 00:00:30.790 haben gelernt, damals, Leute zu fragen, die sich mit irgendwas auskennen. 00:00:30.790 --> 00:00:33.012 Jetzt ist Leute fragen, die sich mit großen 00:00:33.012 --> 00:00:34.890 Datenmengen auskennen auch nicht unbedingt 00:00:34.890 --> 00:00:39.800 zielführend für unserein, dafür gibts aber neuerdings einen relativ frischen Beruf, 00:00:39.800 --> 00:00:43.800 dieser Beruf nennt sich Datenjournalist. Datenjournalisten sind diese Menschen, die 00:00:43.800 --> 00:00:47.140 aus aberwitzig großen Datenmengen Zusammenhänge rauspopeln und diese 00:00:47.140 --> 00:00:49.900 Zusammenhänge dann idealerweise auch noch so visualisieren, 00:00:49.900 --> 00:00:51.610 dass solche Noobs wie ich das dann 00:00:51.610 --> 00:00:54.679 auch verstehen und hinterher kompetent drüber reden können, oder 00:00:54.679 --> 00:00:57.829 jedenfalls so aussehen können, als würden sie kompetent drüber reden und einer der 00:00:57.829 --> 00:01:01.740 so Leute wie uns sehr dabei unterstützt, ist Datenjournalist. Das ist nämlich der 00:01:01.740 --> 00:01:06.341 Michael Kreil und seinen Vortrag seht ihr jetzt. Viel Spaß. 00:01:06.341 --> 00:01:16.880 Applaus Michael: Guten Morgen. Ihr habt gut 00:01:16.880 --> 00:01:23.209 geschlafen, ich nicht, weil erstens halte ich jetzt einen Vortrag vor vielen Leuten 00:01:23.209 --> 00:01:27.010 und zum anderen werde ich mich in ein-- mit einem Thema beschäftigen, das zu sehr 00:01:27.010 --> 00:01:30.640 hitzigen Debatten und Shitstorms geführt hat und da möchte ich auch nicht im 00:01:30.640 --> 00:01:36.860 Zentrum sein. Deswegen ist auch meine erste Folie der Disclaimer. Ich würde mich 00:01:36.860 --> 00:01:40.840 politisch als links einordnen. Ich distanziere mich hiermit ausdrücklich 00:01:40.840 --> 00:01:44.950 gegen jegliche Form von Rassismus, Sexismus, Antisemitismus, 00:01:44.950 --> 00:01:48.430 Fremdenfeindlichkeit, Islamfeindlichkeit und allgemein gegen jede Form von 00:01:48.430 --> 00:01:56.929 gruppenbezogener Menschlichkeit (Applaus) - Menschenfeindlichkeit. Und im Rahmen 00:01:56.929 --> 00:02:00.229 dieses Vortrags bin ich Wissenschaftler und Beobachter einer hitzigen 00:02:00.229 --> 00:02:04.080 Gesellschaftsdebatte und sehe mich somit der Neutralität verpflichtet. Ich möchte 00:02:04.080 --> 00:02:07.800 die Debatte beobachten und nicht Teil von ihr sein. Es geht also nicht um meine 00:02:07.800 --> 00:02:12.080 politische Position sondern um eine neutrale Analyse von Daten. Und dafür habe 00:02:12.080 --> 00:02:17.090 ich mal 150 Folien vorbereitet. Ich hab den Übersetzungsengeln schon Bier 00:02:17.090 --> 00:02:23.030 versprochen. Ähm ... genau, dann lass uns direkt reinschmeißen. Das erste ist die 00:02:23.030 --> 00:02:27.590 Methodik. Das möchte ich gerne nochmal vorher erzählen, damit die Leute auch 00:02:27.590 --> 00:02:31.658 wissen, wie es funktioniert und mir ist es auch wichtig, dass es reproduzierbar ist. 00:02:31.658 --> 00:02:37.850 Es gibt ne Twitter-API, in der man Status und Tweets abfragen kann, 00:02:37.850 --> 00:02:40.946 User abfragen kann, welche Listen veröffentlicht wurden. 00:02:40.946 --> 00:02:43.740 Man kann danach suchen, gucken, welche Follower sie haben 00:02:43.740 --> 00:02:47.164 und so weiter und so fort. Dann setzt man sich hin und dann baut man sich 00:02:47.164 --> 00:02:50.650 son Interface für die API, wenn man sich ein bisschen Mühe gibt, packt man 00:02:50.650 --> 00:02:54.430 auch noch einen Cache dazwischen. Das heißt wenn ich Anfragen an die Twitter-API 00:02:54.430 --> 00:02:57.780 stelle und eine Anfrage kommt zweimal, dann holt er sie aus der 00:02:57.780 --> 00:03:02.629 Datenbank und so weiter. Und wenn man sich richtig Mühe gibt und vielleicht auch ein 00:03:02.629 --> 00:03:07.730 paar Tage oder Wochen investiert, dann skaliert man das in einer Art und Weise, 00:03:07.730 --> 00:03:11.770 dass man nicht ein Interface hat, sondern ganz viele und jedes Einzelne davon steht 00:03:11.770 --> 00:03:15.710 für einen anderen Twitter-Nutzer. Die Idee ist, dass ich nicht als einzelner Nutzer 00:03:15.710 --> 00:03:19.489 abfrage, sondern ganz viele Nutzer können parallel die Twitter-API abfragen. Und 00:03:19.489 --> 00:03:25.909 darüber gibt es so eine Art Load-Balancer, der guckt ob-- sozusagen, wie die Last 00:03:25.909 --> 00:03:30.650 verteilt wird. Ziel der Aktion ist, die Twitter API ist nämlich limitiert. Ich 00:03:30.650 --> 00:03:34.439 kann wenn ich zum Beispiel wissen möchte, wer wie wem folgt, darf ich pro Minute 00:03:34.439 --> 00:03:39.940 durchschnittlich nur eine Anfrage stellen. Wenn aber ich von ganz vielen Leuten die 00:03:39.940 --> 00:03:44.470 Autorisierung habe, in deren Namen Anfragen zu stellen, darf ich entsprechend 00:03:44.470 --> 00:03:48.470 mehr Anfragen stellen. Das ist so eine Art demokratischer Prozess, finde ich da drin, 00:03:48.470 --> 00:03:53.970 dass die Ressourcen von Twitter aufgeteilt werden. Umso mehr Leute mich bei meiner 00:03:53.970 --> 00:03:58.010 API-Anfrage unterstützen, um so mehr Anfragen darf ich machen und umso mehr 00:03:58.010 --> 00:04:02.409 Last darf ich verursachen. Finde ich sehr spann-- sympathisch. Mein Kollege jetzt 00:04:02.409 --> 00:04:06.360 hat dann mal ein Interface aufgebaut, wo man einen Token spenden kann. Da klickt 00:04:06.360 --> 00:04:10.120 man da halt drauf und dann kriegt man-- kriegen wir sozusagen einen langen Code, 00:04:10.120 --> 00:04:13.840 der uns dann ermöglicht zusätzliche Anfragen an die API von Twitter zu 00:04:13.840 --> 00:04:18.880 stellen. Großes Danke geht hier nochmal an Logbuch Netzpolitik, insbesondere Tim und 00:04:18.880 --> 00:04:23.460 Linus, und natürlich an die fast 700 Spender und Spenderinnen, die uns Tokens 00:04:23.460 --> 00:04:29.110 zur Verfügung gestellt haben. Das war not- wendig, um große Datenmengen aus Twitter 00:04:29.110 --> 00:04:33.486 herauszuholen. Genau, damit kann ich dann sozusagen ... 00:04:33.486 --> 00:04:41.870 Applaus Schon bei mir zu Hause kann ich dann über 00:04:41.870 --> 00:04:46.390 Kabel Deutschland 10 Requests pro Sekunde absetzen, mal zum Vergleich, wenn ich 00:04:46.390 --> 00:04:50.550 jetzt zum Beispiel mal die Metadaten aller 330 Millionen Twitter-Accounts abfragen 00:04:50.550 --> 00:04:55.530 möchte, braucht man etwa vier Tage dafür. Das ist dann auch machbar, ohne die Tokens 00:04:55.530 --> 00:04:59.890 kann es sich um Monate oder sogar um Jahre handeln. Das mal so ein bisschen erklärt, 00:04:59.890 --> 00:05:04.100 technisch, wie das im Hintergrund funktioniert. Im Prinzip auch sehr stark 00:05:04.100 --> 00:05:10.110 auf Twitter fokussiert, die Analysen. Genau. Erstes Thema, Fake News. Fake News 00:05:10.110 --> 00:05:14.730 ist ein komplexes Thema. Ich habe jetzt mal eine Grafik übernommen von der 00:05:14.730 --> 00:05:18.550 Stiftung Neue Verantwortung, ich finde die haben da die besten Kategorisierungen 00:05:18.550 --> 00:05:23.290 gemacht, was Fake News sind und was Fake News nicht sind. Auf der linken Seite was 00:05:23.290 --> 00:05:27.260 nicht Fake News sind, ist schlechte Politik, also Fake News als politischer 00:05:27.260 --> 00:05:31.550 Kampfbegriff, zum Beispiel Trump gegen die New York Times oder so was, aber auch 00:05:31.550 --> 00:05:35.581 Satire sind keine Fake News, schlechter Journalismus, Clickbaiting oder auch 00:05:35.581 --> 00:05:41.070 Zeitungsenten sollen eigentlich nicht zu Fake News gezählt werden, Fake News sein-- 00:05:41.070 --> 00:05:49.760 oder sind gezielte Desinformation, falsch verstandene Inhalte und manipulierte 00:05:49.760 --> 00:05:53.320 Inhalte, also oft sieht man, dass zum Beispiel Bilder beschnitten sind oder 00:05:53.320 --> 00:06:00.100 retuschiert sind und so weiter oder völlig frei erfundene Inhalte. Ich habe leider 00:06:00.100 --> 00:06:03.780 nur ne Stunde Zeit, deswegen kann ich mich jetzt nicht mit mehreren Fake News- 00:06:03.780 --> 00:06:07.420 Wellen auseinandersetzen. Deswegen habe ich eine herausgenommen, die ich ganz 00:06:07.420 --> 00:06:14.241 typisch und eindrucksvoll fand und zwar die Fake News über eine Reisewarnung nach 00:06:14.241 --> 00:06:19.270 Schweden des Auswärtigen Amtes. Hier ist ein Tweet von der AfD Magdeburg, die sagt: 00:06:19.270 --> 00:06:22.780 „Das Auswärtige Amt - Erhöhte Terrorwarnstufe für Schweden. Das hat 00:06:22.780 --> 00:06:26.640 natürlich nichts mit irgendwas zu tun. Hashtag AfD wählen". Direkt danach-- naja 00:06:26.640 --> 00:06:32.700 nicht direkt danach, einige Stunden oder Tage später kam ein Tweet des Auswärtigen 00:06:32.700 --> 00:06:37.000 Amtes, die dann die Gegendarstellung veröffentlicht haben: „Es gibt keine 00:06:37.000 --> 00:06:42.360 Reisewarnung für Schweden. Hashtag Fake News". Fast 2000 Tweets wurden zu diesem 00:06:42.360 --> 00:06:46.290 Thema veröffentlicht und die kann ich jetzt nun mit diesem Twitter-Framework 00:06:46.290 --> 00:06:51.340 runterladen, analysieren und mir ein paar Visualisierungen dazu ausdenken. Ich hab 00:06:51.340 --> 00:06:56.750 mal die Eine gemacht, das ist jetzt ein Zeitstrahl. Auf der x-Achse sieht man die 00:06:56.750 --> 00:07:03.641 Zeit. Hier geht's vom 2. März bis zum-- 0 Uhr bis zum 9. März 0 Uhr. Oben, die 00:07:03.641 --> 00:07:08.140 Roten, das sind die Fake News-Verbreiter. Unten, das sind diejenigen, die die 00:07:08.140 --> 00:07:11.962 Gegendarstellungen verbreiten. Auf dem Zeitstrahl sind -- viel zu klein, das kann 00:07:11.962 --> 00:07:15.632 man jetzt drauf nicht sehen -- der Zeitpunkt, wann ein Tweet veröffentlicht 00:07:15.632 --> 00:07:17.310 wurde und wenn er retweetet wurde, 00:07:17.310 --> 00:07:18.840 kriegt er sozusagen einen Bogen, 00:07:18.840 --> 00:07:20.940 zu dem Zeitpunkt, wohin er retweetet wurde. 00:07:20.940 --> 00:07:21.890 Das hat den Vorteil, 00:07:21.890 --> 00:07:23.450 dass ich nicht nur sehe, wie viele Tweets 00:07:23.450 --> 00:07:25.180 veröffentlicht wurden, sondern auch sehen kann, 00:07:25.180 --> 00:07:26.800 welchen Impact dieser Tweet hat. 00:07:26.800 --> 00:07:28.970 Wenn er also, zum Beispiel veröffentlicht wird und keiner 00:07:28.970 --> 00:07:32.560 geht damit um, dann ist es halt nur ein Punkt, aber wenn es viele Leute retweeten, 00:07:32.560 --> 00:07:38.800 gibts dann halt große Bögen dazu. Das-- Den ersten Tweet, den ich finden konnte, 00:07:38.800 --> 00:07:44.180 zu der Fake News, dass es eine Reisewarnung nach Schweden gibt, war-- ist 00:07:44.180 --> 00:07:49.100 bereits am 28. September veröffentlicht worden, wurde aber nicht beachtet. Keine 00:07:49.100 --> 00:07:55.180 Favs, keine Retweets, obwohl der Account aktuell 481 Follower hat. Am--, im Februar 00:07:55.180 --> 00:08:01.960 gab es dann nochmal einen Tweet dazu. Der Account hat jetzt aber nur einen Follower 00:08:01.960 --> 00:08:05.520 und der Tweet hat keine Retweets. Das heißt also die Themen kamen schon mal 00:08:05.520 --> 00:08:11.650 vorher hoch, aber sie wurden nicht weitergetragen. Noch ein Beispiel aus dem 00:08:11.650 --> 00:08:16.850 1. März 2017. Also jetzt gehen wir mal rüber zu unserem Zeitstrahl, da gibt's 00:08:16.850 --> 00:08:24.570 dann den ersten, der dazu was twittert, einen Screenshot von einem Bot, der 00:08:24.570 --> 00:08:29.540 Reisewarnungen veröffentlicht. Der Tweet hat immerhin 6 Tweets und 6 Favs-- 6 00:08:29.540 --> 00:08:38.200 Retweets und 6 Favs erreicht und hat damit sozusagen den ersten kleinen Impact. Dann 00:08:38.200 --> 00:08:43.970 steigert es sich immer mehr, dann gibt's die Reisewarnung für Schweden mit 29 00:08:43.970 --> 00:08:48.460 Retweets. Der nächste Tweet, kann ich leider nicht mehr anzeigen, weil der 00:08:48.460 --> 00:08:52.330 Account inzwischen gesperrt wurde, das ist auch ein Phänomen, das man immer wieder 00:08:52.330 --> 00:08:56.311 sieht, dass in diesem Bereich Accounts gesperrt werden von Twitter. „Trump hatte 00:08:56.311 --> 00:09:02.440 recht, Auswärtiges Amt gibt Reisewarnung für Schweden heraus". Genau, und verweist 00:09:02.440 --> 00:09:11.380 auf einen Artikel von zuerst.de. 45 Retweets und es steigert sich immer mehr. 00:09:11.380 --> 00:09:20.700 „Doch nicht alles ruhig in Schweden". Holger Ewald. „Islamterror". Und dann zum 00:09:20.700 --> 00:09:25.630 Schluss die AfD Magdeburg mit--, die dann aufspringt und dann das erste AfD-Hashtag 00:09:25.630 --> 00:09:29.490 dran setzt und „Multikulturell scheint es nicht so richtig zu laufen in Schweden". 00:09:29.490 --> 00:09:33.330 Man sieht, dass es eine Steigerung gibt von fängt an mit Reisehinweisen und endet 00:09:33.330 --> 00:09:40.000 mit Islamterror. Ich springe jetzt mal ganz weit nach vorne zu den Antworten. 00:09:40.000 --> 00:09:44.370 Diejenigen, die also dann die Gegendarstellung veröffentlichen, da 00:09:44.370 --> 00:09:48.850 fing's, oder der Startschuss war da das Auswärtige Amt, die in einem-- die dann 00:09:48.850 --> 00:09:54.080 erklären, dass es sich um Fake News handelt und relativ schnell springen dann 00:09:54.080 --> 00:10:00.560 halt auch die Medien mit auf, die das sozusagen weiterverbreiten. Und zum 00:10:00.560 --> 00:10:06.630 Schluss sieht man den gesamten Zeitstrahl nochmal und das Interessante ist dabei, 00:10:06.630 --> 00:10:10.960 dass das Thema gar nicht sozusagen, dass ne Fake News veröffentlicht wird und dann 00:10:10.960 --> 00:10:14.750 schlägt die total ein und alle sind total empört, sondern man stottert sich 00:10:14.750 --> 00:10:18.710 sozusagen förmlich in die Fake News rein. Also es fängt klein an und dann werden sie 00:10:18.710 --> 00:10:24.870 nochmal weiter überspitzt und man hat eher den Eindruck, als ob da rumexperimentiert 00:10:24.870 --> 00:10:29.790 wird, bis das Netzwerk eine Resonanz hervorruft. Ich würde persönlich 00:10:29.790 --> 00:10:34.030 behaupten, Fake News sind eigentlich Meme, die sich im Internet verbreiten. Oft 00:10:34.030 --> 00:10:39.180 haben sie keine singuläre Quelle, sondern sie bilden sich erst im Netzwerk oder 00:10:39.180 --> 00:10:43.120 anders formuliert, das Kern-Phänomen an Fake News ist nicht deren Existenz, 00:10:43.120 --> 00:10:46.831 sondern, dass sie sich so gut verbreiten können, also das Problem ist nicht die 00:10:46.831 --> 00:10:52.880 Quelle, die sie erzeugt, sondern dass sie eine so große Resonanz im Netzwerk findet. 00:10:52.880 --> 00:10:57.500 Würde man also Fake-News-Quellen verbieten, würden sie trotzdem weiterhin 00:10:57.500 --> 00:11:02.271 entstehen, im Netzwerk. Und das ist halt wichtig, da Fake News als Meme eine große 00:11:02.271 --> 00:11:06.350 Reichweite haben, kann man aus ihnen Kapital schlagen, politisches oder 00:11:06.350 --> 00:11:10.290 monetäres Kapital. Und da möchte ich mal aus dem amerikanischen Raum, zum Beispiel 00:11:10.290 --> 00:11:15.680 Breitband News und-- Breitbart News und Trump erwähnen, die monetäres Kapital oder 00:11:15.680 --> 00:11:20.280 politisches Kapital daraus schlagen. Aber zurück zu den Reisewarnungen. Man kann 00:11:20.280 --> 00:11:25.970 sie nicht nur im zeitlichen Verlauf sich anschauen, sondern man kann tiefer 00:11:25.970 --> 00:11:29.380 einsteigen. Man kann halt gucken, welche Accounts haben denn jetzt die 00:11:29.380 --> 00:11:33.500 Gegendarstellungen und die Fake News verbreitet und kann gucken, wie die sich 00:11:33.500 --> 00:11:41.990 gegenseitig folgen. Und daraus baut man dann so ein Netzwerk. Die Blauen sind die 00:11:41.990 --> 00:11:47.000 Gegendarstellungensverbreiter und die Roten sind die Fake-News-Verbreiter. Um so 00:11:47.000 --> 00:11:51.060 näher sie grafisch dargestellt werden, umso also-- folgen die sich. Also 00:11:51.060 --> 00:11:54.890 sozusagen, alle Kugel stoßen sich ab und die, die sich folgen, ziehen sich an und 00:11:54.890 --> 00:11:58.570 daraus kann man halt solche komplexen Netzwerke grafisch darstellen. Das 00:11:58.570 --> 00:12:03.060 Interessante ist, dass die Fake-News- Verbreiter sich in einer Gruppe fast 00:12:03.060 --> 00:12:10.440 außerhalb befinden und eigentlich nur noch über die Massenmedien verbunden sind mit 00:12:10.440 --> 00:12:14.860 der Gesellschaft. Man sieht natürlich auch noch Tendenzen, dass viele Fake-News- 00:12:14.860 --> 00:12:18.280 Verbreiter dann mit Lügenpresse usw. versuchen sich weiter von diesen-- 00:12:18.280 --> 00:12:23.080 von den Medien zu distanzieren. Aber tatsächlich sind es zwei verschiedene 00:12:23.080 --> 00:12:28.840 Gruppen, die man hier sehen kann und das erste Mal, als ich das Bild gesehen habe, 00:12:28.840 --> 00:12:32.310 habe ich gedacht: "Oh, das ist eine Filterblase oder eine Echokammer oder 00:12:32.310 --> 00:12:37.930 sowas." Das Schöne ist, weil wir mit Twitter-APIs tiefer in die Daten rein- 00:12:37.930 --> 00:12:44.310 gucken können, können wir von jedem ein-- die die Timeline rekonstruieren. Also ich 00:12:44.310 --> 00:12:49.800 hab jetzt mal so schematisch dargestellt die Gegendarsteller und die Fake-News- 00:12:49.800 --> 00:12:55.830 Verbreiter und man sieht, dass von den Fake-News-Verbreitern 89% die 00:12:55.830 --> 00:13:00.980 Gegendarstellungen mitbekommen haben, aber sie nicht weiter teilen. Und nur 45% 00:13:00.980 --> 00:13:04.020 derjenigen, die die Gegendarstellung verbreitet haben, haben 00:13:04.020 --> 00:13:07.710 die tatsächliche ursprüngliche Fake News eigentlich mitbekommen. Das Ergebnis 00:13:07.710 --> 00:13:14.211 daraus ist, es gibt eine Filterblase und zwar bekommen wir die Fake News nicht mit. 00:13:14.211 --> 00:13:18.400 Gelächter Was ist jetzt eigentlich tatsächlich 00:13:18.400 --> 00:13:23.220 dieser Impact dieser Gruppe. Und dann hab' ich ganz ganz schweres Geschütz 00:13:23.220 --> 00:13:27.780 aufgefahren und habe 1,6 Millionen Twitter-Accounts, die angegeben haben, 00:13:27.780 --> 00:13:31.780 dass sie Deutsch sprechen, extrahiert und geguckt, wie die sich gegenseitig folgen. 00:13:31.780 --> 00:13:35.670 Also ähnlich wie diese Filterblasengrafik gerade sieht man hier jetzt das gesamte 00:13:35.670 --> 00:13:39.432 deutschsprachige Twitternetzwerk, eingefärbt nach Herkunftsland. Also hier 00:13:39.432 --> 00:13:43.090 unten haben wir die Schweiz und da haben wir Österreich, wenn man ein bisschen 00:13:43.090 --> 00:13:45.589 klickt, sieht man das so wer sich dahinter befindet. 00:13:45.589 --> 00:13:46.836 Und das Schöne ist, ... 00:13:46.836 --> 00:13:50.090 das ist son Tool was ich gebastelt habe Man kann das unterschiedlich einfärben. 00:13:50.090 --> 00:13:54.160 Hier kann man zum Beispiel mal das Alter des Accounts einfärben. Rot 00:13:54.160 --> 00:13:57.810 sind die alten, grün sind die eher neueren Accounts. Hier oben sind die 00:13:57.810 --> 00:14:02.770 Jugendlichen, da ist viel Justin Bieber und YouTube und Let's Play dabei. Hier 00:14:02.770 --> 00:14:09.120 haben wir eine Blase, die sich mit Porn beschäftigt (Lachen), nicht drauf klicken. 00:14:09.120 --> 00:14:13.470 Hier haben wir eine Gruppe, die sich mit Marketing beschäftigt, so würde ich das 00:14:13.470 --> 00:14:19.350 mal umschreiben, größtenteils SEO und keine Ahnung was. Und das sind die Leute, 00:14:19.350 --> 00:14:23.320 die sich eigentlich mit Politik und Medien beschäftigen und vielleicht auch die, die 00:14:23.320 --> 00:14:26.750 jetzt hier auch hier im Raum auf Twitter sind, wahrscheinlich am meisten 00:14:26.750 --> 00:14:32.220 mitbekommen. Man kann aber diese Grafik auch anders einfärben und zwar kann ich 00:14:32.220 --> 00:14:38.880 mal einfärben, welche Bundestagsabgeordneten oder Kandidaten von 00:14:38.880 --> 00:14:42.571 Parteien wo sich in diesem Netzwerk befinden und entsprechend einfärben. Und 00:14:42.571 --> 00:14:48.460 man sieht zum Beispiel Gelb FDP, Schwarz, Rot, Grün, Blau, Rot, Grün befinden sich 00:14:48.460 --> 00:14:53.541 alle so in einer verteilten Gruppe und es gibt eine sehr enge Gruppe aus Leuten, die 00:14:53.541 --> 00:14:59.390 Mitglieder der AfD sind und auf Twitter aktiv sind. Ich vergrößer das mal so ein 00:14:59.390 --> 00:15:03.030 bisschen. Und jetzt verändere ich wieder diese Färbung und zwar als erstes 00:15:03.030 --> 00:15:06.815 die Fake-News-Verbreiter. Ja. Gelächter 00:15:06.815 --> 00:15:15.029 Der Witz ist. Applaus 00:15:15.029 --> 00:15:18.630 Der Witz ist, dass es nicht die AfD- Abgeordneten selber sind, die das Fake- 00:15:18.630 --> 00:15:22.540 News verbreiten, aber sie befinden sich in einer gleichen Gruppe da drin. Man kann 00:15:22.540 --> 00:15:26.590 auch einfärben nach Alter. Man sieht, dass die Accounts dieser Gruppe eher jung sind, 00:15:26.590 --> 00:15:31.820 also relativ frisch auf Twitter. Sie haben eine sehr hohe Aktivität. Rot heißt viele 00:15:31.820 --> 00:15:35.410 Tweets pro Tag veröffentlicht werden. Und man kann von dieser Gruppe auch 00:15:35.410 --> 00:15:40.190 schauen, welche typischen Begriffe sie verwenden, um zu vergleichen, mit was das 00:15:40.190 --> 00:15:44.161 restliche Twitter-Netzwerk für Begriffe verwendet. Und die Begriffe, die am 00:15:44.161 --> 00:15:47.920 häufigsten in dieser Gruppe verwendet werden, im Vergleich zu anderen 00:15:47.920 --> 00:15:52.430 Twitter-Accounts, sind Islam, Deutschland, Migranten, Merkel, Maas, Politik, 00:15:52.430 --> 00:15:56.990 Freiheitskampf, Flüchtlinge, SPD, Netzdurchsetzungsgesetz, NPD, Antifa, 00:15:56.990 --> 00:16:02.910 Zensur, PEGIDA, Syrer, Asylbewerber. Man sieht relativ klar, dass diese Gruppe auch 00:16:02.910 --> 00:16:07.890 eher monothematisch unterwegs ist. Also, was ist das für eine Gruppe? Und ich sehe 00:16:07.890 --> 00:16:13.480 wir müssen uns beeilen. Sie sind relativ neu auf Twitter. Sie stehen der AfD nah. 00:16:13.480 --> 00:16:19.740 Sie teilen oft Fake News. Sie sind auf Twitter sehr aktiv. Und sie befassen sich 00:16:19.740 --> 00:16:25.870 fast monothematisch mit Migrations- und Asylpolitik. Und ich komme auf diese 00:16:25.870 --> 00:16:30.470 Gruppe wieder zurück, denn den ersten- die erste Theorie, die man jetzt reinwerfen 00:16:30.470 --> 00:16:37.399 würde, sind Social Bots. Und da es in diesem Vortrag auch darum geht, ist der 00:16:37.399 --> 00:16:42.120 nächste Block sich mal das Thema Social Bots genauer anzuschauen. Zu Social Bots 00:16:42.120 --> 00:16:46.930 wurde eine Menge veröffentlicht, auch in den Medien. „Warum Meinungsroboter die 00:16:46.930 --> 00:16:50.930 Gefahr für die Demokratie werden.“, „Digitale Dreckschleudern“, „Angriff der 00:16:50.930 --> 00:16:57.940 Meinungsroboter“. Jeder hat da irgendwie auch seine Meinung und seine Gefahr 00:16:57.940 --> 00:17:02.460 hervorgebracht. Was sind eigentlich Social Bots? Es gibt aus dem Büro für 00:17:02.460 --> 00:17:06.920 Technikfolgen-Abschätzung beim Deutschen Bundestag einen Absatz, den ich mal 00:17:06.920 --> 00:17:10.609 herausgegriffen habe. Social Bots, die Computerprogramme, die uns irgendwie in 00:17:10.609 --> 00:17:14.769 den sozialen Medien manipulieren können. „Echte Menschen, die mit dem Social Bot 00:17:14.769 --> 00:17:18.556 kommunizieren, nehmen diese nicht als durch Algorithmen ausgelöste automatische 00:17:18.556 --> 00:17:22.120 Kommunikation, sondern als echte Internet- teilnehmer wahr und sind sich der 00:17:22.120 --> 00:17:26.270 Manipulation nicht bewusst." Konkret, was diese Social Bots angeblich machen sollen 00:17:26.270 --> 00:17:31.040 können, sind, sie können den Turing-Test bestehen. Das heißt, Die Idee eines Turing 00:17:31.040 --> 00:17:35.080 Tests ist, ich interagiere mit etwas und kann hinterher sagen, 00:17:35.080 --> 00:17:37.000 ob es ein Mensch, oder ein Computer ist. 00:17:37.000 --> 00:17:40.420 Und diese Social Bots sollen jetzt magischer Weise diesen Turing-Test 00:17:40.420 --> 00:17:44.690 bestehen können und können nicht nur so tun als wären sie ein Mensch, sondern sie 00:17:44.690 --> 00:17:49.220 können angeblich sogar noch unsere Meinung beeinflussen. Naja, zumindest hat der 00:17:49.220 --> 00:17:50.490 Bundestag veröffentlicht: 00:17:50.490 --> 00:17:53.448 "Wirkung von Social Bots ist unter Sachverständigen strittig." 00:17:53.448 --> 00:17:57.800 Ich hab mal extra das vorgespult, wo Linus Neumann zu sehen ist. Aber, da ich 00:17:57.800 --> 00:18:01.900 ja so ein Framework habe, kann ich jetzt auch selber mal reinschauen. Was sind denn 00:18:01.900 --> 00:18:05.820 diese Social Bots? Da kommt man schnell in so einen Teufelskreis. Wenn ich Social 00:18:05.820 --> 00:18:10.800 Bots auf Twitter finden möchte, dann muss ich sie erstmal suchen. Und dazu muss ich 00:18:10.800 --> 00:18:14.660 erst mal wissen, wie sie denn eigentlich aussehen. Und um zu wissen, wie sie 00:18:14.660 --> 00:18:18.050 aussehen, muss ich sie erst mal analysieren können und dazu brauche ich 00:18:18.050 --> 00:18:21.940 erst mal welche. Also, zu sagen „Okay, da gibts irgendwelche.", das bringt nichts. 00:18:21.940 --> 00:18:27.000 Ich muss entweder eine Gruppe haben, um sie analysieren zu können, damit ich die 00:18:27.000 --> 00:18:30.610 Eigenschaften rauskriegen kann, oder andersrum. Und diesen Teufelskreis 00:18:30.610 --> 00:18:34.210 durchbrechen, gibt unterschiedliche Möglichkeiten. Ich habe mich mal für den 00:18:34.210 --> 00:18:38.670 folgenden Weg entschlossen. Ich kaufe jetzt einfach mal Social Bots. 00:18:38.670 --> 00:18:39.795 Gelächter 00:18:40.030 --> 00:18:42.740 Kleine Anmerkung, Moment, Moment. 00:18:42.750 --> 00:18:45.429 Es sind nicht wirklich Social Bots im dem engeren Sinne, 00:18:45.429 --> 00:18:49.920 sondern ich hab mir einfach 4.500 Bots gekauft. Ob die jetzt tatsächlich dann 00:18:49.920 --> 00:18:53.620 auch mit den Leuten sozial interagieren usw., weiß ich ja nicht. Aber im 00:18:53.620 --> 00:18:57.610 Kern hab ich mir einen Twitter-Account Software Team Berlin geholt. Habe keinem 00:18:57.610 --> 00:19:01.309 gesagt, damit ich also weiß, dass kein realer Mensch diesem Account folgt und 00:19:01.309 --> 00:19:06.530 habe dann auf Google gesucht „buy Twitter Bots". Genau. Und dann gibt's dann 4.500 00:19:06.530 --> 00:19:09.870 Follower und davon sind 100% Bots. Das ist nur um zu gucken, welche 00:19:09.870 --> 00:19:13.870 Technologien werden dann eingesetzt, obs dann Follower Bots sind usw. Um zu 00:19:13.870 --> 00:19:17.820 gucken, sehe ich dann bestimmte Eigenschaften, die ich bei Menschen nicht 00:19:17.820 --> 00:19:24.309 sehe. Also sozusagen eher eine Trockenübung, ja. Also wieder das große 00:19:24.309 --> 00:19:28.220 Twitter-Framework draufgeworfen und die Metadaten analysiert. Und raus kommt 00:19:28.220 --> 00:19:35.050 folgende Grafik: Jeder einzelne Punkt ist eines dieser eingekauften Follower. 4.500 00:19:35.050 --> 00:19:39.190 Punkte, und ich weiß 100 % Bots dabei. Und ich versuche die nun zu 00:19:39.190 --> 00:19:43.181 sortieren nach ihren Eigenschaften. Alles, was eher wie ein Bot aussieht, ist auf der 00:19:43.181 --> 00:19:47.007 linken Seite und alles ,was eher wie ein Mensch aussieht, auf der rechten Seite. 00:19:47.007 --> 00:19:50.280 Ich kann jetzt auf die einzelnen drauf klicken; ich klicke jetzt mal auf den ganz 00:19:50.280 --> 00:19:56.370 linken unteren drauf, dann hab ich einen Asus D5B23, und habe unterschiedliche 00:19:56.370 --> 00:20:00.340 Eigenschaften von dem, die ich von ihm überprüft habe, wie zum Beispiel, ob er 00:20:00.340 --> 00:20:06.510 immer noch sozusagen ein Egg ist, also ob er noch gar kein Avatar Bild hochgeladen 00:20:06.510 --> 00:20:12.799 hat, ob er weniger als 10 Follower hat, wieviele Favs er hat, abgesetzt hat. Ob er 00:20:12.799 --> 00:20:18.640 noch gar keine Beschreibungstext für sich angegeben hat und ob er keine Zeitzone 00:20:18.640 --> 00:20:21.890 angegeben hat. Also so die ganzen Metadaten, die man halt aus Twitter 00:20:21.890 --> 00:20:24.010 herausbekommt zum analysieren, um zu gucken, 00:20:24.010 --> 00:20:26.640 ob die sich denn irgendwie strukturieren und gruppieren. 00:20:26.640 --> 00:20:29.469 Man sieht auch ganz links, das sind so ein Bisschen die sehr 00:20:29.469 --> 00:20:33.380 dummen Bots. Die sind jung und teilweise tun sie auch gar nichts, sondern folgen 00:20:33.380 --> 00:20:36.810 nur Leuten. Dann gibt es einen großen und breiten Bereich, teilweise sehr 00:20:36.810 --> 00:20:41.620 realistische Bots dabei, teilweise sind es sogar reale Accounts die verwaist sind, 00:20:41.620 --> 00:20:45.960 also die seit drei Jahren inaktiv sind und auf irgendeiner Art, also aus irgendeinem 00:20:45.960 --> 00:20:49.650 Grund übernommen wurden. Wahrscheinlich hat sich da einer mal mit Passwort 00:20:49.650 --> 00:20:54.950 durchprobieren massenhaft versucht verwaiste Accounts zu übernehmen. Und 00:20:54.950 --> 00:20:58.570 die dritte, und das fand ich sehr interessant, das sind Accounts die 00:20:58.570 --> 00:21:03.000 teilweise sogar verifizierte Menschen sind. Also ich habe jetzt mal schonmal 00:21:03.000 --> 00:21:10.250 Peggy, die ist Moderatorin aus den Staaten irgendwo, Jeff Zausch ist ein Survival 00:21:10.250 --> 00:21:15.430 Spezialist und Chris Glorioso. Das sind, das sind reale Personen, die mir gefolgt 00:21:15.430 --> 00:21:19.570 sind weil ich dafür bezahlt habe, als Bot, und das fand ich sehr merkwürdig. Ich habe 00:21:19.570 --> 00:21:22.650 versucht mit den Leuten Kontakt aufzunehmen; nicht alle haben mir 00:21:22.650 --> 00:21:26.300 geantwortet. Der Grund dafür ist, dass ihr Account gehijacked wurde und sie haben 00:21:26.300 --> 00:21:29.280 dann eigentlich nur noch DMs von irgendwelchen fremden Accounts bekommen. 00:21:29.280 --> 00:21:32.670 Die haben auf DMS auch gar nicht mehr so richtig reagiert. Ich habe auch versucht 00:21:32.670 --> 00:21:37.320 herauszubekommen, auf welchem Wege das passiert ist – ob sie sich dort irgendwie 00:21:37.320 --> 00:21:42.440 einen Twitter Service eingetreten haben der in ihrem Namen postet. Ich weiß es 00:21:42.440 --> 00:21:46.640 nicht. Laut eigenen Aussagen ging es dann aber weniger um politische Inhalte, 00:21:46.640 --> 00:21:50.290 sondern Zitat, es war eher "Sex Scheisse" die dann in ihren Twitter Timelines 00:21:50.290 --> 00:21:53.890 veröffentlicht wurde. Was ich aber spannend finde, ist wenn man so eine CDU 00:21:53.890 --> 00:21:57.770 Forderung, Kennzeichnung von Social Bots. Ja was ist denn, wenn der eigene Account 00:21:57.770 --> 00:22:01.940 übernommen wurde. Also der wird dann, der eigene Account ist mit einmal halb 00:22:01.940 --> 00:22:06.110 automatisiert, ob man es will oder nicht. Eine Fragestellung die ich dann auch 00:22:06.110 --> 00:22:10.820 nochmal jetzt kurz im Vortrag hatte weil die Daten ja jetzt 11 Monate alt sind: 00:22:10.820 --> 00:22:15.640 Welche Accounts gibts denn heute noch? Und man sieht grün, die Accounts gibt's heute 00:22:15.640 --> 00:22:20.090 noch, elf, gelb sind die Accounts die in der Zwischenzeit von Twitter gesperrt 00:22:20.090 --> 00:22:25.350 wurden, und rot die Accounts die von sich aus sich gelöscht haben. Genau. Also man 00:22:25.350 --> 00:22:29.930 sieht zumindest dass da Bewegung von Seiten Twitter passiert. Was man jetzt an 00:22:29.930 --> 00:22:33.690 diesen Bots auch noch analysieren kann, ist die Follower Netzwerke, wie die sich 00:22:33.700 --> 00:22:39.951 also gegenseitig folgen. Da habe ich mal folgende Grafik gemacht. Das sind so die 00:22:39.951 --> 00:22:45.390 4.5 Tausend Bots und wem sie folgen und von wem sie gefolgt werden. Rot 00:22:45.390 --> 00:22:52.820 Trinken rot sind die Bots, 4.5 Tausend, und blau sind die anderen Nutzer, andere 00:22:52.820 --> 00:22:56.700 Accounts oder so weiter. Da kann man auch mal ein Bisschen rein zoomen hier, sieht 00:22:56.700 --> 00:23:05.710 auch ganz hübsch aus. Fast wie fliegende Spaghetti Monster, fand ich. Die Blauen, 00:23:05.710 --> 00:23:10.970 das scheinen mir Jugendliche zu sein, die sich einfach Twitter-Bots oder Follower 00:23:10.970 --> 00:23:14.260 gekauft haben, was eigentlich ganz interessant ist dass ich dann damit 00:23:14.260 --> 00:23:17.860 eigentlich die Kunden die analysieren kann. Wobei man vorsichtig sein muss, 00:23:17.860 --> 00:23:22.730 jemandem 10,000 Bots oder Follower künstlich anzuhängen ist halt relativ 00:23:22.730 --> 00:23:27.730 einfach zu machen und ist auch gar nicht so teuer. 50,000 Bots gibt es so für 60 00:23:27.730 --> 00:23:35.230 Dollar. Wie könnte man Bots noch erkennen? Und da gibt es halt so eine 00:23:35.230 --> 00:23:39.670 Tweet-App Analyse. Ich weiß nicht ob ihr euch noch erinnern könnt, vor einigen 00:23:39.670 --> 00:23:44.260 Jahren stand unter jedem Tweet noch drunter, mit welcher App man diesen Tweet 00:23:44.260 --> 00:23:49.040 veröffentlicht hat. Das steht leider jetzt nicht mehr drunter, aber die Daten sind 00:23:49.040 --> 00:23:54.431 noch in der API drin. So sieht übrigens so eine API Antwort von Twitter aus, und da 00:23:54.431 --> 00:23:59.050 steht unter anderem auch Source drin, d.h. also mit welchem Service man das 00:23:59.050 --> 00:24:02.850 veröffentlicht hat. Habe ich mal über die Bots rüber laufen lassen. Twitter für 00:24:02.850 --> 00:24:07.930 iPhone, Android, Web Client, aber auch Facebook, die automatisch dann sozusagen 00:24:07.930 --> 00:24:12.000 das heisst den Post als Tweet veröffentlichen und Instagram. Und 00:24:12.000 --> 00:24:17.620 interessant fand ich halt 350 weitere Services, ja. So sehen die aus. Genau. 00:24:17.620 --> 00:24:24.730 Also es ist ein riesen Potpourri, Koreanisch Japanisch alles dabei. Genau. 00:24:24.730 --> 00:24:29.410 Das war mir ja auch gar nicht so richtig klar vorher, dass es eigentlich ein 00:24:29.410 --> 00:24:33.850 riesiges enormes Ökosystem gibt von Skripten die auf Twitter Sachen 00:24:33.850 --> 00:24:42.461 veröffentlichen. Und wie gesagt, halt in meiner Probe sind es allein 350. Um den 00:24:42.461 --> 00:24:47.049 Leuten auch zu zeigen, was das denn jetzt eigentlich für Services sind, die dahinter 00:24:47.049 --> 00:24:50.530 stecken, habe ich mal so ein paar herausgegriffen. Hier ist zum Beispiel 00:24:50.530 --> 00:24:54.870 FeedBlitz. Das ist eigentlich ein Bot der nichts weiter macht als einen RSS Feed in 00:24:54.870 --> 00:25:00.110 Twitter zu posten. Haben wir twittbot.net, das ist irgendwie was selber gebasteltes. 00:25:00.110 --> 00:25:04.170 Der twittert aber irgendwie nur Käse, das hat sich wahrscheinlich einer mal ein 00:25:04.170 --> 00:25:07.900 Bisschen herumexperimentiert oder sowas. Es gibt aber auch den Kim Kardashian: 00:25:07.900 --> 00:25:12.000 Hollywood Service, der dir dann wahrscheinlich die neuen Spielestände 00:25:12.000 --> 00:25:17.860 veröffentlich. Interessant fand ich auch, es gab 9 gelöschte Services, die 00:25:17.860 --> 00:25:21.390 dann umbenannt wurden in "Erased" und eine lange Nummer. Ich würde mich mal 00:25:21.390 --> 00:25:25.090 interessieren ob die Nummer fortlaufend ist, denn sie endet mit 5.6 Millionen. 00:25:25.090 --> 00:25:29.530 Sind das jetzt 5.6 Millionen gelöschte Services, oder sind insgesamt bei Twitter 00:25:29.530 --> 00:25:33.410 schon 5.6 Millionen angemeldet worden. Ich weiß es nicht. Aber wir können darüber 00:25:33.410 --> 00:25:37.470 sprechen oder wir können sagen, dass auf Twitter nicht mehr nur Menschen unterwegs 00:25:37.470 --> 00:25:42.860 sind sondern halt auch Services die wir nutzen. Genau. Bots sind auch nicht nur 00:25:42.860 --> 00:25:46.110 böse. Ich habe mal ein paar herausgegriffen. Ich weiß nicht ob jemand 00:25:46.110 --> 00:25:51.840 die Rathausuhr Neukölln kennt. Applaus & Lachen Ist der Entwickler da? Nein. Der 00:25:51.840 --> 00:25:56.280 Entwickler der das Rathaus Uhrwerk Neukölln als Service benutzt, also der 00:25:56.280 --> 00:26:05.090 veröffentlicht sowas wie acht bämm bämm bämm bämm bämm bämm bämm bämm. 00:26:05.090 --> 00:26:08.900 Vor kurzem bin ich übrigens auf den Wichser Bot gestoßen. Wenn man einen Tweet 00:26:08.900 --> 00:26:12.880 veröffentlicht wo das Wort Wichser drin vorkommt, dann retweetet der einen. 00:26:12.880 --> 00:26:20.170 Spiegelonline Top benutzt den Service if this than that, zu 100%, also nicht 00:26:20.170 --> 00:26:26.090 normal SpiegelOnline sondern Top. Und ZEIT ONLINE Digital hat sich auch einen Service 00:26:26.090 --> 00:26:30.020 gebaut, ich weiß nicht ob der eingekauft oder selbst entwickelt ist, aber der ist 00:26:30.020 --> 00:26:35.711 registriert als ZEIT ONLINE. Ich fasse zusammen: Woran könnte man Bots erkennen? 00:26:35.711 --> 00:26:40.669 Ist das Profil vollständig? Ist ein Avatar Bild und Beschreibungstext dran? Ist der 00:26:40.669 --> 00:26:47.460 Account Teil eines Netzwerkes? Von welcher App werden die Tweets abgeschickt und wie 00:26:47.460 --> 00:26:51.620 sehen die anderen Metadaten des Accounts oder der Tweets aus? Interessant ist, 00:26:51.620 --> 00:26:56.240 dass das aber alles Indizien Beweise sind. Wenn man anfängt, sich tatsächlich mal 00:26:56.240 --> 00:27:00.220 hinzusetzen und zu gucken, ist das nun ein Bot oder nicht, kommt man relativ schnell 00:27:00.220 --> 00:27:05.070 ins Grübeln. Jegliche Bot Erscheinung könnte auch gut menschlich erklärt sein 00:27:05.070 --> 00:27:07.249 und andersherum. Man kann aber auch 00:27:07.249 --> 00:27:09.599 rangehen, dass man jedes menschliche Verhalten in 00:27:09.599 --> 00:27:14.830 die Sphäre, das könnte und natürlich auch ein hochintelligente KI sein schien. 00:27:14.830 --> 00:27:18.471 Egal, auf jeden Fall mit diesem Kenntnisstand sag ich mal lasst uns jetzt 00:27:18.471 --> 00:27:22.440 mal Bots finden. Ich habe gesucht. Ich hab lange lange lange gesucht und ich kürz es 00:27:22.440 --> 00:27:28.480 mal ab mit: ich habe gefunden inaktive Accounts, Service Accounts, Trolle welche 00:27:28.480 --> 00:27:32.940 Teenager, Rassisten und Hater und Spam mit links zu YouTube Polen und Bitcoin schickt 00:27:32.940 --> 00:27:37.330 und so weiter. Aber was ich nicht gefunden habe ist diese politisch aktiven Social 00:27:37.330 --> 00:27:41.230 Bot Netzwerke, und dafür gibt es zwei Erklärungen: Entweder die gibts nicht oder 00:27:41.230 --> 00:27:49.640 Ich bin zu doof. Also fragen wir mal die Profis wie machen die das denn. Und einer 00:27:49.640 --> 00:27:55.160 davon ist zum Beispiel Professor Dr. Simon Hegelich, Forschungsfeld Political Data 00:27:55.160 --> 00:28:02.360 Science, Forschungsmethoden Machine Learning plus X. Ist das VELTINS, die mit 00:28:02.360 --> 00:28:07.429 plus X ist Alkohol, ne, ich weiß nicht, keine Ahnung. Der veröffentlicht Studien 00:28:07.429 --> 00:28:10.950 zum Beispiel für die Konrad-Adenauer- Stiftung mit dem Titel "Invasion der 00:28:10.950 --> 00:28:16.429 Meinungs-Roboter". Leider wird in dieser Studie die Methodik nicht beschrieben. 00:28:16.429 --> 00:28:21.299 Hegelich hatte selber damals mit Professor Dietmar Jaresko eine Studie veröffentlicht 00:28:21.299 --> 00:28:26.190 wo sie tatsächlich ein Bot-Netzwerk gefunden haben in der Ukraine. Was sie 00:28:26.190 --> 00:28:30.261 dabei identifizieren konnten ist dass diese Accounts unter einem Service 00:28:30.261 --> 00:28:36.210 "twifarm" prorussische Meldungen veröffentlicht haben, insgesamt 1740 Bots 00:28:36.210 --> 00:28:42.180 haben sie darunter gefunden. Und genau das ist auf jeden Fall, das kann man glaube 00:28:42.180 --> 00:28:46.690 ich sagen, ein Bot-Netzwerk, was dort in der Ukraine gefunden wurde. Aber wie sieht 00:28:46.690 --> 00:28:50.650 das eigentlich mit der deutschen Debatte aus? Und dazu hab ich, vielleicht habs ich 00:28:50.650 --> 00:28:54.200 auch nicht gefunden aber ich habe zumindest keine Studie von Prof. Hegelich 00:28:54.200 --> 00:28:58.030 dazu gefunden, mit einer nachprüfbaren Methodik. Was ich aber gefunden habe ist 00:28:58.030 --> 00:29:04.230 ein ZDF Bericht, ZDF Zoom "Alles nur Lüge? Wie im Netz getäuscht wird". Professor 00:29:04.230 --> 00:29:09.630 Simon Hegelich hatte hier die Aufgabe, aus Gigabytes an Daten Social Bots zu suchen. 00:29:09.630 --> 00:29:15.380 Und er hatte einen möglichen Kandidaten gefunden, und zwar Egon Dombrowski, der 00:29:15.380 --> 00:29:22.570 136 Posts am Tag veröffentlich mit ganz klarer Tendenz zu Pegida und AfD. Nun ist 00:29:22.570 --> 00:29:26.710 natürlich spannend: Ist das vielleicht ein gesteuerter Bot? Oder handelt es sich 00:29:26.710 --> 00:29:30.160 dabei um einen realen Menschen? Die Redaktion hat ihn einfach mal 00:29:30.160 --> 00:29:37.270 angeschrieben, und der potenzielle Social Bot heißt Egon Dombrowski. Ist 50 Jahre 00:29:37.270 --> 00:29:42.800 alt, berufsunfähig Rentner, lebt in Erfurt und war in einem Gemeinderat für die SPD. 00:29:42.800 --> 00:29:50.220 Und jetzt ist er auf Facebook sehr aktiv. Medien bezeichnet er als Propaganda- 00:29:50.220 --> 00:29:55.350 Presse, und er macht Werbung für die AfD und wird laut eigener Aussage nicht von 00:29:55.350 --> 00:30:00.400 der AfD oder anderen bezahlt, er macht das aus eigener überzeugung. Gut, also der 00:30:00.400 --> 00:30:04.370 Versuch, hier einen Social Bot zu finden, ist missglückt, wir haben leider nur eine 00:30:04.370 --> 00:30:08.600 reale Person gefunden. Aber es gibt auch andere die sich damit beschäftigen, 00:30:08.600 --> 00:30:14.130 beispielsweise botswatch.de, die versuchen, parallel zu wichtigen Events in 00:30:14.130 --> 00:30:19.890 Deutschland zu gucken, wie viel sich auf Twitter nun Social Bots einmischen, 00:30:19.890 --> 00:30:24.490 veröffentlichen auch das Bot-Barometer und so weiter. Und da gibts auch einen Link 00:30:24.490 --> 00:30:27.910 zur Methode wie sie das machen, und da steht dann drin "Accounts die 00:30:27.910 --> 00:30:31.710 durchschnittlich gleich oder mehr als 50 Tweets am Tag veröffentlichen". Hab ich 00:30:31.710 --> 00:30:38.080 ihnen gesagt "Naja, Dombrowski schafft 136 Posts am Tag." Ich hatte, weil 00:30:38.080 --> 00:30:42.830 wir die Bundestagswahl beobachtet haben eine lange Liste von Accounts 00:30:42.830 --> 00:30:46.070 zusammengestellt, die irgendwie beim Thema Bundestagswahl mitmischten 00:30:46.070 --> 00:30:48.010 und bin die einfach mal durchgegangen, 00:30:48.010 --> 00:30:51.229 an welchen Tagen haben die mehr als 50 Tweets abgesetzt und hier ist 00:30:51.229 --> 00:30:55.850 mal so ein bisschen Zusammenfassung: sogar eine CDU/CSU und FDP haben das geschafft. 00:30:55.850 --> 00:31:03.270 Genau. Also, 50 Tweets am Tag und schon ist man Social Bot, mit drunter sind 00:31:03.270 --> 00:31:10.490 Medien wie Welt, die schaffen 190 am Tag, Focus Online 97 am Tag. Auch Christopher 00:31:10.490 --> 00:31:15.559 Lauer 72. Anja Schillhaneck von den Bündnes 90 / Die Grünen im Berliner 00:31:15.559 --> 00:31:19.250 Abgeordnetenhaus schafft fast die Grenze mit 50 am Tag. Und natürlich auch die 00:31:19.250 --> 00:31:23.090 Parteien vor den Bundestagswahlen, die dann natürlich in den sozialen Netzwerken 00:31:23.090 --> 00:31:27.860 besonders aktiv sind, schaffen mehr als 50, und dann noch Hipster, Aktivisten, 00:31:27.860 --> 00:31:32.429 AfD-Anhänger darunter geschrieben. Also 50 Tweets am Tag als Kriterium für Social 00:31:32.429 --> 00:31:37.190 Bots ist wissenschaftlich unseriös. Da frage ich mich natürlich: Wie kommen die 00:31:37.190 --> 00:31:41.390 da drauf? Und davor steht es auch: Das sei das Social Bot-Kriterium der Oxford- 00:31:41.390 --> 00:31:47.030 Universität. Das finde ich natürlich spannend, und habe dann angefangen, die 00:31:47.030 --> 00:31:53.650 ganzen Studien und wissenschaftlichen Paper dazu durchgelesen wie deren Methode 00:31:53.650 --> 00:31:59.720 ist. Und ich hab nur zwei herausgegriffen, weil es wirklich eine Menge ist, die 00:31:59.720 --> 00:32:09.049 besonders das deutlich machen. Social Bots bei den US-Wahlen. Das ist ein Paper was 00:32:09.049 --> 00:32:13.400 veröffentlicht wurde mit dem Titel "Bots and Automation over Twitter during the 00:32:13.400 --> 00:32:18.809 U.S. Election" und ich spule mal vor was an welcher Stelle Sie das definieren. Da 00:32:18.809 --> 00:32:24.910 muss ich mal kurz sagen: Sie fangen halt an, von Social Bots zu reden. Dann heißt 00:32:24.910 --> 00:32:28.750 es irgendwann "Social Bot like" und dann steht dann so etwas wie "Heavy Automated 00:32:28.750 --> 00:32:33.539 Bots". Und dann steht dann zum Schluss "we define a high level of automation as 00:32:33.539 --> 00:32:37.659 accounts that post at least 50 times a day using one of these election-related 00:32:37.659 --> 00:32:43.780 hashtags". Das heißt also, wer mehr als 50 Mal am Tag ein bestimmtes Hashtag 00:32:43.780 --> 00:32:47.580 veröffentlicht, wird als social Bot kategorisiert. Die Hashtags sind die hier. 00:32:47.580 --> 00:32:52.669 Der erste Block sind die pro-Trump- Hashtags, zweite Block die pro-Clinton- 00:32:52.669 --> 00:32:56.390 Hashtags, und der dritte Block sind Hashtags, die sich generell um die 00:32:56.390 --> 00:33:01.710 amerikanische Wahl beschäftigen. Aber zu dieser Definition von Social Bots habe ich 00:33:01.710 --> 00:33:06.870 mal ein paar Fragen: Also erstens, warum sind das 50 und nicht 30 oder 100 Tweets 00:33:06.870 --> 00:33:13.140 am Tag? Und gilt das dann für alle Länder, also kann man jetzt dieses Kriterium aus 00:33:13.140 --> 00:33:16.840 Amerika eins zu eins übernehmen für Deutschland? Und was für Accounts sind das 00:33:16.840 --> 00:33:20.700 eigentlich? Ich meine wenn ich die wenn ich die identifizieren kann, dann kann ich 00:33:20.700 --> 00:33:24.440 die ja auch mal genauer anschauen, wie viele Follower haben die? Wie viele Favs 00:33:24.440 --> 00:33:27.910 und retweets haben sie? Vielleicht veröffentlichen sie ja wahnsinnig viele 00:33:27.910 --> 00:33:31.630 Tweets aber keiner liest es. Und über welches Service posten sie? Das hatte ich 00:33:31.630 --> 00:33:36.330 vorhin gezeigt, dass man das nachschauen kann. Und klar kann ich verstehen, dass es 00:33:36.330 --> 00:33:38.690 halt eine Menge Accounts sind, aber es gibt eine 00:33:38.690 --> 00:33:40.861 wissenschaftlich statistisch saubere Methode: 00:33:40.861 --> 00:33:42.970 Man nimmt einfach eine Stichprobe, man wählt einfach mal zufällig 00:33:42.970 --> 00:33:46.120 100 aus und guckt sich halt an, was das für Accounts sind, um zu gucken, ob sie 00:33:46.120 --> 00:33:50.600 tatsächlichen politischen Einfluss haben. Dazu gibts aber in dieser Studie keine und 00:33:50.600 --> 00:33:55.100 auch den anderen keine Antwort. Leider kann ich das auch nicht überprüfen, weil 00:33:55.100 --> 00:33:58.850 die Universität Oxford die Daten dazu nicht veröffentlicht hat. Das liegt 00:33:58.850 --> 00:34:04.850 teilweise an der Developer API von, oder den Guidelines von Twitter. Das liegt aber 00:34:04.850 --> 00:34:10.109 auch daran, oder gibt es einen Ausweg da drauß: Und zwar kann man nämlich die Liste 00:34:10.109 --> 00:34:14.469 der Twitter IDs veröffentlichen, das darf man nämlich, und kann sich dann sozusagen 00:34:14.469 --> 00:34:18.899 nachträglich den Tweet nochmal holen und genauer analysieren. Zum Glück gibt es von 00:34:18.899 --> 00:34:24.799 der George Washington Universität eine Veröffentlichung "2016 United States 00:34:24.799 --> 00:34:28.690 Presidential Election Tweet IDs". Da gibt es unter anderem auch eine Liste von 00:34:28.690 --> 00:34:34.018 Tweets, die den Hashtag "Election Day" verwendet haben. Das heißt ich hab jetzt 00:34:34.018 --> 00:34:37.839 leider nicht die gleiche Datenbasis wie die Universität Oxford. Ich kann aber 00:34:37.839 --> 00:34:42.168 einen kleinen Ausschnitt rausnehmen und zwar mir nur angucken, wer hat am Wahltag 00:34:42.168 --> 00:34:48.109 mehr als 100 mal eines von diesen Hashtags verwendet plus den Hashtag "Election Day". 00:34:48.109 --> 00:34:56.869 Und diejenigen, die sogar mehr als 100 Mal am Wahltag getwittert haben sind diese 12, 00:34:56.869 --> 00:35:01.680 das sind sozusagen die laut Social Both Kriterien die die am deutlichsten als 00:35:01.680 --> 00:35:08.499 Social Bots sich definieren. Und wenn ihr jetzt mal wissen wollt, wer denn dieses 00:35:08.499 --> 00:35:12.390 Social Bots wirklich sind: Nehmen wir uns mal Zeit und gucken uns jeden einzelnen 00:35:12.390 --> 00:35:21.950 von diesen 12 an. Das erste ist ein @dreamedofdust, der 437 Tweets am Wahltag 00:35:21.950 --> 00:35:25.759 veröffentlicht hat (mit diesen erwähnten Hashtags), und was er macht: er twittert 00:35:25.759 --> 00:35:31.109 Links zu reddit.com/r/The_Donald zu diesen einzelnen Kommentaren. Und er benutzt 00:35:31.109 --> 00:35:37.920 dabei If This Then That. Und bot: klares Ja, auf jeden Fall. Was er aber dabei tut 00:35:37.920 --> 00:35:41.930 ist bereits veröffentlichte Kommentare im Reddit-Forum einfach nochmal in diesem 00:35:41.930 --> 00:35:45.460 Account zu spiegeln, und ich lehne mich mal aus dem Fenster wenn ich sage: 00:35:45.460 --> 00:35:50.170 Einfluss? Kaum. Also völlig kommentarlos, wie gesagt, spiegelt einfach nur Reddit- 00:35:50.170 --> 00:35:55.640 Kommentare. Der nächste Account, ITX News, twittert Screenshots von Texten, 00:35:55.640 --> 00:35:59.830 völlig abgedrehter Verschwörungsquark, also da ist, da sind Sachen dabei, die 00:35:59.830 --> 00:36:05.609 Queen wurde von Hindus vergiftet. Und, also wirklich, find ich völlig abgedreht. 00:36:05.609 --> 00:36:10.400 Und er benutzt für seine für seine Screenshots, die er dann veröffentlicht, 00:36:10.400 --> 00:36:17.549 immer die aktuellen trending Hashtags. Er hat vier Follower, und er ist ganz klar 00:36:17.549 --> 00:36:24.799 kein Bot. Der nächste Account: Er ist Trump-Supporter weil er Clinton furchtbar 00:36:24.799 --> 00:36:30.559 findet. Er nutzt intensiv Hashtags, lebt auf Hawaii, schläft sechs Stunden, macht 00:36:30.559 --> 00:36:35.349 Mittagspause - das sieht man an den an den Zeiten, wann er twittert. Und der ist auf 00:36:35.349 --> 00:36:41.529 jeden Fall kein Bot. Der nächste. Offensichtlich liebt er Bernie Sanders, er 00:36:41.529 --> 00:36:45.450 hasst Donald Trump, Hillary Clinton, die Demokraten (weil sie nämlich Hillary 00:36:45.450 --> 00:36:49.029 Clinton aufgestellt haben statt Bernie Sanders), Bill und Chelsea Clinton, und er 00:36:49.029 --> 00:36:53.979 hasst Expedia, weil Chelsea Clinton jetzt im Board sitzt. Aber ein Bot ist er nicht. 00:36:53.979 --> 00:36:59.370 Der nächste. Der sieht mir doch sehr fischig aus. Ich vermute mal, dass es eine 00:36:59.370 --> 00:37:04.759 spanischsprachige Click-Farm ist, die versucht, User auf Werbeseiten zu locken. 00:37:04.759 --> 00:37:10.110 Die machen dann Werbung für was weiß ich, irgendwelche Apps oder sowas, überhaupt 00:37:10.110 --> 00:37:13.859 gar keine politischen Inhalte, denn sie nutzen einfach nur Training Hashtags um 00:37:13.859 --> 00:37:17.671 sich in politischen Diskussionen sozusagen da noch nochmal ihre Links zu 00:37:17.671 --> 00:37:23.410 veröffentlichen, haben einen Follower. Ob es ein Bot ist oder nicht? Ich sag mal, 00:37:23.410 --> 00:37:28.119 vermutlich nicht. Da sind halt Tippfehler drin, das wäre eigentlich ein schlecht 00:37:28.119 --> 00:37:31.559 programmierter Bot (oder besonders schlau). Im Zweifelsfall könnt ihr ihn 00:37:31.559 --> 00:37:35.421 gern als Bot definieren, aber impact hat er keinen. Jetzt wird es ein bisschen 00:37:35.421 --> 00:37:39.579 spannender. Ave Hurley ist eine Oma aus Brooklyn, sie ist eine Künstlerin, malt 00:37:39.579 --> 00:37:43.201 Bilder, macht Schmuck, verkauft sie in einem Shop und hat vor kurzem mit dem 00:37:43.201 --> 00:37:49.810 Rauchen aufgehört. An dem Wahltag hat sie wie wild für Trump getwittert und hat ihn 00:37:49.810 --> 00:37:53.390 unterstützt und hat versucht, Leute zu überzeugen. Aber ein Bot ist sie auch 00:37:53.390 --> 00:37:58.650 nicht. Dann hab ich hier noch den hier. Der ist aus Tokio. Ich vermute es ist ein 00:37:58.650 --> 00:38:03.160 Student, der twittert auf Japanisch und ab dem Moment war ich so ein bisschen Lost in 00:38:03.160 --> 00:38:07.719 Translation um herauszukriegen, was er da möchte. Aber ich vermute, dass er Toru 00:38:07.719 --> 00:38:12.609 Hashimoto und Kazuma Ieri hasst, das eine ist ein Politiker, das andere ein 00:38:12.609 --> 00:38:19.190 Internet Entrepreneur. Er hat am Wahlabend auf einen Tweet zu Kazuma gefeuert, muss 00:38:19.190 --> 00:38:22.720 man sagen, und hat da einfach die aktuellen Trending hashtags genommen, und 00:38:22.720 --> 00:38:28.869 da war natürlich auch die Election dabei, aber ein Bot ist es nicht. Der nächste: 00:38:28.869 --> 00:38:34.099 Paolo. Paolo kann 13 Tweets in drei Sekunden schicken. 00:38:34.099 --> 00:38:44.039 Gelächter Applaus 00:38:44.039 --> 00:38:48.530 Er nutzt dafür drei unbekannte italienische Twitter-Services, einer davon 00:38:48.530 --> 00:38:53.390 ist in der Zwischenzeit gesperrt. Pro Hillary. Tweets werden so gut wie gar 00:38:53.390 --> 00:38:58.200 nicht gefavt und retweetet. Ein Bot ist er auf jeden Fall, aber einen Einfluss hat 00:38:58.200 --> 00:39:03.220 er, glaube ich zumindest, keinen. Dann haben wir noch den hier. Er liebt Jesus, 00:39:03.220 --> 00:39:07.579 Die Familie, Trump, Wikileaks, Fox News, und Waffen. 00:39:07.579 --> 00:39:12.549 Gelächter Hasst Abtreibung, Feminismus, Hillary 00:39:12.549 --> 00:39:19.410 Clinton, CNN, und Obamacare. Aber ein Bot ist es nicht. Dann haben wir auch 00:39:19.410 --> 00:39:26.369 PresidentDrumf. Der ist ein Satire- Account. Teilweise witzig, hat trotzdem 00:39:26.369 --> 00:39:28.380 nur einen Follower. Gelächter 00:39:28.380 --> 00:39:35.640 Aber ein Bot ist es auch nicht. Dann haben wir noch Maryke. Sie ist Journalistin aus 00:39:35.640 --> 00:39:40.819 Südafrika, arbeitet für die französische Presseagentur AFP, und hat über Election 00:39:40.819 --> 00:39:47.509 Day live getwittert an dem Abend. Und sie ist auch kein Bot. Dann haben wir noch ein 00:39:47.509 --> 00:39:53.349 Dr. Van Nostrand. Ich habe leider kein Bild von ihm gefunden, aber er liebt 00:39:53.349 --> 00:40:00.609 Baseball, American Football, Fox News und Trump. Er hasst Hillary und Bill Clinton, 00:40:00.609 --> 00:40:07.059 CNN, Islam, Feministen, und Linke. Und er verfolgte Trumps' Sieg live. Hat den 00:40:07.059 --> 00:40:13.200 Wahltag intensiv verfolgt und begleitet, aber ein Bot ist er auch nicht. So, und 00:40:13.200 --> 00:40:18.660 das war jetzt der zwölfte von den zwölf. Fassen wir mal zusammen. Ich habe ja mal 00:40:18.660 --> 00:40:23.140 so ein kleines Tabelle gemacht, spaltenweise pro Clinton, neutral, pro 00:40:23.140 --> 00:40:27.940 Trump, und zeilenweise ist es ein Mensch, sind wir uns nicht ganz sicher, oder ist 00:40:27.940 --> 00:40:31.530 es ein Social Bot. Wir haben auf jeden Fall ein Social Bot gefunden der pro- 00:40:31.530 --> 00:40:35.386 Clinton ist, und wir haben einen Social Bot gefunden von pro-Trump ist, ob es sich 00:40:35.386 --> 00:40:39.309 tatsächlich um einen Social Bot handelt wäre ich sehr vorsichtig denn sie haben ja 00:40:39.309 --> 00:40:42.907 keine soziale Interaktion bewiesen, sondern alles was sie gemacht haben ist 00:40:42.907 --> 00:40:46.530 automatisiert Links und Nachrichten zu veröffentlichen, und hatten auch dabei 00:40:46.530 --> 00:40:51.039 nicht wirklich einen Impact weil keiner sie retweetet oder gefavt hat. Eine große 00:40:51.039 --> 00:40:58.799 Gruppe die wir gefunden haben waren pro- Trump-Menschen, die alle, auf der pro- 00:40:58.799 --> 00:41:03.790 Clinton Seite haben wir nur einen Satire- Account gefunden. Und dazwischen im 00:41:03.790 --> 00:41:08.259 neutralen Bereich einen Bernie Sanders- Fan, eine Journalistin, einen Japaner und 00:41:08.259 --> 00:41:15.630 einen Verschwörungstheoretiker. Und dann haben wir noch hier unsure derjenige der 00:41:15.630 --> 00:41:19.780 seine Links zu App-Webseiten vertreibt. Wenn ich jetzt mal hervorhebe von denen 00:41:19.780 --> 00:41:23.139 Accounts von denen ich glaube dass sie tatsächlich an einer politischen 00:41:23.139 --> 00:41:27.039 Diskussion teilgenommen haben... sind das die hier und das sind alles Menschen. Ist 00:41:27.039 --> 00:41:41.700 nur die Hälfte, aber ja. Die Studie "Bots and Automation over Twitter during U.S. 00:41:41.700 --> 00:41:45.689 Election" müsste eigentlich heißen "Highly active Twitter users during US Election". 00:41:47.079 --> 00:41:51.019 Social Bots, oder als was wir sie bezeichnet haben, sind politisch aktive 00:41:51.019 --> 00:41:58.450 Bürger, Hashtag-Spam, Medien und Journalisten, und einige simple Bots. Auf 00:41:58.450 --> 00:42:02.900 Vollständigkeit halber habe ich versucht noch eine Studie zu finden die eine andere 00:42:02.900 --> 00:42:09.209 Methodik verwendet. Und da gibt es von der University of South California "Social 00:42:09.209 --> 00:42:15.710 bots distort the 2016 U.S. Presidential election online discussion", und was sie 00:42:15.710 --> 00:42:20.000 zur Identifizierung von Social Bots verwenden ist ein Service der nennt sich 00:42:20.000 --> 00:42:25.139 BotOrNot, in der Zwischenzeit umbenannt in Botometer. Und ich will da nicht zu tief 00:42:25.139 --> 00:42:28.799 einsteigen, da gibt's auch nochmal ein Paper dazu, aber was sie im Kern machen 00:42:28.799 --> 00:42:32.370 ist im Prinzip das was ich am Anfang gemacht habe – sie versuchen die ganzen 00:42:32.370 --> 00:42:36.420 Metadaten rund um einen Account zu kategorisieren, und dann kommt da Machine 00:42:36.420 --> 00:42:39.839 Learning oben drauf, und dann wird versucht mit einer Wahrscheinlichkeit 00:42:39.839 --> 00:42:44.130 abzuschätzen ob nun ein Account nun ein Bot ist oder nicht, und das ist die Basis 00:42:44.130 --> 00:42:48.329 dieser Studie. Ich hab das mal... Unten ist noch mal der Link dazu, falls einer da 00:42:48.329 --> 00:42:52.640 selber mit spielen möchte. Vorsichtig, man muss dazu seinen Twitter-Account 00:42:52.640 --> 00:42:56.419 autorisieren und das ist dann... der im Gegensatz zu uns keine Leserechte haben 00:42:56.419 --> 00:42:59.720 möchte, sondern er möchte auch Schreibrechte haben; für den Fall falls 00:42:59.720 --> 00:43:03.499 die gehackt werden, werdet ihr also auch irgendwie Scheiße twittern. Ich hab 00:43:03.499 --> 00:43:06.079 einfach mal ein paar Accounts rein geworfen um zu gucken wie vertrauenswürdig 00:43:06.079 --> 00:43:09.859 das ist; da habe ich jetzt einfach mal einen erdgeist und einen Frank Rieger und 00:43:09.859 --> 00:43:13.970 einen Linuzifer rein geworfen. Das Kriterium übrigens der Studie ist 50%, 00:43:13.970 --> 00:43:17.450 alle die unter 50% sind, sind Menschen, alle die über 50% 00:43:17.450 --> 00:43:23.450 sind, sind Bots. Gegenübergestellt hab ich nochmal das BMVI, das Bundesministerium 00:43:23.450 --> 00:43:32.299 für Justiz und Verbraucherschutz – 55 Prozent, das BKA ist ein Social Bot. 00:43:32.299 --> 00:43:36.509 Applaus Und vielleicht liegt das an den deutschen 00:43:36.509 --> 00:43:40.630 Accounts, da die Studie sich im Speziellen mit den US-Wahlen beschäftigt haben, hab 00:43:40.630 --> 00:43:44.680 ich da mal stichprobenartig ein paar rein geworfen. Da haben wir das Wall Street 00:43:44.680 --> 00:43:48.849 Journal, LA Times ist ein Bot, CNN und Fox News ist ein Bot, realDonaldTrump ist ein 00:43:48.849 --> 00:43:51.869 Bot, und der amerikanische Präsident. Lachen 00:43:51.869 --> 00:43:59.989 Applaus Das könnt ihr ja auch alles selber 00:43:59.989 --> 00:44:04.140 ausprobieren. Also wissenschaftlich ist das alles nicht haltbar. 00:44:05.319 --> 00:44:06.972 Und wen das noch nicht überzeugt, 00:44:06.972 --> 00:44:12.602 Hegelich erwartet keine große Gefahr durch Social Bots im Wahlkampf. 00:44:13.410 --> 00:44:20.309 Zusammenfassung. Social Bot, Filterblasen, Fake News. Ich versuche 00:44:20.309 --> 00:44:24.070 versuch's mal vorsichtig zu formulieren: die Forschung ist noch in den Anfängen. 00:44:24.070 --> 00:44:28.369 Die Methodiken sind neu, teilweise experimentell, und müssen noch überprüft 00:44:28.369 --> 00:44:32.319 werden. Und im Speziellen müssen die wissenschaftlichen Publikation überprüft 00:44:32.319 --> 00:44:37.299 werden. Falls einer irgendwie in dem Thema gerade arbeitet, den kann ich das ans Herz 00:44:37.299 --> 00:44:42.119 legen, als Bachelor- oder Masterarbeit mal ans Herz zu legen, diese Studien 00:44:42.119 --> 00:44:45.789 tatsächlich zu überprüfen. Was ich bei Social Bots, Filterblase und Fake News 00:44:45.789 --> 00:44:53.180 gefunden habe sind exemplarisch: Egon Dombrowski und Ave Hurley. Wir haben in 00:44:53.180 --> 00:44:59.039 den Diskursen die Leute als Nazis, bildungsfern, sozial abgehängt, 00:44:59.039 --> 00:45:04.219 Mittelschicht mit Verlustängsten und jetzt auch neu als Social Bots bezeichnet. 00:45:04.219 --> 00:45:05.989 Aber was sie alle gemeinsam haben: 00:45:05.989 --> 00:45:07.750 Sie haben Angst und sie sind wütend. 00:45:07.750 --> 00:45:10.370 Und sie haben Vertrauensverlust in die Institutionen. 00:45:10.370 --> 00:45:12.519 Und was wir beobachten ist das neue 00:45:12.519 --> 00:45:18.180 gesellschaftliche Gruppen in die sozialen Netzwerke betreten, und sie nutzen ihr 00:45:18.180 --> 00:45:23.119 Recht und die Möglichkeit ihrer Meinungsäußerung. Und im Zweifelsfall 00:45:23.119 --> 00:45:29.511 greifen sie auch auf Fake News zurück wenn es ihre Ansichten bestätigt. 00:45:29.511 --> 00:45:33.330 Was wir aber beobachten ist, dass die sozialen Netzwerke nicht geeignet sind, um 00:45:33.330 --> 00:45:37.319 gesellschaftliche Lösungen zu entwickeln. Vielleicht gibt es irgendwann technische 00:45:37.319 --> 00:45:42.339 Lösungen. Wer weiß. Vielleicht gehört es aber in Zukunft auch zur Medienkompetenz, 00:45:42.339 --> 00:45:47.859 eine gewisse Debattenkultur zu entwickeln. Ich weiß es nicht. Das ist auf jeden Fall, 00:45:47.859 --> 00:45:51.229 ich will jetzt den Begriff "Neuland" nicht verwenden, das auf jeden Fall ein neues 00:45:51.229 --> 00:45:55.630 Forschungsgebiet. Wir sehen glaube ich dass hier eine neue Wissenschaft beginnt 00:45:55.630 --> 00:45:59.609 zu entstehen. Sie steckt noch in den Kinderschuhen, aber sie macht gerade einen 00:45:59.609 --> 00:46:03.819 fundamentalen Wandel mit, von einer ideographischen Wissenschaft, also einer 00:46:03.819 --> 00:46:07.529 reinen Phänomen beschreibenden, wie Sozialwissenschaft, Kulturwissenschaft 00:46:07.529 --> 00:46:11.680 oder Politikwissenschaften, hin zu einer nomothetischen Wissenschaft, die versucht 00:46:11.680 --> 00:46:16.160 Regeln zu erkennen, Gesetze zu entdecken, reproduzierbare Ergebnisse zu entwickeln, 00:46:16.160 --> 00:46:20.750 so wie man das aus den Naturwissenschaften kennt. Ähnliche Entwicklungen haben wir 00:46:20.750 --> 00:46:25.249 auch gesehen, die Astrologie, das war die Lehre von den Sternen, bis dann das 00:46:25.249 --> 00:46:29.110 Teleskop erfunden wurde und wir nun anfangen konnten, Gesetze in der Bewegung 00:46:29.110 --> 00:46:32.650 von Planeten und Sternen zu entdecken, die reproduzierbar sind. Und aus der 00:46:32.650 --> 00:46:38.700 Astrologie wurde dann die Astronomie. Ich sehe, dass wir in den Debatten, die jetzt 00:46:38.700 --> 00:46:44.209 in den sozialen Netzwerken stattfinden, eine neue Wissenschaft haben können die 00:46:44.209 --> 00:46:49.049 sich mit diesem Thema beschäftigt. Und ich glaube das ist nicht nur möglich ist, 00:46:49.049 --> 00:46:53.020 sozusagen als Teleskop oder Mikroskop die für die Gesellschaft, sondern dass es auch 00:46:53.020 --> 00:46:58.090 notwendig ist. Und dazu ist viel Forschung nötig und ich animiere jeden, der nicht so 00:46:58.090 --> 00:47:01.900 richtig weiß ob er jetzt in dem geisteswissenschaftlichen Bereich oder im 00:47:01.900 --> 00:47:05.299 Data Science-Bereich arbeiten möchte, diese beiden Welten miteinander zu 00:47:05.299 --> 00:47:12.180 verbinden. Bachelor und Master sind, Arbeiten sind da gut definitiv 00:47:12.180 --> 00:47:17.469 prädestiniert um diese wissenschaftlichen Ausarbeitungen zu reproduzieren. Und diese 00:47:17.469 --> 00:47:21.649 Studien von der Oxford-Universität oder von South California zu reproduzieren 00:47:21.649 --> 00:47:25.630 und zu validieren. Und ich würde das gerne unterstützen, und ich hoffe, die nächsten 00:47:25.630 --> 00:47:29.380 zweieinhalb Tage noch Zeit zu finden, Teile meines Frameworks und auch der 00:47:29.380 --> 00:47:36.509 Rohdaten zu veröffentlichen. Ansonsten bin ich die nächsten zweieinhalb Tage zu 00:47:36.509 --> 00:47:41.170 erreichen: DECT Telefonnummer 360, 3600 Entschuldigung, und Twitter-Account, 00:47:41.170 --> 00:47:45.839 @michaelkreil. Ich würde gerne andere Leute, die in dem Bereich forschen oder 00:47:45.839 --> 00:47:53.049 sowas zusammenbringen um zu gucken ob wir zum Thema Social Bot da nicht mal eine 00:47:53.049 --> 00:48:09.869 Wissenschaftssprache Debatte starten können. Danke schön. 00:48:09.869 --> 00:48:16.200 Applaus Herald: Mindestens das will ich nachher 00:48:16.200 --> 00:48:19.839 nochmal hören. Jetzt haben wir noch, ja, etwas über ne Viertelstunde Zeit für 00:48:19.839 --> 00:48:24.599 Fragen und Antworten. Habt ihr Fragen an Michael Kreil? Positioniert euch bitte an 00:48:24.599 --> 00:48:29.709 den Mikrophonen, ich versuche einigermaßen ausgeglichen auszuwählen. Falls schon 00:48:29.709 --> 00:48:33.339 irgendwo jemand steht, steht schon irgendwo jemand, hebt mal die Hand? Ah, da 00:48:33.339 --> 00:48:37.390 hinten. Mikrophon 4, fang an. Mikrophon 4: Jawohl. Ich hab eine Frage 00:48:37.390 --> 00:48:45.549 bezüglich State-sponsored Propaganda, also die sind wirklich Leute, die bezahlt 00:48:45.549 --> 00:48:52.320 werden von Staaten, damit die Propaganda betreiben. Habt ihr auch in der Forschung 00:48:52.320 --> 00:48:55.609 diebezüglich was rausgefunden, oder habt ihr das überhaupt untersucht? 00:48:55.609 --> 00:49:01.199 MK: Wir haben versucht, Leute zu finden, die an den Bots, die an den politischen 00:49:01.199 --> 00:49:04.660 Diskursen teilnehmen. Ob sie jetzt tatsächlich dafür bezahlt werden oder 00:49:04.660 --> 00:49:09.589 nicht ist unmöglich festzustellen. Wir sehen aber, wenn jetzt zum Beispiel jemand 00:49:09.589 --> 00:49:15.129 bei der US-Wahl was postet und dann aber in den nächsten Monaten bis heute noch 00:49:15.129 --> 00:49:18.680 ganz normales Leben auf den, in den sozialen Netzwerken führt, und parallel 00:49:18.680 --> 00:49:22.400 dann auch noch auf Facebook oder sowas, gehen wir eher davon aus, dass es sich 00:49:22.400 --> 00:49:27.040 nicht um einen bezahlten Akteur oder Akteure handelt. Die große Frage, die ich 00:49:27.040 --> 00:49:30.759 mir eigentlich auch stelle ist dabei: Was ist der tatsächliche impact, also die 00:49:30.759 --> 00:49:35.749 Unterstellung mit jemand bezahlt da irgendwie, kann ich wirklich auf Twitter 00:49:35.749 --> 00:49:39.329 durch soziale Interaktion Leute davon überzeugen, die politische Richtung zu 00:49:39.329 --> 00:49:43.049 wechseln? Das ist eine bisherige Unterstellung, die noch nicht überprüft 00:49:43.049 --> 00:49:46.780 wurde, und deswegen finde ich das vorsichtig, bin ich da vorsichtig, sowas 00:49:46.780 --> 00:49:50.009 anzunehmen. H: Mikro 2. 00:49:50.009 --> 00:49:54.220 M2: Vielen, vielen Dank für den großartigen Vortrag, ich fand' das super 00:49:54.220 --> 00:49:57.550 wichtig, anhand von dem kann man eigentlich sehen, was sich wirklich an 00:49:57.550 --> 00:50:01.309 wissenschaftlichen Methodiken verändern muss, und von daher vielen, vielen Dank. 00:50:01.309 --> 00:50:05.079 Ich habe eine Frage, ich habe mich gerade gefragt, ob man wirklich von Fake News 00:50:05.079 --> 00:50:08.791 sprechen sollte, weil offensichtlich spiegeln diese Nachrichten ja nur, was die 00:50:08.791 --> 00:50:14.309 Verbreiter und weiteren Re-tweeter der Nachrichten hören oder sehen oder wissen 00:50:14.309 --> 00:50:18.319 wollen, also das, was sie eigentlich schon denken, wird quasi nur gespiegelt. Und ich 00:50:18.319 --> 00:50:22.229 hab mich gefragt, ob es nicht irreführend ist, dieses Wort "News", und ob man nicht 00:50:22.229 --> 00:50:25.760 ein neues Wort dafür finden müsste. MK: Auf jeden Fall, auf jeden Fall. Wir 00:50:25.760 --> 00:50:30.699 haben auch zum Beispiel gesehen, dass bei der US-Wahl relativ viele Fake News aus 00:50:30.699 --> 00:50:34.650 einer Stadt aus Osteuropa kommt, die aber gar keine politische Agenda haben, sondern 00:50:34.650 --> 00:50:38.309 einfach nur Geld damit verdient haben, dass ihre Posts sich so weit verbreitet 00:50:38.309 --> 00:50:42.459 haben, und damit klick-Werbung, verstanden haben, Geld gewonnen haben. Da war 00:50:42.459 --> 00:50:47.829 überhaupt kein politischer, gar kein politisches Ziel dahinter, im Gegenteil, 00:50:47.829 --> 00:50:51.550 laut eigener Aussage haben sie erst pro- Clinton probiert, aber das hat einfach 00:50:51.550 --> 00:50:56.019 nicht so gut eingeschlagen wie pro-Trump- Sachen. Deswegen halte ich auch den 00:50:56.019 --> 00:51:00.440 Begriff von Fake News dann auch nicht mehr für angebracht. 00:51:00.440 --> 00:51:03.809 H: So, aus dem Internet haben wir auch eine Frage. 00:51:03.809 --> 00:51:08.229 Signal-Engel: Ja, zuerst auch aus dem IRC großes Lob an den Vortrag, es wurde 00:51:08.229 --> 00:51:12.529 angemerkt, es sei sehr interessant, mal den Hashtag #34c3 zu analysieren und 00:51:12.529 --> 00:51:18.050 Trolle aufzudecken. Cyberrichter und Afdex lässt fragen: Gibt es schon schlaue Bots 00:51:18.050 --> 00:51:21.769 mit Einfluss, ist irgendwas über die Interaktion untereinander bekannt, gibt es 00:51:21.769 --> 00:51:33.180 bald Bot Wars? MK: Äh. Flame-Bots, ja, äh. Das sind alles 00:51:33.180 --> 00:51:38.879 theoretische Konzepte. Wenn man sich die Studien dazu durchliest, das sind alles 00:51:38.879 --> 00:51:42.539 Konzepte "es könne irgendwann mal so sein". Ich stehe auch nicht hier und sage 00:51:42.539 --> 00:51:46.549 "sowas wird nie passieren" oder sowas. Keine Ahnung, was es für Entwicklungen mit 00:51:46.549 --> 00:51:52.450 KI in den nächsten Tagen oder Monaten oder so gibt. Aber das, was wir jetzt bisher 00:51:52.450 --> 00:51:56.709 sehen konnten, waren jetzt nicht irgendwelche KI's, die durchs Internet 00:51:56.709 --> 00:52:00.239 laufen. H: Die 3. 00:52:00.239 --> 00:52:07.039 M3: Servus. Wunderbar, funktioniert. Das erste harte Kriterium, das mir einfallen 00:52:07.039 --> 00:52:11.059 würde, um Bot-Accounts von Menschen- Accounts zu trennen wäre die posting- 00:52:11.059 --> 00:52:14.720 Frequenz, und die hat jetzt hier nur einmal Einfluss gefunden - woran liegt 00:52:14.720 --> 00:52:17.289 das? MK: Weil sie tatsächlich auch nur einmal 00:52:17.289 --> 00:52:25.729 auffällig war. Also, die anderen Accounts, also ich meine, wenn ich jetzt nen Social 00:52:25.729 --> 00:52:29.809 Bot entwickle, dann wäre ich jetzt auch schlau zu sagen okay, dann haut der jetzt 00:52:29.809 --> 00:52:35.450 nicht alle halbe Sekunde nen tweet raus, wenn ich sowas bauen würde. Aber in diesem 00:52:35.450 --> 00:52:39.250 Fall ist es tatsächlich nur einmal aufgetreten, das ein Bot sozusagen den Bug 00:52:39.250 --> 00:52:43.410 hatte, das zu tun. M3: Okay, taugt also nicht. Super, danke. 00:52:43.410 --> 00:52:47.609 H: Und MIkro 1. M1: Hallo erstmal, ja, jetzt geht's. Ich 00:52:47.609 --> 00:52:51.049 wollte fragen ob, weil du ja gesagt hattest dass bei den Social Bots ja 00:52:51.049 --> 00:52:54.949 eigentlich der Einfluss sich verliert, ob das dann wiederum heißen könnte, dass die 00:52:54.949 --> 00:52:59.349 eigentliche Gefahr von Filterblasen, dass kein Meinungsdiskurs entsteht, oder dass 00:52:59.349 --> 00:53:03.789 der halt eingedämmt wird, ob das sich dann verliert oder ob du in den Forschungen 00:53:03.789 --> 00:53:07.459 gesehen hast, dass die Gefahr gar nicht so da ist, wie sie irgendwie überall 00:53:07.459 --> 00:53:12.009 propagiert wird? Ja. MK: Also, zum Einen: Ich glaube, es gibt 00:53:12.009 --> 00:53:15.600 so einen Satz, den man in den letzten 10 Jahren immer wieder gehört hat, das 00:53:15.600 --> 00:53:18.460 Internet ist nicht an bestimmten Sachen schuld, sondern das Internet macht nur 00:53:18.460 --> 00:53:22.339 einfach wieder Sachen sichtbar. Und ich glaube, dass es eine Menge Leute gibt, die 00:53:22.339 --> 00:53:27.231 sich gerne an einem politischen Diskurs beteiligen wollen und nicht die 00:53:27.231 --> 00:53:31.319 Möglichkeit hatten, und jetzt nun mit den sozialen Netzen diese Möglichkeit haben, 00:53:31.319 --> 00:53:34.479 und dann als Bots klassifiziert werden. Problem ist, dass ich deine Frage 00:53:34.479 --> 00:53:35.780 vergessen habe. 00:53:35.780 --> 00:53:37.690 M1: Ich wollte eigentlich nur wissen, ob 00:53:37.690 --> 00:53:41.079 diese Gefahr, dass man halt sagt, der Diskurs ist so ein bisschen eingedämmt, 00:53:41.079 --> 00:53:44.891 weil jeder in seiner eigenen Blase lebt, ob sich das nicht dadurch verliert, weil 00:53:44.891 --> 00:53:49.309 du ja gesagt hattest, Social Bots sind unwirksam so wirklich, ob das nicht dann 00:53:49.309 --> 00:53:52.839 sich auch sozusagen auf das andere übertragen lässt für unsere, für unseren 00:53:52.839 --> 00:53:56.701 normane Gebrauch. MK: Genau, also, ich, kann ich, kann ich 00:53:56.701 --> 00:54:01.290 keine abschließende Meinung zu abgeben. Ich weiß aber dass, oder man merkt es 00:54:01.290 --> 00:54:05.180 halt, dass die sozialen Netze oft, oder fast immer nicht dazu geeignet sind, 00:54:05.180 --> 00:54:08.510 tatsächlich einen Diskurs zu führen, sondern es gibt halt, es ist halt, 00:54:08.510 --> 00:54:12.139 endet immer in einem Flame War, sind sozusagen, "du bist, ihr seid die Bösen, 00:54:12.139 --> 00:54:15.808 und wir sind die Guten." Aber tatsächlich irgendwie eine Lösung zu entwickeln, 00:54:15.808 --> 00:54:18.029 eignet sich nicht dafür, vielleicht ist der Mensch auch nicht dafür gemacht. 00:54:18.029 --> 00:54:22.279 Vielleicht haben Netzwerke nen, nen bestimmten flaw, den wir halt noch nicht 00:54:22.279 --> 00:54:24.979 kennen, man darf ja auch nicht vergessen, das ist eine extrem experimentelle 00:54:24.979 --> 00:54:29.930 Technologie. Noch nie gab es ein Netzwerk, das weltübergreifend so vielen Menschen 00:54:29.930 --> 00:54:32.819 die Möglichkeit gibt, miteinander zu kommunizieren und Diskurse zu führen. 00:54:32.819 --> 00:54:35.369 M1: Danke. H: Mikro 4. 00:54:35.369 --> 00:54:40.789 M4: Ja, Hallo. Erstmal Kompliment für diesen superwichtigen und sehr coolen 00:54:40.789 --> 00:54:44.730 Vortrag. Meine Frage: Du hattest ja jetzt ausschließlich über Twitter gesprochen - 00:54:44.730 --> 00:54:48.420 habt ihr mal Analysen gefahren über andere soziale Netze, die ja durchaus auch 00:54:48.420 --> 00:54:54.340 Verbreitung haben, speziell dazu, auch nicht nur über die Anzahl der Tweets 00:54:54.340 --> 00:54:58.069 sondern auch über den Impact, weil die Frage ist ja, die hattest du ja mehrfach 00:54:58.069 --> 00:55:01.450 aufgeworfen, was wirkt eigentlich eine Tweet, wenn die, wenn die einen 00:55:01.450 --> 00:55:05.369 veröffentlichen, also ein Tweet auf 10.000 Follower könnte möglicherweise wichtiger 00:55:05.369 --> 00:55:10.170 sein als 10.000 Tweets mit einem Follower. MK: Genau, da kann man sich halt Metriken 00:55:10.170 --> 00:55:14.790 überlegen. Normalerweise ist es für mich halt ein Ausschlusskriterium, wenn ein 00:55:14.790 --> 00:55:19.009 Tweet nur, nicht gefavt wird und nicht retweetet wird, das ist für mich, das ist 00:55:19.009 --> 00:55:22.349 ein Ausschlusskriterium. Was der tatsächliche Impact ist, obs dafür ne 00:55:22.349 --> 00:55:27.920 Metrik gibt, weiß ich nicht. Kann man sich überlegen, wie gesagt, neue Wissenschaft. 00:55:27.920 --> 00:55:33.190 Das andere ist, andere soziale Netzwerke. Man sieht, dass auf YouTube ne Menge 00:55:33.190 --> 00:55:37.819 passiert. Ganz viele Leute packen im Wohnzimmer die Kamera aus und teilen ihre 00:55:37.819 --> 00:55:42.180 politischen Meinungen im Wohnzimmer und veröffentlichen das auf YouTube, es gibt 00:55:42.180 --> 00:55:47.839 auch dieses russische Social Network, wie heißt das? VKan... VKan-irgendwas, ja. 00:55:47.839 --> 00:55:54.279 Genau, da gibt es - VKontakte, genau - da gibt es auch, kenne ich eine Gruppe die 00:55:54.279 --> 00:55:57.980 sich damit beschäftigt hat, wie das da aussieht, das ist aber ein sehr kleiner 00:55:57.980 --> 00:56:04.459 Teil, der große Brocken ist natürlich Facebook, und Facebook hat zwei Probleme: 00:56:04.459 --> 00:56:08.720 Erstens gibt es eine Menge geschlossene Gruppen wo viel stattfindet, da habe ich 00:56:08.720 --> 00:56:12.310 mal rein geguckt, sind die gleichen Themen, es geht halt auch um Asylpolitik 00:56:12.310 --> 00:56:16.250 und so weiter. Und das andere Problem mit Facebook ist, die API ist leider nicht so 00:56:16.250 --> 00:56:20.380 offen. Es gibt Schwierigkeiten, da große Mengen an Daten rauszuholen. Ich glaube 00:56:20.380 --> 00:56:25.749 dass Facebook in diesem Bereich wahnsinnig viel Datenmaterial hat und Forschung dazu 00:56:25.749 --> 00:56:29.680 betreiben könnte, aber leider halt nur innerhalb eines Konzerns und nicht 00:56:29.680 --> 00:56:32.439 innerhalb der Forschungsgemeindschaft. M4: Okay, danke. 00:56:32.439 --> 00:56:36.089 H: Unser Social Bot hat auch noch eine Frage. 00:56:36.089 --> 00:56:41.170 Signal: Mie lässt fragen, ob es Studien zu dem realen Ausmaß und dem realen Impact 00:56:41.170 --> 00:56:45.089 von Fake News in den sozialen Medien, und wurden die eventuell zur Legitimation des 00:56:45.089 --> 00:56:49.079 NetzDGs herangezogen? MK: Habe ich akustisch nicht verstanden. 00:56:49.079 --> 00:56:54.089 Signal: Gibt es Studien über das reale Ausmaß von Fake News und wurden die 00:56:54.089 --> 00:56:56.219 herangezogen zur Legitimisierung des NetzDGs? 00:56:56.219 --> 00:57:03.219 MK: Soweit ich weiß ist mir, mir ist keine Studie bekannt, aus meiner Erfahrung würde 00:57:03.219 --> 00:57:07.250 ich sagen: Sie haben keinen Einfluss, weil sie halt erstmal nicht Leute überzeugen, 00:57:07.250 --> 00:57:10.849 ich glaube die Leute kommen schon mit einer Überzeugung in die Netzwerke und 00:57:10.849 --> 00:57:15.279 werden einfach nur noch weiter zusätzlich bestätigt. Ich glaube, dass es einen 00:57:15.279 --> 00:57:20.019 gewissen Impact gibt mit Leuten, die sozusagen Latent ne Sorge um 00:57:20.019 --> 00:57:24.650 Flüchtlingspolitik haben und dann nur noch in einer Filterblase stecken und nur noch 00:57:24.650 --> 00:57:28.519 mit Flüchtlingskriminalität bombardiert werden. Dass sie dazu dann auch neigen, 00:57:28.519 --> 00:57:32.429 eine Angst gegen beispielsweise Migranten zu entwickeln. Aber eine Studie dazu ist 00:57:32.429 --> 00:57:35.529 mir noch nicht bekannt, wie das tatsächlich, ob das psychologische 00:57:35.529 --> 00:57:39.220 Auswirkungen auf die Menschen hat. H: Und die 2. 00:57:39.220 --> 00:57:45.910 Frage M2: Ja hallo, danke für den Vortrag. Du hattest am Anfang so einen schöne 00:57:45.910 --> 00:57:49.539 Karte, wo verschiedene Gruppen aus dem Twitternetzwerk aufgezeigt wurden, und 00:57:49.539 --> 00:57:53.690 dann hast du gezeigt, da sitzt die AfD und dann kam der Switch und da sind die 00:57:53.690 --> 00:57:57.949 Fakenews. Wie hast du denn ermittelt, dass diese Tweets Fakenews waren? 00:57:57.949 --> 00:58:01.619 Antwort: Also konkret, ich habe mir Fakenews ausgesucht und hab geguckt wer 00:58:01.619 --> 00:58:05.949 sie auf Twitter teilt. Also andersrum, ich hab mir sozusagen Geschichten rausgesucht, 00:58:05.949 --> 00:58:09.880 von denen ich weiß dass es Fakenews sind und habe dann beispielsweise Blogpost und 00:58:09.880 --> 00:58:14.029 so weiter die es verbreitet haben und diese URL... also wer twittert im Prinzip 00:58:14.029 --> 00:58:18.369 Fakenews und genau, dadurch kam dann diese Einfärbung zustande. 00:58:18.369 --> 00:58:22.829 H: Mikro 3. M3: Ja ich hab noch ein Frage zu 00:58:22.829 --> 00:58:26.889 Antworten, also ich hab oft gehört von Journalisten die sich beschwert haben, 00:58:26.889 --> 00:58:30.510 wenn sie über ein bestimmtes Thema berichtet haben, dass da irgendwelche Bots 00:58:30.510 --> 00:58:34.239 sie mit Antworten zumüllen oder sowas. Hast du sowas beobachten können wird das 00:58:34.239 --> 00:58:37.959 irgendwie als Megafon eingesetzt um dann einfach nochmal ein bisschen mehr Bums 00:58:37.959 --> 00:58:41.449 oder Druck zu machen auf solche Accounts? Gibt's das was oder ist das auch 00:58:41.449 --> 00:58:44.809 eigentlich alles echte Menschen die wirklich wütend sind? 00:58:44.809 --> 00:58:49.499 MK: Ich sag noch nicht, dass das alles echte Menschen sind, also ich kann mit 00:58:49.499 --> 00:58:57.330 einem Bot zum Beispiel immer einen Hashtag unbenutzbar machen. Ich kann mir einen 00:58:57.330 --> 00:59:00.890 Hashtag raussuchen und kann das dann mit Bots vollmüllen, aber das ist dann 00:59:00.890 --> 00:59:05.670 eigentlich mehr ein Spam oder um den Diskurs zu stören, aber nicht wirklich 00:59:05.670 --> 00:59:13.380 einen Einfluss zu haben dabei. Zu den Journalisten, ich kenne da einige 00:59:13.380 --> 00:59:20.140 Journalisten, die auf Twitter aktiv sind und dann immer wieder mit einer großen 00:59:20.140 --> 00:59:24.049 Anzahl Accounts konfrontiert werden. Ich bin mir da auch nicht sicher, 00:59:24.049 --> 00:59:27.488 ob es tatsächlich sich um Botnetzwerke handelt, denn es sind immer wieder 00:59:27.488 --> 00:59:31.209 vereinzelt Leute die unterschiedliche Tweets machen, es ist ja schon wahnsinnig 00:59:31.209 --> 00:59:35.429 schwierig 100.000 künstliche Tweets zu erzeugen mit einer künstlichen Intelligenz 00:59:35.429 --> 00:59:39.019 zu erzeugen, die aber unterschiedlich sind. Das ist schon ein relativ hartes 00:59:39.019 --> 00:59:42.589 Problem, ich weiß nicht ob das bereits gelöst ist, ich glaube nämlich nicht. 00:59:42.589 --> 00:59:48.469 H: Nummer 4 bitte. M4: Eine Frage zu einem Kriterium, bei dem 00:59:48.469 --> 00:59:52.720 ich nicht weiß, ob es aufgetaucht ist oder nicht, oder ob ich nur nicht aufmerksam 00:59:52.720 --> 00:59:58.400 genug war. Und zwar geht es um gleichlautende Nachrichten in Tweets zum 00:59:58.400 --> 01:00:03.819 Beispiel. Also ich weiß, dass bei Fakenews teilweise ganze absatzweise Texte 1 zu 1 01:00:03.819 --> 01:00:10.189 kopiert werden und auch manuell sozusagen, trotzdem kommt mir das auch als ein 01:00:10.189 --> 01:00:14.709 wichtiges Kriterium vor um, wie gesagt, einen Einflussfaktor, ist es ein Bot oder 01:00:14.709 --> 01:00:19.920 nicht festzustellen. Spielt das in den Studien irgend eine Rolle, die Du 01:00:19.920 --> 01:00:24.849 untersucht hast oder für Deine Arbeit? MK: In den Studien kann ich es nicht 01:00:24.849 --> 01:00:29.250 sagen, die hatten jetzt immer nur ihre Kriterien mit den Hashtags und so weiter. 01:00:29.250 --> 01:00:35.550 Was in meiner Arbeit aufgefallen ist, dass ist immer wieder, zum einen es gibt 01:00:35.550 --> 01:00:39.379 natürlich Leute die sagen, ich will das jetzt nicht retweeten sondern ich kopiere 01:00:39.379 --> 01:00:43.189 den Tweet und sage sozusagen, dass das mein Eigener ist. Aber es gibt tatsächlich 01:00:43.189 --> 01:00:48.220 bestimmte Formulierungen die zu 10.000-en identisch auftauchen, aber es 01:00:48.220 --> 01:00:53.429 sind tatsächlich nur Textdatenbanken, die da einfach abgespielt werden, auch nicht 01:00:53.429 --> 01:00:57.210 mit politischen Inhalten, sondern ... ich weiß nicht vielleicht sind die dormant 01:00:57.210 --> 01:01:01.680 oder sowas, aber keinerlei politische Aktivität zu sehen dort. 01:01:01.680 --> 01:01:04.869 H: Und die 2 bitte. Lachen 01:01:04.869 --> 01:01:12.109 M2: Ja hallo, auch nochmal vielen Dank für den Vortrag. Eine Frage zu dem Thema 01:01:12.109 --> 01:01:20.149 Schweden-Reisewarnung, was am Anfang kam. Wie viel Handarbeit war dabei die Tweets 01:01:20.149 --> 01:01:23.770 quasi rauszufinden, die zu dieser Story gehören, und wie kannst Du Dir sicher 01:01:23.770 --> 01:01:27.269 sein, dass Du alle gefunden hast? MK: Ich kann mir nicht sicher sein, dass 01:01:27.269 --> 01:01:31.131 ich alle gefunden habe, insbesondere weil immer wieder Tweets gelöscht werden oder 01:01:31.131 --> 01:01:34.889 ganze Accounts. Das hat man auch gesehen, wenn man sich die Daten mal ein halbes 01:01:34.889 --> 01:01:38.648 Jahr später anschaut, oder wie viele Accounts in der Zwischenzeit weg sind. Ich 01:01:38.648 --> 01:01:41.990 kann mir nicht sicher sein, dass ich alle Tweets gefunden habe, natürlich nicht. Was 01:01:41.990 --> 01:01:44.840 man halt machen kann ist sich durchzuhangeln. Man fängt dann an mit 01:01:44.840 --> 01:01:48.789 sowas wie "Schweden Reisewarnung" und dann sieht man die ersten, und dann kommen da 01:01:48.789 --> 01:01:52.600 aber auch noch andere Begriffe zusammen und hier finde ich nochmal einen Link auf 01:01:52.600 --> 01:01:55.579 einen Blogpost und dann suche ich mal nach dem und so weiter, und so wird die 01:01:55.579 --> 01:01:59.759 Datenbank immer größer und so habe ich glaube ich 1800 Tweets oder sowas gefunden 01:01:59.759 --> 01:02:03.469 und versuch die dann so halbautomatisiert zu kategorisieren mit Fakenews und so 01:02:03.469 --> 01:02:07.249 weiter. Das ist sozusagen die Methodik, das ist eigentlich so halbautomatisierte 01:02:07.249 --> 01:02:10.119 Handarbeit. H: Jetzt aber, Fefe. 01:02:10.119 --> 01:02:14.239 Frage M1 [???]: Ich hab eine H: Die eins ist das bitte. 01:02:14.239 --> 01:02:19.159 Frage M1: Hallo, hallo. Also ich hab eine kurze Frage und eine Bitte um weitere 01:02:19.159 --> 01:02:22.490 Daten. Erstens würde ich gerne wissen, wie viele von Deinen Rohdaten Du 01:02:22.490 --> 01:02:26.760 veröffentlichen kannst und tust. Und zweitens Dein Beispiel am Anfang mit der 01:02:26.760 --> 01:02:31.309 Twitter-Timeline da ging's irgendwie um 2.000 Tweets oder 2.000 Leute und das ist 01:02:31.309 --> 01:02:35.219 eine Größenordnung, die man häufiger sieht in diesen Debatten und da frage ich mich 01:02:35.219 --> 01:02:39.230 immer, ich hab mehr ungelesene Mails in meiner Inbox, wieso interessieren mich 01:02:39.230 --> 01:02:43.749 2000 Leute? Ist das irgendwie, wieso ist das jetzt eine relevante Größenordnung? 01:02:43.749 --> 01:02:46.799 Kannst du da vielleicht noch etwas dazu sagen? 01:02:46.799 --> 01:02:50.739 A: Okay, also das erste war, ob ich meine Daten veröffentlichen kann. Es gibt 01:02:50.739 --> 01:02:54.529 tatsächlich eine Guideline von Twitter, die es mir nicht erlaubt beispielsweise 01:02:54.529 --> 01:02:58.389 von einem bestimmten Account zehntausende von Tweets zu veröffentlichen. Es gibt 01:02:58.389 --> 01:03:02.209 bestimmte Sachen, die man machen darf. Da würde ich mich halt, sonst hätte ich es 01:03:02.209 --> 01:03:06.119 jetzt einfach mal so "Rechtsklick veröffentlichen" gemacht. Ich würde es mir 01:03:06.119 --> 01:03:11.089 jetzt mal nochmal genauer anschauen, was ich machen darf und so weiter. Gerade 01:03:11.089 --> 01:03:14.630 "hydrated Tweets" heißt das, also sozusagen nicht nur Twitter-IDs zu haben, 01:03:14.630 --> 01:03:17.469 sondern wirklich eine große csv-Datei oder sowas, die man dann sich in Excel mal 01:03:17.469 --> 01:03:20.930 durchklicken kann, kann glaube ich bei dem ein oder anderen, der da frisch mit dem 01:03:20.930 --> 01:03:25.339 Thema ist schon weiterhelfen. Muss ich halt mal kucken in den nächsten Tagen. Und 01:03:25.339 --> 01:03:29.329 die zweite Frage war, inwieweit zweitausend Accounts einen Einfluss haben? 01:03:29.329 --> 01:03:33.150 F: Genau, vielleicht ein bisschen Kontext geben. Ist das irgendwie besonders viel 01:03:33.150 --> 01:03:37.439 oder ist das üblich oder findest du das eine relavante Größe? Wieso müssen wir 01:03:37.439 --> 01:03:41.029 über 2.000 reden, weil mir kommt es intuitiv nicht so viel vor, frage ich 01:03:41.029 --> 01:03:44.299 mich. Bei 80 Millionen Leuten sind 2.000 Leute nicht so. 01:03:44.299 --> 01:03:48.620 A: Das ist halt auch ein klassisches wichtiges Argument. Ich meine, erstens es 01:03:48.620 --> 01:03:51.920 sind nicht alle Leute in sozialen Netzwerken, dann sind eine Menge Leute in 01:03:51.920 --> 01:03:55.829 Facebook. Es ist nur ein winzig kleiner Teil davon auf Twitter und inwieweit da 01:03:55.829 --> 01:04:00.150 dann irgendwie 2.000 Leute tatsächlich einen Impact haben auf einen politischen 01:04:00.150 --> 01:04:04.819 Diskurs in Deutschand, da wird dann immer gesagt: ja aber in den sozialen Netzwerken 01:04:04.819 --> 01:04:09.500 sind aber die Aktivisten, die Journalisten usw. und wenn die beeinflusst werden, 01:04:09.500 --> 01:04:16.230 irgendwie sowas. Tatsächlich halte ich die Twitter-Diskussion nicht für politisch, 01:04:16.230 --> 01:04:18.679 gesellschaftlich relevant in Deutschland. F: Lachen 01:04:18.679 --> 01:04:21.069 H: So, eine Frage schaffen wir noch. Das ist die 4. 01:04:21.069 --> 01:04:30.269 Frage M4: Hallo! Erst kurz Danke, weil Dein Projekt mir im Studium, mich ziemlich 01:04:30.269 --> 01:04:40.269 gerettet hat, also Danke. Und dann ist mir halt aufgefallen, gerade bei diesen Troll- 01:04:40.269 --> 01:04:46.959 Armeen, keine Ahnung, diese bezahlten, ob Du mal gekuckt hast in den Accounts, wie 01:04:46.959 --> 01:04:52.509 oft sich besitmmte Sachen wiederholen? Zum Beispiel haben die ja oft dasselbe 01:04:52.509 --> 01:04:58.729 Profilbild und dann Accounts mit fortlaufenden Nummern, wenn der erste 01:04:58.729 --> 01:05:02.629 gelöscht wird oder gesperrt? A: Dieses Phänomen sieht man auch 01:05:02.629 --> 01:05:06.469 generell. Das sieht man auch bei wütenden Bürgern, die in den sozialen Netzwerken 01:05:06.469 --> 01:05:10.199 sind. Dann von beispielsweise Twitter gesperrt werden, dann wieder rauf kommen 01:05:10.199 --> 01:05:13.789 und dann packen sie sich hinter ihren alten Usernamen einfach noch eine Zahl 01:05:13.789 --> 01:05:17.739 hinten dran. Aber ob die Leute tatsächlich bezahlt werden oder nicht, das kriege ich 01:05:17.739 --> 01:05:21.510 über eine Twitter-API auch nicht heraus. Eigentlich müsste man dann fast wie ein 01:05:21.510 --> 01:05:26.059 Ethnologe sich mit den Leuten unterhalten und kucken, was sie da für eine Agenda 01:05:26.059 --> 01:05:31.660 haben. Ich finde es aber gefährlich dann von vornherein zu sagen, die sind bezaht 01:05:31.660 --> 01:05:35.729 oder sind vom Kreml gesteuert oder sind künstliche Intelligenzen oder keine Ahnung 01:05:35.729 --> 01:05:39.459 was. Das muss auf jeden Fall wieder eine Debatte sein, die auf evidenzbasierter 01:05:39.459 --> 01:05:42.323 Forschung basiert. F: Ja ich hab die auch nur. Bin ich noch 01:05:42.323 --> 01:05:44.150 da? H: Ja. 01:05:44.150 --> 01:05:52.219 F: Ich hab die auch nur zufällig gefunden, weil ich das halt gemacht hab damals zur 01:05:52.219 --> 01:05:58.920 Türkei-Wahl und es halt sehr viele Accounts gab, die immer so türkischen Spam 01:05:58.920 --> 01:06:03.309 gepostet haben, sich dann aber plötzlich in sehr schlechtem Deutsch in deutsche 01:06:03.309 --> 01:06:06.600 Debatten eingemischt hatten. A: Super, dann sollten wir auf jeden Fall 01:06:06.600 --> 01:06:09.679 mal unterhalten, ich glaube da können wir uns gegenseitig helfen. 01:06:09.679 --> 01:06:13.440 H: Unterhalten könnt ihr euch gleich neben der Bühne, die Zeit ist nämlich jetzt 01:06:13.440 --> 01:06:17.563 leider um. Vielen Dank Michael Kreil! Da geht mehr! 01:06:17.563 --> 01:06:25.709 Applaus 01:06:25.709 --> 01:06:30.999 Abspannmusik 01:06:30.999 --> 01:06:42.769 Untertitel erstellt von c3subtitles.de im Jahr 2019. Mach mit und hilf uns!