0:00:13.264,0:00:18.563 Herzlich willkommen zu meinem Talk. Vielen Dank für die nette Einführung und die nette Begrüßung von euch allen! 0:00:18.563,0:00:25.472 Ihr seht der Talk hat den anspielungsreichen Namen "Überwachen und Sprache" 0:00:25.472,0:00:28.343 spielt natürlich auf Foucault an "Überwachen und Strafen" 0:00:28.343,0:00:36.115 Allerdings, lange bevor Foucault die Genese der Disziplinargesellschaft dargestellt hat 0:00:36.115,0:00:41.592 findet man in einem Kinderbuch eine sehr schöne moralische Erzählung 0:00:41.592,0:00:48.776 die heißt "Das Kind im Glashaus" von Heinrich Oswalt entstanden 1877 und sehr weitsichtig 0:00:48.776,0:00:53.111 In Frankfurt lebt ein Glasermeister,[br]Herr Lebrecht Scheibenmann, so heißt er;[br] 0:00:53.111,0:00:56.960 Der hat ein kleines Töchterlein,[br]Das wollte nie gewaschen sein. 0:00:56.960,0:00:59.576 Und kam mit Schwamm und Seif sein Gretchen,[br]Da lief davon das böse Mädchen; 0:00:59.576,0:01:04.408 Es warf sogar den Waschtisch um -[br]Das Wasser floß im Haus herum. 0:01:04.408,0:01:09.695 Da fing Herr Lebrecht Scheibenmann[br]Ein seltsam Haus zu bauen an, 0:01:09.695,0:01:13.519 Aus lauter Glas ein Haus, das, ach![br]Durchsichtig war bis unters Dach. 0:01:13.519,0:01:16.479 Und in dies Glashaus setzte man[br]Das böse Töchterlein sodann. 0:01:16.479,0:01:19.739 Da blieben, um es anzusehn,[br]Die Leute auf der Straße stehn. 0:01:19.739,0:01:23.575 […][br]Da schämte sich das Kind und lief[br]Im ganzen Haus herum und rief: 0:01:23.575,0:01:26.359 “Wo soll ich mich denn nur verstecken?[br]Man sieht mich ja in allen Ecken! 0:01:26.359,0:01:31.839 Das Dach, der Keller, jedes Zimmer[br]Ist ja von Glas! man sieht mich immer!” 0:01:31.839,0:01:35.967 Die Mutter sprach: “Mein liebes Kind![br]Ein Mittel gibt’s, das hilft geschwind: 0:01:35.967,0:01:40.360 Wenn dich die Leute artig sehn[br]Dann werden sie vorübergehn; 0:01:40.360,0:01:43.472 […][br]Das merkte sich das Töchterlein;[br]Es nahm sich vor, geschickt zu sein. 0:01:43.472,0:01:46.831 Und weil’s beim Waschen nicht mehr schrie,[br]Da lachten auch die Leute nie; 0:01:46.831,0:01:50.791 Denn jeder, der ins Haus jetzt blickt,[br]Der sieht ein Kind, das ganz geschickt. 0:01:50.791,0:01:54.888 Und habt Ihr selbst ein Kind, Ihr Leut’,[br]Das bei dem Waschen immer schreit, 0:01:54.888,0:02:01.431 Sagts nur Herrn Lebrecht Scheibenmann,[br]Der schafft Euch gleich ein Glashaus an. 0:02:01.431,0:02:09.935 Ja, da … erste Applausansätze lacht[br]Applaus 0:02:09.935,0:02:13.487 Ja, interessante Geschichte, die natürlich sehr gut auf unsere Zeit passt 0:02:13.487,0:02:21.264 denn Lebrecht Scheibenmann heißt Keith Alexander und arbeitet für die NSA 0:02:21.941,0:02:26.311 Die NSA hat aus unser aller Zuhause Glashäuser gemacht 0:02:26.311,0:02:29.127 wir können alle gesehen werden in diesen Glashäusern 0:02:29.127,0:02:39.559 und man weiß nicht, bzw. ich bin mir ziemlich sicher, dass man damit pädagogische Ziele verfolgt 0:02:39.559,0:02:43.351 dass bestimmte Handlungen nicht mehr als akzeptabel gelten 0:02:43.351,0:02:47.320 und dass wir diese Beobachtung verinnerlichen 0:02:47.320,0:02:51.552 Bei dieser Beobachtung spielt Sprache natürlich eine ganz wichtige Rolle 0:02:51.552,0:02:56.535 Viele unserer Äußerungen finden im Medium der Sprache statt 0:02:56.535,0:03:05.655 Das hat auch viele Hacker auf die Idee gebracht, dass wir die NSA austricksen mit einer Seite wie "Hallo NSA" 0:03:05.655,0:03:16.767 Eine Website, die wie ein „Bullshitter“ verdächtige Wörter zu Botschaften zusammensetzt 0:03:16.767,0:03:23.895 und diese dann getweetet, gemailt oder verchattet werden sollen 0:03:23.895,0:03:30.399 um soetwas zu erreichen wie hier "Operation Troll the NSA“ 0:03:30.399,0:03:35.879 dass man die NSA-Scanners jammen kann, dass man eine DDOS Attacke machen kann. 0:03:35.879,0:03:44.370 indem man einfach zu viel Content schickt, der quasi verdächtig ist auf der Basis von Keywords 0:03:44.370,0:03:50.911 In meinem Vortrag soll es darum gehen, dass dieses Bild von der NSA falsch ist. 0:03:50.911,0:03:55.394 Wir können nicht davon ausgehen, dass in der NSA die Leute tatsächlich bei Anzeige eines Keywords 0:03:55.394,0:04:05.358 sofort etwas ausdrucken und zu einer Gelächter[br]Analyse schreiten 0:04:05.404,0:04:10.968 und sich das genauer anschauen und qualitativ quasi auswerten 0:04:11.060,0:04:13.519 und das natürlich eine sehr intensive Tätigkeit 0:04:13.519,0:04:26.504 und deswegen ist ein Keyword-Spam-DDoS natürlich erfolglos wäre 0:04:28.900,0:04:34.100 Ihr alle werdet vermutlich die thanksgiving taklkingpoints der NSA gelesen haben. 0:04:34.100,0:04:41.880 Ich weiß nicht, ob ihr darüber gestolpert seid, dass unter Punkt 4 etwas ganz wichtiges steht 0:04:41.880,0:04:47.888 “NSA brings together the best linguists, analysts, mathematicians, engineers and computer scientists 0:04:47.888,0:04:52.249 in the United States.“ [br]und die Linguisten werden als erstes genannt. 0:04:52.249,0:04:56.290 verhaltenes Lachen 0:04:56.290,0:05:02.063 Also da sieht man, der NSA ist durchaus bewusst, dass Sprache ein wichtiges Medium ist 0:05:02.063,0:05:08.603 und das auch für sie sehr wichtig ist. Insofern macht es durchaus Sinn, sich damit zu beschäftigen 0:05:08.603,0:05:16.755 Zufälligerweise wurde vom Innenminister die neuste Analysesoftware geleakt, der "Advanced Security Toolkit" 0:05:16.755,0:05:25.514 Entwickelt vom von-Leitner-institut für verteiltes Echtzeit-Java. Gelächter 0:05:27.530,0:05:31.193 Wir gucken uns zunächst unsere heutige Mission an. 0:05:31.193,0:05:35.913 Die heutige Aufgabe besteht darin, die deutsche Bloggerszene unter die Lupe zu nehmen 0:05:35.913,0:05:40.192 die radikalisiert sich ja offenbar seit Regierungsübernahme durch die Große Koalition 0:05:40.192,0:05:47.928 wichtig ist es, zu schauen, ob Aktionen in Vorbereitung sind, und ggf. radikale Subjekte zu identifizieren, 0:05:47.928,0:05:59.747 die sich da besonders hervortun. Zunächst wählen wir unsere Targets, wir kriegen natürlich welche vorgeschlagen 0:05:59.747,0:06:03.873 Leider kann ich nur eine kleine Auswahl möglicher Targets präsentieren. Ich hätte gerne noch viel mehr genommen 0:06:03.873,0:06:06.241 Es gibt ein paar gesellschaftskritische Blogs und Newssites 0:06:06.241,0:06:11.900 wie blog.fefe.de, indymedia, Mädchenmannschaft, Netzpolitik.org, rebellmarkt.blogger.de 0:06:11.900,0:06:18.361 Und religiös motivierte Webseiten, wie kreuz.net, islambruderschaft.com-blog und Diskussionsforum salafistisches 0:06:18.361,0:06:23.229 und wir bestätigen natürlich die Auswahl. Das ist eine sehr sinnvolle Auswahl 0:06:23.229,0:06:31.681 Folgende Analysen sind möglich. Ich kann natürlich nur eine Auswahl an möglichen Analysetools heute zeigen 0:06:31.681,0:06:36.417 Ich würde gerne viel mehr zeigen, aber die Zeit wird nicht reichen. 0:06:36.417,0:06:42.361 Zunächst gucken wir uns an, was schreiben Autoren über mögliche sensible Ziele 0:06:42.361,0:06:46.193 Wir machen also mal eine Zielanalyse. 0:06:46.193,0:06:55.980 diese untersucht auf Basis von Named-Entity-Recognition die Kollokation zu möglichen Terrorzielen 0:06:55.980,0:07:04.393 Wir müssen … was ist das denn? … wir gucken mal ins Handbuch rein, was Named Entities sind 0:07:04.393,0:07:08.649 ist ja unser erster Tag heute 0:07:08.649,0:07:19.577 Named-Entities sind zunächst mal Ausdrücke, die eine Etentität eindeutig von anderen Entitäten mit ähnlichen Attributen unterscheiden 0:07:19.577,0:07:25.139 Man denkt spontan an Namen, aber es ist nicht so trivial zu sagen was ein Name ist 0:07:25.139,0:07:31.690 Named-Entitiy-Recognition ist entsprechend das Verfahren, wie man solche Named Entities identifiziert 0:07:31.690,0:07:43.889 Es gibt sicherlich unterschiedliche Klassen von Named Entities, bspw. Personen, Organisationen, Orte 0:07:43.889,0:07:51.217 Manchmal ist auch nicht so deutlich zu was eine bestimmte Named Entity gehört. z.B. „der Bundestag“ 0:07:51.217,0:07:57.361 das kann sowohl ein geografischer Ort sein, als auch eine Organisation 0:08:02.100,0:08:06.241 Jetzt müssen wir noch wissen, was Kollokationen sind 0:08:06.241,0:08:12.409 Das sind statistisch überzufällig häufige Wortkombinationen 0:08:12.409,0:08:22.849 d.h. “we define a collocation as a combination of two words, that exhibit a tendency to occur near each other in natural language that is to cooccur” 0:08:22.849,0:08:27.369 also z.B. „ein Weg einschlagen“, „ein Weg gehen“ 0:08:27.369,0:08:31.761 Das sind typische Verbindungen zwischen den Worten „Weg“, „gehen“ bzw. „einschlagen“ 0:08:31.761,0:08:41.024 und diese Verbindungen bilden Kollokationen, wenn sie überzufällig sind 0:08:41.024,0:08:44.929 wie wir mit statistischen Tests feststellen können 0:08:44.929,0:08:48.313 und wir können die in natürlicher Sprache beobachten 0:08:48.313,0:08:53.569 Ein Beispiel – ihr müsst das jetzt nicht lesen können – ich wollte ein Beispiel zeigen zum Wort „Spezialexperte“ 0:08:53.569,0:08:59.100 man sieht hier das “keyword in context”, also das gesuchte Schlüsselwort 0:08:59.100,0:09:07.242 und man sieht die Kontexte dieses Wortes, also einen „ausgesuchten Spezialexperten für Internetfragen“ haben sie wohl nicht gefunden 0:09:07.242,0:09:12.337 Wir müssen kein Ratespiel machen, aus welchem Blog das wohl stammen könnte 0:09:12.337,0:09:15.217 Was man dann macht, bei einer Kollokationsanalse[br]man untersucht Kontexte 0:09:15.217,0:09:22.457 z.B. hier fünf Wörter links, fünf Wörter rechts bis Satzanfang oder -ende 0:09:22.457,0:09:28.833 Man zählt einfach die Wörter, die im blauen Bereich stehen 0:09:28.833,0:09:35.832 und vergleicht die relative Frequenz mit Wörtern, die links und rechts im weißen Bereich stehen 0:09:35.832,0:09:43.947 Wenn ein Wort signifikant häufiger im blauen Bereich vorkommt, kann man sagen, es ist eine Kollokation des Worts „Spezialexperte“ 0:09:43.947,0:09:49.529 Hier fällt bspw. auf „kriegen“ oder „Adobe-Spezialexperten“ Gelächter 0:09:49.529,0:09:58.395 Man kann Kollokationen als Graphen visualisieren Gelächter 0:09:59.672,0:10:05.961 Die Knoten bezeichnen Lexeme, (ich weiß jetzt nicht, was es da zu lachen gibt) mehr Gelächter 0:10:05.961,0:10:12.170 (das ist ernste Linguistik!) und die Kanten bezeichnen „ist Kollokation von“ 0:10:12.170,0:10:18.625 Sie sehen also hier „die besten der besten, Sir“, Sarrazin und Mehdorn gehören dazu. 0:10:18.625,0:10:24.258 Es wuchert ein bisschen weiter. „Adobe-Backup“, „Backup-Spezialexperten“ … interessant 0:10:24.258,0:10:34.880 Ok. Wir sind im Bereich der Zielanalyse. Wir starten mal die Analyse. 0:10:34.880,0:10:43.241 Was machen wir da eigentlich? Was wir machen ist, wir erkennen in allen Corpora alle Named Entities 0:10:43.241,0:10:49.537 Wir berechnen das erstmal mit Methoden maschinellen Lernens. 0:10:49.537,0:10:53.409 D.h. man untersucht bestimmte Kontexte in denen Named Entities stehen. 0:10:53.409,0:10:59.361 Wir haben einen Trainings-Corpus, in dem steht bereits drin, was Named Entities sind 0:10:59.361,0:11:07.569 bspw. dass „Bundestag“ eine Organisation ist und die Software lernt aus diesen Kontexten 0:11:07.569,0:11:16.913 was typische Kontexte für solche Named Intities sind und versucht diese auf neue Corpora anzuwenden 0:11:16.913,0:11:23.162 Was wir hier machen: wir identifizieren in allen Corpora, in allen Blogs, die wir untersuchen die Named Entities. 0:11:23.162,0:11:28.309 wir kategorisieren diese Named Entities nach Personen, Organisationen, geografischen Orten und Sonstigen 0:11:28.309,0:11:32.408 und dann berechnen wir die Kollokationen eben zu relevanten Named Entities. 0:11:32.408,0:11:37.353 z.B. „Angela Merkel” könnte interessant sein oder sowas. 0:11:37.353,0:11:45.281 Und dann schauen wir auch in den Kollokationen, ob darin irgendwelche Gefährderwörter sind. 0:11:45.281,0:11:50.634 Also Wörter, die auf Anschlagsplanungen oder sonstiges hindeuten. Das machen wir jetzt. 0:11:50.634,0:12:02.157 die Analyse ist offenbar abgeschlossen und Ergebnis ist, wir haben Gefahrenstufe 1 von 5, also nicht weiter tragisch 0:12:02.157,0:12:12.730 die Software schlägt uns eine Überprüfung der Gefährdungslage in Hinblick auf Berlin vor 0:12:12.730,0:12:17.377 also der Ortsangabe bei donalphonso, Rebellmarkt-Blogger 0:12:17.377,0:12:31.769 Potentielles Ziel bei Fefe ist SPD Gelächter und bei der Mädchenmanschaft sollen wir nach Kristina Schröder als Person gucken Gelächter 0:12:31.769,0:12:45.942 Wir haben jetzt zum Beispiel als Auftrag bekommen, zu schauen, warum donalphonso Böses über Berlin schreibt und ggf. etwas plant 0:12:45.942,0:12:50.219 Wir können uns jetzt Kollokationsgraphen anzeigen lassen oder Geokollokationen 0:12:50.219,0:13:00.588 D.h. wir haben eine Landkarte und darauf stehen an den Orten, über die donalphonso schreibt, die Kollokationen zu den Orten 0:13:00.588,0:13:07.153 In Amerika schreibt er über Boyd und Kultur, Einzeltäter, verwirrt und „hassen Mail“ und sowas 0:13:07.153,0:13:15.444 Deutschland, Mitteleuropa ist natürlich im Fokus. Das geht auch bis Italien runter 0:13:15.444,0:13:20.444 Da sieht man auch, worüber donalphonso so schreibt. 0:13:20.444,0:13:26.229 Wir nähern uns Berlin. Da sind zu viele Kollokationen als dass wir sie alle auswerten könnten 0:13:26.229,0:13:35.804 Deswegen schauen wir uns den Kollokationsgraphen an und suchen nach Hinweisen auf Terror, der stattfinden könnte 0:13:35.804,0:13:45.690 Ich lese einige vor: „Berlin“, „Slum“, „Reichshauptslum“, „arm“, „Transferleistung“, „abscheulich“, „Berliner Hipster“ Gelächter 0:13:45.690,0:13:54.268 Das zeigt zwar eine sehr negative Haltung zu dem Gegenstand, aber ich würde nicht sagen terrorverdächtig. 0:13:54.268,0:14:01.295 Das weitere potentielle Ziel waren die Organisationen „SPD“ bei Fefe 0:14:01.295,0:14:13.572 Wir lassen uns den Kollokationsgraphen anschauen. Fefe und die SPD. Gelächter[br]Applaus 0:14:13.572,0:14:17.789 hey „Verräterpartei“, „Umfallerpartei“, mal kurz zurück 0:14:17.789,0:14:20.856 Insgesamt in der gesamten Liste fanden sich tatsächlich so Wörter wie: 0:14:20.856,0:14:36.773 „erhängen“, „erzwingen“, „Spitzenkandidat“, „Verräterpartei“, „Umfallerpartei“, „Pest“, „Cholera“ Gelächter, Applaus 0:14:36.773,0:14:42.277 Wenn wir uns den Kollokationsgraphen anschauen, dann merken wir schon, das sind Vorwurfshandlungen. 0:14:42.277,0:14:54.019 Aber da wird nicht geplant, dass der Spitzenkandidat um die Ecke gebracht werden soll von Fefe 0:14:56.158,0:15:02.477 Wir machen jetzt weiter mit dem Ideologiemonitor. Wir wollen jetzt mal messen … 0:15:02.477,0:15:15.530 Es ist belegt, dass die NSA viele Softwarepatente für Algorithmen zu Named-Entity-Recognition angemeldet hat 0:15:15.530,0:15:19.689 Es wurde in der Tat viel in dem Bereich Forschung betrieben vor einiger Zeit 0:15:19.689,0:15:27.711 Aber man findet zunächst heraus, was interessante Targets sind und was über die gesagt wird 0:15:27.711,0:15:34.234 Das kann man sicherlich noch besser machen, in dem man Idieologien misst. 0:15:34.234,0:15:44.227 Was wir jetzt berechnen wollen ist die Ähnlichkeit von Texten, von Blogs zu bestimmten weltanschaulichen Ideologien 0:15:44.227,0:15:53.428 Wir haben die Möglichkeit, linksextreme, rechtsextreme oder islamistische Einstellungen zu messen 0:15:53.428,0:16:06.579 Das machen wir so, dass wir typische Kollokationen berechnen … also zu einem bestimmten Korpus 0:16:06.579,0:16:11.990 Von diesem Korpus lernen wir. Das ist also das Vergleichsmodell. 0:16:11.990,0:16:18.269 Wir nehmen mal die „Islambruderschaft“. Die hat ein Blog und da schreiben sie böse Sachen 0:16:18.269,0:16:33.510 und wir lernen von diesem Blog: was sind typische Wortverbindungen, die wir als islamistisch betrachten können 0:16:33.510,0:16:42.187 wir wollen gerne wissen, wer in einem salafistischen Diskussionsforum besonders viel von radikalislamischer Ideologie hat 0:16:42.187,0:16:52.579 also das ist ein ganz fieses Untersuchungsprogramm, das wir hier starten. Ja, die Analyse läuft 0:16:52.579,0:16:59.968 Das Ziel ist es, wie sind bestimte Texte von bestimmter Ideologie durchdrungen 0:16:59.968,0:17:09.363 und wir gleichen ein salafistisches Diskussionsforum mit unserem Trainingskorpus ab 0:17:09.363,0:17:15.395 und dieses Trainingscorpus ist ein Blog von der Islambruderschaft 0:17:15.395,0:17:22.900 was wir bekommen sind Wortverbindungen, die womöglich auf islamistische Grundhaltungen verweisen 0:17:22.900,0:17:24.799 – also ich hoffe, ihr denkt die Anführungszeichen immer mit – 0:17:24.799,0:17:34.771 Wir haben hier „Allah -> Krieg“, „Bombe -> Jahr -> Feind“, „Kufr -> beleidigen“, „Gesetz -> Islam“, „Bedeutung -> Jihad“, „Allah -> Afghanistan“, „martern -> Kufr“, usw. 0:17:34.771,0:17:41.750 Also es gibt eine ganze Reihe dieser Wortverbindungen, die wir aus diesem Korpus lernen 0:17:41.750,0:17:49.819 und jetzt schauen wir, wie diese Wortverbindugnen in personenspezifischen Korpora von Mitgliedern 0:17:49.819,0:17:56.851 in diesem Diskussionsforum vorkommen. Wir sehen hier einen User – natürlich ist der Nickname nicht echt 0:17:56.851,0:18:02.371 man sieht es ein bisschen schlecht, aber hier sind rote Verbindungen angeleuchtet 0:18:02.371,0:18:09.131 Das sind islamistische[br]Gelächter 0:18:09.131,0:18:16.858 Das sind sämtliche Kollokationen in diesem Korpus mit der höchsten Typizität 0:18:16.858,0:18:21.555 und solche Verdichtungspunkte verweisen auf bestimmte Themen 0:18:21.555,0:18:28.546 Wir haben auch den User „JihadFan“ Gelächter – der aber offenbar auch nicht so jihadistisch unterwegs ist 0:18:28.546,0:18:35.568 weil es sind relativ wenige – wir haben aber die Userin „Muslima“ – und leider sieht man das jetzt wirklich nicht so gut 0:18:35.568,0:18:42.582 ich mach es mal ein bisschen größer – bei ihr sehen wir relativ viele rote Verbindungen 0:18:42.582,0:18:48.386 wir können uns natürlich auch ein paar verdächtige Verbindungen anschauen 0:18:48.386,0:18:54.595 jetzt müssen wir wieder klein werden – da sind solche Verbindungen wie „der -> ganzen -> Welt -> Frieden -> Krieg -> bringen“ 0:18:54.595,0:19:01.235 Da sind Verbindungen wie „Bombadierung -> Zivilist -> schlachten -> martern -> Invasoren“, „erfolgreiche -> Operation“ 0:19:01.235,0:19:12.603 oder Verbindungen wie „Koran -> Taliban -> edel -> Sieg“, die vielleicht auf das Schreiben über das Thema hindeuten 0:19:12.603,0:19:17.838 das heißt, wir würden sagen, das wäre ein Ziel für weitere operative Maßnahmen, diese Userin, 0:19:17.838,0:19:21.431 und das schicken wir ab und dann geht es weiter. 0:19:21.431,0:19:35.946 Damit haben wir aber nichts mehr zu tun, denn wir sind ja nur Linguisten. Gelächter, Applaus 0:19:35.946,0:19:42.990 Ich deute das als Zustimmung. Gelächter Gut, wir fahren mit weiteren Analyseschritten fort. 0:19:43.040,0:19:59.379 Und zwar messen wir Radikalität. Radikalität ist etwas, das man so ohne weiteres erstmal nicht messen kann 0:19:59.379,0:20:03.323 denn es ist ja selbst ein ideologisches Konzept 0:20:03.323,0:20:13.590 Wir – vom Innenministerium – verstehen unter Radikalität zunächst eine stark negative Weltsicht 0:20:13.590,0:20:20.406 wir verstehen darunter eine Intoleranz gegenüber abweichenden Auffassungen, also ein schwarz-weißes Weltbild 0:20:20.406,0:20:26.147 wir verstehen darunter eine hohe emotionale Involviertheit 0:20:26.147,0:20:37.683 und eine Neigung zu Verschwörungstheorien[br]vereinzeltes Gelächter Ja! mehr Gelächter 0:20:37.683,0:20:48.990 Das ist nicht ganz vom Himmel gefallen. Es gibt tatsächlich Forschungsliteratur, die diese Punkte nennt 0:20:48.990,0:20:55.966 wie operationalisieren wir das jetzt, also eine negative Weltsicht? Ich möchte euch zwei Ansätze vorstellen 0:20:55.966,0:21:06.483 Es gibt also den sehr einfachen, listenbasierten Ansatz. Man sagt, wir haben eine bestimmte Liste von Wörten, 0:21:06.483,0:21:16.109 deren Bedeutung wir kennen und gucken, wie häufig finden sich die Listenelemente in Texten 0:21:16.109,0:21:21.700 Bspw. wenn wir „negative Weltsicht“ operationalisieren wollten, könnten wir sagen, wir suchen nach Phrasen 0:21:21.700,0:21:26.531 oder auch Vokabeln, die skandalisieren, wie: „Blindheit“, „Blödheit“, „Bodenlosigkeit“, „Chaos“, „Debakel“, 0:21:26.531,0:21:32.993 „Desaster“, „Dreistigkeit“, „Dummheit“, das könnte man alles anders nennen, könnte Indikator sein für negative Weltsicht 0:21:32.993,0:21:39.443 Wir haben auch den Gebrauch von negativ wertenden Adjektiven. Nur mal die ersten: „abartig“, „aberwitzig“, 0:21:39.443,0:21:45.850 „abfällig“, „abgedroschen“, „abgegriffen“, „abgeschmackt“, usw. Insgesamt 700, oder so 0:21:45.850,0:21:50.771 das wäre also der listenbasierte Ansatz. 0:21:50.771,0:21:56.747 Was wir natürlich auch machen können ist ein schwarzweißes Weltbild operationalisieren 0:21:56.747,0:22:03.402 das kann man mit Hilfe von „semantischen Taxonomien“ machen. Semantische Taxonomien beschreiben die Relationen 0:22:03.402,0:22:11.714 zwischen Wörtern in unserem Wortschatz, bspw. könnte auf schwarzweiß-Denken in Texten hindeuten 0:22:11.714,0:22:25.202 eine hohe Frequenz von „polaren Antonymen“, also Gegensatzwörtern, die man ohne degradierte Form gebraucht 0:22:25.202,0:22:30.645 also dass man sagt „lang“ und „kurz“ statt „länger …“ oder „kürzer als“. 0:22:30.645,0:22:36.957 Noch deutlicher wird es vielleicht bei Wörtern, die gar nicht gradierbar sind, wie „wahr“ oder „falsch“, 0:22:36.957,0:22:41.126 „tot oder lebendig“, „anwesend oder abwesend“, „dafür oder dagegen“. Da gibt es nichts dazwischen, 0:22:41.126,0:22:51.959 die sind komplementär und ihr Gebrauch, könnte man meinen, lässt Rückschlüsse auf ein schwarzweißes Weltbild zu. 0:22:51.959,0:22:57.733 Emotionale Involviertheit könnte man operationalisieren mit Hilfe von Gradpartikeln 0:22:57.733,0:23:05.558 das ist sowas wie „ich finde das absolut toll“, oder „total toll“. Ja, nicht nur „toll“, sondern „total“ 0:23:05.558,0:23:10.403 Das wäre bspw. ein Gradpartikel aus dem absoluten Intensivierungsbereich 0:23:10.403,0:23:21.210 wir können Gradpartikel unterscheiden nach Intensivierungsbereichen und es gibt unterschiedliche Abstufungen 0:23:21.210,0:23:24.746 wie den „absoluten“ Intensivierungsbereich, in den „absolut“, „gänzlich“, „grundlegend“, „gründlich“, 0:23:24.746,0:23:29.426 „im geringsten“, „komplett“, „längst“, „rein“ usw. reinfallen, den „extrem hohen“ Intensivierungsbereich: 0:23:29.426,0:23:34.820 „höchst“, „äußerst“, „zutiefst“, „aufs äußerste“, „aufs höchste“, „aufs Tiefste“, „höchstlichst“, usw. 0:23:34.820,0:23:40.200 und den hohen Intensivierungsbereich mit „sehr“, „stark“, „gewaltig“, „besonders“, „so“, „arg“, „übertrieben“ usw. 0:23:40.200,0:23:45.966 Wenn wir die Distribution dieser Gradpartikel in Korpora messen, dann könnten wir sagen: 0:23:45.966,0:23:55.534 vielleicht sind die Indikator für emotionale Involviertheit. Und die Neigung zu Verschwörungstheorien 0:23:55.534,0:24:01.259 das ist natürlich besonders schwierig zu operationalisieren, da haben wir einfach 0:24:01.259,0:24:09.674 eine Liste von Wörtern genommen, die darauf verweisen, dass vielleicht etwas nicht so ist, wie es sein könnte 0:24:09.674,0:24:12.917 wenn man Wörter hat wie „angeblich“, „vermeintlich“, „scheinbar“, „behaupten“, „heucheln“, 0:24:12.917,0:24:16.174 „verheimlichen“, „verschweigen“, „fingieren“, „vorgaukeln“, „entlarven“, usw 0:24:16.174,0:24:20.633 das sind natürlich Wörter, die zumindest das Potential haben, darauf zu verweisen, 0:24:20.633,0:24:25.134 dass die Welt nicht so ist, wie sie uns verkauft wird oder dargestellt wird. 0:24:25.134,0:24:36.690 Und das findet man natürlich eher bei Personen, die Verschwörungstheorien anhängen 0:24:36.690,0:24:44.573 Wenn man jetzt den Radikalitätsindex berechnet – das hier sind normalisierte Werte – dann kann man sehen Gelächter 0:24:44.573,0:24:56.470 dass Fefe, knapp gefolgt von donalphonso und mit kleinem Abstand das salafistische Forum lautes Gelächter 0:24:56.470,0:25:07.850 und weiterem Abstand kreuz.net hier aufschlagen. Fefe hat nirgendwo die erste Position, muss man dazu sagen 0:25:07.850,0:25:11.707 also auch bei den Verschwörungen nicht, da schlägt kreuz.net Fefe noch um Längen 0:25:11.707,0:25:15.440 – interessanterweise übrigens, wie ich fand – 0:25:15.440,0:25:22.493 und donalphonso ist also tatsächlich ein großer Skandalisierer und Intensivierer, kann man feststellen 0:25:22.493,0:25:27.796 wenn man sich noch einmal das Ranking anschaut, dann sieht das so aus … Fefe, donalphonso, salafistische … 0:25:27.796,0:25:40.998 Also ob wir operative Maßnahmen einleiten überlasse ich euch. Ich würde sagen, wir behalten die im Auge. 0:25:40.998,0:25:52.517 Das waren jetzt ein paar Techniken, die ich euch darstellen wollte, die wenig zu tun haben mit dem „Keywordbullshitter“ 0:25:52.517,0:26:01.989 den wir gesehen haben. Denn diese Keywords selbst spielen eine sehr geringe Rolle bei den Analysen, besonders wie zuletzt gesehen 0:26:01.989,0:26:11.273 Ich denke die Linguistik und die NSA-Linguisten sind sicherlich sehr viel weiter um e-Mails zu filtern 0:26:11.273,0:26:21.400 Ich denke, wenn man sich den Rechenschaftsbericht der G10-Kommission anschaut, die die deutschen Geheimdienste überwachen 0:26:21.400,0:26:27.573 die hatten ja zunächst so dargestellt es wurden so wahnsinnig viele e-Mails gescreent, aber das meiste davon war Spam 0:26:27.573,0:26:32.485 und wenn man sich den neueren Bericht anschaut, dann steht da, wir haben die Spamerkennung verbessert 0:26:32.485,0:26:38.518 und es wurden deswegen sehr viel weniger e-Mails. Aber es ist auch die Rede von mehreren Ebenen des Screenings 0:26:38.518,0:26:45.317 und es werden erst zu einem sehr späten Zeitpunkt e-Mails tatsächlich in die Hand genommen und qualitativ ausgewertet 0:26:45.317,0:26:56.133 und ich denke, dass vielleicht der allererste Zugriff über ein Keyword erfolgt, das auch sehr allgemein gehalten sein kann 0:26:56.133,0:27:03.137 dass die weiteren Ebenen dann natürlich viel feinere Analysen beinhalten, die eben Kollokation, semantische Taxonomien 0:27:03.137,0:27:10.845 oder Topic-Modelling, über das ich heute leider nicht sprechen kann, benutzen 0:27:10.845,0:27:18.446 Ja, ich bin noch nicht fertig. Vielleicht kennen einige von euch den Film „Alphaville“? 0:27:18.446,0:27:27.560 Alphaville ist ein Film von Jean-Luc Godard, in dem es darum geht dass Lemmy Caution, ein Spion, 0:27:27.560,0:27:38.750 in die Stadt Alphaville kommt, die von einem allmächtigen, diktatorischen, totalitären Computer beherrscht wird: Alpha 60 0:27:38.750,0:27:46.866 und ein Teil seiner Aufgabe ist es, diesen Computer auzuschalten und den Erzeuger von Braun zu finden. 0:27:46.866,0:27:53.873 Er spricht dann mit einem der Programmierer dieses Computers, einem Assistenten von von Braun 0:27:53.873,0:28:03.690 und der Assistent fragt ihn: „Sind Sie auch ein Spion?“ – Ich kann den Screenshot wegen Urheberrecht leider nur so zeigen 0:28:03.690,0:28:09.213 Darauf sagt Lemmy Caution: „Nein, das wissen Sie genau, ich bin nämlich ein freier Mann!“ 0:28:09.213,0:28:13.733 Daraufhin sagt der Assistent: „Ihre Antwort ist bedeutungslos. Wir wissen nichts. 0:28:13.733,0:28:18.598 Wir registrieren, berechnen und ziehen unsere Schlussfolgerungen.“ 0:28:18.598,0:28:27.733 Und dieser Satz erfasst eigentlich das Problem, das wir mit den Diensten haben, relativ gut. 0:28:27.733,0:28:36.624 Denn die Dienste unterwerfen unsere Lebensäußerungen einer Logik, die zunächst nicht unsere Logik ist 0:28:36.624,0:28:45.592 sie werten sie nach bestimmten Mustern aus: „Wir registrieren, berechnen…“, sie ziehen Schlussfolgerungen daraus 0:28:45.592,0:28:51.454 aber sie müssen sich dafür nicht rechtfertigen. Sie müssen ihre Methoden nicht offenlegen 0:28:51.454,0:28:55.792 und ihre Logik nicht zur Diskussion stellen. Und genau das ist das Problem. 0:28:55.792,0:29:05.153 Das ist aber ein Kennzeichen für alle totalitären Systeme, dass sie ihre Logik nicht rechtfertigen müssen. 0:29:05.153,0:29:09.349 Wir wissen überhaupt nicht, was überhaupt verdächtig sein könnte 0:29:09.349,0:29:16.909 und der Grund dafür ist, dass diese Dienste eben im Geheimen operieren können 0:29:16.909,0:29:21.312 und unsere Aufgabe sollte es sein, diese Methoden öffentlich zu machen, diese Methoden zu diskutieren 0:29:21.312,0:29:26.947 zu beweisen, dass diese Methoden fehlerhaft sind und unglaublich viele „false positives“ produzieren 0:29:26.947,0:29:32.635 und dass wir es deswegen lieber lassen sollten und wir vielleicht ein paar Scheiben ins Glashaus werfen 0:29:32.635,0:29:34.620 Vielen Dank 0:29:34.620,0:29:54.923 Applaus 0:29:54.923,0:29:58.339 Engel: Ja vielen Dank, Josh, für diesen richtig coolen Talk. Was auch cool ist: 0:29:58.339,0:30:01.819 Was auch total cool ist, wir haben noch richtig viel Zeit für Fragen und Antworten 0:30:01.819,0:30:06.659 Wir haben vier Saalmikrofone hier, wir haben zwei auf jeder Seite 0:30:06.659,0:30:14.667 für Leute, denen es schwerer fällt, zum Saalmikro zu kommen, habe ich auch das tragbare Handmikro 0:30:14.667,0:30:22.888 und wir können noch gucken, ob es Fragen aus dem Internet gibt und die dann den Signal Angle stellen 0:30:22.888,0:30:26.549 seid nicht so schüchtern, wir haben noch eine halbe Stunde, das war ja wohl ein guter Input 0:30:26.549,0:30:29.314 wenn ihr also eine Frage habt, dann bewegt euch dahin. 0:30:29.314,0:30:36.758 Ja vielleicht fangt ihr an, euch zu den Mikrofonen zu bewegen, geht das auch für euch beide? 0:30:36.758,0:30:40.438 Dann komm ich gleich zu dir, dann die erste Frage 0:30:40.438,0:30:48.294 Frage: Wie ist denn das mit diesen Kollokationen und Kultureller Kontext? Also es könnte sein, dass wir jetzt bspw. 0:30:48.294,0:30:58.710 da wollte jetzt ein Osama ein Konto eröffnen und das wurde ihm verweigert, weil er Osama heißt 0:30:58.710,0:31:09.787 dass wir dann diese Kollokation quasi feststellen, aber dass der Name Osama ein recht geläufiger im arabischen Kontext ist 0:31:09.787,0:31:17.774 wie wird damit umgegangen, dass das etwas ganz normales dort ist, für uns aber sofort verdächtig erscheint? 0:31:17.774,0:31:24.813 Antwort: Vielen Dank, ich weiß nicht auf welcher Ebene ich die Frage beantworten soll. 0:31:24.813,0:31:30.572 Aus linguistischer Perspektive kann man damit, glaube ich, recht gut umgehen, indem man weiteren Kontext dazu nimmt 0:31:30.572,0:31:35.859 und relativ schnell disambiguieren könnte, dass es sich eben nicht um Osama bin Laden handelt, 0:31:35.859,0:31:40.854 zumal der ja auch schon tot ist[br]Gelächter 0:31:40.854,0:31:50.749 aus Sicht eines Analytikers, der vielleicht gar nicht versteht, was unter der Haube eines solchen Toolkits läuft, ist es erstmal egal 0:31:50.749,0:31:58.705 denn er folgt seiner Logik, er hat seine Mission und wie gesagt, die Menge an false positives ist riesig 0:31:58.705,0:32:14.270 das wird eben damit gerechtfertig, dass das, was auf dem Spiel steht, so unglaublich monströs ist, wenn es denn fiele, dass das jedes Mittel rechtfertigt 0:32:14.270,0:32:19.117 E: Okay danke, dann haben wir noch eine Frage von dir und dann du als nächstes, bitteschön 0:32:19.117,0:32:25.693 F: ja, mich würde interessieren, ob du dir mal die Mühe gemacht hast, mit diesen Methoden 0:32:25.693,0:32:28.410 auch mal sowas wie die Pressemitteilungen des Innenministeriums zu analysieren 0:32:28.410,0:32:33.699 weil da ist doch bestimmt auch eine Menge Schwarzmalerei und emotionaler Sprachgebrauch zu finden 0:32:33.699,0:32:36.129 A: Sehr interessant, das ist eine gute Frage. Habe ich nicht gemacht 0:32:36.129,0:32:41.820 Was ich gemacht habe, war bei Politikerinnen und Politikern, also Angela Merkel, usw. 0:32:41.820,0:32:46.595 das trieft aber natürlich von positiven Darstellungen der Wirklichkeit 0:32:46.595,0:32:50.251 weil als Regierungschefin ist man natürlich bemüht, die Wirklichkeit so zu konstruieren, 0:32:50.251,0:33:01.200 dass sie in einem möglichst positiven Licht erscheint und es wäre sicherlich interessant das genauer anzuschauen 0:33:01.200,0:33:03.122 E: Die nächste Frage von dir bitteschön 0:33:03.122,0:33:10.843 F: Wäre es eigentlich möglich, so Konnotationsspam zu erzeugen 0:33:10.843,0:33:14.986 in einem etwas komplexeren Zusammenhang mit ein paar Bots? 0:33:14.986,0:33:25.309 A: Naja, hier kommt eine kluge Frage. Wenn wir jetzt schon wissen, dass Keyword-Bullshitting zu grob ist 0:33:25.309,0:33:30.330 ob wir dann nicht klugerweisen unser Wissen nutzen können, um Texte automatisiert zu erstellen, 0:33:30.330,0:33:38.478 die bestimmte Kollokationsprofile abbilden, bspw. Das können wir alles machen. 0:33:38.478,0:33:45.715 Aber ich möchte noch einmal drauf hinweisen, was mir wirklich ganz zentral ist 0:33:45.715,0:33:52.403 es hat, glaube ich, keinen Sinn, sich zu verstellen, sich zu verbergen in diesem Kontext 0:33:52.403,0:33:57.138 was sich ändern muss, ist diese Logik, in der dieses Spiel gespielt wird 0:33:57.138,0:34:04.820 Denn für jede Methode gibt es eine Gegenmethode. Das ist ein Wettrüsten, das in diesem Fall sehr wenig Sinn macht 0:34:04.820,0:34:09.819 Natürlich ist Verschlüsselung und alles sehr sinnvoll, aber gegen Dinge, die geäußert werden 0:34:09.819,0:34:17.187 und wir wollen uns eben auch öffentlich äußern, da sind wir gegen Ausspähung nicht gefeit. 0:34:17.187,0:34:23.954 und ich bin der Meinung, dass wir uns durch diese Dinge nicht einschränken lassen sollten 0:34:23.954,0:34:29.851 sondern dass wir uns eher darum bemühen sollten, die Logik der Dienste zu hinterfragen, 0:34:29.851,0:34:35.723 sie aus dem Geheimen herauszuziehen und das zu diskutieren, was da passiert, das ist das Entscheidende 0:34:35.723,0:34:42.514 E: Okay, die nächste Frage[br]Applaus 0:34:42.514,0:34:46.427 die nächste Frage ist von mspro und danach hätten wir noch Fragen aus dem Internet 0:34:46.427,0:34:51.432 F: Hallo, ich hätt da noch ne Frage zu deiner Anspielung am Anfang mit „Überwachen und Strafen“ 0:34:51.432,0:34:55.593 und deinem Schlussstatement. Das passt nicht so richtig zusammen. Du hast gesagt: 0:34:55.593,0:35:04.240 sowohl im Glashaus, als auch beim Panoptikum geht es darum, dass ich weiß, dass der Überwacher da ist 0:35:04.240,0:35:09.400 und weiß, nach welchen Kriterien er mich beurteilt, damit ich eine disziplinarische Wirkung habe 0:35:09.400,0:35:15.456 jetzt sagst du aber, dass ja genau diese Opakheit der Geheimdienste nach ihren Verdachtskriterien das Problem ist 0:35:15.456,0:35:22.575 das widerspricht sich total. Wenn ich nicht weiß, wonach ich als verdächtig betrachtet werde, 0:35:22.575,0:35:27.550 diszipliniert mich das ja gar nicht. Irgendwie passt das nicht zusammen 0:35:27.550,0:35:31.222 A: Danke für die Möglichkeit, das noch ein bisschen zu präzisieren. Ich denke, 0:35:31.222,0:35:37.480 wir haben natürlich eine Ahnung. Das ist ja das Schlimme, wir haben nicht mehr als eine Ahnung davon, 0:35:37.480,0:35:42.448 was denn als vermeintlich gefährlich betrachtet wird. Und genau das ist das Problem 0:35:42.448,0:35:49.976 also das Nicht-Wissen darum ist vielleicht noch die totalere Methode uns zu überwachen, 0:35:49.976,0:35:54.360 denn, ich möchte ein Beispiel geben: ich habe kürzlich ein Buch gelesen über ein maoistisches Gefängnis 0:35:54.360,0:36:02.547 und da ist es so, die Verhöre finden so statt, dass der Verhörende ein Buch hat. 0:36:02.547,0:36:10.284 und er sitzt dem Delinquenten gegenüber und sagt: „In diesem Buch steht alles, was du falsch gemacht hast, 0:36:10.284,0:36:17.336 alle deine Sünden stehen hier geschrieben. Du musst nur gestehen.“ Aber er darf nie in das Buch schauen 0:36:17.336,0:36:21.867 und er zermartert sich sein Gehirn unglaublich, weil er nicht weiß, was in diesem Buch steht 0:36:21.867,0:36:25.960 und er überlegt sich, „was kann ich noch alles gestehen, damit ich dieses Buch abarbeiten kann?“ 0:36:25.960,0:36:32.712 und ich glaube gerade die Unwissenheit darüber ist die viel raffiniertere, perfidere Methode der Kontrolle 0:36:32.712,0:36:37.696 und insofern schließt sich das nicht gegenseitig aus, weil unser Kopfkino, 0:36:37.696,0:36:41.811 was alles gefährlich sein könnte, ist mächtig genug. 0:36:41.811,0:36:47.320 E: Alles klar, danke. Dann haben wir jetzt Fragen aus dem Internet. Magst du die kurz stellen? 0:36:47.320,0:36:55.842 F: Gibt es eine Instanz, die die Keyword-Listen überprüft, und wenn ja, welche ist das? 0:36:55.842,0:37:02.968 A: Ja, sehr gute Frage! Keine Ahnung, weil wir wissen es nicht. Die leaken ab und zu 0:37:02.968,0:37:06.560 – und ich habe mir überlegt, mal eine Zusammenstellung zu machen: 0:37:06.560,0:37:10.272 es gibt die Echelon-Liste und es gibt ganz verschiedene Listen – also nein. 0:37:10.272,0:37:16.408 die sind nicht validiert, aber man kann davon ausgehen, dass die schon irgendwie an Fallbeispielen überprüft sind 0:37:16.408,0:37:20.239 denn sonst würde man sich ja unglaublich viel Arbeit machen. Aber wie und wo 0:37:20.239,0:37:30.740 und wie man das wissenschaftlich nachvollziehen kann, das ist leider nicht beschrieben und nachlesbar. 0:37:30.740,0:37:32.285 E: Da gibts wohl noch mehr Fragen aus dem Internet? 0:37:32.285,0:37:38.432 F: Noch eine zweite: Brächte es was, wenn wir jetzt alle schön in unserem Dialekt schreiben, 0:37:38.432,0:37:43.968 weil dann werden die Keywörter eventuell nicht erkannt, oder ist das sinnfrei? 0:37:43.968,0:37:54.552 Gelächter und Applaus 0:37:54.552,0:38:02.728 A: Also als Hess kann ich dir da sache, das det schon was bringe wärdd Gelächter 0:38:02.728,0:38:10.336 also in der Tat, das hätte tatsächlich Chancen, es den Diensten schwerer zu machen, absolut 0:38:10.336,0:38:16.993 es gibt natürlich Verfahren, mit denen man Ähnlichkeiten zwischen Wörtern messen kann, usw. 0:38:16.993,0:38:21.845 das ist durchaus möglich. Aber es würde es schwerer machen. 0:38:21.845,0:38:27.256 Es würde ja auch die Kommunikation erheblich schwerer machen, wenn wir alle im Dialekt schreiben 0:38:27.256,0:38:31.709 es gibt dann keine Standardorthografie, aber es funktioniert natürlich auch. Wie in der Schweiz 0:38:31.709,0:38:38.819 Gelächter 0:38:38.819,0:38:42.568 E: okay, die nächsten beiden Fragen sind von euch und dann seid ihr beide da drüben dran 0:38:42.568,0:38:47.128 F: Ja, mich würde interessieren, wie man mit der Schwierigkeit von Fremdsprachen umgeht 0:38:47.128,0:38:53.894 oder allgemein der Vielfalt an Sprachen. Wie kann man ggf. einen Bezug herstellen, 0:38:53.894,0:38:58.187 wenn der eine in Deutsch, der eine in Englisch schreibt. Oder wie analysiert man die Salafisten, 0:38:58.187,0:39:01.528 wenn sie in ihrer Muttersprache sprechen. 0:39:01.528,0:39:08.936 A: Ja, also grundsätzlich gibt es Software, die designt ist das sie sprachunabhängig funktioniert 0:39:08.936,0:39:15.993 Zumindest wenn die Sprache sich klar in Wörter abgrenzen lässt, usw. 0:39:15.993,0:39:23.392 Ich glaube, diese Software ist nicht so gut wie Tools, die sprachliches Wissen einbringen, 0:39:23.392,0:39:30.516 aber nichtsdestotrotz wird sie eingesetzt. Siemens macht sowas, bspw. zur Autorenerkennung 0:39:30.516,0:39:40.312 das wird eingesetzt und funktioniert eben auch tatsächlich sprachabstrakt. 0:39:40.312,0:39:44.480 Man lernt Feature und es ist egal, in welcher Sprache man die lernt. 0:39:44.480,0:39:48.218 es wird halt reicher und besser, wenn man sprachliches Wissen einbringt 0:39:48.218,0:39:57.225 F: Ich hab eine Frage, die ein bisschen schwarz-weiß ist. Wenn man sagt, wir reden über diese Listen 0:39:57.225,0:40:05.113 und die Worte, die darin stehen, dann ist doch das Problem, dass sie nicht mehr wertvoll sind, sobald sie bekannt sind 0:40:05.113,0:40:11.300 d.h. man hat nur die binäre Option, solche Techniken nicht anzuwenden, oder die Listen nicht zu veröffentlichen 0:40:11.300,0:40:14.288 oder kommt man irgendwie darum herum 0:40:14.288,0:40:23.531 A: eine gute Frage. Ich glaube eben, es gibt überhaupt kein Entkommen. 0:40:23.531,0:40:30.210 Klar, wenn die Listen bekannt sind, dann funktioniert es nicht mehr, wir können die wegschmeißen 0:40:30.210,0:40:33.829 wir arbeiten ja schon nicht mehr mit Listen. Aber auch die anderen Verfahren. 0:40:33.829,0:40:40.371 Wenn wir die kennen, können wir sie wegschmeißen. Ich glaube, dass dann die nächsten Verfahren kommen 0:40:40.371,0:40:45.531 Verfahren, die klandestine Kommunikation erkennbar machen, die maximale Abweichung 0:40:45.531,0:40:51.335 von normaler Kommunikation sichtbar machen und damit ist man wieder gefangen. 0:40:51.335,0:40:57.339 Ich glaube, dieses Katz-und-Maus-Spiel existiert, aber ich glaube, wir müssen da raus, 0:40:57.339,0:41:05.731 weil ich glaube, dass es das nicht bringt. Ich glaube, man soll es einfach lassen. 0:41:05.731,0:41:11.715 Applaus[br]E: Okay, du bist als nächster dran 0:41:11.715,0:41:18.376 F: Ich fühlte mich durch den Vortrag an den Fall des Staatssoziologen Andrej Holm erinnert, 0:41:18.376,0:41:25.683 der als angebliches Mitglied der militanten Gruppe im Gefängnis gelandet ist und zwar deswegen, 0:41:25.683,0:41:30.707 weil die Bekennerschreiben der militanten Gruppe angebliche Parallelen 0:41:30.707,0:41:38.298 zu seiner wissentlichen Veröffentlichungen aufwiesen, was damals soweit in die Öffentlichkeit 0:41:38.298,0:41:43.146 kolportiert wurde, dass es hieß, in beiden käme das Wort „Gentrifizierung“ vor, 0:41:43.146,0:41:46.246 das damals noch ein bisschen seltener war als im Nachgang. 0:41:46.246,0:41:52.110 Hast du dich mit dem Fall mal näher beschäftigt, wie die Behörden da scheinbar vorgegangen sind? 0:41:52.110,0:41:58.787 A: Ja, ich hab auf den Datenspuren letztes Jahr einen Vortrag gehalten zu Autorenidentifizierung, 0:41:58.787,0:42:06.250 gerade auch mit Aufhänger Andrej Holm. Ich denke, dass da ganz unterschiedliche Dinge passiert sind 0:42:06.250,0:42:12.810 bspw. hat das BKA ein Gutachten gemacht und gesagt, dass Andrej Holm nicht der Autor ist 0:42:12.810,0:42:25.523 der Tipp kam offenbar woanders her, von irgendwelchen Diensten, die wohl auf maschinelle Verfahren zurückgegriffen haben 0:42:25.523,0:42:30.196 um da Ähnlichkeiten festzustellen. Wäre jetzt mein Tipp, aber das wissen wir natürlich auch nicht. 0:42:30.196,0:42:37.663 Aber irgendwoher muss das ja gekommen sein. Wenn das BKA sagt, er wars wohl nicht, aufgrund der Sprachanalyse, ist schon interessant. 0:42:37.663,0:42:44.915 Die Sprachdaten haben letztlich für den Fall keine große Rolle gespielt. Es wurde zwar kolpotiert in den Medien, 0:42:44.915,0:42:50.300 aber für den Haftbefehl und weiteres waren andere Aspekte ausschlaggebender. 0:42:50.300,0:42:52.341 E: Vielen Dank, du da hinten am Mikro bist als nächstes dran 0:42:52.341,0:42:56.496 F: Ja, ich wollte sagen, dass es mich gefreut hat, dass du den Link zu Foucault gemacht hast, 0:42:56.496,0:43:00.996 weil es ja bei „Überwachen & Strafen“ genau darum geht, dass wir dazu erzogen werden, 0:43:00.996,0:43:10.236 uns selbst zu überwachen, was letztlich diese Schere im Kopf ist. Ich finde das ein sehr schönes Bild, dass du da diese Parallele gezogen hast. 0:43:10.236,0:43:15.906 Meine Frage wollte ich eigentlich auch nach einem Beispiel für so ein False positive stellen, 0:43:15.906,0:43:19.133 das wurde ja gerade mit diesem Fall beantwortet. 0:43:19.133,0:43:27.645 A: Die spülen mal immer wieder in die Medien rein. Jemand hat in der Schweiz T-Shirts drucken lassen, 0:43:27.645,0:43:32.993 – die haben da Schwierigkeiten mit dem Flughafen – „Südanflug“. Und hat die T-Shirts auch bezahlt 0:43:32.993,0:43:40.748 und dann wurden die Tremata über den Umlauten weggemacht. Und dann stand da „Sudanflug“, 0:43:40.748,0:43:48.988 was dann aber gleich „Sudan-Flug“ gelesen wurde. Und dann hat die Bank gleich den Staatsschutz informiert. 0:43:48.988,0:43:57.906 Also so kuriose Fälle tauchen natürlich auf, wir haben auch von der Frau mit Schnellkochtopf gehört 0:43:57.906,0:44:07.692 das sind Dinge, die tauchen tatsächlich immer wieder auf. Wir kriegen es in vielen Fällen auch gar nicht mit, was passiert. 0:44:07.692,0:44:13.829 Man muss ja auch nicht informiert werden, wenn man Gegenstand von Überwachung ist. Ist ja auch so. 0:44:13.829,0:44:18.206 Wenn es im Interesse der Bundesrepublik ist, muss man nicht informiert werden 0:44:18.206,0:44:23.986 E: Ich hätte gerne Kooperation von Leuten der ersten Reihe, könnt ihr eure Sachen wegnehmen? Vielen Dank. 0:44:23.986,0:44:26.917 Wir haben noch eine Frage aus dem Internet, wenn ich das richtig sehe, bitteschön 0:44:26.917,0:44:34.364 F: Nicht aus dem Internet. Linguistik ist ja eine Geisteswissenschaft 0:44:34.364,0:44:42.108 und die sind ja bekanntlich an den Unis nicht so gut finanziert. Ist es bekannt, oder hast du eine Idee davon, 0:44:42.108,0:44:47.648 wie groß die Differenz zwischen der öffentlichen Forschung und der der Geheimdienste in der Linguistik 0:44:47.648,0:44:53.112 oder gerade im Bezug darauf ist. Wenn man sich die Budgets so anguckt, könnte da ja eine echte Differenz sein. 0:44:53.112,0:44:58.490 A: das ist eine interessante Frage. Richtig, Geistes- oder Kulturwissenschaften sind nicht so toll finanziert 0:44:58.490,0:45:06.825 aber die Forschung findet zum Teil auch in der Informatik statt. Die Verfahren, die ich vorgestellt habe, 0:45:06.825,0:45:12.816 haben zunächst mal nichts mit Überwachung zu tun. Ohne die Verfahren wäre Google keine so tolle Suchmaschine 0:45:12.816,0:45:18.655 d.h. die Verfahren sind im Grunde erstmal abstrakt von ihrer Verwendung. 0:45:18.655,0:45:27.810 Viel Forschung findet dann tatsächlich in Privatunternehmen statt, wobei die Unis glaube ich noch mithalten können, 0:45:27.810,0:45:41.837 aber ich würde meinen, die NSA finanziert ja auch Forschung an Unis, auch in Deutschland, und es geht gut voran in dem Bereich 0:45:41.837,0:45:50.810 Um das mal zu sagen: das ist zentrale Technologie, die brauchen wir. Wir erschließen uns Wissen, über Sprache 0:45:50.810,0:46:00.810 Unsere Anfragen an die Welt funktionieren mit dem Medium Sprache. Wir suchen Informationen mit komplexen Anfragen, 0:46:00.810,0:46:12.458 die alle erstmal sprachlicher Natur sind. Auch bei einer Google Bildersuche. Wir ordnen uns die Welt durch das Medium Sprache 0:46:12.458,0:46:18.521 und das ist eine zentrale Technologie, in die auch in Zukunft sehr viel Geld fließen wird. 0:46:18.521,0:46:21.929 E: Gut, ich habe noch mindestens drei Fragen gesehen, aber wir haben ja auch noch eine viertel Stunde Zeit 0:46:21.929,0:46:24.570 du bist als nächstes dran. 0:46:24.570,0:46:28.617 F: Ich würde mal gerne die Aktualität deiner vorgestellten Informationen hier überprüfen 0:46:28.617,0:46:34.744 Erstmal würde ich gerne wissen, woher du die Information hast, dass solche Sachen benutzt werden, kommt das aus den Snowden-Files? 0:46:34.744,0:46:42.512 Und: wie alt ist das ganze Zeug. Dieses Toolkit, kann ja auch sein, dass das schon fünf Jahre alt ist 0:46:42.512,0:46:48.368 und das mittlerweile flächendeckende Liveüberwachung jeglicher Sprache stattfindet und alles viel intelligenter ist. 0:46:48.368,0:46:56.586 A: Wichtige Frage natürlich, aber auch ganz wichtig: Das Toolkit war natürlich frei erfunden. 0:46:56.586,0:47:00.632 Keine Ahnung, wie das aussieht, werden wir auch nicht zu Gesicht bekommen. Ist schon klar. 0:47:00.632,0:47:04.685 – F: Das hab ich schon verstanden – A: Gut, klang jetzt eben so, tschuldigung. 0:47:04.685,0:47:09.320 Also, wie alt sind die Verfahren: die Entwicklung geht weiter, es geht vor allem um Verfeinerungen 0:47:09.320,0:47:15.979 in bestimmten Bereichen. Wie gesagt, Topic-Modelling hyped im Moment sehr, ist aber nicht grundlegend verschieden 0:47:15.979,0:47:25.320 von Kollokationsanalysen. Es ist ein ähnliches Verfahren. Die Algorithmen für maschinelles Lernen werden besser. 0:47:25.320,0:47:30.920 Die Rechenleistung wird besser. Wir können größere Daten anschauen, um von ihnen zu lernen, da tut sich eine Menge. 0:47:30.920,0:47:41.311 Aber grundsätzlich würde ich sagen, viel Neues gibt es nicht. Wir hätten uns das Identifizieren von Frames angucken können 0:47:41.311,0:47:50.191 aber ich würde meinen, es sind schon Technologien, die zum Einsatz kommen könnten und ausgereift genug sind, 0:47:50.191,0:47:55.967 dass sie zum Einsatz kommen aber darüber, ob sie tatsächlich zum Einsatz kommen, weiß ich nichts. 0:47:55.967,0:47:58.895 E: Alles klar, die nächste Frage ist von dir da hinten 0:47:58.895,0:48:02.919 F: Vielen Dank erstmal, für den spannenden Vortrag, 0:48:02.919,0:48:07.871 es war ein Ausflug in die Linguistik, den sogar ich als Ingenieur verstanden habe 0:48:07.871,0:48:15.976 du hast vorhin zurecht gesagt, dass man vermutlich anstatt mit Bullshitting von Keywords 0:48:15.976,0:48:24.559 es sichtbar machen sollte, was da passiert. Den Ansatz fand ich richtig. 0:48:24.559,0:48:28.111 Im zweiten Satz fragte ich mich: was wären denn dann die Möglichkeiten 0:48:28.111,0:48:33.671 wir haben ein paar absurde Beispiele gesehen, wie das mal in der Presse herauskommt 0:48:33.671,0:48:37.466 du als jemand, der sich damit viel beschäftigt hat, was würdest du sagen, 0:48:37.466,0:48:43.270 was sind so die Dinge, mit denen man sich, mit denen sich die Szene beschäftigen sollte? 0:48:43.270,0:48:50.385 A: Ganz schwierig, ja. Ich glaube, es geht nur der Weg über die Politik. 0:48:50.385,0:48:57.439 Es ist ein politisches Anliegen zu sagen, dass die Methoden öffentlich gemacht werden müssen 0:48:57.439,0:49:04.764 dass sie gerechtfertigt werden müssen in Hinblick auf Vadilität, u.ä. Aber das ist ein politischer Weg. 0:49:04.764,0:49:12.156 Das heißt Lobbying da, wo es wehtut. Man muss zu den Parteien gehen, die die Macht haben 0:49:12.156,0:49:18.745 und man muss auch mit denen reden und die überzeugen. Es ist ein hartes Brot, aber wichtig. 0:49:18.745,0:49:25.397 Man kann das nicht mit technischen Mitteln lösen. Ich weiß, das ist eigentlich unser Ansatz, aber das reicht nicht. 0:49:25.397,0:49:27.186 E: OK, du hast die nächste Frage 0:49:27.186,0:49:31.630 F: Wir haben uns jetzt hier kollokationsbasierte Sachen angeschaut. 0:49:31.630,0:49:37.707 In wie weit kommen denn formale Grammatiken zum Einsatz, die auch die Satzsyntax berücksichtigen? 0:49:37.707,0:49:44.804 Schauen wir uns den Satz an „auf keinen Fall sind unsere Politiker als Verbrecher und Dilettanten zu sehen“ 0:49:44.804,0:49:50.470 da wird man mit der Kollokationsanalyse schnell einen False positive haben, oder? 0:49:50.470,0:50:02.597 A: Der Trend geht eindeutig weg von formalen Grammatiken, hin zu großen Datenmengen. 0:50:02.597,0:50:07.677 Zu eher mehr Kontext angucken, stärkeres maschinelles Lernen auf größeren Corpora 0:50:07.677,0:50:13.760 und eher der Google-Ansatz … F: wie Google Translate, so ähnlich A: … genau 0:50:13.760,0:50:19.991 mit vielen Daten die Sache lösen. Und das ist für uns Linguisten natürlich total frustrierend. 0:50:19.991,0:50:25.539 F: ja, ich komme selbst aus der Computerlinguistik, deshalb frage ich A: ja, das dachte ich mir schon. 0:50:25.539,0:50:33.197 Aber ja, es ist so. Aber wir sind uns, denke ich einig, mit linguistischem Wissen kann man vieles besser machen. 0:50:33.197,0:50:36.812 E: mspro, du hattest vorhin signalisiert, als wolltest du noch fragen, hast du es dir anders überlegt? 0:50:36.812,0:50:39.367 – hat sich erledigt – alles klar, dann bist du als nächstes dran 0:50:39.367,0:50:47.400 F: Was mir noch einfiel: wie würdest du das bewerten, 0:50:47.400,0:50:52.125 wenn man eine Überlegung zu einer Theorie sprachlicher Bedeutung da mit hinein bringt? 0:50:52.125,0:50:57.453 Was der Staat ja prinzipiell macht ist, er schmeißt sein Gewaltmonopol in unsere Sprache rein 0:50:57.453,0:51:03.293 und macht Regelsysteme auf, in denen er nachher die Bedeutung von gewissen Aussagen festlegt 0:51:03.293,0:51:10.223 und sagt: das hier ist wahrscheinlich eine kriminelle Äußerung oder die eines Kriminellen 0:51:10.223,0:51:15.552 kann man schon beobachten, bzw. ich könnte mir vorstellen aus einer Sprechertheorie, 0:51:15.552,0:51:24.324 dass das Verwüstungen in der Sprache anrichtet, dass der Staat Einfluss auf die Bedeutung unseres Sprachgebrauchs nimmt. 0:51:24.324,0:51:31.427 A: Das ist eine spannende Hypothese zu sagen, dadurch dass der Staat die Definitionsmacht hier hat zu sagen, 0:51:31.427,0:51:38.365 wie eine sprachliche Handlung verstanden werden soll, dass dadurch eine Bedeutungsverschiebung stattfindet, 0:51:38.365,0:51:45.565 die ggf. tatsächlich im Sinne eines „Neusprech“ nur noch bestimmte Äußerungen ermöglicht 0:51:45.565,0:51:50.164 das wäre eine spannende Hypothese, die mal zu überprüfen wäre 0:51:50.164,0:51:56.116 F: ja, also wenn man eine ganz moderne Theorie so „freier Signifikation“ annimmt, dann … 0:51:56.116,0:52:02.366 A: … dann haben wir immer noch Macht dann. Immerhin, subversiv können wir sein! 0:52:02.366,0:52:11.391 Aber das ist eine interessante Frage. Ich glaube nicht, dass der Einfluss auf den Alltag schon so stark ist, 0:52:11.391,0:52:14.727 das glaube ich nicht, aber warten wir es ab. 0:52:14.727,0:52:16.817 E: Gut, du hast die nächste Frage 0:52:17.309,0:52:20.659 Du sprachst gerade von den großen Datenmengen, die Datenmengen werden immer größer 0:52:20.659,0:52:23.894 damit ja auch irgendwie die Erfolgsquote dieser Voraussagen, 0:52:23.894,0:52:32.561 typischerweise selbst wenn die Algorithmen nicht besser werden, wenn die Datenmenge größer ist, wird es irgendwie besser 0:52:32.561,0:52:40.288 Was wird denn passieren, wenn wir einmal so große Datenmengen haben und die Algorithmen sich dann zusätzlich verbessern, 0:52:40.288,0:52:47.910 dass wir fast keine false positives mehr haben. Wir werden das dann nicht mehr mitbekommen 0:52:47.910,0:52:51.965 und es werden nur noch die Leute tatsächlich … das Horrorszenario, das ich mir gerade vorstelle, 0:52:51.965,0:53:02.142 es werden tatsächlich nur noch die echten Terroristen verhaftet. Und dann? Wie lange dauert es noch, bis es so weit ist? 0:53:02.142,0:53:07.290 Ich glaube, wir müssen jetzt handeln, bevor es so weit kommt. Denn sonst wird der Kampf dagegen 0:53:07.290,0:53:12.378 und die Rechtfertigung, dagegen Aktionen zu machen, immer schwieriger. Wie ist da deine Einschätzung? 0:53:12.378,0:53:14.847 A: Ganz spannender Punkt, hab ich noch nicht darüber nachgedacht. 0:53:14.847,0:53:20.981 Als erstes bin ich skeptisch, dass es so gut sein könnte, aber es ist ein spannender Punkt, ja 0:53:20.981,0:53:27.160 wenn nur noch die Terroristen verhaftet werden … die echten … dann haben wir ein Problem, ja … 0:53:27.160,0:53:35.785 Gelächter, Applaus 0:53:35.785,0:53:40.760 (Einruf; wird nicht aufgegriffen)[br]E: Du bist als nächstes dran 0:53:40.760,0:53:48.536 F: Wenn du dir mal die Berichte von Jeremy Scahill – das wurde im Tagesspiegel kolpotiert – anguckst, 0:53:48.536,0:53:53.894 die werten ja nicht nur die linguistischen Beziehungen aus, sondern tatsächlich auch: 0:53:53.894,0:53:59.357 wer hat mit wem telefoniert, wer ist mit wem verwandt und – eine ganz gefährliche Beziehung ist eben: 0:53:59.357,0:54:04.776 „Vater ist Islamist”, auch wenn man ihn 16 Jahre nicht gesehen hat – das ist evtl. ziemlich tödlich 0:54:04.776,0:54:12.281 und es scheint so zu sein, dass die ganzen Drohnenangriffe in zwei Zuständen laufen 0:54:12.281,0:54:18.306 nämlich im militärischen, operativ aktiven Zustand und dass sie eine Liste abarbeiten, wenn sie 0:54:18.306,0:54:30.427 gerade nicht operativ benötigt werden, wo eine Metadatenbank von oben nach unten nach einem Scoring abgearbeitet wird 0:54:30.427,0:54:36.332 und dann ist das Linguistische, glaube ich, nicht das gefährlichste, wenn man die falsche Verwandtschaft hat 0:54:36.332,0:54:42.729 A: ist richtig. Wir haben uns nur einen kleinen Teilbereich angeschaut von Daten, 0:54:42.729,0:54:46.309 die aber natürlich sehr wertvoll sind, weil sie sehr viel tieferen Einblick in unser Leben geben 0:54:46.309,0:54:58.128 als andere Daten. Gerade Radikalität zu messen – wovon ich nicht weiß, ob es stattfindet, etwas, was wir selbst vielleicht gar nicht wissen – 0:54:58.128,0:55:02.579 aber die Metadaten sind sehr viel mächtiger, wenn es um so harte Fakten geht. 0:55:02.579,0:55:05.310 Da sind die Metadaten natürlich interessanter. 0:55:05.310,0:55:07.346 E: Du hast die nächste Frage 0:55:07.346,0:55:12.720 F: Ich stimme zu, dass das ganz super wäre, wenn wir das auf der politischen Ebene besser in den Griff bekämen, 0:55:12.720,0:55:20.310 aber mit einer üblichen pessimistischen Einstellung, gibt es nicht eigentlich schon jede Menge Beispiele, 0:55:20.310,0:55:24.152 dass Politiker einfach auf den Zug aufspringen und das ganz super finden. 0:55:24.152,0:55:27.775 „Ist doch eine tolle Methode, funktioniert doch großartig!” ? 0:55:27.775,0:55:38.522 A: Ja! Was gemacht werden kann wird gemacht. Der Vortrag parallel ist ja über den „tiefen Staat“ 0:55:38.522,0:55:44.633 das wär dann zu überprüfen, ob wir nicht trotzdem zu Regularitäten kommen können, zu einer Gesetzgebung 0:55:44.633,0:55:47.772 kommen können, die zunächst bestimmte Dinge zunächst mal verbietet. Ich finde das immer noch ein Ziel, 0:55:47.772,0:55:52.242 das wir glaube ich teilen. Aber natürlich, der Zug fährt in eine andere Richtung. 0:55:52.242,0:56:01.987 Aber was bei Snowden so unglaublich ist, ist, dass er Dinge in das Licht der Öffentlichkeit zerrt, 0:56:01.987,0:56:07.139 aber sie müssen eben da sein! Solange es nur Gerüchte sind, kann man nichts machen, 0:56:07.139,0:56:14.532 – und Desinformation ist eine wichtige Strategie – sind wir ausgeliefert. 0:56:14.532,0:56:19.256 Aber sobald harte Fakten da sind, wird es interessant. Dann kann man darüber diskutieren 0:56:19.256,0:56:22.516 und an dem Punkt sind wir jetzt wenigstens mal. Mal sehen, ob wir da nochmal hinkommen. 0:56:22.516,0:56:26.870 E: Okay, die nächste Frage kommt aus der ersten Reihe 0:56:26.870,0:56:31.829 F: Eher eine Ergänzung: Du hast gesagt, „was machen wir, wenn wir alle Terroristen fangen können?“ 0:56:31.829,0:56:35.928 Natürlich müssen wir uns dann immer noch wehren, natürlich gibt es dann immer noch keine Rechtfertigung, 0:56:35.928,0:56:42.211 denn es wird immer noch alles gesammelt und – welche Datenbank ist 100% sicher?! 0:56:42.211,0:56:47.620 Früher oder später kommen die Daten an die Öffentlichkeit! Will ich dann wirklich wissen, 0:56:47.620,0:56:53.352 was man über mich weiß? Will ich, dass andere wissen können? 0:56:53.352,0:56:55.810 Wir brauchen keine Rechtfertigung, um dagegen vorzugehen. 0:56:55.810,0:56:59.848 Selbst wenn man nur noch die Terroristen fangen kann … wenn alle Daten gesammelt werden … 0:56:59.848,0:57:02.538 Können wir nicht wollen! 0:57:02.538,0:57:08.704 A: Danke, zumal auch das Konzept „Terrorist“ etwas ist, was man gesellschaftlich diskutieren kann. 0:57:08.704,0:57:14.986 E: Noch eine Frage von da hinten. Ich würde sagen, die letzte Frage, weil die meisten schon aufbrechen 0:57:14.986,0:57:26.812 F: Kurze Frage zum Thema false positive. Mal ein Forum zu etwas wie Medizin oder Sterbebegleitung gegen-gescannt? 0:57:26.812,0:57:35.729 Auf die Themen schwarz-weiß, Negativität, und so? Thema Operation? 0:57:35.729,0:57:40.216 Einfach so im Ranking im Vergleich zu Fefe, donalphonso, usw. liegen würde? 0:57:40.216,0:57:45.969 A: Wäre interessant, habe ich nicht gemacht. Es gibt viel zu tun, viel zu rechnen 0:57:45.969,0:57:52.490 F: na einfach von der Idee her, könnte da ja auch relativ viel false positive auftreten, oder? 0:57:52.490,0:57:58.499 A: Klar … (durcheinander) … tschuldigung F: Rein aus dem Bauch heraus 0:57:58.499,0:58:06.600 ist so die Richtung mal so ein Ansatz, wenn man sagt, man möchte viel false positive aufdecken. 0:58:06.600,0:58:12.944 A: Ja, es ist ganz wichtig, dass wir die Entstehungskontexte und die Medien der Texte mit berücksichtigen müssten 0:58:12.944,0:58:15.515 das haben wir jetzt überhaupt nicht gemacht, wir haben so getan, als seien alle Texte gleich, 0:58:15.515,0:58:19.160 aber es ist natürlich nicht so. Wer sich mit der Thematik beschäftigt, merkt, dass Textsorten usw. 0:58:19.160,0:58:22.535 einen unglaublichen Einfluss darauf haben, auf was wir da eigentlich messen. 0:58:22.535,0:58:27.520 Deswegen hat die Fragestellerin völlig recht. 0:58:27.520,0:58:34.350 Aber es gibt natürlich Methoden, Textsorten zu erkennen. 0:58:34.350,0:58:39.408 E: Alles klar! Dann ganz vielen Dank nochmal an Josh und auch dass da noch so viel Zeit war… 0:58:39.408,0:58:47.941 subtitles created by c3subtitles.de