-
Not Synced
Herzlich willkommen zu meinem Talk. Vielen Dank für die nette Einführung
-
Not Synced
Ihr seht der Talk hat den anspruchsvollen Titel "Überwachen und Sprache"
-
Not Synced
Spielt natürlich auf Foucault an "Überwachen und Strafen"
-
Not Synced
Allerdings, lange bevor Foucault die Genese der Disziplinargesellschaft dargestellt hat
-
Not Synced
findet man in einem Kinderbuch eine sehr schöne moralische Erzählung
-
Not Synced
die heißt "Das Kind im Glashaus" von Heinrich Oswalt entstanden 1877 und sehr weitsichtig
-
Not Synced
In Frankfurt lebt ein Glasermeister,
Herr Lebrecht Scheibenmann, so heißt er;
-
Not Synced
Der hat ein kleines Töchterlein,
Das wollte nie gewaschen sein.
-
Not Synced
Und kam mit Schwamm und Seif sein Gretchen,
Da lief davon das böse Mädchen;
-
Not Synced
Es warf sogar den Waschtisch um -
Das Wasser floß im Haus herum.
-
Not Synced
Da fing Herr Lebrecht Scheibenmann
Ein seltsam Haus zu bauen an,
-
Not Synced
Aus lauter Glas ein Haus, das, ach!
Durchsichtig war bis unters Dach.
-
Not Synced
Und in dies Glashaus setzte man
Das böse Töchterlein sodann.
-
Not Synced
Da blieben, um es anzusehn,
Die Leute auf der Straße stehn.
-
Not Synced
[…]
Da schämte sich das Kind und lief
Im ganzen Haus herum und rief:
-
Not Synced
“Wo soll ich mich denn nur verstecken?
Man sieht mich ja in allen Ecken!
-
Not Synced
Das Dach, der Keller, jedes Zimmer
Ist ja von Glas! man sieht mich immer!”
-
Not Synced
Die Mutter sprach: “Mein liebes Kind!
Ein Mittel gibt’s, das hilft geschwind:
-
Not Synced
Wenn dich die Leute artig sehn
Dann werden sie vorübergehn;
-
Not Synced
[…]
Das merkte sich das Töchterlein;
Es nahm sich vor, geschickt zu sein.
-
Not Synced
Und weil’s beim Waschen nicht mehr schrie,
Da lachten auch die Leute nie;
-
Not Synced
Denn jeder, der ins Haus jetzt blickt,
Der sieht ein Kind, das ganz geschickt.
-
Not Synced
Und habt Ihr selbst ein Kind, Ihr Leut’,
Das bei dem Waschen immer schreit,
-
Not Synced
Sagts nur Herrn Lebrecht Scheibenmann,
Der schafft Euch gleich ein Glashaus an.
-
Not Synced
Ja, da … erste Applausansätze
[Applaus]
-
Not Synced
Ja, interessante Geschichte, die natürlich sehr gut auf unsere Zeit passt
-
Not Synced
denn Lebrecht Scheibenmann heißt Keith Alexander und arbeitet für die NSA
-
Not Synced
Die NSA hat aus unser aller Zuhause Glashäuser gemacht
-
Not Synced
wir können alle gesehen werden in diesen Glashäusern
-
Not Synced
und man weiß nicht, bzw. ich bin mir ziemlich sicher, dass man damit pädagogische Ziele verfolgt
-
Not Synced
dass bestimmte Handlungen nicht mehr als akzeptabel gelten
-
Not Synced
und dass wir diese Beobachtung verinnerlichen
-
Not Synced
Bei dieser Beobachtung spielt Sprache natürlich eine ganz wichtige Rolle
-
Not Synced
Viele unserer Äußerungen finden im Medium der Sprache statt
-
Not Synced
Das hat auch viele Hacker auf die Idee gebracht, dass wir die NSA austricksen mit einer Seite wie "Hallo NSA"
-
Not Synced
Eine Website, die wie ein „Bullshitter“ verdächtige Wörter zu Botschaften zusammensetzt
-
Not Synced
und diese dann getweetet, gemailt oder verchattet werden sollen
-
Not Synced
um soetwas zu erreichen wie hier "Operation Troll the NSA“
-
Not Synced
dass man die NSA-Scanners jammen kann, dass man eine DDOS Attacke machen kann.
-
Not Synced
indem man einfach zu viel Content schickt, der quasi verdächtig ist auf der Basis von Keywords
-
Not Synced
In meinem Vortrag soll es darum gehen, dass dieses Bild von der NSA falsch ist.
-
Not Synced
Wir können nicht davon ausgehen, dass in der NSA die Leute tatsächlich bei Anzeige eines Keywords
-
Not Synced
sofort etwas ausdrucken und zu einer [Gelächter]
Analyse schreiten und sich das genauer anschauen
-
Not Synced
in der Annahme das sei eine sehr intensive Tätigkeit
-
Not Synced
und deswegen ist ein Keyword-Spam-DDoS natürlich erfolglos
-
Not Synced
Ihr alle werdet vermutlich die thanksgiving taklkingpoints der NSA gelesen haben.
-
Not Synced
Ich weiß nicht, ob ihr darüber gestolpert seid, dass unter Punkt 4 etwas ganz wichtiges steht
-
Not Synced
“NSA brings together the best linguists, analysts, mathematicians, engineers and computer scientists
-
Not Synced
in the United States.“
und die Linguisten werden als erstes genannt.
-
Not Synced
[Lachen]
-
Not Synced
Also da sieht man, der NSA ist durchaus bewusst, dass Sprache ein wichtiges Medium ist
-
Not Synced
und das auch für sie sehr wichtig ist. Insofern macht es
durchaus Sinn, sich damit zu beschäftigen
-
Not Synced
Zufälligerweise wurde vom Innenminister die neuste Analysesoftware geleakt, der "Advanced Security Toolkit"
-
Not Synced
Entwickelt vom Leibnitz-institut für verteiltes Echtzeit-Java. [Gelächter]
-
Not Synced
Wir gucken uns zunächst unsere heutige Mission an.
-
Not Synced
Die heutige Aufgabe besteht darin, die deutsche Bloggerszene unter die Lupe zu nehmen
-
Not Synced
die radikalisiert sich ja offenbar seit Regierungsübernahme durch die Große Koalition
-
Not Synced
wichtig ist es, zu schauen, ob Aktionen in Vorbereitung sind, und ggf. radikale Subjekte zu identifizieren,
-
Not Synced
die sich da besonders hervortun. Zunächst wählen wir unsere Targets, wir kriegen natürlich welche vorgeschlagen
-
Not Synced
Leider kann ich nur eine kleine Auswahl möglicher Targets präsentieren. Ich hätte gerne noch viel mehr genommen
-
Not Synced
Es gibt ein paar gesellschaftskritische Blogs und Newssites
-
Not Synced
wie blog.fefe.de, indymedia, Mädchenmannschaft, Netzpolitik.org, rebellmarkt.blogger.de
-
Not Synced
Und religiös motivierte Webseiten, wie kreuz.net, islambruderschaft.com-blog und Diskussionsforum salafistisches
-
Not Synced
und wir bestätigen natürlich die Auswahl. Das ist eine sehr sinnvolle Auswahl
-
Not Synced
Folgende Analysen sind möglich. Ich kann natürlich nur eine Auswahl an möglichen Analysetools heute zeigen
-
Not Synced
Ich würde gerne viel mehr zeigen, aber die Zeit wird nicht reichen.
-
Not Synced
Zunächst gucken wir uns an, was schreiben Autoren über mögliche sensible Ziele
-
Not Synced
Wir machen also mal eine Zielanalyse.
-
Not Synced
diese untersucht auf Basis von Named-Entity-Recognition die Kollokation zu möglichen Terrorzielen
-
Not Synced
Wir müssen … was ist das denn? … wir gucken mal ins Handbuch rein, was Named Intities sind
-
Not Synced
ist ja unser erster Tag heute
-
Not Synced
Named-Entities sind zunächst mal Ausdrücke, die eine Identität eindeutig von anderen Entitäten mit ähnlichen Attributen unterscheiden
-
Not Synced
Man denkt spontan an Namen, aber es ist nicht so trivial zu sagen was ein Name ist
-
Not Synced
Named-Entitiy-Recognition ist entsprechend das Verfahren, wie man solche Named Entities identifiziert
-
Not Synced
Es gibt sicherlich unterschiedliche Klassen von Named Entities, bspw. Personen, Organisationen, Orte
-
Not Synced
Manchmal ist auch nicht so deutlich zu was eine bestimmte Named Entity gehört. z.B. „der Bundestag“
-
Not Synced
das kann sowohl ein geografischer Ort sein, als auch eine Organisation
-
Not Synced
Jetzt müssen wir noch wissen, was Kollokationen sind
-
Not Synced
Das sind statistisch überzufällig häufige Wortkombinationen
-
Not Synced
d.h. “we define a collocation as a combination of two words, that exhibit a tendency to occur near each other in natural language that is to cooccur”
-
Not Synced
also z.B. „ein Weg einschlagen“, „ein Weg gehen“
-
Not Synced
Das sind typische Verbindungen zwischen den Worten „Weg“, „gehen“ bzw. „einschlagen“
-
Not Synced
und diese Verbindungen bilden Kollokationen, wenn sie überzufällig sind
-
Not Synced
wie wir mit statistischen Tests feststellen können
-
Not Synced
und wir können die in natürlicher Sprache beobachten
-
Not Synced
Ein Beispiel – ihr müsst das jetzt nicht lesen können – ich wollte ein Beispiel zeigen zum Wort „Spezialexperte“
-
Not Synced
man sieht hier das “keyword in context”, also das gesuchte Schlüsselwort
-
Not Synced
und man sieht die Kontexte dieses Wortes, also einen „ausgesuchten Spezialexperten für Internetfragen“ haben sie wohl nicht gefunden
-
Not Synced
Wir müssen kein Ratespiel machen, aus welchem Blog das wohl stammen könnte
-
Not Synced
Was man dann macht, bei einer Kollokationsanalse
man untersucht Kontexte
-
Not Synced
z.B. hier fünf Wörter links, fünf Wörter rechts bis Satzanfang oder -ende
-
Not Synced
Man zählt einfach die Wörter, die im blauen Bereich stehen
-
Not Synced
und vergleicht die relative Frequenz mit Wörtern, die links und rechts im weißen Bereich stehen
-
Not Synced
Wenn ein Wort signifikant häufiger im blauen Bereich vorkommt, kann man sagen, es ist eine Kollokation des Worts „Spezialexperte“
-
Not Synced
Hier fällt bspw. auf „kriegen“ oder „Adobe-Spezialexperten“
-
Not Synced
Man kann Kollokationen als Graphen visualisieren
[Gelächter]
-
Not Synced
Die Knoten bezeichnen Lexeme, (ich weiß jetzt nicht, wass es da zu lachen gibt) [mehr Gelächter]
-
Not Synced
(das ist ernste Linguistik!) und die Kanten bezeichnen „ist Kollokation von“
-
Not Synced
Sie sehen also hier „die besten der besten, Sir“, Sarrazin und Mehdorn gehören dazu.
-
Not Synced
Es wuchert ein bisschen weiter. „Adobe-Backup“, „Backup-Spezialexperten“ … interessant
-
Not Synced
Ok. Wir sind im Bereich der Zielanalyse. Wir starten mal die Analyse.
-
Not Synced
Was machen wir da eigentlich? Was wir machen ist, wir erkennen in allen Corpora alle Named Entities
-
Not Synced
Wir berechnen das erstmal mit Methoden maschinellen Lernens.
-
Not Synced
D.h. man untersucht bestimmte Kontexte in denen Named Entities stehen.
-
Not Synced
Wir haben einen Trainings-Corpus, in dem steht bereits drin, was Named Entities sind
-
Not Synced
bspw. dass „Bundestag“ eine Organisation ist und die Software lernt aus diesen Kontexten
-
Not Synced
was typische Kontexte für solche Named Intities sind und versucht diese auf neue Corpora anzuwenden
-
Not Synced
Was wir hier machen: wir identifizieren in allen Corpora, in allen Blogs, die wir untersuchen die Named Entities.
-
Not Synced
wir kategorisieren diese Named Entities nach Personen, Organisationen, geografischen Orten und sonstigen
-
Not Synced
und dann berechnen wir die Kollokationen eben zu relevanten Named Entities.
-
Not Synced
z.B. „Angela Merkel” könnte interessant sein oder sowas.
-
Not Synced
Und dann schauen wir auch in den Kollokationen, ob darin irgendwelche Gefährderwörter sind.
-
Not Synced
Also Wörter, die auf Anschlagsplanungen oder sonstiges hindeuten. Das machen wir jetzt.
-
Not Synced
die Analyse ist offenbar abgeschlossen und Ergebnis ist, wir haben Gefahrenstufe 1 von 5, also nicht weiter tragisch
-
Not Synced
die Software schlägt uns eine Überprüfung der Gefährdungslage in Hinblick auf Berlin vor
-
Not Synced
also der Ortsangabe bei donalphonso, Rebellmarkt-Blogger
-
Not Synced
Potentielles Ziel bei Fefe ist SPD und bei der Mädchenmanschaft sollen wir nach Christina Schröder als Person gucken [Gelächter]
-
Not Synced
Wir haben jetzt zum Beispiel als Auftrag bekommen, warum donalphonso Böses über Berlin schreibt und ggf. etwas plant
-
Not Synced
Wir können uns jetzt Kollokationsgraphen anzeigen lassen oder Geokollokationen
-
Not Synced
D.h. wir haben eine Landkarte und darauf stehen an den Orten, über donalphonso schreibt, die Kollokationen zu den Orten
-
Not Synced
In Amerika schreibt er über Boy(?) und Kultur, Einzeltäter, verwirrt und „hassen Mail“ und sowas
-
Not Synced
Deutschland, Mitteleuropa ist natürlich im Fokus. Das geht auch bis Italien runter
-
Not Synced
Da sieht man auch, worüber donalphonso so schreibt.
-
Not Synced
Wir nähern uns Berlin. Da sind zu viele Kollokationen als dass wir sie alle auswerten könnten
-
Not Synced
Deswegen schauen wir uns den Kollokationsgraphen an und suchen nach Hinweisen auf Terror, der stattfinden könnte
-
Not Synced
Ich lese einige vor: „Berlin“, „Slum“, „Reichshauptslum“, „arm“, „Transferleistung“, „abscheulich“, „Berliner Hipster“ [Gelächter]
-
Not Synced
Das zeigt zwar eine sehr negative Haltung zu dem Gegenstand, aber ich würde nicht sagen terrorverdächtig.
-
Not Synced
Das weitere potentielle Ziel waren die Organisationen „SPD“ bei Fefe
-
Not Synced
Wir lassen uns den Kollokationsgraphen anschauen. Fefe und die SPD. [Gelächter]
[Gelächter]
-
Not Synced
hey „Verräterpartei“, „Umfallerpartei“, mal kurz zurück
-
Not Synced
Insgesamt in der gesamten Liste fanden sich tatsächlich so Wörter wie:
-
Not Synced
„erhängen“, „erzwingen“, „Spitzenkandidat“, „Verräterpartei“, „Umfallerpartei“, „Pest“, „Cholera“ [Gelächter, Applaus]
-
Not Synced
Wenn wir uns den Kollokationsgraphen anschauen, dann merken wir schon, das sind Vorwurfshandlungen.
-
Not Synced
Aber da wird nicht geplant, dass der Spitzenkandidat um die Ecke gebracht werden soll von Fefe
-
Not Synced
Wir machen jetzt weiter mit dem Ideologiemonitor. Wir wollen jetzt mal messen …
-
Not Synced
Es ist belegt, dass die NSA viele Softwarepatente für Algorithmen zu Named-Entity-Recognition angemeldet hat
-
Not Synced
Es wurde in der Tat viel in dem Bereich Forschung betrieben vor einiger Zeit
-
Not Synced
Aber man findet zunächst heraus, was interessante Targets sind und was über sie gesagt wird
-
Not Synced
Das kan man sicherlich noch besser machen, in dem man Idieologien misst.
-
Not Synced
Was wir jetzt berechnen wollen ist die Ähnlichkeit von Texten, von Blogs zu bestimmten weltanschaulichen Ideologien
-
Not Synced
Wir haben die Möglichkeit, linksextreme, rechtsextreme oder islamistische Einstellungen zu messen
-
Not Synced
Das machen wir so, dass wir typische Kollokationen berechnen … also zu einem bestimmten Korpus
-
Not Synced
Von diesem Korpus lernen wir. Das ist also das Vergleichsmodell.
-
Not Synced
Wir nehmen mal die „Islambruderschaft“. Die hat ein Blog und da schreiben sie böse Sachen
-
Not Synced
und wir lernen von diesem Blog: was sind typische Wortverbindungen, die wir als islamistisch betrachten können
-
Not Synced
wir wollen gerne wissen, wer in einem salafistischen Diskussionsforum besonders viel von radikalislamischer Ideologie hat
-
Not Synced
also das ist ein ganz fieses Untersuchungsprogramm, das wir hier starten. Ja, die Analyse läuft
-
Not Synced
Das Ziel ist es, wie sind bestimte Texte von bestimmter Ideologie durchdrungen
-
Not Synced
und wir gleichen ein salafistisches Diskussionsforum mit unserem Trainingskorpus ab
-
Not Synced
und dieses Trainingscorpus ist ein Blog von der Islambruderschaft
-
Not Synced
was wir bekommen sind Wortverbindungen, die womöglich auf islamistische Grundhaltungen verweisen
-
Not Synced
– also ich hoffe, ihr denkt die Anführungszeichen immer mit –
-
Not Synced
Wir haben hier „Allah -> Krieg“, „Bombe -> Jahr -> Feind“, „Kufr -> beleidigen“, „Gesetz -> Islam“, „Bedeutung -> Jihad“, „Allah -> Afghanistan“, „martern -> Kufr“, usw.
-
Not Synced
Also es gibt eine ganze Reihe dieser Wortverbindungen, die wir aus diesem Korpus lernen
-
Not Synced
und jetzt schauen wir, wie diese Wortverbindugnen in personenspezifischen Korpora von Mitgliedern
-
Not Synced
in diesem Diskussionsforum vorkommen. Wir sehen hier einen User – natürlich ist der Nickname nicht echt
-
Not Synced
man sieht es ein bisschen schlecht, aber hier sind rote Verbindungen angeleuchtet
-
Not Synced
Das sind islamistische
[Gelächter]
-
Not Synced
Das sind sämtliche Kollokationen in diesem Korpus mit der höchsten Typizität
-
Not Synced
und solche Verdichtungspunkte verweisen auf bestimmte Themen
-
Not Synced
Wir haben auch den User „JihadFan“ [Gelächter] – der aber offenbar auch nicht so jihadistisch unterwegs ist
-
Not Synced
weil es sind relativ wenige – wir haben aber die Userin „Muslima“ – und leider sieht man das jetzt wirklich nicht so gut
-
Not Synced
ich mach es mal ein bisschen größer – bei ihr sehen wir relativ viele rote Verbindungen
-
Not Synced
wir können uns natürlich auch ein paar verdächtige Verbindungen anschauen
-
Not Synced
jetzt müssen wir wieder klein werden – da sind solche Verbindungen wie „der -> ganzen -> Welt -> Frieden -> Krieg -> bringen“
-
Not Synced
Da sind Verbindungen wie „Bombadierung -> Zivilist -> schlachten -> martern -> Invasoren“, „erfolgreiche -> Operation“
-
Not Synced
oder Verbindungen wie „Koran -> Taliban -> edel -> Sieg“, die vielleicht auf das Schreiben über das Thema hindeuten
-
Not Synced
das heißt, wir würden sagen, das wäre ein Ziel für weitere operative Maßnahmen, diese Userin,
-
Not Synced
und das schicken wir ab und dann geht es weiter.
-
Not Synced
Damit haben wir aber nichts mehr zu tun, denn wir sind ja nur Linguisten. [Gelächter, Applaus]
-
Not Synced
Ich deute das als Zustimmung. Gut, wir fahren mit weiteren Analyseschritten fort.
-
Not Synced
Und zwar messen wir Radikalität. Radikalität ist etwas, das man so ohne weiteres erstmal nicht messen kann
-
Not Synced
denn es ist ja selbst ein ideologisches Konzept
-
Not Synced
Wir – vom Innenministerium – verstehen unter Radikalität zunächst eine stark negative Weltsicht
-
Not Synced
wir verstehen darunter eine Intoleranz gegenüber abweichenden Auffassungen, also ein schwarz-weißes Weltbild
-
Not Synced
wir verstehen darunter eine hohe emotionale Involviertheit
-
Not Synced
und eine Neigung zu Verschwörungstheorien
[vereinzeltes Gelächter] Ja!
-
Not Synced
Das ist nicht ganz vom Himmel gefallen. Es gibt tatsächlich Forschungsliteratur, die diese Punkte nennt
-
Not Synced
wie operationalisieren wir das jetzt, also eine negative Weltsicht? Ich möchte euch zwei Ansätze vorstellen
-
Not Synced
Es gibt also den sehr einfachen, listenbasierten Ansatz. Man sagt, wir haben eine bestimmte Liste von Wörten,
-
Not Synced
deren Bedeutung wir kennen und gucken, wie häufig finden sich die Listenelemente in Texten
-
Not Synced
Bspw. wenn wir „negative Weltsicht“ operationalisieren wollten, könnten wir sagen, wir suchen nach Phrasen
-
Not Synced
oder auch Vokabeln, die skandalisieren, wie: „Blindheit“, „Blödheit“, „Bodenlosigkeit“, „Chaos“, „Debakel“,
-
Not Synced
„Desaster“, „Dreistigkeit“, „Dummheit“, das könnte man alles anders nennen, könnte Indikator sein für negative Weltsicht
-
Not Synced
Wir haben auch den Gebrauch von negativ wertenden Adjektiven. Nur mal die ersten: „abartig“, „aberwitzig“,
-
Not Synced
„abfällig“, „abgedroschen“, „abgegriffen“, „abgeschmackt“, usw. Insgesamt 700, oder so
-
Not Synced
das wäre also der listenbasierte Ansatz.
-
Not Synced
Was wir natürlich auch machen können ist ein schwarzweißes Weltbild operationalisieren
-
Not Synced
das kann man mit Hilfe von „semantischen Taxonomien“ machen. Semantische Taxonomien beschreiben die Relationen
-
Not Synced
zwischen Wörtern in unserem Wortschatz, bspw. könnte auf schwarzweiß-Denken in Texten hindeuten
-
Not Synced
eine hohe Frequenz von „polaren Antonymen“, also Gegensatzwörtern, die man ohne degradierte Form gebracht
-
Not Synced
also dass man sagt „lang“ und „kurz“ statt „länger …“ oder „kürzer als“.
-
Not Synced
Noch deutlicher wird es vielleicht bei Wörtern, die gar nicht gradierbar sind, wie „wahr“ oder „falsch“,
-
Not Synced
„tot oder lebendig“, „anwesend oder abwesend“, „dafür oder dagegen“. Da gibt es nichts dazwischen,
-
Not Synced
die sind komplementär und ihr Gebrauch, könnte man meinen, lässt Rückschlüsse auf ein schwarzweißes Weltbild zu.
-
Not Synced
Emotionale Involviertheit könnte man operationalisieren mit Hilfe von Gradpartikeln
-
Not Synced
das ist sowas wie „ich finde das absolut toll“, oder „total toll“. Ja, nicht nur „toll“, sondern „total“
-
Not Synced
Das wäre bspw. ein Gradpartikel aus dem absoluten Intensivierungsbereich
-
Not Synced
wir können Gradpartikel unterscheiden nach Intensivierungsbereichen und es gibt unterschiedliche Abstufungen
-
Not Synced
wie den „absoluten“ Intensivierungsbereich, in den „absolut“, „gänzlich“, „grundlegend“, „gründlich“,
-
Not Synced
„im geringsten“, „komplett“, „längst“, „rein“ usw. reinfallen, den „extrem hohen“ Intensivierungsbereich:
-
Not Synced
„höchst“, „äußerst“, „zutiefst“, „aufs äußerste“, „aufs höchste“, „aufs Tiefste“, „höchstlichst“, usw.
-
Not Synced
und den hohen Intensivierungsbereich mit „sehr“, „stark“, „gewaltig“, „besonders“, „so“, „arg“, „übertrieben“ usw.
-
Not Synced
Wenn wir die Distribution dieser Gradpartikel in Korpora messen, dann könnten wir sagen:
-
Not Synced
vielleicht sind die Indikator für emotionale Involviertheit. Und die Neigung zu Verschwörungstheorien
-
Not Synced
das ist natürlich besonders schwierig zu operationalisieren, da haben wir einfach
-
Not Synced
eine Liste von Wörtern genommen, die darauf verweisen, dass vielleicht etwas nicht so ist, wie es sein könnte
-
Not Synced
wenn man Wörter hat wie „angeblich“, „vermeintlich“, „scheinbar“, „behaupten“, „heucheln“,
-
Not Synced
„verheimlichen“, „verschweigen“, „fingieren“, „vorgaukeln“, „entlarven“, usw
-
Not Synced
das sind natürlich Wörter, die zumindest das Potential haben, darauf zu verweisen,
-
Not Synced
dass die Welt nicht so ist, wie sie uns verkauft wird oder dargestellt wird.
-
Not Synced
Und das findet man natürlich eher bei Personen, die Verschwörungstheorien anhängen
-
Not Synced
Wenn man jetzt den Radikalitätsindex berechnet – das hier sind normalisierte Werte – dann kann man sehen
-
Not Synced
dass Fefe, knapp gefolgt von donalphonso und mit kleinem Abstand das salafistische Forum [Gelächter]
-
Not Synced
und weiterem Abstand kreuz.net hier aufschlagen. Fefe hat nirgendwo die erste Position, muss man dazu sagen
-
Not Synced
also auch bei den Verschwörungen nicht, da schlägt kreuz.net Fefe noch um Längen
-
Not Synced
– interessanterweise übrigens, wie ich fand –
-
Not Synced
und donalphonso ist also tatsächlich ein großer Skandalisierer und Intensivierer, kann man feststellen
-
Not Synced
wenn man sich noch einmal das Ranking anschaut, dann sieht das so aus … Fefe, donalphonso, salafistische …
-
Not Synced
Also ob wir operative Maßnahmen einleiten überlasse ich euch. Ich würde sagen, wir behalten die im Auge.
-
Not Synced
Das waren jetzt ein paar Techniken, die ich euch darstellen wollte, die wenig zu tun haben mit dem „Keywordbullshitter“
-
Not Synced
den wir gesehen haben. Denn diese Keywords selbst spielen eine sehr geringe Rolle bei den Analysen, besonders wie zuletzt gesehen
-
Not Synced
Ich denke die Linguistik und die NSA-Linguisten sind sicherlich sehr viel weiter um e-Mails zu filtern
-
Not Synced
Ich denke, wenn man sich den Rechenschaftsbericht der G10-Kommission anschaut, die die deutschen Geheimdienste überwachen
-
Not Synced
die hatten ja zunächst so dargestellt es wurden so wahnsinnig viele e-Mails gescreent, aber das meiste davon war Spam
-
Not Synced
und wenn man sich den neueren Bericht anschaut, dann steht da, wir haben die Spamerkennung verbessert
-
Not Synced
und es wurden deswegen sehr viel weniger e-Mails. Aber es ist auch die Rede von mehreren Ebenen des Screenings
-
Not Synced
und es werden erst zu einem sehr späten Zeitpunkt e-Mails tatsächlich in die Hand genommen und qualitativ ausgewertet
-
Not Synced
und ich denke, dass vielleicht der allererste Zugriff über ein Keyword erfolgt, das auch sehr allgemein gehalten sein kann
-
Not Synced
dass die weiteren Ebenen dann natürlich viel feinere Analysen beinhalten, die eben Kollokation, semantische Taxonomien
-
Not Synced
oder Topic-Modelling, über das ich heute leider nicht sprechen kann, benutzen
-
Not Synced
Ja, ich bin noch nicht fertig. Vielleicht kennen einige von euch den Film „Alphaville“?
-
Not Synced
Alphaville ist ein Film von Jean-Luc Godard, in dem es darum geht dass Lemmy Caution, ein Spion,
-
Not Synced
in die Stadt Alphaville kommt, die von einem allmächtigen, diktatorischen, totalitären Computer beherrscht wird: Alpha 60
-
Not Synced
und ein Teil seiner Aufgabe ist es, diesen Computer auzuschalten und den Erzeuger von Braun zu finden.
-
Not Synced
Er spricht dann mit einem der Programmierer dieses Computers, einem Assistenten von von Braun
-
Not Synced
und der Assistent fragt ihn: „Sind Sie auch ein Spion?“ – Ich kann den Screenshot wegen Urheberrecht leider nur so zeigen
-
Not Synced
Darauf sagt Lemmy Caution: „Nein, das wissen Sie genau, ich bin nämlich ein freier Mann!“
-
Not Synced
Daraufhin sagt der Assistent: „Ihre Antwort ist bedeutungslos. Wir wissen nichts.
-
Not Synced
Wir registrieren, berechnen und ziehen unsere Schlussfolgerungen.“
-
Not Synced
Und dieser Satz erfasst eigentlich das Problem, das wir mit den Diensten haben, relativ gut.
-
Not Synced
Denn die Dienste unterwerfen unsere Lebensäußerungen einer Logik, die zunächst nicht unsere Logik ist
-
Not Synced
sie werten sie nach bestimmten Mustern aus: „Wir registrieren, berechnen…“, sie ziehen Schlussfolgerungen daraus
-
Not Synced
aber sie müssen sich dafür nicht rechtfertigen. Sie müssen ihre Methoden nicht offenlegen
-
Not Synced
und ihre Logik nicht zur Diskussion stellen. Und genau das ist das Problem.
-
Not Synced
Das ist aber ein Kennzeichen für alle totalitären Systeme, dass sie ihre Logik nicht rechtfertigen müssen.
-
Not Synced
Wir wissen überhaupt nicht, was überhaupt verdächtig sein könnte
-
Not Synced
und der Grund dafür ist, dass diese Diese eben im Geheimen operieren können
-
Not Synced
und unsere Aufgabe sollte es sein, diese Methoden öffentlich zu machen, diese Methoden zu diskutieren
-
Not Synced
zu beweisen, dass diese Methoden fehlerhaft sind und unglaublich viele „false positives“ produzieren
-
Not Synced
und dass wir es deswegen lieber lassen sollten und wir vielleicht ein paar Scheiben ins Glashaus werfen
-
Not Synced
Vielen Dank
-
Not Synced
[Applaus]
-
Not Synced
Ja vielen Dank, Josh, für diesen richtig coolen Talk. Was auch cool ist:
-
Not Synced
Was auch cool ist, wir haben noch richtig viel Zeit für Fragen und Antworten
-
Not Synced
Wir haben vier Saalmikrofone hier, wir haben zwei auf jeder Seite
-
Not Synced
für Leute, denen es schwerer fällt, zum Saalmikro zu kommen, habe ich auch das tragbare Handmikro
-
Not Synced
und wir können noch gucken, ob es Fragen aus dem Internet gibt und die dann dem Signal Angel stellen
-
Not Synced
seid nicht so schüchtern, wir haben noch eine halbe Stunde, das war ja wohl ein guter Input
-
Not Synced
wenn ihr also ne Frage habt, dann bewegt euch da.
-
Not Synced
Ja vielleicht fangt ihr an, euch zu den Mikrofonen zu bewegen, geht das auch für euch beide?
-
Not Synced
Dann komm ich gleich zu dir, dann die erste Frage
-
Not Synced
Wie ist denn das mit diesen Kollokationen und Kultureller Kontext? Also es könnte sein, dass wir jetzt bspw.
-
Not Synced
da wollte jetzt ein Osama ein Konto eröffnen und das wurde ihm verweigert, weil er Osama heißt
-
Not Synced
dass wir dann diese Kollokation zwar feststellen, aber dass der Name Osama ein recht häufiger im arabischen Kontext ist
-
Not Synced
wie wird damit umgegangen, dass das etwas ganz normales dort ist, für uns aber sofort verdächtig erscheint?
-
Not Synced
Vielen Dank, ich weiß nicht auf welcher Ebene ich die Frage beantworten soll.
-
Not Synced
Aus linguistischer Perspektive kann man damit, glaube ich, recht gut umgehen, indem man weiteren Kontext hinzunimmt
-
Not Synced
und relativ schnell disambiguieren könnte, dass es sich eben nicht um Osama bin Laden handelt,
-
Not Synced
vor allem weil der ja auch schon tot ist
[Gelächter]
-
Not Synced
aus Sicht eines Analytikers, der vielleicht gar nicht versteht, was unter der Haube eines solchen Toolkits läuft, ist es erstmal egal
-
Not Synced
denn er folgt seiner Logik, er hat seine Mission und wie gesagt, die Menge an False positives ist riesig
-
Not Synced
das wird eben damit gerechtfertig, dass das, was auf dem Spiel steht, so monströs ist, wenn es denn fiele, dass jedes Mittel rechtfertigt