-
Not Synced
Herzlich willkommen zu meinem Talk. Vielen Dank für die nette Einführung
-
Not Synced
Ihr seht der Talk hat den anspruchsvollen Titel "Überwachen und Sprache"
-
Not Synced
Spielt natürlich auf Foucault an "Überwachen und Strafen"
-
Not Synced
Allerdings, lange bevor Foucault die Genese der Disziplinargesellschaft dargestellt hat
-
Not Synced
findet man in einem Kinderbuch eine sehr schöne moralische Erzählung
-
Not Synced
die heißt "Das Kind im Glashaus" von Heinrich Oswalt entstanden 1877 und sehr weitsichtig
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
-
Not Synced
Ja, da … erste Applausansätze
[Applaus]
-
Not Synced
Ja, interessante Geschichte, die natürlich sehr gut auf unsere Zeit passt
-
Not Synced
denn Lebrecht Scheibenmann heißt Keith Alexander und arbeitet für die NSA
-
Not Synced
Die NSA hat aus unser aller Zuhause Glashäuser gemacht
-
Not Synced
wir können alle gesehen werden in diesen Glashäusern
-
Not Synced
und man weiß nicht, bzw. ich bin mir ziemlich sicher, dass man damit pädagogische Ziele verfolgt
-
Not Synced
dass bestimmte Handlungen nicht mehr als akzeptabel gelten
-
Not Synced
und dass wir diese Beobachtung verinnerlichen
-
Not Synced
Bei dieser Beobachtung spielt Sprache natürlich eine ganz wichtige Rolle
-
Not Synced
Viele unserer Äußerungen finden im Medium der Sprache statt
-
Not Synced
Das hat auch viele Hacker auf die Idee gebracht, dass wir die NSA austricksen mit einer Seite wie "Hallo NSA"
-
Not Synced
Eine Website, die wie ein „Bullshitter“ verdächtige Wörter zu Botschaften zusammensetzt
-
Not Synced
und diese dann getweetet, gemailt oder verchattet werden sollen
-
Not Synced
um soetwas zu erreichen wie hier "Operation Troll the NSA“
-
Not Synced
dass man die NSA-Scanners jammen kann, dass man eine DDOS Attacke machen kann.
-
Not Synced
indem man einfach zu viel Content schickt, der quasi verdächtig ist auf der Basis von Keywords
-
Not Synced
In meinem Vortrag soll es darum gehen, dass dieses Bild von der NSA falsch ist.
-
Not Synced
Wir können nicht davon ausgehen, dass in der NSA die Leute tatsächlich bei Anzeige eines Keywords
-
Not Synced
sofort etwas ausdrucken und zu einer [Gelächter]
Analyse schreiten und sich das genauer anschauen
-
Not Synced
in der Annahme das sei eine sehr intensive Tätigkeit
-
Not Synced
und deswegen ist ein Keyword-Spam-DDoS natürlich erfolglos
-
Not Synced
Ihr alle werdet vermutlich die thanksgiving taklkingpoints der NSA gelesen haben.
-
Not Synced
Ich weiß nicht, ob ihr darüber gestolpert seid, dass unter Punkt 4 etwas ganz wichtiges steht
-
Not Synced
“NSA brings together the best linguists, analysts, mathematicians, engineers and computer scientists
-
Not Synced
in the United States.“
und die Linguisten werden als erstes genannt.
-
Not Synced
[Lachen]
-
Not Synced
Also da sieht man, der NSA ist durchaus bewusst, dass Sprache ein wichtiges Mittel ist. ...
-
Not Synced
Zufälligerweise wurde vom Innenminister die neuste Analysesoftware geleakt. ...
-
Not Synced
Wir gucken uns zunächst unsere heutige Vision an. Die Bloggerscene ...
-
Not Synced
Wichtig ist zu schauen, ob irgendwelche Visionen erfolgreich sind. ...
-
Not Synced
Erstmal wählen wir unsere Targets. Wir bekommen natürlich welche vorsgeschlagen. ...
-
Not Synced
Und religiös motivierte Webseiten. ...
-
Not Synced
Folgende Analysen sind möglich. Ich kann natürlich nur eine Auswahl an Analysetools zeigen. ...
-
Not Synced
Named-Entities sind zunächst mal Ausdruck von ... die andere Entities von anderen unterscheiden.
-
Not Synced
Entitiy-Recognition ist entsprechend das Verfahren ...
-
Not Synced
Manchmal ist auch nicht so deutlich wozu eine NE gehört. z.B. der Bundestag ...
-
Not Synced
Jetzt müssen wir noch wissen, was Kollokationen sind. ...
-
Not Synced
Das sind typische Verbindungen zwischen dem Wort gehen bzw einschlagen. ...
-
Not Synced
Ein Beispiel: (Ihr müsst das jetzt nicht lesen können) ...
-
Not Synced
Was man da macht, bei einer Kollokationsanalse ist Kontext. ...
-
Not Synced
Man zählt also die Wörter, die im blauen Bereich stehen und ...
-
Not Synced
Die Knoten bezeichnen Lexeme, (ich weiß jetzt nicht, wass es da zu lachen gibt) ...
-
Not Synced
Ok Also wir sind im Bereich der Zielanalyse. Wir starten mal die Analyse. Was machen wir da eigentlich? Was wir machen ist, wir erkennen alle ...
-
Not Synced
D.h. man untersucht bestimmte Kontexte in denen Wörter stehen ...
-
Not Synced
Und die Software lernt, dann ...
-
Not Synced
Was wir hier machen ist, wir identifizieren in allen Korpora die NE ...
-
Not Synced
Und dann schauen wir auch in den Kollokationen, ob da irgendwelche Gefährderwörter drin sind.
-
Not Synced
Die Analyse ist abgeschlossen und Ergebnis ist, dass ...
-
Not Synced
Potentielles Ziel bei Fefe ist SPD und bei der Mädchenmanschaft sollen wir nach Christina Schröder als Person schauen. ...
-
Not Synced
Wir haben jetzt zum Beispiel als Auftrag bekommen, warum Don Alfonso etwas über Berlin schreibt ...
-
Not Synced
Deutschland ist natürlich im Fokus. Das geht auch bis Italien rüber. Da sieht man auch, worüber DA so schreibt.
-
Not Synced
Deswegen schauen wir uns den Kollokationsgraphen an. ...
-
Not Synced
Das zeigt zwar eine sehr negative Haltung zu dem Gegenstand, aber ich würde nicht sagen terrorverdächtig.
-
Not Synced
Wir lassen uns den KG anschauen. Fefe und die SPD. Insgesamt in der gesamten Liste fanden sich tatsächlich so Wörter wie: (Aufzählung)
-
Not Synced
Aber wenn wir uns den KG anschauen, dann merken wir schon, dass sind Vorwurfshandlungen. Aber da wird nicht geplant, dass der ... umgebracht werden soll von fefe. ...
-
Not Synced
Wit machen weiter mit dem Energiemonitor. ...
-
Not Synced
Es ist in der Tat so, dass in diesen Bereich viel Forschung betrieben wurde. ...
-
Not Synced
Das kan man sicherlich noch besser machen, in dem man Idieologien misst. Was wir also berechen wollen ist die Ähnlichkeit von Blogs zu bestimmten Ideologien. ...
-
Not Synced
Das machen wir so, dass wir typische Kollokationen berechnen in denen ... also zu einem bestimmten Korpus ... also aus diesem Korpus lernen.
-
Not Synced
Also wir lernen von dem ... was sind typische Wortverbindungen.
-
Not Synced
Wir wollen gerne wissen, wer in einem Salafistischen Kommunikationsforum hat besonders viel von einem ...
-
Not Synced
Das Ziel ist es, wie sind bestimte Texte von bestimmter Ideologie durchdrungen. ...
-
Not Synced
Was wir bekommen sind Wortverbindungen, die möglicherweise auf salafistische ...
-
Not Synced
Und jetzt schauen wir, wie diese Wortverbindugnen ... in diesem Diskussionsforum vorkommen.
-
Not Synced
Das sind sämtliche Kollokationen in diesem Korpus.
-
Not Synced
Wir haben auch den User JihadFan, der offenbar auch nicht ...
-
Not Synced
Da sehen wir relativ viele rote Verbindungen. Wir können uns natürlich auch ein paar verdächtige Verbindungen anschauen.
-
Not Synced
Damit haben wir aber nichts mehr zu tun, denn wir sind ja nur Linguisten. Ich deute das als Zustimmung. Gut, wir fahren mit weiteren Anayseschritten fort. Und zwar Radikalität. Radikalität ist etwas, dass man so ohne weiteres nicht messen kann. Wir vom Innenministerium verstehen unter radik. ein ...
-
Not Synced
Wir verstehen darunter eine hohe Emotion also ... und eine Neigung zu Verschwörungstheorien. Das ist nicht ganz vom Himmel gefallen. Es gibt tatsächlich Forschungsliteratur, die diese Punkte nennen.
-
Not Synced
Es gibt also den sehr einfachen Listenbasierten Ansatz. Man sagt, wir haben eine bestimmte Liste von Wörten, deren Bedeutung wir kennen und suchen ...
-
Not Synced
Wir haben auch den gebrauch von negativen Adjektiven. (Auflistung)
-
Not Synced
Was wir natürlich auch malen können ist ein schwarzweißes Weltbild ... das kann man mit semantischen Taxonmien machen.
-
Not Synced
... Wörter, die man auch gebraucht ohne degradierte Form (lang & kurz vs länger & kürzer)
-
Not Synced
Emotionale envolviertheit könnte man ... mit Hilfe von Gradpartikel (ich finde das absolut/total toll).
-
Not Synced
...
-
Not Synced
... und den hohen Intensivierungsbereich.
-
Not Synced
Wenn wir die Distribution dieser Gradpartikel im Korpus messen, dann können wir ...
-
Not Synced
Also wenn man eine Liste hat wie Wörter ... dann sind das natürlich Wörter, die zumindest das Potential haben, ...
-
Not Synced
Wenn man jetzt den Radikalitätsindex berechnet, dann kann man sehen, das fefe, gefolgt von DA und dem salafistischen Forum und kreuz.net hier aufschlagen. Fefe hat nicht überall die erste Position.
-
Not Synced
DA ist also tatsächlich ein großer skandalsierer und intensivierer.
-
Not Synced
Ob wir operative Maßnahmen einleiten überlasse ich euch. Ich würde sagen, ich behalte sie im Auge.
-
Not Synced
Ich denke die NSA-Lingusiten sind weiter um das zu filtern. Ich denke, wenn man sich den Rechenschaftsbericht anschaut ...
-
Not Synced
Wenn man sich den neuen Bericht anschaut, dann steht da, dass weniger Span analysiert wurde.
-
Not Synced
... und ich denke, dass eventuell der allererste Zugriff über ein ... Zugriff erfolgt, aber dass die weiteren Ebenen viel feinere Analysen beinhalten, wie ...
-
Not Synced
Alphaville ist ein Film von ... in dem es darum geht dass ... ein Spion in die Stadt AV kommt, die von einem mächtigen ... und ein Teil einer Aufgabe ist es diesen Computer auzuschalten und den ... zu finden. Er spricht dann mit einem ...
-
Not Synced
Darauf sagt Lemmy Caution "" ...
-
Not Synced
Und dieser Sazt erfasst eigentlich das Problem, dass wir mit den Diensten haben relativ gut. Denn diese Dienste unterwerfen unsere .. einer Logik die nicht unsere ist ...
-
Not Synced
Und genau das ist das Problem. Das ist aber ein kennzeichen für alle totalitären Systeme. Dass sie ihre Logik nicht rechtfertigen müssen.
-
Not Synced
-
Not Synced
-
Not Synced
Q/A
-
Not Synced
- Wie ist das mit den Kollokationen und dem Kulturellem Kontext. Zum Beispiel: Ein Osama möchte ein Konto eröffnen. Das wird ihm aufgrund des Namen verweigert. ...
- Ich weiß nicht auf welcher Ebene ich diese Frage beantworten soll. Aus linguistischer Ebene kann man ganz einfach ... . Aus Sicht eines Analytikers, der nicht versteht was unter der Haube von so einem Toolkit läuft ist das egal. ... Aber das wird damit gerechtfertigt, dass was auf dem Spielfeld steht so mönströs ist, dass es jedes Mittel rechtfertigt.
-
Not Synced
- Ich würde mich mal interessieren, ob du mit diesen Methoden mal die Pressemitteilungen ... zu analysieren
- ... das trieft aber von positiven Darstellungen der Wirklichkeit, denn also Regierungs ... ist man natürlich motiviert, dass man unter besonders positivem Lich fällt
-
Not Synced
- Wäre es eigentlich möglich solchen Konnotaitions-Spam zu erzeugen?
- Das können wir alles machen. Aber ich möchte darauf hinweisen: Es macht keinen Sinn sich zu verstellen. Was sich ändern muss ist die Logik. Es gibt für jede Methode eine Gegenmmethode. ... Ich bin der Meinung, dass wir uns deswegen durch diese Dinge nicht einschränken lassen sollten. ...
-
Not Synced
- Ich habe noch eine Frage zu der Anspielung am Anfang ... es geht natürlich darum, dass ich weiß, dass der Überwacher da ist und was seine Kriterien sind... Wenn ich nicht weiß, wonach ich als vertächtig betrachtet werde, dann diszipliniert mich das ja gar nicht.
- Wir haben eine Ahnung, aber wir haben nicht mehr als eine ahnung ... ich möchte ein Beispiel geben. Ich habe ein Buch gelesen über ein maoistisches Gefängnis ... Er zermatert sich sein Gehirn. ... ich glaube grade die unwissenheit darüber ist das perfidere Mittel zur Kontrolle
-
Not Synced
- Gibt es eine Instanz, die diese Keywordlisten überprüft. Wenn ja, welche ist das?
- Keine Ahnung. Wir wissen es nicht ... Nein, die sind nicht validiert. Man knan natürlich davon ausgehen, dass sie überprüft sind, aber ... wie man das wissenschaftlich nachprüfen kann
-
Not Synced
- Brächte es etwas, wenn wir alle in einem Dialekt schreiben, damit die Keywörter nicht erkannt werden. Ist das sinnvoll.
- Als Hesse kann ich dir sagen, dass das schon etwas bringen würde. Das hätte tatsächlich Chancen es den Diensten schwerer zu machen. Wie gesagt, es würde auch die Kommunikation erheblich erschweren.
-
Not Synced
- Wie geht man mit der schwierigkeit von fremdssprachen/verschiedenen Sprachen um ...
- Grundsätzlich gibt es Software die designt ist, dass sie sprachunabhängig funktioniert. ... Nichtsdestotrotz wird sie eingesetzt. Siemens macht soetwas zu Autorenerkennnung ... man lernt Features, unabhängig von der Sprache.
-
Not Synced
- Wenn man sagt, wir reden über diese Listen, dann ist doch das Problem, dass es nicht mehr wertvoll ist, sobald sie bekannt sind.
- Es gibt gar kein Entkommen. Wenn die Listen bekannt sind, dann können wir diese wegschmeißen. Auch die anderen Verfahren. Ich glaube, dass dann die nächsten Verfahren kommen ... und damit ist man wieder gefangen. Ich glaube dieses Katz und Maus Spiel existiert, aber man muss da raus. Ich glaube man sollte es einfach lassen.
-
Not Synced
- Ich fühlte mich durch den Vortrag an den Staatssoziologen ... erinnert. ... Was damals soweit in die Öffentlichkeit ... hast du dich mit diesem Fall mal näher beschäftigt. Wie die Behörden in diesem Fall vorgegangen sind?
- ... ich denke, dass da ganz unterschiedliche Dinge passiert sind. Das BKA hat gesagt, dass Andre Holm nicht der Autor ist. Das Gutachten kam woanders her ... aber igrendwoher musste das ja gekommen sein ... Letztlich hat die Sprachanalyse für diesen Fall keine Rolle gespielt.
-
Not Synced
- Ich freue mich, dass du diesen Link zu Foucault ... Ich wollte auch noch mal die Frage nach einem Beispiel für false-positives ...
- ... Sudanflug. Was dann aber Sudan-Flug gelesen wurde. Und da hat die Bank direkt den Statsschutz informiert. ... Das sind so Dinge, die tauchen immer wieder auf. Wir bekommen es in viele Fällen auch gar nicht mit ...
-
Not Synced
- Linguistik ist ja eine Geisteswissenschaft, die nicht so gut finanziert ist. Ist es dir bekannt ... könte da eine echte differenz sein?
- ... die Verfahren haben ja zunächst einmal nichts mit überwachung zu tun ... sie sind abstrakt von ihrer Verwendung ... aber ich würde meinen, dass die NSA finanziert ja auch Forschung an deutschen Universitäten. Es geht gut voran in diesem Bereich. Wir erschließen uns Wissen über Sprache. ... Wir suchen Informationen mit komplexen Anfragen, die komplizierter Natur sind ... wir ordnen uns die Welt neu mit dem Medium Sprache ...
-
Not Synced
- Ich würde gerne die Aktualität deiner Mittel überprüfen. Zum einen, wo hast du diese her (aus dem Snowden-Fall?), aber auch wie alt sind diese Informationen?
- .. wie alt sind diese Verfahren. Die ... nicht grundlegend verschiedenen von Kollokationsverfahren ... da tut sich eine Menge. Aber grundsätzlich würde ich schon sagen: Viel neues gibt es nicht. Man hätte sich noch anschauen kännen, wie man Frames identifiziert ...
-
Not Synced
- Du hast vorhin zu recht gesagt, dass man mit bulshitting das sichtbar machen sollte und das der Öffentlichkeit klar machen sollte. Was wären denn da die Möglichkeiten? ...
- Ganz shcwierig. Ich glaube es geht nur der Weg über die Politik. Es ist ein politisches Anliegen, dass diese Methoden öffentlich gemacht werden müssen ... Das ist ein Politischer Weg. Lobbying, da wo es weh tut. ... das ist ein hartes Brot, aber wichtig. Man kann es nicht mit technischen Mitteln lösen. ...
-
Not Synced
- ... auf keinen Fall sind unsere Politiker als Verbrecher und dilletanten zu sehen. Da wird man ... schnell einen false-positive haben ...
- ... Das ist sozusagen der Google-Ansatz ... mit viele Daten diese Sache lösen Das ist natürlich für Linguisten ... aber eben, das ist so. Mit linguistischem Wissen ...
-
Not Synced
- Wie würdest du das bewerten, wenn man eine Überlegung zur Theorie ... Kann man da schon beobachten, dass ... ich könnte mir vorstellen, dass der ...
- Das ist eine spannende Hypothese. Dadurch, dass der Staat ... das wäre eine spannende Hypothese, die mal zu überprüfen wäre ...
- ...
- Dann haben wir immerhin noch macht. Subversiv können wir immernoch sein.
-
Not Synced
- Du sprachst grade von den großen Datenmengen. Diese werden immer größer und dadurch auch die Erfolgsquoten. ... Was würde denn passieren, wenn wir so große Datenmengen haben und auch die Algorithmen, dass wir keine false-postives mehr haben ... Dann wird der Kampf dagegen immer schwieriger.
- Ich habe noch nicht darüber nachgedacht. Das ist ein ganz interessanter Punkt. Wenn nur noch die echten Terroristen verhaftet werden, dann habe wir ein Problem.
-
Not Synced
- Wenn du dir mal die Berichte von ... anschaust. Die werten ja nicht nur die linguistischen ... Vater ist islamist. Auch wenn man ihn 60 Jahre nicht gesehen hast. ... und dass sie eine Liste abarbeiten, wenn sie grade nicht operativ ... dann ist da linguistische nicht das gefährlichste.
- Das ist richtig. Wir haben uns jetzt nur einen kleinen Teil angeschaut von Daten ... Aber die Metadaten sind viel mächtiger, wenn es um harte Fragen(oder Fakten?) geht.
-
Not Synced
- Ich stimme zu, das es auf politischer Ebene besser, aber gibt es nicht eigentlich schon jede Menge Beispiele, dass Politiker auf diesen Zug aufspringen. "Ist doch eine Tolle Methode" ...
- ... Natürlich. der Zug fährt in eine andere Richtung ...
-
Not Synced
- Was machen wir wenn alle Terroristen gefangen werden. Natürlich müssen wir uns immernoch wehren ... will ich dann immernoch wissen, was man über mich weiß? ...
- Danke. Zumal auch das Konzept "Terrorist" durchaus etwas ist, dass man gesellschaftlich diskutieren kann.
-
Not Synced
- Kurze Frage zu false-positive. Schon mal etwas wie Sterbebegleitung gegengescannt. ...
- Wäre interessant, aber hab eich nicht gemacht.
- ...
- Klar.
...
- Ich glaube es ist ganz wichtig, dass wir die Entstehungskontexte ... und deswegen hat die Fragestellerin recht ... es gibt Methoden Textsorten zu erkennen. ...