WEBVTT
00:00:00.000 --> 00:00:14.840
rC3 wikipaka Vorspannmusik
00:00:14.840 --> 00:00:20.240
Willkommen zu meinem Talk "FragDenStaat
für HackerInnen". Zuerst einmal: Was ist
00:00:20.240 --> 00:00:26.210
denn überhaupt FragDenStaat? FragtDenStaat
ist ein vierteiliges Projekt. Zum einen
00:00:26.210 --> 00:00:32.240
ist eine Online-Plattform unter
fragdenstaat.de. Dort kann man Anfragen
00:00:32.240 --> 00:00:35.720
nach dem Informationsfreiheitsgesetz
stellen. Dieses
00:00:35.720 --> 00:00:42.380
Informationsfreiheitsgesetz oder kurz IFG
erlaubt es jedem Menschen, amtliche
00:00:42.380 --> 00:00:49.340
Dokumente anzufragen. Das können z.B.
Baupläne, interne Protokolle oder Verträge
00:00:49.340 --> 00:00:56.390
sein. Über FragDenStaat kann man solche
Anfragen stellen und auch schon gestellte
00:00:56.390 --> 00:01:02.750
Anfragen finden, da die allermeisten
Anfragen auf FragDenStaat öffentlich
00:01:02.750 --> 00:01:09.440
verfügbar sind. Zudem machen wir viele
Kampagnen, um das
00:01:09.440 --> 00:01:14.030
Informationsfreiheitsgesetz zu promoten,
damit mehr Menschen ihr Recht auf
00:01:14.030 --> 00:01:19.220
Informationen nutzen und bieten mit den
Kampagnen auch einen einfachen Einstieg,
00:01:19.220 --> 00:01:25.970
wenn man noch keine Anfrage vorher
gestellt hat. Und zudem erhöhen wir durch
00:01:25.970 --> 00:01:30.890
die hohe Anzahl der Anfragen durch die
Kampagnen auch den Druck auf Behörden, von
00:01:30.890 --> 00:01:37.250
sich aus Informationen zu veröffentlichen
und nicht nur auf Anfrage. Außerdem
00:01:37.250 --> 00:01:43.250
verklagen wir regelmäßig Behörden, wenn
diese die Auskunft verweigern und machen
00:01:43.250 --> 00:01:50.330
einige Recherchen auf Basis von IFG
Anfragen. FragDenStaat ist für HackerInnen
00:01:50.330 --> 00:01:56.090
besonders interessant, da es einen großen
Zugang zu vielen politisch relevanten
00:01:56.090 --> 00:02:04.160
offenen Daten liefert. Zum einen gibt es
da die Daten von FragDenStaat selbst, das
00:02:04.160 --> 00:02:10.460
sind hauptsächlich die Behördendaten. Wir
haben mittlerweile über 40.000 Behörden in
00:02:10.460 --> 00:02:16.190
der Datenbank, die per API abgefragt
werden können. Hier sieht man jetzt
00:02:16.190 --> 00:02:21.410
beispielsweise den Behörden-Endpoint.
Darüber erhält man Informationen wie z.B.
00:02:21.410 --> 00:02:28.580
Name, Website, E-Mail, Adresse, die Anzahl
der Anfragen an die Behörde. Und hier
00:02:28.580 --> 00:02:34.520
unten sind jetzt noch drei weitere
Endpoints, z.B. die Jurisdiktion, also das
00:02:34.520 --> 00:02:42.680
Rechtsgebiet, das insofern relevant, da
das IFG Ländersache ist. Das heißt z.B.
00:02:42.680 --> 00:02:47.960
das Bundesverkehrsministerium unterliegt
dem Bundes-IFG, während die Berliner
00:02:47.960 --> 00:02:56.180
Polizei den Berliner IFG unterliegt. Über
den Jurisdiktion-Endpoint erhält man dann
00:02:56.180 --> 00:03:03.650
z.B. Bund oder Baden-Württemberg und kann
mit den ID's dann die Behörden danach
00:03:03.650 --> 00:03:12.530
filtern. Also es ist eine relativ
standardmäßige REST-API. Das Fraunhofer
00:03:12.530 --> 00:03:17.840
Institut nutzt z.B. die API, um eine
Analyse-Dashboard zur Verfügung zu
00:03:17.840 --> 00:03:24.080
stellen. Und mit der API oder auch mit dem
Dashboard lassen sich dann ganz
00:03:24.080 --> 00:03:30.470
interessante Meta-Analyse machen. Hier
habe ich jetzt z.B. mal den Anteil an
00:03:30.470 --> 00:03:36.230
erfolgreichen Anfragen über die Jahre nach
aufgezeichnet. Ja, und wie man jetzt von
00:03:36.230 --> 00:03:42.290
2020 auch nichts anderes erwartet: Es
natürlich eine große Enttäuschung. Genau
00:03:42.290 --> 00:03:47.090
solche Analysen lassen sich dann mit der
API oder mit dem Dashboard relativ einfach
00:03:47.090 --> 00:03:52.940
machen. Viel interessanter ist es
eigentlich aber, die Anfragen zu
00:03:52.940 --> 00:03:59.750
verwenden. Es gibt mittlerweile schon über
170 000 Anfragen auf FragDenStaat, die
00:03:59.750 --> 00:04:04.370
allermeisten davon sind öffentlich. Und
dabei sind ganz viele interessante
00:04:04.370 --> 00:04:08.600
Dokumente, die allerdings noch kaum
benutzt wurden. Also es lohnt sich
00:04:08.600 --> 00:04:12.860
wirklich mal ein bisschen durch zu
stöbern, was alles für Daten noch
00:04:12.860 --> 00:04:20.945
rumliegen. Ich habe z.B. eine interessante
Anfrage gefunden zur Warn-App NINA. Wer
00:04:20.945 --> 00:04:26.810
die nicht kennt: Darüber ist es
möglich, wenn z.B. ein Großbrand entsteht,
00:04:26.810 --> 00:04:31.520
die Menschen in der Umgebung, die die App
installiert haben, über die
00:04:31.520 --> 00:04:37.980
Rauchentwicklung zu informieren. Bei der
Anfrage kann man jetzt z.B. schon mal was
00:04:37.980 --> 00:04:42.060
wichtiges mitnehmen. Man sollte nämlich
immer nach maschinenlesbaren Daten
00:04:42.060 --> 00:04:48.630
fragen. Oft wird dem nachgegangen.
Allerdings gibt es keine rechtliche
00:04:48.630 --> 00:04:54.960
Verpflichtung, die Daten maschinenlesbar
oder überhaupt digital bereitzustellen.
00:04:54.960 --> 00:05:01.080
Oftmals bekommt man die Daten per Post und
muss sie dann irgendwie einscannen und per
00:05:01.080 --> 00:05:07.350
OCR irgendwie maschinenlesbar machen an.
Hier hatten wir allerdings Glück. Die
00:05:07.350 --> 00:05:12.390
Daten wurden als Excel-Tabelle
zurückgeschickt. So sieht es ungefähr aus.
00:05:12.390 --> 00:05:18.750
Und damit lassen sich schon relativ
einfache Auswertungen machen. Ich habe
00:05:18.750 --> 00:05:25.530
jetzt hier z.B. mal die Warnmeldungen 2020
nach Bundesländern und Warnstufe in ein
00:05:25.530 --> 00:05:32.580
Diagramm gemacht. Relativ simpel, einfach
mit LibreOffice. Und da kann man ja z.B.
00:05:32.580 --> 00:05:37.680
sehen, dass die Nutzung zwischen den
Ländern ziemlich ungleich ist. Also NRW
00:05:37.680 --> 00:05:45.480
benutzt die App am allermeisten und die
anderen Ländern quasi kaum. Und ich fand,
00:05:45.480 --> 00:05:50.430
das ist eine interessante Erkenntnis
aus Daten, die eigentlich die ganze Zeit
00:05:50.430 --> 00:05:55.710
im Aktenschrank von einer Behörde liegen
und erst jetzt wirklich eine nützliche
00:05:55.710 --> 00:06:03.930
Informationen rausgezogen wurde. Ein
weiteres interessantes Projekt von uns ist
00:06:03.930 --> 00:06:08.820
"Die Demo-Hauptstadt Berlin". Hintergrund
ist, dass in Berlin etwa 14
00:06:08.820 --> 00:06:14.460
Demonstrationen am Tag stattfinden. Und
wir haben deshalb die Daten der
00:06:14.460 --> 00:06:20.160
Veranstaltungsdatenbank der Polizei
Berlin angefragt und wollten die Daten
00:06:20.160 --> 00:06:27.420
aufgeschlüsselt nach Thema, nach Zeit und
nach Besucherzahl. Und wir haben das jetzt
00:06:27.420 --> 00:06:35.160
visuell dargestellt auf einer Zeitleiste.
Je größer hier einen Punkt ist, desto mehr
00:06:35.160 --> 00:06:41.370
Personen haben an der Demonstration
teilgenommen und je gesättigter ein Punkt
00:06:41.370 --> 00:06:45.750
ist, desto höher ist das Verhältnis von
den angemeldeten und den tatsächlich
00:06:45.750 --> 00:06:52.800
anwesenden BesucherInnen. Und was man
jetzt daraus z.B. rauslesen kann ist, dass
00:06:52.800 --> 00:06:58.020
rechte Demos oft deutlich weniger
BesucherInnen als angemeldet haben im
00:06:58.020 --> 00:07:05.370
Vergleich zu den meisten anderen
Kategorien, z.B. der Kategorie Umwelt. Das
00:07:05.370 --> 00:07:09.540
ist ein interaktives Datenprojekt auf
unserer Website mit einer ziemlich
00:07:09.540 --> 00:07:14.370
mächtigen Visualisierung. Und das zeigt
auch schon so ein bisschen das Potenzial
00:07:14.370 --> 00:07:19.740
von IFG-Anfragen und welche Informationen
man aus den Anfragen rausziehen kann.
00:07:19.740 --> 00:07:27.210
Gleichzeitig zeigt das aber auch die
Kosten und den Aufwand, die mit so einem
00:07:27.210 --> 00:07:31.380
Projekt verbunden sein können. IFG-
Anfragen sind nämlich teilweise
00:07:31.380 --> 00:07:40.950
gebührenpflichtig, wenn durch die Anfrage
ein erhöhter Behörden-Aufwand entsteht. In
00:07:40.950 --> 00:07:46.530
diesem Fall haben wir fünf Anfragen
gestellt, die insgesamt 260 Euro gekostet
00:07:46.530 --> 00:07:50.700
haben, und mussten zudem auch noch
ziemlich hartnäckig sein, um die Daten
00:07:50.700 --> 00:07:55.500
überhaupt zu bekommen. Die Berliner
Polizei meinte nämlich zunächst, dass ein
00:07:55.500 --> 00:08:00.570
Datenexport gar nicht möglich ist. Nachdem wir
allerdings die Struktur der Datenbank
00:08:00.570 --> 00:08:07.170
angefragt haben, konnten wir beweisen,
dass es doch geht. Man muss sich also Zeit
00:08:07.170 --> 00:08:13.560
nehmen. Und dann das andere Problem mit dem
Kosten. Natürlich kann nicht jeder oder
00:08:13.560 --> 00:08:18.900
jede so ein Budget für ein kleines
Nebenprojekt aufwenden. Deswegen gibt es
00:08:18.900 --> 00:08:24.570
einige Unterstützungsmöglichkeiten. Z.B.
gibt es von Wikimedia die Möglichkeit,
00:08:24.570 --> 00:08:32.160
gebührenpflichtige IFG-Anfragen zu
fördern. Wenn ihr die Ergebnisse auf
00:08:32.160 --> 00:08:37.680
Wikipedia dokumentiert oder auf Commons
bereitstellt, dann übernimmt Wikimedia die
00:08:37.680 --> 00:08:42.310
Kosten für eure Anfragen und auf
FragDenStaat haben wir auch - relativ neu
00:08:42.310 --> 00:08:48.310
dieses Jahr - eine Crowdfunding Möglichkeit
angelegt. Damit könnt ihr auch
00:08:48.310 --> 00:08:53.189
gebührenpflichtige Anfragen finanzieren
oder sogar klagen.
00:09:03.943 --> 00:09:08.971
Herald: Hi Max. Cool, dass du
da bist. Es gibt bisher irgendwie
00:09:08.971 --> 00:09:13.136
noch keine wirklichen Fragen aus dem Chat.
Ich gebe den Leuten mal noch ne Minute,
00:09:13.136 --> 00:09:16.680
aber ich hab gehört, ihr macht auch
direkt im Anschluss ein Meetup.
00:09:16.680 --> 00:09:19.322
Max: Ja, das ist auch zusammen
mit Arne. Da werden wir
00:09:19.322 --> 00:09:24.650
wahrscheinlich so ein bisschen einen
kleinen Jahresrückblick machen. Und da
00:09:24.650 --> 00:09:29.030
gibt's natürlich auch die Möglichkeit,
noch ein paar Fragen zu stellen oder auch
00:09:29.030 --> 00:09:31.970
gerne von eigenen kleinen Projekten
erzählen.
00:09:31.970 --> 00:09:37.954
Herald: Das klingt super. Dann würde ich
sagen, dass mal einer meiner Kollegen
00:09:37.954 --> 00:09:43.096
vielleicht den Link nochmal verteilt auf
den diversen Kanälen. Und dann hoffe ich,
00:09:43.096 --> 00:09:47.550
dass da vielleicht noch ein paar spannende
Fragen reinkommen. Das Ganze findet auch
00:09:47.550 --> 00:09:52.880
bei BigBlueButton statt und ich würde
sagen, es sieht nicht so aus. Doch da, es
00:09:52.880 --> 00:09:58.440
gibt eine Frage. Ich les sie mal direkt
vor: "How to deal with threats by
00:09:58.440 --> 00:10:03.760
agencies like 'You are responsible for the
consequences of publishing what we
00:10:03.760 --> 00:10:07.670
sent you via snail-mail?'".
Max: Hm, soll ich die
00:10:07.670 --> 00:10:09.950
Frage auch auf Englisch beantworten?
00:10:09.950 --> 00:10:13.915
Ich glaube, du kannst sie vielleicht auch
auf Deutsch beantworten.
00:10:13.915 --> 00:10:19.580
Max: Also wenn du die Antwort
auf FragDenStaat veröffentlichst,
00:10:19.580 --> 00:10:26.030
dann sind glaube ich wir dafür
verantwortlich, da es ja unserer Seite
00:10:26.030 --> 00:10:30.590
ist. Das heißt. Insofern liegt hier
erstmal die Konsequenz bei uns. Wenn du
00:10:30.590 --> 00:10:38.060
das natürlich dann z.B. auf einer eigenen
Website weiterverarbeitest, dann ist das
00:10:38.060 --> 00:10:42.830
natürlich anders. Allerdings, in den
allermeisten Fällen dürfen die Ergebnisse
00:10:42.830 --> 00:10:48.560
von den IFG-Anfragen veröffentlicht
werden. Also da gibt es selten Probleme.
00:10:48.560 --> 00:10:53.330
Herald: Das klingt so, als wäre es auf jeden Fall
sinnvoll, das irgendwie in Absprache mit
00:10:53.330 --> 00:11:01.340
euch zu machen - Sicher, gerne - Ja Cool,
dann würde ich sagen, schicke ich dich mal
00:11:01.340 --> 00:11:06.140
rüber in den Meetup-Raum und alle anderen,
die folgen möchten, dürfen das gerne tun.
00:11:06.140 --> 00:11:12.019
Und noch viel Spaß heute.
00:11:12.019 --> 00:11:16.069
Abspannmusik
00:11:16.069 --> 00:11:22.000
Untertitel erstellt von c3subtitles.de
im Jahr 2021. Mach mit und hilf uns!