WEBVTT 00:00:00.000 --> 00:00:14.840 rC3 wikipaka Vorspannmusik 00:00:14.840 --> 00:00:20.240 Willkommen zu meinem Talk "FragDenStaat für HackerInnen". Zuerst einmal: Was ist 00:00:20.240 --> 00:00:26.210 denn überhaupt FragDenStaat? FragtDenStaat ist ein vierteiliges Projekt. Zum einen 00:00:26.210 --> 00:00:32.240 ist eine Online-Plattform unter fragdenstaat.de. Dort kann man Anfragen 00:00:32.240 --> 00:00:35.720 nach dem Informationsfreiheitsgesetz stellen. Dieses 00:00:35.720 --> 00:00:42.380 Informationsfreiheitsgesetz oder kurz IFG erlaubt es jedem Menschen, amtliche 00:00:42.380 --> 00:00:49.340 Dokumente anzufragen. Das können z.B. Baupläne, interne Protokolle oder Verträge 00:00:49.340 --> 00:00:56.390 sein. Über FragDenStaat kann man solche Anfragen stellen und auch schon gestellte 00:00:56.390 --> 00:01:02.750 Anfragen finden, da die allermeisten Anfragen auf FragDenStaat öffentlich 00:01:02.750 --> 00:01:09.440 verfügbar sind. Zudem machen wir viele Kampagnen, um das 00:01:09.440 --> 00:01:14.030 Informationsfreiheitsgesetz zu promoten, damit mehr Menschen ihr Recht auf 00:01:14.030 --> 00:01:19.220 Informationen nutzen und bieten mit den Kampagnen auch einen einfachen Einstieg, 00:01:19.220 --> 00:01:25.970 wenn man noch keine Anfrage vorher gestellt hat. Und zudem erhöhen wir durch 00:01:25.970 --> 00:01:30.890 die hohe Anzahl der Anfragen durch die Kampagnen auch den Druck auf Behörden, von 00:01:30.890 --> 00:01:37.250 sich aus Informationen zu veröffentlichen und nicht nur auf Anfrage. Außerdem 00:01:37.250 --> 00:01:43.250 verklagen wir regelmäßig Behörden, wenn diese die Auskunft verweigern und machen 00:01:43.250 --> 00:01:50.330 einige Recherchen auf Basis von IFG Anfragen. FragDenStaat ist für HackerInnen 00:01:50.330 --> 00:01:56.090 besonders interessant, da es einen großen Zugang zu vielen politisch relevanten 00:01:56.090 --> 00:02:04.160 offenen Daten liefert. Zum einen gibt es da die Daten von FragDenStaat selbst, das 00:02:04.160 --> 00:02:10.460 sind hauptsächlich die Behördendaten. Wir haben mittlerweile über 40.000 Behörden in 00:02:10.460 --> 00:02:16.190 der Datenbank, die per API abgefragt werden können. Hier sieht man jetzt 00:02:16.190 --> 00:02:21.410 beispielsweise den Behörden-Endpoint. Darüber erhält man Informationen wie z.B. 00:02:21.410 --> 00:02:28.580 Name, Website, E-Mail, Adresse, die Anzahl der Anfragen an die Behörde. Und hier 00:02:28.580 --> 00:02:34.520 unten sind jetzt noch drei weitere Endpoints, z.B. die Jurisdiktion, also das 00:02:34.520 --> 00:02:42.680 Rechtsgebiet, das insofern relevant, da das IFG Ländersache ist. Das heißt z.B. 00:02:42.680 --> 00:02:47.960 das Bundesverkehrsministerium unterliegt dem Bundes-IFG, während die Berliner 00:02:47.960 --> 00:02:56.180 Polizei den Berliner IFG unterliegt. Über den Jurisdiktion-Endpoint erhält man dann 00:02:56.180 --> 00:03:03.650 z.B. Bund oder Baden-Württemberg und kann mit den ID's dann die Behörden danach 00:03:03.650 --> 00:03:12.530 filtern. Also es ist eine relativ standardmäßige REST-API. Das Fraunhofer 00:03:12.530 --> 00:03:17.840 Institut nutzt z.B. die API, um eine Analyse-Dashboard zur Verfügung zu 00:03:17.840 --> 00:03:24.080 stellen. Und mit der API oder auch mit dem Dashboard lassen sich dann ganz 00:03:24.080 --> 00:03:30.470 interessante Meta-Analyse machen. Hier habe ich jetzt z.B. mal den Anteil an 00:03:30.470 --> 00:03:36.230 erfolgreichen Anfragen über die Jahre nach aufgezeichnet. Ja, und wie man jetzt von 00:03:36.230 --> 00:03:42.290 2020 auch nichts anderes erwartet: Es natürlich eine große Enttäuschung. Genau 00:03:42.290 --> 00:03:47.090 solche Analysen lassen sich dann mit der API oder mit dem Dashboard relativ einfach 00:03:47.090 --> 00:03:52.940 machen. Viel interessanter ist es eigentlich aber, die Anfragen zu 00:03:52.940 --> 00:03:59.750 verwenden. Es gibt mittlerweile schon über 170 000 Anfragen auf FragDenStaat, die 00:03:59.750 --> 00:04:04.370 allermeisten davon sind öffentlich. Und dabei sind ganz viele interessante 00:04:04.370 --> 00:04:08.600 Dokumente, die allerdings noch kaum benutzt wurden. Also es lohnt sich 00:04:08.600 --> 00:04:12.860 wirklich mal ein bisschen durch zu stöbern, was alles für Daten noch 00:04:12.860 --> 00:04:20.945 rumliegen. Ich habe z.B. eine interessante Anfrage gefunden zur Warn-App NINA. Wer 00:04:20.945 --> 00:04:26.810 die nicht kennt: Darüber ist es möglich, wenn z.B. ein Großbrand entsteht, 00:04:26.810 --> 00:04:31.520 die Menschen in der Umgebung, die die App installiert haben, über die 00:04:31.520 --> 00:04:37.980 Rauchentwicklung zu informieren. Bei der Anfrage kann man jetzt z.B. schon mal was 00:04:37.980 --> 00:04:42.060 wichtiges mitnehmen. Man sollte nämlich immer nach maschinenlesbaren Daten 00:04:42.060 --> 00:04:48.630 fragen. Oft wird dem nachgegangen. Allerdings gibt es keine rechtliche 00:04:48.630 --> 00:04:54.960 Verpflichtung, die Daten maschinenlesbar oder überhaupt digital bereitzustellen. 00:04:54.960 --> 00:05:01.080 Oftmals bekommt man die Daten per Post und muss sie dann irgendwie einscannen und per 00:05:01.080 --> 00:05:07.350 OCR irgendwie maschinenlesbar machen an. Hier hatten wir allerdings Glück. Die 00:05:07.350 --> 00:05:12.390 Daten wurden als Excel-Tabelle zurückgeschickt. So sieht es ungefähr aus. 00:05:12.390 --> 00:05:18.750 Und damit lassen sich schon relativ einfache Auswertungen machen. Ich habe 00:05:18.750 --> 00:05:25.530 jetzt hier z.B. mal die Warnmeldungen 2020 nach Bundesländern und Warnstufe in ein 00:05:25.530 --> 00:05:32.580 Diagramm gemacht. Relativ simpel, einfach mit LibreOffice. Und da kann man ja z.B. 00:05:32.580 --> 00:05:37.680 sehen, dass die Nutzung zwischen den Ländern ziemlich ungleich ist. Also NRW 00:05:37.680 --> 00:05:45.480 benutzt die App am allermeisten und die anderen Ländern quasi kaum. Und ich fand, 00:05:45.480 --> 00:05:50.430 das ist eine interessante Erkenntnis aus Daten, die eigentlich die ganze Zeit 00:05:50.430 --> 00:05:55.710 im Aktenschrank von einer Behörde liegen und erst jetzt wirklich eine nützliche 00:05:55.710 --> 00:06:03.930 Informationen rausgezogen wurde. Ein weiteres interessantes Projekt von uns ist 00:06:03.930 --> 00:06:08.820 "Die Demo-Hauptstadt Berlin". Hintergrund ist, dass in Berlin etwa 14 00:06:08.820 --> 00:06:14.460 Demonstrationen am Tag stattfinden. Und wir haben deshalb die Daten der 00:06:14.460 --> 00:06:20.160 Veranstaltungsdatenbank der Polizei Berlin angefragt und wollten die Daten 00:06:20.160 --> 00:06:27.420 aufgeschlüsselt nach Thema, nach Zeit und nach Besucherzahl. Und wir haben das jetzt 00:06:27.420 --> 00:06:35.160 visuell dargestellt auf einer Zeitleiste. Je größer hier einen Punkt ist, desto mehr 00:06:35.160 --> 00:06:41.370 Personen haben an der Demonstration teilgenommen und je gesättigter ein Punkt 00:06:41.370 --> 00:06:45.750 ist, desto höher ist das Verhältnis von den angemeldeten und den tatsächlich 00:06:45.750 --> 00:06:52.800 anwesenden BesucherInnen. Und was man jetzt daraus z.B. rauslesen kann ist, dass 00:06:52.800 --> 00:06:58.020 rechte Demos oft deutlich weniger BesucherInnen als angemeldet haben im 00:06:58.020 --> 00:07:05.370 Vergleich zu den meisten anderen Kategorien, z.B. der Kategorie Umwelt. Das 00:07:05.370 --> 00:07:09.540 ist ein interaktives Datenprojekt auf unserer Website mit einer ziemlich 00:07:09.540 --> 00:07:14.370 mächtigen Visualisierung. Und das zeigt auch schon so ein bisschen das Potenzial 00:07:14.370 --> 00:07:19.740 von IFG-Anfragen und welche Informationen man aus den Anfragen rausziehen kann. 00:07:19.740 --> 00:07:27.210 Gleichzeitig zeigt das aber auch die Kosten und den Aufwand, die mit so einem 00:07:27.210 --> 00:07:31.380 Projekt verbunden sein können. IFG- Anfragen sind nämlich teilweise 00:07:31.380 --> 00:07:40.950 gebührenpflichtig, wenn durch die Anfrage ein erhöhter Behörden-Aufwand entsteht. In 00:07:40.950 --> 00:07:46.530 diesem Fall haben wir fünf Anfragen gestellt, die insgesamt 260 Euro gekostet 00:07:46.530 --> 00:07:50.700 haben, und mussten zudem auch noch ziemlich hartnäckig sein, um die Daten 00:07:50.700 --> 00:07:55.500 überhaupt zu bekommen. Die Berliner Polizei meinte nämlich zunächst, dass ein 00:07:55.500 --> 00:08:00.570 Datenexport gar nicht möglich ist. Nachdem wir allerdings die Struktur der Datenbank 00:08:00.570 --> 00:08:07.170 angefragt haben, konnten wir beweisen, dass es doch geht. Man muss sich also Zeit 00:08:07.170 --> 00:08:13.560 nehmen. Und dann das andere Problem mit dem Kosten. Natürlich kann nicht jeder oder 00:08:13.560 --> 00:08:18.900 jede so ein Budget für ein kleines Nebenprojekt aufwenden. Deswegen gibt es 00:08:18.900 --> 00:08:24.570 einige Unterstützungsmöglichkeiten. Z.B. gibt es von Wikimedia die Möglichkeit, 00:08:24.570 --> 00:08:32.160 gebührenpflichtige IFG-Anfragen zu fördern. Wenn ihr die Ergebnisse auf 00:08:32.160 --> 00:08:37.680 Wikipedia dokumentiert oder auf Commons bereitstellt, dann übernimmt Wikimedia die 00:08:37.680 --> 00:08:42.310 Kosten für eure Anfragen und auf FragDenStaat haben wir auch - relativ neu 00:08:42.310 --> 00:08:48.310 dieses Jahr - eine Crowdfunding Möglichkeit angelegt. Damit könnt ihr auch 00:08:48.310 --> 00:08:53.189 gebührenpflichtige Anfragen finanzieren oder sogar klagen. 00:09:03.943 --> 00:09:08.971 Herald: Hi Max. Cool, dass du da bist. Es gibt bisher irgendwie 00:09:08.971 --> 00:09:13.136 noch keine wirklichen Fragen aus dem Chat. Ich gebe den Leuten mal noch ne Minute, 00:09:13.136 --> 00:09:16.680 aber ich hab gehört, ihr macht auch direkt im Anschluss ein Meetup. 00:09:16.680 --> 00:09:19.322 Max: Ja, das ist auch zusammen mit Arne. Da werden wir 00:09:19.322 --> 00:09:24.650 wahrscheinlich so ein bisschen einen kleinen Jahresrückblick machen. Und da 00:09:24.650 --> 00:09:29.030 gibt's natürlich auch die Möglichkeit, noch ein paar Fragen zu stellen oder auch 00:09:29.030 --> 00:09:31.970 gerne von eigenen kleinen Projekten erzählen. 00:09:31.970 --> 00:09:37.954 Herald: Das klingt super. Dann würde ich sagen, dass mal einer meiner Kollegen 00:09:37.954 --> 00:09:43.096 vielleicht den Link nochmal verteilt auf den diversen Kanälen. Und dann hoffe ich, 00:09:43.096 --> 00:09:47.550 dass da vielleicht noch ein paar spannende Fragen reinkommen. Das Ganze findet auch 00:09:47.550 --> 00:09:52.880 bei BigBlueButton statt und ich würde sagen, es sieht nicht so aus. Doch da, es 00:09:52.880 --> 00:09:58.440 gibt eine Frage. Ich les sie mal direkt vor: "How to deal with threats by 00:09:58.440 --> 00:10:03.760 agencies like 'You are responsible for the consequences of publishing what we 00:10:03.760 --> 00:10:07.670 sent you via snail-mail?'". Max: Hm, soll ich die 00:10:07.670 --> 00:10:09.950 Frage auch auf Englisch beantworten? 00:10:09.950 --> 00:10:13.915 Ich glaube, du kannst sie vielleicht auch auf Deutsch beantworten. 00:10:13.915 --> 00:10:19.580 Max: Also wenn du die Antwort auf FragDenStaat veröffentlichst, 00:10:19.580 --> 00:10:26.030 dann sind glaube ich wir dafür verantwortlich, da es ja unserer Seite 00:10:26.030 --> 00:10:30.590 ist. Das heißt. Insofern liegt hier erstmal die Konsequenz bei uns. Wenn du 00:10:30.590 --> 00:10:38.060 das natürlich dann z.B. auf einer eigenen Website weiterverarbeitest, dann ist das 00:10:38.060 --> 00:10:42.830 natürlich anders. Allerdings, in den allermeisten Fällen dürfen die Ergebnisse 00:10:42.830 --> 00:10:48.560 von den IFG-Anfragen veröffentlicht werden. Also da gibt es selten Probleme. 00:10:48.560 --> 00:10:53.330 Herald: Das klingt so, als wäre es auf jeden Fall sinnvoll, das irgendwie in Absprache mit 00:10:53.330 --> 00:11:01.340 euch zu machen - Sicher, gerne - Ja Cool, dann würde ich sagen, schicke ich dich mal 00:11:01.340 --> 00:11:06.140 rüber in den Meetup-Raum und alle anderen, die folgen möchten, dürfen das gerne tun. 00:11:06.140 --> 00:11:12.019 Und noch viel Spaß heute. 00:11:12.019 --> 00:11:16.069 Abspannmusik 00:11:16.069 --> 00:11:22.000 Untertitel erstellt von c3subtitles.de im Jahr 2021. Mach mit und hilf uns!