-
Wikipaka Intro Musik
-
Herald: Es ist 12 Uhr. Willkommen zum
Wikipaka Television und Fernstreamen. Wir
-
leben im Informationszeitalter. Wir leben
im Zeitalter der Digitalisierung. Doch wo
-
sind sie, die Informationen und wo ist das
Digitalisierte? Oder kurz: Wo sind die
-
Daten? Das weiß unser Korrespondent Simon
Jockers. Der arbeitet nämlich an der
-
Schnittstelle zwischen Softwareentwicklung
und Journalismus, entwickelt verschiedene
-
Tools, die allen Menschen, vor allem
JournalistInnen, dabei helfen, mit Daten
-
sinnvoll arbeiten zu können, z.B. mit den
Daten der statistischen Ämter. Im Projekt
-
Datenguide ist er besonders aktiv. Das ist
ein Tool, als freie Software, und genau
-
das wird er jetzt vorstellen. Bitteschön.
Simon: Hi, ich heiße Simon Jokers und ich
-
bin einer der Köpfe hinter Datenguide.
Datenguide - das ist eine Open Data
-
Initiative, mit der wir amtlichen
Statistiken zugänglicher für alle machen
-
wollen. Und bei Datenguide, da entwickeln
wir Open Source Software, die dabei hilft,
-
mit amtlichen Statistiken zu arbeiten und
wir veranstalten Workshops und Hackdays
-
und andere Veranstaltungen zu diesem
Thema. Und dieser Vortrag heute, der hat
-
zwei große Teile. Im ersten Teil gebe ich
so einen allgemeinen Überblick über
-
amtliche Statistik und im zweiten Teil
erkläre ich, was genau wir mit Datenguide
-
machen. Aber zum Einstieg Was ist
eigentlich amtliche Statistik? Einfach
-
gesagt sind das alle Statistiken zu
Gesellschaft, Umwelt und Wirtschaft, die
-
von den Statistischen Ämtern erstellt
werden. Und bei Datenguide konzentrieren
-
wir uns auf einen bestimmten Bereich der
amtlichen Statistik, und zwar auf die
-
Regionalstatistik, d.h. Statistiken zu
Regionen wie z.B. Bundesländern,
-
Landkreisen und Gemeinden. Und wenn man
sich jetzt die Selbstdarstellungen der
-
Statistischen Ämter anschaut, dann sagen
die, dass die Statistiken, die sie
-
produzieren, objektiv, unabhängig und
qualitativ hochwertig sind und da gehe ich
-
auf jeden Fall mit. Und weiter sagen sie
dann, dass Sie das machen für Politik,
-
Verwaltung, Wirtschaft sowie für
Bürgerinnen und Bürger. Und bei Datenguide
-
sind wir der Meinung, dass dieser letzte
Teil, Bürgerinnen und Bürger, dass man den
-
durchaus noch besser machen kann. Um ein
bisschen plastischer zu machen, was so
-
drinsteckt in der amtlichen Statistik, hab
ich hier mal ein paar Beispiele gesammelt.
-
Bei amtlicher Statistik, da denkt man
meistens erst einmal an demografische
-
Daten und das ist auf jeden Fall richtig.
Also es gibt in der amtlichen Statistik
-
Zahlen zur Bevölkerung, zur
Altersstruktur, zu Wanderungsbewegungen,
-
also zum Hinzug und Wegzug aus bestimmten
Regionen. Und es gibt beispielsweise auch
-
Daten zur Migration, also z.B. zu
Schutzsuchenden in Deutschland oder zur
-
Einbürgerung. Und für dieses Beispiel hier
hab ich mir mal die Frage gestellt: Wo
-
gibt's in Deutschland denn die meisten
RentnerInnen? Und dann habe ich mir die
-
Daten aus der amtlichen Statistik
runtergeladen und habe sie mit einem
-
Datenvisualisierungs-Tool auf eine Karte
gepackt. Und hier sehen wir, dass die
-
Rentnermetropolen Deutschlands die Städte
Baden-Baden und Dessau-Roßlau sind. Und in
-
beiden Städten kommen auf 100 Personen im
typischen Erwerbsalter fast 50 Menschen,
-
die schon im Rentenalter sind. Aber es
gibt eben nicht nur demografische Daten,
-
sondern ganz allgemein auch Daten zu den
Bereichen Wirtschaft und Umwelt. Also z.B.
-
Daten zu Industrie und Gewerbe oder Daten
zum Tourismus oder Daten zur
-
Abfallentsorgung oder Daten zur
Landwirtschaft. In diesem Beispiel hier,
-
da hab ich mir mal angeschaut, wo es in
Deutschland die meisten Schweine gibt. Und
-
da gibt's einen ganz klaren Cluster in
Niedersachsen und in Teilen von Nordrhein-
-
Westfalen. Und es gibt Zahlen zu Wahlen.
Also z.B. gültige Stimmen, Wahlbeteiligung
-
oder Wahlberechtigte bei Landtagswahlen,
bei Bundestagswahlen und bei Europawahlen.
-
Und für die letzte Europawahl hab ich mir
in dieser Grafik mal angeschaut, wo die
-
Leute denn tendenziell eher grün wählen
und wo die Leute eher AfD wählen. Und dann
-
sehen wir hier erst mal, dass es da eine
ganz klare Trennung gibt. Also die Grünen
-
sind eher eine Partei der Westdeutschen
und die AfD ist scheinbar eher eine Partei
-
der Ostdeutschen. Und am einen Ende des
Spektrums sehen wir dass in Freiburg im
-
Breisgau 39 prozent grün gewählt haben,
während am anderen Ende des Spektrums in
-
der Sächsischen Schweiz, Ost-Erzgebirge,
dort haben 33 Prozent die AfD gewählt. Und
-
das ist jetzt auch nur ein ganz einfaches
Beispiel. Aber es gibt eben eine ganze
-
Reihe von Daten aus dem Bereich der
Wahlen, mit denen ihr arbeiten könnt. Und,
-
ein ganz wichtiger Aspekt ist, dass die
Statistiken der amtlichen Statistik in der
-
Regel Zeitreihen sind. Das heißt, die
Beispiele, die ich gerade gezeigt habe,
-
die haben immer den Zustand zu einem
bestimmten Zeitpunkt gezeigt. Aber die
-
Daten gibt's eigentlich immer über die
Zeit, weil so eine Statistik, die wird
-
immer wieder durchgeführt. Und dann haltet
ihr eine Zeitreihe, mit der ihr Verläufe
-
zeigen könnt, wie ich das hier gemacht
habe, z.B. mit Immobilienpreisen für die
-
Städte Hamburg, Berlin und Leipzig. Und
auf Basis dieser vier Beispiele, die ich
-
jetzt gerade gezeigt habe, könnt ihr euch
wahrscheinlich ganz gut vorstellen, dass
-
es eine Reihe von, ich sag mal,
zivilgesellschaftlichen Anwendungen für
-
diese Daten gibt. Das ist einmal der
Bereich Journalismus. Also amtliche
-
Statistiken sind ein super wertvolles
Werkzeug, z.B. für Datenjournalismus oder
-
für Fact Checking. Und amtliche
Statistiken sind auch sehr wichtig, z.B.
-
für die Sozialwissenschaften. Aber auch
für zivilgesellschaftliche Initiativen
-
können Daten echter Mehrwert sein, z.B.
wenn eine Initiative Daten-gestützt für
-
die gute Sache kämpfen will. Wenn man
jetzt anfängt mit amtlichen Statistiken
-
zu arbeiten, dann ist es immer ganz
wichtig, sich einmal in den Hinterkopf zu
-
rufen, wie diese Daten entstehen. Und dazu
erzähle ich immer ganz gerne diese
-
Geschichte, die habt ihr in den letzten
Tagen vielleicht auch schon mal gehört.
-
Und zwar war es so, dass etwa vor 2 000
Jahren Kaiser Augustus, der Kaiser des
-
Römischen Reiches, einen Zensus angesetzt
hat, weil er bessere Daten über die
-
Bevölkerung seines Reichs brauchte. Und im
Rahmen von diesem Zensus, da mussten Maria
-
und Josef zusammen nach Bethlehem reisen,
um sich zählen zu lassen. Und das passiert
-
auch heute noch. Also in allen
Industrienationen gibt es irgendeine Form
-
von Zensus, der so ungefähr alle zehn
Jahre durchgeführt wird. Entweder in Form
-
von einer klassischen Volkszählung, wo
wirklich Menschen von Tür zu Tür gehen und
-
von der Bevölkerung Daten über jeden
einzelnen Haushalt erfassen oder, das ist
-
der andere Ansatz, indem man Daten aus
Registern, die ohnehin vorliegen,
-
zusammenfasst. Der Zensus in Deutschland,
der zum letzten Mal 2011 stattgefunden hat
-
und zum nächsten Mal 2022 stattfindet, der
ist in erster Linie ein Register-Zensus.
-
Das heißt, es werden Daten aus dem
Bevölkerungsregistern und anderen
-
amtlichen Registern zusammengetragen und
dann wird eben mit statistischen Methoden
-
berechnet, z.B. wie viele Menschen in
einer Stadt leben. Und zusätzlich gibt es
-
dann ein eine kleinere Anzahl von
Menschen, die befragt wird, um das
-
gegenzuchecken. Es gibt auch eben diese
andere Art, ein Zensus durchzuführen, die
-
man Mikrozensus nennt. Und das ist eben
einfach ein Sample. Das heißt, man befragt
-
einen bestimmten Teil der Gesellschaft und
dann nimmt man diese Daten und rechnet die
-
hoch auf das ganze Land. Und es gibt den
Bereich der Sekundärstatistik, da werden
-
z.B. Daten, die an anderer Stelle erfasst
werden, z.B. von der Agentur für Arbeit,
-
die werden dann hinterher weitergegeben an
die Statistischen Ämter und die
-
Statistischen Ämter, die bereiten dann
eine Statistik auf und veröffentlichen
-
die. Und bei allen Verfahren ist es ganz
wichtig zu verstehen, dass die Daten eben
-
nicht ein perfektes Abbild der Welt sind.
Es sind immer Daten, die nach einer
-
bestimmten Methodik erhoben wurden und
weiterverarbeitet. Und die sind in der
-
Regel nicht perfekt. Aber trotzdem ist die
amtliche Statistik normalerweise das
-
Beste, was wir haben. Also die amtliche
Statistik ist in den meisten Fällen so
-
etwas wie der Goldstandard der Daten. Ja,
und wichtig in diesem Zusammenhang ist
-
auch – wir haben in Deutschland ein ganz
strenges Statistikgeheimnis, d. h. dass
-
die Daten, die so gesammelt werden, werden
immer anonymisiert. Es werden nur
-
aggregierte Zahlen veröffentlicht und
grundsätzlich dürfen Menschen oder
-
Unternehmen nie nachträglich
identifizierbar sein. Und trotzdem oder
-
auch deswegen ist in Deutschland der
Zensus immer hochumstritten, also in den
-
80er Jahren, da gab es sehr große Proteste
und auch Verfassungsbeschwerden gegen den
-
Zensus. Und das ist auch der Grund, warum
wir heute in Deutschland überhaupt dieses
-
Konzept eines Rechts auf informationelle
Selbstbestimmung in dieser Form haben. Das
-
heißt, die Proteste, die es immer wieder
gibt gegen den Zensus, die sind sehr
-
wichtig für den Datenschutz in
Deutschland. Aber ich will das jetzt gar
-
nicht so thematisieren. In diesem Vortrag
soll es eher darum gehen, dass diese Daten
-
jetzt da sind und dass wir euch in die
Position versetzen wollen, mit diesen
-
Daten auch wirklich zu arbeiten. Wenn ihr
jetzt euch überlegt habt: Okay, ich
-
brauche Statistiken zu einem bestimmten
Thema und die finde ich vielleicht in der
-
amtlichen Statistik und ihr sucht mal im
Web, dann seid ihr höchstwahrscheinlich
-
erst einmal ziemlich erschlagen, weil es
wirklich sehr, sehr viele Angebote im Web
-
gibt, die amtliche Statistiken zur
Verfügung stellen. Und die sind leider
-
auch von sehr unterschiedlicher Qualität.
Der Grund dafür ist, einfach gesagt,
-
Föderalismus. Also wir haben in
Deutschland eben das Statistische
-
Bundesamt und das wird auch Destatis
genannt. Und wir haben 14 statistische
-
Landesämter. Außerdem haben wir noch den
Bereich der Kommunalstatistik oder
-
städtisch statistische Ämter, wo
eigentlich in jeder Kommune in Deutschland
-
auch irgendwie Daten erfasst werden. Und
all diese Daten werden dann auch in
-
irgendeiner Form im Web veröffentlicht.
Und da haben wir sehr, ich sag mal, coole
-
oder moderne Angebote wie das hier. Das
ist ganz neu - das Dashboard Deutschland
-
vom Statistischen Bundesamt. Und hier
könnt ihr euch so eine Sammlung von
-
aktuellen Statistiken angucken. Die sind
dann auch dargestellt in so ziemlich
-
coolen Grafiken. Aber ihr habt halt keine
Möglichkeit, jetzt nach einem bestimmten
-
Thema zu suchen oder die Daten hinterher
runterzuladen und in euren eigenen
-
Analysen oder Grafiken
weiterzuverarbeiten. Das heißt, wenn ihr
-
damit eigene Sachen machen wollt mit
diesen Daten, dann sind solche
-
Veröffentlichungen relativ nutzlos. Und
noch viel schlimmer ist dieses Beispiel:
-
Das gibt es leider immer noch, dass Daten
einfach in ein PDF gepackt werden in Form
-
von einer Tabelle oder einer Grafik. Und
hinterher ist es dann sehr schwer für
-
euch, diese Daten wieder rauszuholen aus
diesem PDF. Und damit ihr jetzt diese
-
Recherche nicht selber machen müsst, hab
ich mal für euch zusammengefasst, was die
-
richtig guten Portale sind, wo ihr
höchstwahrscheinlich oder hoffentlich auch
-
die Daten findet, die ihr braucht. Der
erste Startpunkt ist... oder sollte
-
normalerweise GENESIS Online sein. GENESIS
Online ist so die zentrale Datenbank oder
-
das zentrale Datenportal des Statistischen
Bundesamts. Hier habt ihr jetzt gleich so
-
ein großes Suchfeld, da könnt ihr ein
Thema eingeben und dann findet ihr
-
hoffentlich Daten, die euch interessieren,
könnt die dann als Tabelle anzeigen und
-
runterladen. Aber damit es nicht zu
einfach ist, gibt es nicht nur dieses
-
blaue Daten-Portal, sondern es gibt das
ganze auch nochmal in Rot. Und das hier
-
ist die Regional-Datenbank Deutschland und
das ist die gemeinsame Plattform der
-
Statistischen Ämter in Deutschland. Und
hier findet ihr eben Daten
-
heruntergebrochen auf die verschiedenen
Regionen. Das heißt, wenn ihr Daten sucht
-
über eure Stadt oder euren Landkreis und
die vielleicht sogar mit anderen Regionen
-
vergleichen wollt, dann findet ihr diese
Daten hier in der Regionaldatenbank
-
Deutschland. Jetzt ist es so, dass diese
Daten leider oft nicht sehr aktuell sind
-
und auch oft nicht so detailliert, wie man
sie vielleicht braucht. Und wenn ihr da...
-
ich sage mal, noch genauere oder
aktuellere Daten braucht, dann hilft es
-
immer, sich auch die Portale der
Statistischen Landesämter anzuschauen.
-
Also jedes Statistische Landesamt hat auch
so ein Daten-Portal und das funktioniert
-
letzten Endes auch wie
regionalstatistik.de oder GENESIS Online.
-
Und der Grund, warum diese Portale alle
sehr ähnlich aussehen, ist, dass die
-
meisten dieser Portale auf der gleichen
Softwarelösung basieren. Diese Software-
-
Lösung heißt Genesis. Und das ist halt so
eine Eigenentwicklung der Statistischen
-
Ämter, die die dann benutzen, um ihre
eigenen Daten-Portale aufzusetzen. Und in
-
diesen GENESIS-Anwendungen, da könnt ihr
einfach gesagt nach einem Thema suchen
-
oder nach einer Statistik suchen, die ihr
braucht. Und wenn ihr eine gefunden habt,
-
dann klickt ihr euch durch so ein Menü und
dann könnt ihr euch eben eine Tabelle
-
anzeigen. Und diese Tabelle könnt ihr dann
entweder in eine einfache Grafik
-
verarbeiten direkt auf diesem Portal. Oder
ihr könnt sie exportieren in einer Excel-
-
Tabelle oder eine CSV-Datei. Jetzt ist es
leider so, dass dieses
-
Datenvisualisierungstool leider nur sehr
rudimentär ist. Und ich hab's ehrlich
-
gesagt noch nie geschafft, damit irgendwas
sinnvoll Verwendbares zu generieren. Und
-
dieser Daten Export für Excel und CSV, der
ist auch nicht maschinenlesbar. Das heißt,
-
es sind verschachtelte Daten, die können
nur schwer mit anderen Tools
-
weiterverarbeitet werden, ohne sie vorher
händisch aufzurollen. Erwähnenswert ist
-
noch, dass es einen Webservice gibt, also
eine Daten-Schnittstelle, mit der er
-
direkt auf Datensätze zugreifen könnt. Die
verwendete bisher Soap, also Soap ist
-
quasi ein Standard für Datenschnittstellen
- der ist eher so aus dem letzten
-
Jahrhundert und wird heute eher so im
Enterprise Segment eingesetzt. Soap ist
-
eher nicht so das Werkzeug, mit dem ich
normalerweise jeden Tag arbeite, aber -
-
und das ist ganz neu, es gibt jetzt auch
eine REST-Schnittstelle, also eine
-
modernere Datenschnittstelle, die euch
JSON zurückgibt. Und es gibt die
-
Möglichkeit, ein neues Datenformat zu
exportieren. Das nennen die Statistischen
-
Ämter Flat CSV und ein Flat CSV ist
einfach ein normale CSV-Datei, die nicht
-
verschachtelt ist und deswegen einfacher
zu verarbeiten. Also hier sehen wir so ein
-
Beispiel. Wenn ihr jetzt auf
regionalstatistik.de z.B. eine Tabelle
-
gefunden habt, dann könnt ihr euch die
anzeigen lassen, das sieht dann so aus.
-
Das ist so eine verschachtelte Tabellen
Darstellung und da könnt ihr jetzt den
-
Wert raussuchen oder die Zahl raussuchen,
die ihr braucht. Oder ihr könnt euch das
-
Ganze eben als Excel oder CSV-Datei
exportieren oder ihr könnt die in so einer
-
einfachen Grafik aufbereiten. Ganz
wichtig: Diese Daten sind Open Data. Sie
-
erscheinen unter der Datenlizenz
Deutschland. Die erfordert eine
-
Namensnennung, einen Verweis auf die
Lizenz und einen Verweis auf den
-
Datensatz, den ihr verwendet. Also auf den
Ort, von dem er diesen Datensatz
-
heruntergeladen habt. Und das ist sehr
ähnlich wie eine CC-BY Lizenz. Das ist
-
jetzt nicht die perfekte Lizenz für Open
Data, also z.B. CC0 wäre irgendwie
-
einfacher zu verwenden, aber es ist jetzt
auch nicht das Schlechteste. Grundsätzlich
-
könnt ihr diese Daten also weiter
verwenden. Vor einem Jahr, da wäre jetzt
-
an dieser Stelle des Vortrags ein großer
Rant gekommen darüber, wie schlimm diese
-
GENESIS-Software ist. Aber ich muss sagen,
dass GENESIS in den letzten Monaten
-
wirklich deutlich verbessert wurde. Das
heißt, die Plattform ist jetzt auf jeden
-
Fall nutzerfreundlicher. Aber trotzdem
gibt's immer noch eine Reihe von
-
Problemen. Das größte Problem aus meiner
Sicht ist, dass es keine stabilen URLs
-
gibt. Das heißt, es gibt eine
sessionbasierte Navigation. Und wenn ihr
-
in eine Tabelle gefunden habt, die ihr
benutzen wollt und ihr kopiert in der
-
Browserleiste die URL dazu, dann könnt ihr
die nicht jemand anderem schicken, weil
-
sie dann nicht mehr funktionieren wird.
Deshalb werdet ihr auch die Browser vor
-
und zurück Navigation nur eingeschränkt
nutzen können und die Seite wird eben
-
nicht von Suchmaschinen indiziert. Das
heißt, wenn ihr auf DuckDuckGo oder auf
-
Google nach einer Statistik sucht, dann
werdet ihr kein Ergebnis von der GENESIS-
-
Datenbank finden. Das nächste Problem ist,
dass der Datenabruf je nach Plattform und
-
je nachdem, wie viele Daten ihr
herunterladen wollt, eine Anmeldung
-
erfordert. Das heißt, ihr sucht euch eine
Tabelle aus, die ihr benutzen wollt und
-
dann könnt ihr die eben nicht direkt
runterladen, sondern ihr müsst euch erst
-
ein Login anlegen und mit diesem Login
könnt ihr die Daten dann bestellen und
-
danach in so einer Art digitalem Postfach
abrufen. Hier wäre es natürlich schöner,
-
wenn man einfach direkt auf den Datensatz
zugreifen könnte. Wenn ihr die Daten
-
weiterverarbeiten wollt, dann steht ihr
vor dem Problem, dass dieser Datenexport,
-
der ein CSV generiert, sehr speziell ist.
Das heißt, die Daten sind verschachtelt.
-
Sie verwenden ein deutsches Zahlenformat,
also Komma als Dezimaltrennzeichen und sie
-
verwenden nicht etwa Unicode oder UTF 8
als Zeichenkodierung wie die meisten
-
modernen Tools, sondern Windows 1252. Und
meine Vermutung ist, dass dieses ein
-
bisschen schräge Format gewählt wurde, um
maximale Kompatibilität mit Microsoft
-
Office sicherzustellen. Das heißt, die
Tabellen sind dafür gemacht, dass man sie
-
in Excel öffnet und dann auf DIN-A4
ausdruckt. Nicht unbedingt dafür, sie
-
einfach direkt in einem
Datenvisualisierungstool weiterverarbeiten
-
zu können. Und jetzt könnte man denken:
Okay, aber es gibt eine
-
Datenschnittstelle, wo ich die Daten
herunterladen kann. Und hier ist es so,
-
dass diese Datenschnittstellen leider eine
sehr hohe Lernschwelle haben. Z.B. diese
-
neue Rest-API, die kommt mit einem 200
seitigen Handbuch und ich denke da kann
-
man schon ganz gut sehen, dass sie nicht
gedacht ist für, ich sage mal so, casual
-
Datennutzer, die einfach nur schnell eine
Tabelle herunterladen möchten. Und das ist
-
der Punkt, wo jetzt Datenguide zum Einsatz
kommt. Was wir bei Datenguide machen, ist:
-
Wir nehmen uns die Daten aus
regionalstatistik.de und laden die Daten
-
einfach einmal alle runter. Also wir
nehmen diese regionalen Statistiken und
-
machen einen riesen Datenimport. Den
machen wir jede Nacht, damit wir eine
-
Spiegelung haben, die aktuell ist. Und die
Daten stellen wir dann eben über unsere
-
eigenen Datenschnittstelle in unserem
eigenen Format zur Verfügung und
-
entwickeln dann eine Webanwendung auf
Basis dieser Daten, mit denen ihr die
-
Daten durchsuchen und herunterladen könnt.
Das sieht dann ungefähr so aus. Wir nennen
-
es das Datenguide Datenportal und das ist
ein experimentelles Tool, mit dem ihr eine
-
Region oder mehrere Regionen auswählen
könnt und dann eine Statistik für diese
-
Region. Und dann könnt ihr noch ein paar
Einstellungen machen und z.B. innerhalb
-
der Statistik weiter einschränken, was ihr
braucht. Und dann könnt ihr die Daten
-
herunterladen. Und die sind dann
idealerweise schon in einem Format, was
-
ihr genau so einfach in einem
Datenvisualisierungstool oder
-
Datenanalyse-Tool weiterverwenden könnt,
ohne dass ihr die Daten erstmal von Hand
-
aufräumen musst. Und wir haben eben nicht
nur dieses Datenportal, sondern wir
-
verwenden die Daten auch, um auf der
Datenguide Website die Statistiken zu
-
erklären. Wir haben eben festgestellt,
dass die Nutzbarmachung von statistischen
-
Daten eben nicht nur ein rein technisches
Problem ist, sondern auch ein Problem mit
-
Data Literacy. Das heißt, Menschen müssen
einfach wissen, wie sie mit diesen Daten
-
umgehen, damit sie mit diesen Daten
umgehen können. Und deswegen haben wir ja
-
jetzt so verschiedene Erklärstücke
veröffentlicht auf der Datenguide-Website.
-
Und diese Daten, die wir zur Verfügung
stellen, die wollen wir eben nicht nur zur
-
Verfügung stellen für unser eigenes Tool,
sondern wir haben ganz bewusst eine offene
-
API, die Dritte verwenden können, um dann
ihre eigenen Anwendungen auf Basis dieser
-
Daten zu entwickeln. Es gibt zwei
Datenschnittstellen, also zwei
-
verschiedene Datenschnittstellen, die wir
zur Verfügung stellen. Die erste ist ein
-
einfacher Tabellendownload über http und
der ist einfach dafür gedacht, dass ihr
-
z.B. direkt im Browser einfach über die
URLleiste einen Link eingebt und dann
-
kriegt ihr eine Tabelle zurück. Und das
ist dieser Tabellen Download, den man eben
-
auch mit dem Datenguide Datenportal
zusammenbauen kann. Und diese Tabellen
-
könnt ihr dann entweder in verschiedenen
CSV Formaten - je nachdem was ihr braucht
-
- runterladen oder als JSON, um sie z.B.
mit JavaScript weiter zu verarbeiten. Und
-
wenn ihr eine komplexere Anwendungen plant
auf Basis von statistischen Daten, dann
-
könnt ihr diese andere Datenschnittstelle
verwenden, die wir zur Verfügung stellen,
-
die verwendet GraphQL. GraphQL ist, ich
sage mal einfach gesagt, ein moderner
-
Standard für Datenschnittstellen, um
komplexere Anwendungen zu realisieren.
-
Beide Datenschnittstellen sind
experimentell in dem Sinne, dass es da
-
durchaus noch Probleme gibt und auch
Fehler, von denen wir zum Teil schon
-
wissen und zum Teil wahrscheinlich noch
nicht. Und dass die sich auch in ihrer
-
Spezifikation noch ändern. Das heißt, es
gibt keine finale Spezifikation für unsere
-
Datenschnittstellen. Wenn ihr jetzt diesen
Tabellen Download nutzen wollt, dann
-
funktioniert das im einfachsten Fall so,
dass ihr auf die Datenguide Website geht.
-
Dort benutzt ihr dieses Datenportal, um
eine Region oder eine Reihe von Regionen
-
auszuwählen, eine Statistik auszuwählen
und dann klickt ihr eben auf Datendownload
-
oder ihr kopiert einfach die CSV Daten in
die Zwischenablage und dann fügt ihr die
-
Daten in einem Datenvisualisierungstool
eurer Wahl ein. Ich habe das zum
-
Beispiel... also diese Grafiken, die ich
eingangs gezeigt habe, die habe ich mit
-
Data Wrapper gemacht. Das ist ein
einfaches Datenvisualisierungstool. Da
-
könnt ihr quasi so eine CSV-Datei rein
laden und dann könnt ihr quasi eine Karte
-
davon erstellen oder ein Liniendiagramm.
Und - Full Disclosure - ich arbeite auch
-
an Data Wrapper, aber nach dem gleichen
Prinzip könnt ihr die Daten mit einem
-
beliebigen Datenvisualisierungstool oder
Analysetool eurer Wahl verwenden. Das ist
-
ein Beispiel für die Verwendung von dieser
fortgeschrittenen GraphQL Schnittstelle.
-
Das ist ein einfaches Quiz zu amtlichen
Statistiken, was bei einem Hack-Day
-
entstanden ist, und hier könnt ihr quasi
euer Wissen über eure Region testen, auf
-
Basis von amtlichen Statistiken. Und ein
bisschen praktischeres Beispiel für die
-
Nutzung von dieser GraphQL-Schnittstelle
ist Datenguide Python. Datenguide Python
-
ist eine Python Bibliothek, mit der ihr
eben direkt aus Python heraus, z.B. aus
-
einem Jupyter Notebook, auf amtliche
Statistiken zugreifen könnt, ohne dass ihr
-
euch selber mit http requests oder so
auseinandersetzen müsst. Das ist ein
-
Projekt, das wird von einer befreundeten
Organisation betreut, Correlate, und die haben
-
auf Basis der Datenschnittstelle diese
Bibliothek entwickelt, um es einfacher zu
-
machen, mit Python auf amtliche
Statistiken zuzugreifen. Das war
-
eigentlich schon alles, was ich hatte.
Datenguide ist jetzt an einem Punkt, wo
-
wir uns überlegen: Wie geht es weiter?
Also wir machen das jetzt seit drei Jahren
-
und wir sind ursprünglich unter der Maxime
gestartet, dass wir gesagt haben, wir
-
machen Datenguide, um es irgendwann wieder
abschalten zu können, weil idealerweise
-
wir nur eine eine Demo oder ein Proof of
Concept entwickeln. Und auf dieser Basis
-
erkennen dann die Statistischen Ämter, wie
sie ihre Arbeit besser machen können, um,
-
ich sag mal, normale Leute zu erreichen.
Jetzt ist es so, dass GENESIS online in
-
den letzten Jahren oder in den letzten
Monaten deutlich besser geworden ist. Aber
-
trotzdem ist es noch nicht so weit, dass
wir Datenguide jetzt irgendwie nächstes
-
Jahr abschalten werden. Das heißt, wir
überlegen uns weiterhin: Was können wir
-
tun, um amtliche Statistiken besser
aufzubereiten, damit sie für alle nutzbar
-
und auch nützlich sind? Und in diesem
Zusammenhang müssen wir eben auch unsere
-
Webanwendungen und die
Datenschnittstellen, die wir zur Verfügung
-
stellen noch einfacher und vor allem auch
stabiler machen. Und in dem Zusammenhang
-
ist auch relevant, dass es jetzt eben
diese neuen Schnittstellen gibt in GENESIS
-
Online. Also ich hab ja vorhin von dieser
neuen Rest Schnittstelle gesprochen und
-
ich könnte mir gut vorstellen, dass man
die benutzen kann, um unsere
-
Dateninfrastruktur bei Datenguide noch
einfacher zu machen. Das heißt, wir sind
-
jetzt an dem Punkt, wo wir so ein bisschen
an der Orientierung feilen, aber auch eben
-
weiter aktiv an den Tools arbeiten, die
wir schon haben. Und dazu auch nochmal die
-
Ansage, dass das eben ein Open-Source-
Projekt ist. Das heißt, wir sind im Moment
-
eine kleine Gruppe von Leuten, die daran
arbeitet. Und wenn ihr euch auch beruflich
-
mit amtlichen Statistiken auseinandersetzt
oder Interesse habt, an so einem Projekt
-
beizutragen, dann kontaktiert uns gerne.
Ihr findet uns oder ihr erreicht uns über
-
community@datengui.de. Oder ihr findet uns
auf Twitter, auf Mastodon oder eben auf
-
GitHub. Und jetzt haben wir noch Zeit für
ein paar Fragen. Vielen Dank.
-
Herald: "Kontaktiert uns sehr gerne und
findet uns." Das gilt natürlich vor allem
-
für so eine langfristige Perspektive.
Kurzfristig können wir hier direkt Simon
-
Fragen stellen. Das heißt, ihr könnt alle
Fragen stellen. Wir können Fragen stellen,
-
indem ihr z.B. im IRC - okay, ich sollte
das vielleicht noch ein bisschen muten.
-
Hört man das? Wahrscheinlich. Ah, Profi
Version. Gut. Wo war ich? Genau, wie kommt
-
ihr ins IRC? Wo könnte ihr die Fragen
stellen? Ihr könnt einfach, wenn ihr auf
-
media.ccc.de wahrscheinlich seid, da gibt
es einen kleinen Button, wo Chat steht. Da
-
könnt ihr draufklicken und dann öffnet
sich direkt im Browser ein Chatfenster. Da
-
könnt ihr reinkommen und könnt dort eure
Fragen stellen. Genauso geht es aber auch
-
auf Mastodon und auf Twitter. Das hab ich
auch alles im Blick. Ihr müsste dazu dann
-
den Hashtag #rC3Wikipaka ergänzen, dass
wir das dann auch rechtzeitig sehen. So,
-
wir haben auch schon die ersten Fragen.
Vielleicht als allererstes: Amtliche
-
Statistiken - wenn man darüber nachdenkt,
dann geht es auch immer darum, dass es
-
eben um einzelne kommunale
Verwaltungsgebiete geht. Postleitzahlen,
-
Kreise, was auch immer, die verändern sich
aber über die Zeit. Das heißt, es gibt
-
sowas wie Gebietsreformen. Und dann ist
die Frage: Wie geht man damit um? Wo
-
gibt's Informationen, wann sich was wie
ändert?
-
Simon: Ja, das ist eine sehr gute Frage,
tatsächlich, und auch Probleme, die man in
-
der Praxis immer wieder zu tun hat. Wir
haben es bei Datenguide bisher ausgespart,
-
uns mit dem Problem auseinanderzusetzen,
einfach weil wir andere Probleme haben,
-
auf die wir uns konzentrieren. Aber es
gibt auf jeden Fall Verfahren, wie man das
-
umrechnen kann, sage ich mal einfach. Also
wenn man... normalerweise hat man einen
-
Datensatz und die Region verschwindet oder
es gibt... die Region geht in zwei neuen
-
Regionen auf oder zwei Regionen werden zu
einer zusammengefasst. Nur um so zu
-
erklären, was das Datenproblem bei einer
Gebietsreform ist. Und es gibt eine Liste
-
der Gemeinden, die wird von den
statistischen Ämtern veröffentlicht jedes
-
Jahr und da sieht man dann halt
Änderungen. Und es gibt das BBSR. Das ist
-
das Bundesamt für - das muss ich jetzt mal
nachgucken - das Bundesamt für Bauwesen
-
und Raumordnung und die haben auch Infos
zu dem Thema. Und ich weiß auch, dass
-
Datenjournalistenkollegen von mir dann
auch schon direkt beim BBSR angefragt
-
haben, wenn es darum ging, konkret ein
Problem aufzulösen oder quasi eine
-
Änderung, die stattgefunden hat, irgendwie
auf die Daten zu übertragen. Das heißt, da
-
gibt's durchaus Verfahren, aber man muss
sich damit ein bisschen auseinandersetzen.
-
Und es ist nichts von dem, das wir jetzt
einfach automatisiert durch Datenguide
-
lösen können. Also ich glaube, das
Stichwort wäre: Liste der Gemeinden bei
-
Destatis und im Zweifelsfall das BBSR
kontaktieren bzw. schauen, ob die Infos
-
auf ihrer Website parat halten. Ich höre
dich leider nicht, Julia.
-
Herald: Vielen Dank dafür. Die nächste
Frage wäre: Muss man sich denn
-
identifizieren, um Daten zu bekommen oder
kann man sie anonym bekommen?
-
Simon: Also man kann die Daten anonym
bekommen. Sowohl bei uns, als auch bei den
-
statistischen Ämtern, wenn man einfach nur
Daten runterladen will. Also ich hab ja im
-
Talk erwähnt, dass man teilweise für diese
GENESIS-Datenbanken einen Login braucht
-
und da kann man sich meinem Verständnis
nach einfach anmelden. Ich hab das jetzt
-
schon eine Weile nicht mehr gemacht, aber
man kann sich glaub ich einfach anmelden,
-
ohne dass man Daten angeben muss. Man
braucht, soweit ich das in Erinnerung
-
habe, nur eine E-Mail-Adresse und dann
bekommt man quasi einen generierten
-
Nutzernamen. Ich glaube, anders ist es,
wenn man Daten wirklich anfragen will von
-
den statistischen Ämtern, also genauso,
wie wenn man bei anderen öffentlichen
-
Stellen irgendwie eine Anfrage macht. Da
gibt es bestimmte Verfahren, auch bei den
-
statistischen Ämtern. Und ich gehe mal
davon aus, dass man sich dann in
-
irgendeiner Form identifizieren muss und
sei es nur aus sozialen Gründen, weil man
-
halt mit Menschen dort zu tun hat. Aber
grundsätzlich, wenn es darum geht, Daten
-
abzufragen aus regionalstatistik.de oder
über Datenguide: Das ist Open Data, das
-
einfach im Web zur Verfügung steht.
Einfach gesagt.
-
Herald: Okay, dann ist natürlich die
Frage: Du hast gesagt, dass das ultimative
-
Ziel ist, den Service irgendwann
abzuschalten, wenn die Statistik Ämter
-
selbst mal auf einem gewissen Stand
angekommen sind. Wie realistisch ist das
-
denn?
Simon: Ja, ich glaube, das kommt dann
-
darauf an, wie man diesen Wissensstand
definiert. Also ich glaube, es hat auf
-
jeden Fall eine... das Mindset ändert sich
bei den statistischen Ämtern und die haben
-
festgestellt, dass der Bereich
Datenjournalismus und auch vielleicht
-
andere zivilgesellschaftliche Initiativen
durchaus wichtige Multiplikatoren für ihre
-
Veröffentlichungen sind und dass es auch
in ihrem Interesse ist, in der
-
Öffentlichkeit gut dazustehen. Und
dementsprechend hat da eine Änderung des
-
Mindsets stattgefunden. Ich glaube, die
Software verändert sich nur sehr langsam
-
und deswegen würde ich sagen, es ist
unwahrscheinlich, dass wir irgendwann im
-
nächsten oder übernächsten Jahr wirklich
die Arbeit, die wir bei Datenguide machen,
-
einstellen. Aber es ist nicht völlig
unrealistisch.
-
Herald: Dazu auch direkt die Frage: Wie
ist das mit den Daten der Statistischen
-
Landesämter? Weil nämlich hier jemand
versucht hat, anzufragen, wie es zum
-
Beispiel in Baden-Württemberg ist, wo erst
einmal niemand wusste, was Open Data ist.
-
Und jetzt möchte diese Person wissen, wie
ist das eigentlich mit der föderalen
-
Struktur und bekommt man die Daten der
Statistischen Landesämter?
-
Simon: Also auf regionalstatistik.de, da
sind ja grundsätzlich mal die Daten der
-
Statistischen Landesämter gesammelt. Also
regionalstatistik.de ist so der kleinste
-
gemeinsame Nenner, wo die Statistischen
Ämter gewisse Daten zusammentragen. Und
-
dann gibt's eben zusätzlich noch Daten,
die halt auf regionaler Ebene, also nur
-
auf Ebene der Bundesländer zur Verfügung
stehen. Also spezielle Datensätze, zum
-
Beispiel, die dann nur für Brandenburg
oder nur für Baden-Württemberg oder so zur
-
Verfügung stehen oder die vielleicht nicht
vergleichbar sind zwischen verschiedenen
-
Ländern. Und es gibt eigentlich immer
irgendeine Form von Datenportal. Ich bin
-
mir jetzt... tatsächlich bin ich nicht so
firm, was Baden-Württemberg angeht, weil
-
ich damit persönlich noch nie etwas zu tun
hatte. Aber ich würde eigentlich erwarten,
-
dass es auch ein Datenportal des
Statistischen Landesamts Baden-Württemberg
-
gibt. Es ist nicht notwendigerweise auch
eine GENESIS-Instanz, also es gibt auch
-
Datenplattformen, die eben nicht auf
Genesis basieren. Aber es gibt
-
normalerweise irgendeine Form von
zentraler Veröffentlichung jedes einzelnen
-
Statistischen Landesamtes.
Herald: Ich meine, Baden-Württemberg ist
-
ein bisschen verrückt. Ich hatte mal
versucht, da drauf zu klicken und dann
-
kommt man wieder auf die gleiche Seite,
ohne irgendwie tiefer zu kommen. Also wer
-
da mehr weiß, gerne mehr Informationen.
Simon: Ja, also ich kann mir das gerne
-
nochmal genauer angucken und vielleicht
noch etwas dazu posten.
-
Herald: Da helfen sich nämlich schon sehr
viele Menschen auch untereinander mit den
-
verschiedensten Links. Vielleicht nochmal
zurück zur Weiterentwicklung: Wie geht es
-
weiter bei euch, plant ihr denn auch
Visualisierungstools direkt auf eurer
-
Website zu integrieren?
Simon: Ja, also das ist ein schwieriges
-
Thema, tatsächlich. Also wir haben es vor.
Wir haben... also wenn jemand schon
-
frühere Versionen dieses Vortrags gesehen
hat, weil es war ja so ein bisschen best-
-
of Zusammenfassung aus den letzten drei
Jahren. Wenn ihr eine frühere Version
-
dieses Talks gesehen habt oder irgendwann
in der Vergangenheit mal auf der
-
Datenguide-Website wart, dann gab's da
durchaus auch so einfache
-
Visualisierungen. Wir haben festgestellt,
dass es sehr schwierig ist, die halt so
-
generisch zu bauen, dass sie immer
funktionieren, weil die Daten, also die
-
Datensätze sind sehr unterschiedlich. Es
gibt so einen Plan, so eine "kleinste
-
gemeinsame Nenner Visualisierung" zu haben
für jeden Datensatz. So ähnlich wie die
-
Statistischen Ämter das machen auf
regionalstatistik.de oder auf GENESIS
-
Online. Aber nur halt ein bisschen
moderner und besser zu benutzen. Aber
-
bisher gibt's das nicht. Wenn jemand
Interesse hat, an sowas zu arbeiten, mit
-
mir zusammen oder mit jemand von uns
zusammen, dann bin ich gerne bereit, mich
-
darüber zu unterhalten, wie man das
konkret im Detail macht. Weil es ist halt
-
ein Open-Source-Projekt. Es ist definitiv
nichts, an dem jemand jetzt gerade aktuell
-
arbeitet. Aber es steht auf unserer Liste.
Herald: Thema Open-Source-Projekt, dazu
-
noch ein kleiner Einwurf: Wie ist das mit
GENESIS? Die Vermutung ist, dass es
-
wahrscheinlich proprietär ist. Gibt's da
irgendwelche Bestrebungen? Wenn das
-
proprietär ist, ob man das vielleicht auch
OpenSource stellen möchte?
-
Simon: Ist mir nicht... also nicht, dass
ich wüsste. Ja, ich bin mir auch nicht
-
sicher... GENESIS ist halt ein riesen
Monster, meinem Verständnis nach. Ich hab
-
noch nie Code gesehen, aber es ist meinem
Verständnis nach eine Java-Anwendung, die
-
es dann Ende der 90er ins Web geschafft
hat. Und das ist auch der Grund dafür,
-
warum es eben diese ganze sessionbasierte
Navigation gibt, weil es glaube ich
-
ursprünglich... das ist nicht aus der
heutigen Webanwendungen
-
Entwicklungsperspektive gestartet worden,
dieses Projekt. Aber ich habe keine, ich
-
kann keine geheime Background-Infos zur
Entwicklung von GENESIS Online geben, aber
-
ich kann mir, ehrlich gesagt, nicht
vorstellen, dass es in der... dass es als
-
Open Source irgendwann in der
Öffentlichkeit landet. Also, wen es im
-
Detail interessiert, GENESIS online ist
eine Eigenentwicklung und das wird von
-
ITNRW entwickelt. ITNRW ist so eine
Kombination aus regionalem IT-
-
Dienstleister für das Land Nordrhein-
Westfalen und dem Statistischen Landesamt
-
Nordrhein-Westfalen. Das ist beides quasi
unter diesem Dach. Und die betreiben
-
regionalstatistik.de. Und die Software
hinter GENESIS online wird zum Teil auch
-
in Wiesbaden beim Statistischen Bundesamt
entwickelt. Es gibt Leute, die im
-
öffentlichen Dienst sind und an dieser
Software arbeiten.
-
Herald: Okay, sehr gut. Jetzt hab ich noch
sehr viele Fragen von Dateninteressierten,
-
die vielleicht ein bisschen über das, was
ihr jetzt als Datenguide anbietet,
-
hinausgehen, trotzdem: Hast du eine
Empfehlung für eine Datenquelle für
-
internationale Daten?
Simon: Das ist eine gute Frage. Es kommt
-
es darauf an, worum es geht. Also es gibt
halt, genauso wie die Statistischen
-
Landesämter in Deutschland alle
zusammenarbeiten und dann eine gemeinsame
-
Datenveröffentlichung machen, gibt's auf
europäischer Ebene auch gemeinsame
-
Datenveröffentlichungen. Also es gibt ein
europäisches Open Data Portal, wo die EU-
-
Mitgliedsländer Daten hin liefern. Es gibt
auch ein zweites Open Data Portal, wo die,
-
wo es eben alle möglichen Arten von Open
Data von der EU gibt. Und es gibt auch
-
eine gemeinsame Plattform von Eurostat,
also Eurostat ist quasi sowas wie die
-
gemeinsame Arbeitsgemeinschaft der
statistischen Ämter in den einzelnen
-
Mitgliedsländern der EU. Das heißt, es
geht immer so nach oben. Auf europäischer,
-
auf internationaler Ebene - also die
Weltbank hat statistische Informationen,
-
quasi über alle Länder. Da findet man
Dinge. Und es gibt halt so verschiedene,
-
ich sage mal unabhängige Plattformen, z.B.
Our World in Data ist sehr gut. Muss kurz
-
nachgucken, ob ich das richtig sage.
Genau, das ist ourworldindata.org. Und die
-
sammeln quasi Daten zu allen möglichen
Themen, die halt weltweit zur Verfügung
-
stehen. Das ist von der Oxford University
und da findet man sehr viele Datensätze,
-
wenn man so internationale Vergleiche
machen möchte, oder ja, Daten zu
-
verschiedenen Themen braucht, die wirklich
für verschiedene Länder irgendwie
-
vergleichbar zur Verfügung stehen, dann
ist das auch ein guter Startpunkt.
-
Herald: Okay, genau so eine ähnliche Frage
wäre: Was ist eigentlich mit
-
teilöffentlichen Daten, zum Beispiel von
der Deutschen Bahn? Findet man die bei
-
euch auch oder weißt du, wo man die
vielleicht finden könnte, z.B. Wie viele
-
Güterzüge fahren nach Hamburg?
Simon: Da bin ich jetzt tatsächlich
-
überfragt. Also ich weiß, dass die Bahn...
also es gibt ja eine OpenData-Initiative
-
innerhalb der Bahn. Ich könnte mir
vorstellen, dass es da vielleicht
-
Veröffentlichungen zu diesem Thema gibt.
Aber sicher bin ich mir da nicht. Ich hab
-
mich mit dem Thema noch nicht befasst, ich
würde jetzt nicht völlig ausschließen,
-
dass es von den Statistischen Bundesämtern
so im Kontext Verkehr irgendwie Daten zu
-
diesem Thema gibt. Aber ich hatte bisher
nie was damit zu tun. Müsste ich jetzt
-
auch mal auf den Seiten der Statistischen
Ämter nachgucken. Ansonsten ... es gibt
-
ja, heißt es opendata.bahn.de?
Herald: Ich weiß nicht gerade aus dem Kopf
-
genau, wie es heißt, aber die Bahn hat
selber auch offene Daten.. Also das ist
-
nicht bei euch jetzt direkt mit dabei?
Simon: Nee.
-
Herald: Okay, eine andere, sehr konkrete
Frage zu Daten wäre: Gibt's z.B. sowas wie
-
die Energieverbrauchsdaten der
Bundesländer für einzelne Gemeinden oder
-
auf Bundesebene? Findet man sowas bei
euch?
-
Simon: Das ist auch eine sehr spezielle
Frage.
-
Herald: Genau das ist richtig. Vielleicht
weißt du es, und sonst kannst du
-
vielleicht erklären, wie man dran kommt?
Simon: Also man kann quasi auf... man
-
könnte jetzt auf regionalstatistik.de z.B.
mal nach dem Thema Energie suchen. Oder
-
Stromversorgung. Und dann schauen, ob es
da Ergebnisse gibt oder eben auf
-
Datenguide. Auch dieses Datenguide
Datenportal. Wenn ihr auf Datenportal
-
klickt auf der Datenguidewebsite und dann
gibt's da so ein Interface, wo ihr ein
-
Suchbegriff eingeben könnt unter Statistik
und da mal mit dem Suchbegriff Strom oder
-
Energie. Ansonsten wäre ich mir relativ
sicher, dass es - es gibt ja Europäische
-
Energie-Agenturen - dass es irgendwie
Stellen gibt, die Daten dazu
-
veröffentlichen. Müsste ich aber auch
recherchieren.
-
Herald: Vielen Dank für deine Antworten zu
den sehr spezifischen Fragen. Ich habe
-
außerdem noch eine sehr spezifische Frage,
die uns über Twitter erreicht hat, und
-
zwar: Es geht um die Verwendung der Daten
der USGS, die aktuell nur noch als PDF
-
vorliegen. Ich weiß leider selbst nicht,
was die USGS ist. Weißt du das? Ich habe
-
auch nochmal nachgefragt und bisher noch
keine Antwort bekommen.
-
Simon: Also das sind Geodaten aus den USA,
glaub ich, aber ich kann dazu nichts
-
sagen, leider. Ich weiß, dass es in den
USA ja auch diese... gab es in den letzten
-
4 Jahren ja so eine umgekehrte
Entwicklung, wo verschiedene Daten, die
-
quasi in der Public Domain oder als Open
Data zur Verfügung standen, jetzt eben
-
nicht mehr als Open Data zur Verfügung
stehen, weil es einfach so ist, dass...
-
die Obama-Regierung hat sehr viel geöffnet
im Sinne von Open Data und die Trump-
-
Regierung hat dann einfach sehr viel
wieder zugemacht und teilweise auch
-
Organisationen oder Organisationsformen,
die es gab und die gemeinsam Daten
-
veröffentlich haben, in der Form
aufgelöst. Aber jetzt zu dieser konkreten
-
Frage kann ich nichts sagen.
Herald: Sind ja auch alles sehr
-
spezifische Fragen, die auch schon
eigentlich über euer Angebot so ein
-
bisschen hinausgehen, wo man dann merkt:
Okay, hier sitzen die Datennerds, die auch
-
bis ins Letzte alles ausschöpfen wollen.
Jetzt ist natürlich so ein bisschen die
-
Frage: Was ist denn vielleicht, wenn ich
noch nicht so viel Erfahrung habe, mich
-
aber ganz gerne mal mit den Daten bei euch
beschäftigen möchte. Wie kann ich denn
-
mitmachen? Wie kann ich einsteigen, wie
kann ich anfangen? Simon: Also der... wenn ich
-
jetzt da mit dem Thema anfangen würde,
würde mir glaube ich... also normalerweise
-
hat man ja ein Thema, mit dem man sich
auseinandersetzen will, also ein
-
inhaltliches Thema, zu dem man Daten
sucht. Dann würde ich mal gucken, was
-
gibt's bei den statistischen Ämtern, was
gibt's auf Datenguide zu dem Thema? Und
-
dann würde ich mal ein bisschen anfangen,
mit diesen Daten zu arbeiten. Mit... also
-
mal die Daten sich genauer angucken, Daten
runterladen und dann mit einem Tool deiner
-
Wahl diese Daten zu visualisieren oder zu
gucken, was man da rausziehen kann. Es
-
kann so einfach wie Excel sein oder mit
Python oder R oder auch mit einfachen
-
Datenvisualisierungstools wie Data Wrapper
oder Flourish Studio. Das sind beides
-
Tools, die kann man umsonst im Web
benutzen, da mal die Daten hochladen und
-
dann gucken, was man daraus machen kann.
Einfach, um mal so ein Gefühl dafür zu
-
kriegen. Und wenn ihr ganz konkret an
Datenguide mitarbeiten wollt, dann ist
-
Datenguide natürlich in erster Linie mal
eine Software-Projekt. Das heißt, wir
-
haben, wir hätten Tickets, an denen man
arbeiten könnte. Am einfachsten im Moment
-
ist, wenn man uns direkt kontaktiert über
die Kanäle, die ich vorhin angezeigt habe
-
oder einfach über Datenguide auf Twitter
z.B., mal Kontakt mit uns aufnimmt und
-
dann können wir darüber reden. Wir haben
sehr viele Tickets, also ein sehr langes
-
Backlog. Es ist glaub ich nicht, es ist
unterschiedlich schwierig, da
-
einzusteigen. Aber zusammen würden wir,
glaube ich, auch einfache Tickets, um
-
einzusteigen, finden. Und die andere Sache
ist eben, dass wir auch ein Interesse dran
-
haben, mehr Arbeit rund um Data Literacy
zu machen. Das heißt, auch wenn ihr nicht
-
aus dem Bereich Softwareentwicklung kommt,
aber euch halt für Daten interessiert,
-
oder als Nutzer von Daten irgendwie
Erfahrung habt, dann gäbe es auch die
-
Möglichkeit, z.B. Workshops zu machen zum
Thema Datenguide und amtlicher Statistik.
-
Da haben wir auch schon so ein paar
Materialien. Aber da könnte man eben
-
weitere Dinge aufschreiben oder einfach
Workshops halten. Und da ist auch, glaube
-
ich, die einfachste Möglichkeit, mal mit
uns Kontakt aufzunehmen. Über die
-
genannten Kanäle.
Herald: Okay, dann sehe ich jetzt erstmal
-
keine weiteren Fragen mehr. Hast du noch
irgendetwas, was du ergänzen möchtest, was
-
dir jetzt vielleicht noch aufgefallen ist?
Simon: Also ich würde mich gerne bedanken.
-
Also danke an das Wikipaka-Team, dass sie
das alles auf die Beine gestellt haben.
-
Und ich freue mich, wenn ihr uns
kontaktiert im Nachgang von diesem Talk.
-
Herald: Genau, das wird jetzt auch noch
gehen. Wir haben noch ein kleines Q&A, das
-
wird in einem BigBlueButton Raum
stattfinden. Den Link dafür findet ihr
-
auch dann gleich im IRC, also wieder auf
media.ccc.de gehen, wo ihr wahrscheinlich
-
seid, wenn ihr diesen Stream schaut, auf
Chat klicken und dann kommt ihr direkt in
-
den richtigen Channel rein. Und dort
gibt's dann den Link zum
-
Q&A-BigBlueButton-Raum. Da wird dann Simon
noch ein paar Fragen beantworten. Ich
-
bedanke mich ganz herzlich für die
Antworten auf diese ganzen Fragen, für die
-
Vorstellung eures Projekts und nicht
zuletzt dafür, dass ihr das überhaupt
-
macht. Danke und großen virtuellen
Applaus. Und damit beenden wir jetzt
-
diesen wunderbaren Talk zu Datenguide.
Dankeschön.
-
Simon: Danke.
-
rC3 Wikipaka Outro Musik
-
Untertitel erstellt von c3subtitles.de
im Jahr 2021. Mach mit und hilf uns!