WEBVTT
00:00:00.000 --> 00:00:16.785
Wikipaka Intro Musik
00:00:16.785 --> 00:00:22.310
Herald: Es ist 12 Uhr. Willkommen zum
Wikipaka Television und Fernstreamen. Wir
00:00:22.310 --> 00:00:27.110
leben im Informationszeitalter. Wir leben
im Zeitalter der Digitalisierung. Doch wo
00:00:27.110 --> 00:00:32.120
sind sie, die Informationen und wo ist das
Digitalisierte? Oder kurz: Wo sind die
00:00:32.120 --> 00:00:37.010
Daten? Das weiß unser Korrespondent Simon
Jockers. Der arbeitet nämlich an der
00:00:37.010 --> 00:00:40.910
Schnittstelle zwischen Softwareentwicklung
und Journalismus, entwickelt verschiedene
00:00:40.910 --> 00:00:45.950
Tools, die allen Menschen, vor allem
JournalistInnen, dabei helfen, mit Daten
00:00:45.950 --> 00:00:52.310
sinnvoll arbeiten zu können, z.B. mit den
Daten der statistischen Ämter. Im Projekt
00:00:52.310 --> 00:00:58.760
Datenguide ist er besonders aktiv. Das ist
ein Tool, als freie Software, und genau
00:00:58.760 --> 00:01:06.140
das wird er jetzt vorstellen. Bitteschön.
Simon: Hi, ich heiße Simon Jokers und ich
00:01:06.140 --> 00:01:10.130
bin einer der Köpfe hinter Datenguide.
Datenguide - das ist eine Open Data
00:01:10.130 --> 00:01:13.580
Initiative, mit der wir amtlichen
Statistiken zugänglicher für alle machen
00:01:13.580 --> 00:01:20.540
wollen. Und bei Datenguide, da entwickeln
wir Open Source Software, die dabei hilft,
00:01:20.540 --> 00:01:25.700
mit amtlichen Statistiken zu arbeiten und
wir veranstalten Workshops und Hackdays
00:01:25.700 --> 00:01:30.140
und andere Veranstaltungen zu diesem
Thema. Und dieser Vortrag heute, der hat
00:01:30.140 --> 00:01:34.190
zwei große Teile. Im ersten Teil gebe ich
so einen allgemeinen Überblick über
00:01:34.190 --> 00:01:37.820
amtliche Statistik und im zweiten Teil
erkläre ich, was genau wir mit Datenguide
00:01:37.820 --> 00:01:43.520
machen. Aber zum Einstieg Was ist
eigentlich amtliche Statistik? Einfach
00:01:43.520 --> 00:01:47.180
gesagt sind das alle Statistiken zu
Gesellschaft, Umwelt und Wirtschaft, die
00:01:47.180 --> 00:01:52.400
von den Statistischen Ämtern erstellt
werden. Und bei Datenguide konzentrieren
00:01:52.400 --> 00:01:56.180
wir uns auf einen bestimmten Bereich der
amtlichen Statistik, und zwar auf die
00:01:56.180 --> 00:02:01.220
Regionalstatistik, d.h. Statistiken zu
Regionen wie z.B. Bundesländern,
00:02:01.220 --> 00:02:07.700
Landkreisen und Gemeinden. Und wenn man
sich jetzt die Selbstdarstellungen der
00:02:07.700 --> 00:02:13.790
Statistischen Ämter anschaut, dann sagen
die, dass die Statistiken, die sie
00:02:13.790 --> 00:02:18.410
produzieren, objektiv, unabhängig und
qualitativ hochwertig sind und da gehe ich
00:02:18.410 --> 00:02:23.990
auf jeden Fall mit. Und weiter sagen sie
dann, dass Sie das machen für Politik,
00:02:23.990 --> 00:02:28.490
Verwaltung, Wirtschaft sowie für
Bürgerinnen und Bürger. Und bei Datenguide
00:02:28.490 --> 00:02:31.970
sind wir der Meinung, dass dieser letzte
Teil, Bürgerinnen und Bürger, dass man den
00:02:31.970 --> 00:02:39.530
durchaus noch besser machen kann. Um ein
bisschen plastischer zu machen, was so
00:02:39.530 --> 00:02:42.200
drinsteckt in der amtlichen Statistik, hab
ich hier mal ein paar Beispiele gesammelt.
00:02:42.200 --> 00:02:46.880
Bei amtlicher Statistik, da denkt man
meistens erst einmal an demografische
00:02:46.880 --> 00:02:50.480
Daten und das ist auf jeden Fall richtig.
Also es gibt in der amtlichen Statistik
00:02:50.480 --> 00:02:55.490
Zahlen zur Bevölkerung, zur
Altersstruktur, zu Wanderungsbewegungen,
00:02:55.490 --> 00:03:02.390
also zum Hinzug und Wegzug aus bestimmten
Regionen. Und es gibt beispielsweise auch
00:03:02.390 --> 00:03:06.980
Daten zur Migration, also z.B. zu
Schutzsuchenden in Deutschland oder zur
00:03:06.980 --> 00:03:12.410
Einbürgerung. Und für dieses Beispiel hier
hab ich mir mal die Frage gestellt: Wo
00:03:12.410 --> 00:03:17.000
gibt's in Deutschland denn die meisten
RentnerInnen? Und dann habe ich mir die
00:03:17.000 --> 00:03:20.585
Daten aus der amtlichen Statistik
runtergeladen und habe sie mit einem
00:03:20.585 --> 00:03:25.340
Datenvisualisierungs-Tool auf eine Karte
gepackt. Und hier sehen wir, dass die
00:03:25.340 --> 00:03:32.300
Rentnermetropolen Deutschlands die Städte
Baden-Baden und Dessau-Roßlau sind. Und in
00:03:32.300 --> 00:03:39.200
beiden Städten kommen auf 100 Personen im
typischen Erwerbsalter fast 50 Menschen,
00:03:39.200 --> 00:03:46.280
die schon im Rentenalter sind. Aber es
gibt eben nicht nur demografische Daten,
00:03:46.280 --> 00:03:51.980
sondern ganz allgemein auch Daten zu den
Bereichen Wirtschaft und Umwelt. Also z.B.
00:03:51.980 --> 00:03:56.870
Daten zu Industrie und Gewerbe oder Daten
zum Tourismus oder Daten zur
00:03:56.870 --> 00:04:01.670
Abfallentsorgung oder Daten zur
Landwirtschaft. In diesem Beispiel hier,
00:04:01.670 --> 00:04:06.650
da hab ich mir mal angeschaut, wo es in
Deutschland die meisten Schweine gibt. Und
00:04:06.650 --> 00:04:11.390
da gibt's einen ganz klaren Cluster in
Niedersachsen und in Teilen von Nordrhein-
00:04:11.390 --> 00:04:20.000
Westfalen. Und es gibt Zahlen zu Wahlen.
Also z.B. gültige Stimmen, Wahlbeteiligung
00:04:20.000 --> 00:04:25.160
oder Wahlberechtigte bei Landtagswahlen,
bei Bundestagswahlen und bei Europawahlen.
00:04:25.160 --> 00:04:29.870
Und für die letzte Europawahl hab ich mir
in dieser Grafik mal angeschaut, wo die
00:04:29.870 --> 00:04:35.420
Leute denn tendenziell eher grün wählen
und wo die Leute eher AfD wählen. Und dann
00:04:35.420 --> 00:04:39.440
sehen wir hier erst mal, dass es da eine
ganz klare Trennung gibt. Also die Grünen
00:04:39.440 --> 00:04:43.370
sind eher eine Partei der Westdeutschen
und die AfD ist scheinbar eher eine Partei
00:04:43.370 --> 00:04:48.950
der Ostdeutschen. Und am einen Ende des
Spektrums sehen wir dass in Freiburg im
00:04:48.950 --> 00:04:56.480
Breisgau 39 prozent grün gewählt haben,
während am anderen Ende des Spektrums in
00:04:56.480 --> 00:05:03.170
der Sächsischen Schweiz, Ost-Erzgebirge,
dort haben 33 Prozent die AfD gewählt. Und
00:05:03.170 --> 00:05:06.860
das ist jetzt auch nur ein ganz einfaches
Beispiel. Aber es gibt eben eine ganze
00:05:06.860 --> 00:05:15.950
Reihe von Daten aus dem Bereich der
Wahlen, mit denen ihr arbeiten könnt. Und,
00:05:15.950 --> 00:05:21.440
ein ganz wichtiger Aspekt ist, dass die
Statistiken der amtlichen Statistik in der
00:05:21.440 --> 00:05:24.710
Regel Zeitreihen sind. Das heißt, die
Beispiele, die ich gerade gezeigt habe,
00:05:24.710 --> 00:05:29.720
die haben immer den Zustand zu einem
bestimmten Zeitpunkt gezeigt. Aber die
00:05:29.720 --> 00:05:32.600
Daten gibt's eigentlich immer über die
Zeit, weil so eine Statistik, die wird
00:05:32.600 --> 00:05:38.270
immer wieder durchgeführt. Und dann haltet
ihr eine Zeitreihe, mit der ihr Verläufe
00:05:38.270 --> 00:05:42.500
zeigen könnt, wie ich das hier gemacht
habe, z.B. mit Immobilienpreisen für die
00:05:42.500 --> 00:05:50.435
Städte Hamburg, Berlin und Leipzig. Und
auf Basis dieser vier Beispiele, die ich
00:05:50.435 --> 00:05:53.330
jetzt gerade gezeigt habe, könnt ihr euch
wahrscheinlich ganz gut vorstellen, dass
00:05:53.330 --> 00:05:57.020
es eine Reihe von, ich sag mal,
zivilgesellschaftlichen Anwendungen für
00:05:57.020 --> 00:06:01.190
diese Daten gibt. Das ist einmal der
Bereich Journalismus. Also amtliche
00:06:01.190 --> 00:06:05.030
Statistiken sind ein super wertvolles
Werkzeug, z.B. für Datenjournalismus oder
00:06:05.030 --> 00:06:10.550
für Fact Checking. Und amtliche
Statistiken sind auch sehr wichtig, z.B.
00:06:10.550 --> 00:06:16.040
für die Sozialwissenschaften. Aber auch
für zivilgesellschaftliche Initiativen
00:06:16.040 --> 00:06:23.690
können Daten echter Mehrwert sein, z.B.
wenn eine Initiative Daten-gestützt für
00:06:23.690 --> 00:06:30.410
die gute Sache kämpfen will. Wenn man
jetzt anfängt mit amtlichen Statistiken
00:06:30.410 --> 00:06:35.330
zu arbeiten, dann ist es immer ganz
wichtig, sich einmal in den Hinterkopf zu
00:06:35.330 --> 00:06:39.290
rufen, wie diese Daten entstehen. Und dazu
erzähle ich immer ganz gerne diese
00:06:39.290 --> 00:06:42.350
Geschichte, die habt ihr in den letzten
Tagen vielleicht auch schon mal gehört.
00:06:42.350 --> 00:06:47.420
Und zwar war es so, dass etwa vor 2 000
Jahren Kaiser Augustus, der Kaiser des
00:06:47.420 --> 00:06:53.630
Römischen Reiches, einen Zensus angesetzt
hat, weil er bessere Daten über die
00:06:53.630 --> 00:07:01.550
Bevölkerung seines Reichs brauchte. Und im
Rahmen von diesem Zensus, da mussten Maria
00:07:01.550 --> 00:07:12.230
und Josef zusammen nach Bethlehem reisen,
um sich zählen zu lassen. Und das passiert
00:07:12.230 --> 00:07:19.070
auch heute noch. Also in allen
Industrienationen gibt es irgendeine Form
00:07:19.070 --> 00:07:23.930
von Zensus, der so ungefähr alle zehn
Jahre durchgeführt wird. Entweder in Form
00:07:23.930 --> 00:07:28.460
von einer klassischen Volkszählung, wo
wirklich Menschen von Tür zu Tür gehen und
00:07:28.460 --> 00:07:33.890
von der Bevölkerung Daten über jeden
einzelnen Haushalt erfassen oder, das ist
00:07:33.890 --> 00:07:38.630
der andere Ansatz, indem man Daten aus
Registern, die ohnehin vorliegen,
00:07:38.630 --> 00:07:44.780
zusammenfasst. Der Zensus in Deutschland,
der zum letzten Mal 2011 stattgefunden hat
00:07:44.780 --> 00:07:49.970
und zum nächsten Mal 2022 stattfindet, der
ist in erster Linie ein Register-Zensus.
00:07:49.970 --> 00:07:53.870
Das heißt, es werden Daten aus dem
Bevölkerungsregistern und anderen
00:07:53.870 --> 00:07:57.920
amtlichen Registern zusammengetragen und
dann wird eben mit statistischen Methoden
00:07:57.920 --> 00:08:05.030
berechnet, z.B. wie viele Menschen in
einer Stadt leben. Und zusätzlich gibt es
00:08:05.030 --> 00:08:10.160
dann ein eine kleinere Anzahl von
Menschen, die befragt wird, um das
00:08:10.160 --> 00:08:17.840
gegenzuchecken. Es gibt auch eben diese
andere Art, ein Zensus durchzuführen, die
00:08:17.840 --> 00:08:22.340
man Mikrozensus nennt. Und das ist eben
einfach ein Sample. Das heißt, man befragt
00:08:22.340 --> 00:08:26.420
einen bestimmten Teil der Gesellschaft und
dann nimmt man diese Daten und rechnet die
00:08:26.420 --> 00:08:32.480
hoch auf das ganze Land. Und es gibt den
Bereich der Sekundärstatistik, da werden
00:08:32.480 --> 00:08:37.880
z.B. Daten, die an anderer Stelle erfasst
werden, z.B. von der Agentur für Arbeit,
00:08:37.880 --> 00:08:42.110
die werden dann hinterher weitergegeben an
die Statistischen Ämter und die
00:08:42.110 --> 00:08:46.310
Statistischen Ämter, die bereiten dann
eine Statistik auf und veröffentlichen
00:08:46.310 --> 00:08:52.850
die. Und bei allen Verfahren ist es ganz
wichtig zu verstehen, dass die Daten eben
00:08:52.850 --> 00:08:59.150
nicht ein perfektes Abbild der Welt sind.
Es sind immer Daten, die nach einer
00:08:59.150 --> 00:09:03.860
bestimmten Methodik erhoben wurden und
weiterverarbeitet. Und die sind in der
00:09:03.860 --> 00:09:09.120
Regel nicht perfekt. Aber trotzdem ist die
amtliche Statistik normalerweise das
00:09:09.120 --> 00:09:12.180
Beste, was wir haben. Also die amtliche
Statistik ist in den meisten Fällen so
00:09:12.180 --> 00:09:21.090
etwas wie der Goldstandard der Daten. Ja,
und wichtig in diesem Zusammenhang ist
00:09:21.090 --> 00:09:24.990
auch – wir haben in Deutschland ein ganz
strenges Statistikgeheimnis, d. h. dass
00:09:24.990 --> 00:09:29.820
die Daten, die so gesammelt werden, werden
immer anonymisiert. Es werden nur
00:09:29.820 --> 00:09:33.750
aggregierte Zahlen veröffentlicht und
grundsätzlich dürfen Menschen oder
00:09:33.750 --> 00:09:40.320
Unternehmen nie nachträglich
identifizierbar sein. Und trotzdem oder
00:09:40.320 --> 00:09:46.920
auch deswegen ist in Deutschland der
Zensus immer hochumstritten, also in den
00:09:46.920 --> 00:09:54.060
80er Jahren, da gab es sehr große Proteste
und auch Verfassungsbeschwerden gegen den
00:09:54.060 --> 00:09:59.640
Zensus. Und das ist auch der Grund, warum
wir heute in Deutschland überhaupt dieses
00:09:59.640 --> 00:10:04.530
Konzept eines Rechts auf informationelle
Selbstbestimmung in dieser Form haben. Das
00:10:04.530 --> 00:10:09.180
heißt, die Proteste, die es immer wieder
gibt gegen den Zensus, die sind sehr
00:10:09.180 --> 00:10:12.900
wichtig für den Datenschutz in
Deutschland. Aber ich will das jetzt gar
00:10:12.900 --> 00:10:17.220
nicht so thematisieren. In diesem Vortrag
soll es eher darum gehen, dass diese Daten
00:10:17.220 --> 00:10:21.510
jetzt da sind und dass wir euch in die
Position versetzen wollen, mit diesen
00:10:21.510 --> 00:10:29.100
Daten auch wirklich zu arbeiten. Wenn ihr
jetzt euch überlegt habt: Okay, ich
00:10:29.100 --> 00:10:32.070
brauche Statistiken zu einem bestimmten
Thema und die finde ich vielleicht in der
00:10:32.070 --> 00:10:38.370
amtlichen Statistik und ihr sucht mal im
Web, dann seid ihr höchstwahrscheinlich
00:10:38.370 --> 00:10:42.000
erst einmal ziemlich erschlagen, weil es
wirklich sehr, sehr viele Angebote im Web
00:10:42.000 --> 00:10:46.950
gibt, die amtliche Statistiken zur
Verfügung stellen. Und die sind leider
00:10:46.950 --> 00:10:52.140
auch von sehr unterschiedlicher Qualität.
Der Grund dafür ist, einfach gesagt,
00:10:52.140 --> 00:10:56.130
Föderalismus. Also wir haben in
Deutschland eben das Statistische
00:10:56.130 --> 00:11:01.920
Bundesamt und das wird auch Destatis
genannt. Und wir haben 14 statistische
00:11:01.920 --> 00:11:05.850
Landesämter. Außerdem haben wir noch den
Bereich der Kommunalstatistik oder
00:11:05.850 --> 00:11:08.700
städtisch statistische Ämter, wo
eigentlich in jeder Kommune in Deutschland
00:11:08.700 --> 00:11:13.170
auch irgendwie Daten erfasst werden. Und
all diese Daten werden dann auch in
00:11:13.170 --> 00:11:20.400
irgendeiner Form im Web veröffentlicht.
Und da haben wir sehr, ich sag mal, coole
00:11:20.400 --> 00:11:24.900
oder moderne Angebote wie das hier. Das
ist ganz neu - das Dashboard Deutschland
00:11:24.900 --> 00:11:29.880
vom Statistischen Bundesamt. Und hier
könnt ihr euch so eine Sammlung von
00:11:29.880 --> 00:11:35.190
aktuellen Statistiken angucken. Die sind
dann auch dargestellt in so ziemlich
00:11:35.190 --> 00:11:40.260
coolen Grafiken. Aber ihr habt halt keine
Möglichkeit, jetzt nach einem bestimmten
00:11:40.260 --> 00:11:45.630
Thema zu suchen oder die Daten hinterher
runterzuladen und in euren eigenen
00:11:45.630 --> 00:11:50.670
Analysen oder Grafiken
weiterzuverarbeiten. Das heißt, wenn ihr
00:11:50.670 --> 00:11:54.210
damit eigene Sachen machen wollt mit
diesen Daten, dann sind solche
00:11:54.210 --> 00:12:01.440
Veröffentlichungen relativ nutzlos. Und
noch viel schlimmer ist dieses Beispiel:
00:12:01.440 --> 00:12:07.200
Das gibt es leider immer noch, dass Daten
einfach in ein PDF gepackt werden in Form
00:12:07.200 --> 00:12:12.480
von einer Tabelle oder einer Grafik. Und
hinterher ist es dann sehr schwer für
00:12:12.480 --> 00:12:20.340
euch, diese Daten wieder rauszuholen aus
diesem PDF. Und damit ihr jetzt diese
00:12:20.340 --> 00:12:26.310
Recherche nicht selber machen müsst, hab
ich mal für euch zusammengefasst, was die
00:12:26.310 --> 00:12:29.940
richtig guten Portale sind, wo ihr
höchstwahrscheinlich oder hoffentlich auch
00:12:29.940 --> 00:12:37.800
die Daten findet, die ihr braucht. Der
erste Startpunkt ist... oder sollte
00:12:37.800 --> 00:12:43.020
normalerweise GENESIS Online sein. GENESIS
Online ist so die zentrale Datenbank oder
00:12:43.020 --> 00:12:47.190
das zentrale Datenportal des Statistischen
Bundesamts. Hier habt ihr jetzt gleich so
00:12:47.190 --> 00:12:50.250
ein großes Suchfeld, da könnt ihr ein
Thema eingeben und dann findet ihr
00:12:50.250 --> 00:12:55.470
hoffentlich Daten, die euch interessieren,
könnt die dann als Tabelle anzeigen und
00:12:55.470 --> 00:13:01.050
runterladen. Aber damit es nicht zu
einfach ist, gibt es nicht nur dieses
00:13:01.050 --> 00:13:06.330
blaue Daten-Portal, sondern es gibt das
ganze auch nochmal in Rot. Und das hier
00:13:06.330 --> 00:13:10.200
ist die Regional-Datenbank Deutschland und
das ist die gemeinsame Plattform der
00:13:10.200 --> 00:13:14.010
Statistischen Ämter in Deutschland. Und
hier findet ihr eben Daten
00:13:14.010 --> 00:13:18.090
heruntergebrochen auf die verschiedenen
Regionen. Das heißt, wenn ihr Daten sucht
00:13:18.090 --> 00:13:22.170
über eure Stadt oder euren Landkreis und
die vielleicht sogar mit anderen Regionen
00:13:22.170 --> 00:13:25.980
vergleichen wollt, dann findet ihr diese
Daten hier in der Regionaldatenbank
00:13:25.980 --> 00:13:32.080
Deutschland. Jetzt ist es so, dass diese
Daten leider oft nicht sehr aktuell sind
00:13:32.080 --> 00:13:37.300
und auch oft nicht so detailliert, wie man
sie vielleicht braucht. Und wenn ihr da...
00:13:37.300 --> 00:13:40.510
ich sage mal, noch genauere oder
aktuellere Daten braucht, dann hilft es
00:13:40.510 --> 00:13:45.760
immer, sich auch die Portale der
Statistischen Landesämter anzuschauen.
00:13:45.760 --> 00:13:50.740
Also jedes Statistische Landesamt hat auch
so ein Daten-Portal und das funktioniert
00:13:50.740 --> 00:13:54.370
letzten Endes auch wie
regionalstatistik.de oder GENESIS Online.
00:13:54.370 --> 00:14:00.700
Und der Grund, warum diese Portale alle
sehr ähnlich aussehen, ist, dass die
00:14:00.700 --> 00:14:02.680
meisten dieser Portale auf der gleichen
Softwarelösung basieren. Diese Software-
00:14:02.680 --> 00:14:09.460
Lösung heißt Genesis. Und das ist halt so
eine Eigenentwicklung der Statistischen
00:14:09.460 --> 00:14:16.960
Ämter, die die dann benutzen, um ihre
eigenen Daten-Portale aufzusetzen. Und in
00:14:16.960 --> 00:14:24.370
diesen GENESIS-Anwendungen, da könnt ihr
einfach gesagt nach einem Thema suchen
00:14:24.370 --> 00:14:29.830
oder nach einer Statistik suchen, die ihr
braucht. Und wenn ihr eine gefunden habt,
00:14:29.830 --> 00:14:33.490
dann klickt ihr euch durch so ein Menü und
dann könnt ihr euch eben eine Tabelle
00:14:33.490 --> 00:14:41.410
anzeigen. Und diese Tabelle könnt ihr dann
entweder in eine einfache Grafik
00:14:41.410 --> 00:14:50.530
verarbeiten direkt auf diesem Portal. Oder
ihr könnt sie exportieren in einer Excel-
00:14:50.530 --> 00:14:54.820
Tabelle oder eine CSV-Datei. Jetzt ist es
leider so, dass dieses
00:14:54.820 --> 00:14:58.780
Datenvisualisierungstool leider nur sehr
rudimentär ist. Und ich hab's ehrlich
00:14:58.780 --> 00:15:04.450
gesagt noch nie geschafft, damit irgendwas
sinnvoll Verwendbares zu generieren. Und
00:15:04.450 --> 00:15:11.320
dieser Daten Export für Excel und CSV, der
ist auch nicht maschinenlesbar. Das heißt,
00:15:11.320 --> 00:15:15.070
es sind verschachtelte Daten, die können
nur schwer mit anderen Tools
00:15:15.070 --> 00:15:20.512
weiterverarbeitet werden, ohne sie vorher
händisch aufzurollen. Erwähnenswert ist
00:15:20.512 --> 00:15:25.563
noch, dass es einen Webservice gibt, also
eine Daten-Schnittstelle, mit der er
00:15:25.563 --> 00:15:30.682
direkt auf Datensätze zugreifen könnt. Die
verwendete bisher Soap, also Soap ist
00:15:30.682 --> 00:15:36.489
quasi ein Standard für Datenschnittstellen
- der ist eher so aus dem letzten
00:15:36.489 --> 00:15:41.875
Jahrhundert und wird heute eher so im
Enterprise Segment eingesetzt. Soap ist
00:15:41.875 --> 00:15:46.844
eher nicht so das Werkzeug, mit dem ich
normalerweise jeden Tag arbeite, aber -
00:15:46.844 --> 00:15:50.965
und das ist ganz neu, es gibt jetzt auch
eine REST-Schnittstelle, also eine
00:15:50.965 --> 00:15:55.368
modernere Datenschnittstelle, die euch
JSON zurückgibt. Und es gibt die
00:15:55.368 --> 00:16:00.934
Möglichkeit, ein neues Datenformat zu
exportieren. Das nennen die Statistischen
00:16:00.934 --> 00:16:05.030
Ämter Flat CSV und ein Flat CSV ist
einfach ein normale CSV-Datei, die nicht
00:16:05.030 --> 00:16:11.252
verschachtelt ist und deswegen einfacher
zu verarbeiten. Also hier sehen wir so ein
00:16:11.252 --> 00:16:17.885
Beispiel. Wenn ihr jetzt auf
regionalstatistik.de z.B. eine Tabelle
00:16:17.885 --> 00:16:23.225
gefunden habt, dann könnt ihr euch die
anzeigen lassen, das sieht dann so aus.
00:16:23.225 --> 00:16:26.663
Das ist so eine verschachtelte Tabellen
Darstellung und da könnt ihr jetzt den
00:16:26.663 --> 00:16:30.626
Wert raussuchen oder die Zahl raussuchen,
die ihr braucht. Oder ihr könnt euch das
00:16:30.626 --> 00:16:37.977
Ganze eben als Excel oder CSV-Datei
exportieren oder ihr könnt die in so einer
00:16:37.977 --> 00:16:46.500
einfachen Grafik aufbereiten. Ganz
wichtig: Diese Daten sind Open Data. Sie
00:16:46.500 --> 00:16:51.795
erscheinen unter der Datenlizenz
Deutschland. Die erfordert eine
00:16:51.795 --> 00:16:56.188
Namensnennung, einen Verweis auf die
Lizenz und einen Verweis auf den
00:16:56.188 --> 00:17:01.228
Datensatz, den ihr verwendet. Also auf den
Ort, von dem er diesen Datensatz
00:17:01.228 --> 00:17:06.922
heruntergeladen habt. Und das ist sehr
ähnlich wie eine CC-BY Lizenz. Das ist
00:17:06.922 --> 00:17:12.427
jetzt nicht die perfekte Lizenz für Open
Data, also z.B. CC0 wäre irgendwie
00:17:12.427 --> 00:17:17.021
einfacher zu verwenden, aber es ist jetzt
auch nicht das Schlechteste. Grundsätzlich
00:17:17.021 --> 00:17:21.080
könnt ihr diese Daten also weiter
verwenden. Vor einem Jahr, da wäre jetzt
00:17:21.080 --> 00:17:26.858
an dieser Stelle des Vortrags ein großer
Rant gekommen darüber, wie schlimm diese
00:17:26.858 --> 00:17:31.657
GENESIS-Software ist. Aber ich muss sagen,
dass GENESIS in den letzten Monaten
00:17:31.657 --> 00:17:36.911
wirklich deutlich verbessert wurde. Das
heißt, die Plattform ist jetzt auf jeden
00:17:36.911 --> 00:17:41.650
Fall nutzerfreundlicher. Aber trotzdem
gibt's immer noch eine Reihe von
00:17:41.650 --> 00:17:45.265
Problemen. Das größte Problem aus meiner
Sicht ist, dass es keine stabilen URLs
00:17:45.265 --> 00:17:49.613
gibt. Das heißt, es gibt eine
sessionbasierte Navigation. Und wenn ihr
00:17:49.613 --> 00:17:55.307
in eine Tabelle gefunden habt, die ihr
benutzen wollt und ihr kopiert in der
00:17:55.307 --> 00:17:59.780
Browserleiste die URL dazu, dann könnt ihr
die nicht jemand anderem schicken, weil
00:17:59.780 --> 00:18:03.485
sie dann nicht mehr funktionieren wird.
Deshalb werdet ihr auch die Browser vor
00:18:03.485 --> 00:18:08.281
und zurück Navigation nur eingeschränkt
nutzen können und die Seite wird eben
00:18:08.281 --> 00:18:13.190
nicht von Suchmaschinen indiziert. Das
heißt, wenn ihr auf DuckDuckGo oder auf
00:18:13.190 --> 00:18:18.656
Google nach einer Statistik sucht, dann
werdet ihr kein Ergebnis von der GENESIS-
00:18:18.656 --> 00:18:24.285
Datenbank finden. Das nächste Problem ist,
dass der Datenabruf je nach Plattform und
00:18:24.285 --> 00:18:28.289
je nachdem, wie viele Daten ihr
herunterladen wollt, eine Anmeldung
00:18:28.289 --> 00:18:32.920
erfordert. Das heißt, ihr sucht euch eine
Tabelle aus, die ihr benutzen wollt und
00:18:32.920 --> 00:18:36.865
dann könnt ihr die eben nicht direkt
runterladen, sondern ihr müsst euch erst
00:18:36.865 --> 00:18:40.742
ein Login anlegen und mit diesem Login
könnt ihr die Daten dann bestellen und
00:18:40.742 --> 00:18:44.934
danach in so einer Art digitalem Postfach
abrufen. Hier wäre es natürlich schöner,
00:18:44.934 --> 00:18:50.328
wenn man einfach direkt auf den Datensatz
zugreifen könnte. Wenn ihr die Daten
00:18:50.328 --> 00:18:55.835
weiterverarbeiten wollt, dann steht ihr
vor dem Problem, dass dieser Datenexport,
00:18:55.835 --> 00:19:00.733
der ein CSV generiert, sehr speziell ist.
Das heißt, die Daten sind verschachtelt.
00:19:00.733 --> 00:19:08.126
Sie verwenden ein deutsches Zahlenformat,
also Komma als Dezimaltrennzeichen und sie
00:19:08.126 --> 00:19:14.766
verwenden nicht etwa Unicode oder UTF 8
als Zeichenkodierung wie die meisten
00:19:14.766 --> 00:19:20.354
modernen Tools, sondern Windows 1252. Und
meine Vermutung ist, dass dieses ein
00:19:20.354 --> 00:19:26.157
bisschen schräge Format gewählt wurde, um
maximale Kompatibilität mit Microsoft
00:19:26.157 --> 00:19:31.071
Office sicherzustellen. Das heißt, die
Tabellen sind dafür gemacht, dass man sie
00:19:31.071 --> 00:19:34.912
in Excel öffnet und dann auf DIN-A4
ausdruckt. Nicht unbedingt dafür, sie
00:19:34.912 --> 00:19:38.828
einfach direkt in einem
Datenvisualisierungstool weiterverarbeiten
00:19:38.828 --> 00:19:42.135
zu können. Und jetzt könnte man denken:
Okay, aber es gibt eine
00:19:42.135 --> 00:19:45.570
Datenschnittstelle, wo ich die Daten
herunterladen kann. Und hier ist es so,
00:19:45.570 --> 00:19:51.133
dass diese Datenschnittstellen leider eine
sehr hohe Lernschwelle haben. Z.B. diese
00:19:51.133 --> 00:19:56.200
neue Rest-API, die kommt mit einem 200
seitigen Handbuch und ich denke da kann
00:19:56.200 --> 00:20:00.085
man schon ganz gut sehen, dass sie nicht
gedacht ist für, ich sage mal so, casual
00:20:00.085 --> 00:20:04.490
Datennutzer, die einfach nur schnell eine
Tabelle herunterladen möchten. Und das ist
00:20:04.490 --> 00:20:10.700
der Punkt, wo jetzt Datenguide zum Einsatz
kommt. Was wir bei Datenguide machen, ist:
00:20:10.700 --> 00:20:14.629
Wir nehmen uns die Daten aus
regionalstatistik.de und laden die Daten
00:20:14.629 --> 00:20:20.540
einfach einmal alle runter. Also wir
nehmen diese regionalen Statistiken und
00:20:20.540 --> 00:20:25.167
machen einen riesen Datenimport. Den
machen wir jede Nacht, damit wir eine
00:20:25.167 --> 00:20:29.315
Spiegelung haben, die aktuell ist. Und die
Daten stellen wir dann eben über unsere
00:20:29.315 --> 00:20:33.400
eigenen Datenschnittstelle in unserem
eigenen Format zur Verfügung und
00:20:33.400 --> 00:20:38.518
entwickeln dann eine Webanwendung auf
Basis dieser Daten, mit denen ihr die
00:20:38.518 --> 00:20:44.732
Daten durchsuchen und herunterladen könnt.
Das sieht dann ungefähr so aus. Wir nennen
00:20:44.732 --> 00:20:51.679
es das Datenguide Datenportal und das ist
ein experimentelles Tool, mit dem ihr eine
00:20:51.679 --> 00:20:56.903
Region oder mehrere Regionen auswählen
könnt und dann eine Statistik für diese
00:20:56.903 --> 00:21:01.371
Region. Und dann könnt ihr noch ein paar
Einstellungen machen und z.B. innerhalb
00:21:01.371 --> 00:21:05.903
der Statistik weiter einschränken, was ihr
braucht. Und dann könnt ihr die Daten
00:21:05.903 --> 00:21:09.631
herunterladen. Und die sind dann
idealerweise schon in einem Format, was
00:21:09.631 --> 00:21:12.766
ihr genau so einfach in einem
Datenvisualisierungstool oder
00:21:12.766 --> 00:21:18.265
Datenanalyse-Tool weiterverwenden könnt,
ohne dass ihr die Daten erstmal von Hand
00:21:18.265 --> 00:21:23.511
aufräumen musst. Und wir haben eben nicht
nur dieses Datenportal, sondern wir
00:21:23.511 --> 00:21:27.710
verwenden die Daten auch, um auf der
Datenguide Website die Statistiken zu
00:21:27.710 --> 00:21:33.080
erklären. Wir haben eben festgestellt,
dass die Nutzbarmachung von statistischen
00:21:33.080 --> 00:21:38.735
Daten eben nicht nur ein rein technisches
Problem ist, sondern auch ein Problem mit
00:21:38.735 --> 00:21:42.840
Data Literacy. Das heißt, Menschen müssen
einfach wissen, wie sie mit diesen Daten
00:21:42.840 --> 00:21:45.896
umgehen, damit sie mit diesen Daten
umgehen können. Und deswegen haben wir ja
00:21:45.896 --> 00:21:51.522
jetzt so verschiedene Erklärstücke
veröffentlicht auf der Datenguide-Website.
00:21:51.522 --> 00:21:56.857
Und diese Daten, die wir zur Verfügung
stellen, die wollen wir eben nicht nur zur
00:21:56.857 --> 00:22:01.012
Verfügung stellen für unser eigenes Tool,
sondern wir haben ganz bewusst eine offene
00:22:01.012 --> 00:22:07.389
API, die Dritte verwenden können, um dann
ihre eigenen Anwendungen auf Basis dieser
00:22:07.389 --> 00:22:11.654
Daten zu entwickeln. Es gibt zwei
Datenschnittstellen, also zwei
00:22:11.654 --> 00:22:16.025
verschiedene Datenschnittstellen, die wir
zur Verfügung stellen. Die erste ist ein
00:22:16.025 --> 00:22:20.705
einfacher Tabellendownload über http und
der ist einfach dafür gedacht, dass ihr
00:22:20.705 --> 00:22:25.928
z.B. direkt im Browser einfach über die
URLleiste einen Link eingebt und dann
00:22:25.928 --> 00:22:31.247
kriegt ihr eine Tabelle zurück. Und das
ist dieser Tabellen Download, den man eben
00:22:31.247 --> 00:22:35.997
auch mit dem Datenguide Datenportal
zusammenbauen kann. Und diese Tabellen
00:22:35.997 --> 00:22:41.370
könnt ihr dann entweder in verschiedenen
CSV Formaten - je nachdem was ihr braucht
00:22:41.370 --> 00:22:47.928
- runterladen oder als JSON, um sie z.B.
mit JavaScript weiter zu verarbeiten. Und
00:22:47.928 --> 00:22:54.242
wenn ihr eine komplexere Anwendungen plant
auf Basis von statistischen Daten, dann
00:22:54.242 --> 00:22:59.546
könnt ihr diese andere Datenschnittstelle
verwenden, die wir zur Verfügung stellen,
00:22:59.546 --> 00:23:04.613
die verwendet GraphQL. GraphQL ist, ich
sage mal einfach gesagt, ein moderner
00:23:04.613 --> 00:23:10.212
Standard für Datenschnittstellen, um
komplexere Anwendungen zu realisieren.
00:23:10.212 --> 00:23:15.004
Beide Datenschnittstellen sind
experimentell in dem Sinne, dass es da
00:23:15.004 --> 00:23:18.647
durchaus noch Probleme gibt und auch
Fehler, von denen wir zum Teil schon
00:23:18.647 --> 00:23:22.579
wissen und zum Teil wahrscheinlich noch
nicht. Und dass die sich auch in ihrer
00:23:22.579 --> 00:23:29.570
Spezifikation noch ändern. Das heißt, es
gibt keine finale Spezifikation für unsere
00:23:29.570 --> 00:23:36.432
Datenschnittstellen. Wenn ihr jetzt diesen
Tabellen Download nutzen wollt, dann
00:23:36.432 --> 00:23:41.034
funktioniert das im einfachsten Fall so,
dass ihr auf die Datenguide Website geht.
00:23:41.034 --> 00:23:45.319
Dort benutzt ihr dieses Datenportal, um
eine Region oder eine Reihe von Regionen
00:23:45.319 --> 00:23:50.803
auszuwählen, eine Statistik auszuwählen
und dann klickt ihr eben auf Datendownload
00:23:50.803 --> 00:23:56.618
oder ihr kopiert einfach die CSV Daten in
die Zwischenablage und dann fügt ihr die
00:23:56.618 --> 00:24:01.106
Daten in einem Datenvisualisierungstool
eurer Wahl ein. Ich habe das zum
00:24:01.106 --> 00:24:05.178
Beispiel... also diese Grafiken, die ich
eingangs gezeigt habe, die habe ich mit
00:24:05.178 --> 00:24:09.065
Data Wrapper gemacht. Das ist ein
einfaches Datenvisualisierungstool. Da
00:24:09.065 --> 00:24:13.545
könnt ihr quasi so eine CSV-Datei rein
laden und dann könnt ihr quasi eine Karte
00:24:13.545 --> 00:24:18.977
davon erstellen oder ein Liniendiagramm.
Und - Full Disclosure - ich arbeite auch
00:24:18.977 --> 00:24:24.054
an Data Wrapper, aber nach dem gleichen
Prinzip könnt ihr die Daten mit einem
00:24:24.054 --> 00:24:33.190
beliebigen Datenvisualisierungstool oder
Analysetool eurer Wahl verwenden. Das ist
00:24:33.190 --> 00:24:41.389
ein Beispiel für die Verwendung von dieser
fortgeschrittenen GraphQL Schnittstelle.
00:24:41.389 --> 00:24:47.328
Das ist ein einfaches Quiz zu amtlichen
Statistiken, was bei einem Hack-Day
00:24:47.328 --> 00:24:54.105
entstanden ist, und hier könnt ihr quasi
euer Wissen über eure Region testen, auf
00:24:54.105 --> 00:24:59.964
Basis von amtlichen Statistiken. Und ein
bisschen praktischeres Beispiel für die
00:24:59.964 --> 00:25:04.018
Nutzung von dieser GraphQL-Schnittstelle
ist Datenguide Python. Datenguide Python
00:25:04.018 --> 00:25:09.873
ist eine Python Bibliothek, mit der ihr
eben direkt aus Python heraus, z.B. aus
00:25:09.873 --> 00:25:15.672
einem Jupyter Notebook, auf amtliche
Statistiken zugreifen könnt, ohne dass ihr
00:25:15.672 --> 00:25:20.109
euch selber mit http requests oder so
auseinandersetzen müsst. Das ist ein
00:25:20.109 --> 00:25:28.389
Projekt, das wird von einer befreundeten
Organisation betreut, Correlate, und die haben
00:25:28.389 --> 00:25:33.868
auf Basis der Datenschnittstelle diese
Bibliothek entwickelt, um es einfacher zu
00:25:33.868 --> 00:25:41.013
machen, mit Python auf amtliche
Statistiken zuzugreifen. Das war
00:25:41.013 --> 00:25:46.307
eigentlich schon alles, was ich hatte.
Datenguide ist jetzt an einem Punkt, wo
00:25:46.307 --> 00:25:52.275
wir uns überlegen: Wie geht es weiter?
Also wir machen das jetzt seit drei Jahren
00:25:52.275 --> 00:25:56.595
und wir sind ursprünglich unter der Maxime
gestartet, dass wir gesagt haben, wir
00:25:56.595 --> 00:26:01.466
machen Datenguide, um es irgendwann wieder
abschalten zu können, weil idealerweise
00:26:01.466 --> 00:26:07.183
wir nur eine eine Demo oder ein Proof of
Concept entwickeln. Und auf dieser Basis
00:26:07.183 --> 00:26:12.247
erkennen dann die Statistischen Ämter, wie
sie ihre Arbeit besser machen können, um,
00:26:12.247 --> 00:26:17.017
ich sag mal, normale Leute zu erreichen.
Jetzt ist es so, dass GENESIS online in
00:26:17.017 --> 00:26:22.548
den letzten Jahren oder in den letzten
Monaten deutlich besser geworden ist. Aber
00:26:22.548 --> 00:26:27.556
trotzdem ist es noch nicht so weit, dass
wir Datenguide jetzt irgendwie nächstes
00:26:27.556 --> 00:26:32.009
Jahr abschalten werden. Das heißt, wir
überlegen uns weiterhin: Was können wir
00:26:32.009 --> 00:26:37.041
tun, um amtliche Statistiken besser
aufzubereiten, damit sie für alle nutzbar
00:26:37.041 --> 00:26:42.833
und auch nützlich sind? Und in diesem
Zusammenhang müssen wir eben auch unsere
00:26:42.833 --> 00:26:46.737
Webanwendungen und die
Datenschnittstellen, die wir zur Verfügung
00:26:46.737 --> 00:26:51.857
stellen noch einfacher und vor allem auch
stabiler machen. Und in dem Zusammenhang
00:26:51.857 --> 00:26:58.342
ist auch relevant, dass es jetzt eben
diese neuen Schnittstellen gibt in GENESIS
00:26:58.342 --> 00:27:01.935
Online. Also ich hab ja vorhin von dieser
neuen Rest Schnittstelle gesprochen und
00:27:01.935 --> 00:27:06.450
ich könnte mir gut vorstellen, dass man
die benutzen kann, um unsere
00:27:06.450 --> 00:27:13.891
Dateninfrastruktur bei Datenguide noch
einfacher zu machen. Das heißt, wir sind
00:27:13.891 --> 00:27:18.936
jetzt an dem Punkt, wo wir so ein bisschen
an der Orientierung feilen, aber auch eben
00:27:18.936 --> 00:27:26.123
weiter aktiv an den Tools arbeiten, die
wir schon haben. Und dazu auch nochmal die
00:27:26.123 --> 00:27:29.762
Ansage, dass das eben ein Open-Source-
Projekt ist. Das heißt, wir sind im Moment
00:27:29.762 --> 00:27:34.050
eine kleine Gruppe von Leuten, die daran
arbeitet. Und wenn ihr euch auch beruflich
00:27:34.050 --> 00:27:38.745
mit amtlichen Statistiken auseinandersetzt
oder Interesse habt, an so einem Projekt
00:27:38.745 --> 00:27:48.247
beizutragen, dann kontaktiert uns gerne.
Ihr findet uns oder ihr erreicht uns über
00:27:48.247 --> 00:27:53.971
community@datengui.de. Oder ihr findet uns
auf Twitter, auf Mastodon oder eben auf
00:27:53.971 --> 00:28:00.682
GitHub. Und jetzt haben wir noch Zeit für
ein paar Fragen. Vielen Dank.
00:28:00.682 --> 00:28:04.250
Herald: "Kontaktiert uns sehr gerne und
findet uns." Das gilt natürlich vor allem
00:28:04.250 --> 00:28:08.589
für so eine langfristige Perspektive.
Kurzfristig können wir hier direkt Simon
00:28:08.589 --> 00:28:14.285
Fragen stellen. Das heißt, ihr könnt alle
Fragen stellen. Wir können Fragen stellen,
00:28:14.285 --> 00:28:21.097
indem ihr z.B. im IRC - okay, ich sollte
das vielleicht noch ein bisschen muten.
00:28:21.097 --> 00:28:30.025
Hört man das? Wahrscheinlich. Ah, Profi
Version. Gut. Wo war ich? Genau, wie kommt
00:28:30.025 --> 00:28:35.599
ihr ins IRC? Wo könnte ihr die Fragen
stellen? Ihr könnt einfach, wenn ihr auf
00:28:35.599 --> 00:28:40.987
media.ccc.de wahrscheinlich seid, da gibt
es einen kleinen Button, wo Chat steht. Da
00:28:40.987 --> 00:28:45.058
könnt ihr draufklicken und dann öffnet
sich direkt im Browser ein Chatfenster. Da
00:28:45.058 --> 00:28:49.980
könnt ihr reinkommen und könnt dort eure
Fragen stellen. Genauso geht es aber auch
00:28:49.980 --> 00:28:54.881
auf Mastodon und auf Twitter. Das hab ich
auch alles im Blick. Ihr müsste dazu dann
00:28:54.881 --> 00:29:00.940
den Hashtag #rC3Wikipaka ergänzen, dass
wir das dann auch rechtzeitig sehen. So,
00:29:00.940 --> 00:29:10.419
wir haben auch schon die ersten Fragen.
Vielleicht als allererstes: Amtliche
00:29:10.419 --> 00:29:14.986
Statistiken - wenn man darüber nachdenkt,
dann geht es auch immer darum, dass es
00:29:14.986 --> 00:29:19.883
eben um einzelne kommunale
Verwaltungsgebiete geht. Postleitzahlen,
00:29:19.883 --> 00:29:25.338
Kreise, was auch immer, die verändern sich
aber über die Zeit. Das heißt, es gibt
00:29:25.338 --> 00:29:29.882
sowas wie Gebietsreformen. Und dann ist
die Frage: Wie geht man damit um? Wo
00:29:29.882 --> 00:29:36.317
gibt's Informationen, wann sich was wie
ändert?
00:29:36.317 --> 00:29:39.890
Simon: Ja, das ist eine sehr gute Frage,
tatsächlich, und auch Probleme, die man in
00:29:39.890 --> 00:29:44.342
der Praxis immer wieder zu tun hat. Wir
haben es bei Datenguide bisher ausgespart,
00:29:44.342 --> 00:29:49.041
uns mit dem Problem auseinanderzusetzen,
einfach weil wir andere Probleme haben,
00:29:49.041 --> 00:29:56.675
auf die wir uns konzentrieren. Aber es
gibt auf jeden Fall Verfahren, wie man das
00:29:56.675 --> 00:30:00.630
umrechnen kann, sage ich mal einfach. Also
wenn man... normalerweise hat man einen
00:30:00.630 --> 00:30:04.912
Datensatz und die Region verschwindet oder
es gibt... die Region geht in zwei neuen
00:30:04.912 --> 00:30:08.386
Regionen auf oder zwei Regionen werden zu
einer zusammengefasst. Nur um so zu
00:30:08.386 --> 00:30:15.067
erklären, was das Datenproblem bei einer
Gebietsreform ist. Und es gibt eine Liste
00:30:15.067 --> 00:30:18.252
der Gemeinden, die wird von den
statistischen Ämtern veröffentlicht jedes
00:30:18.252 --> 00:30:26.060
Jahr und da sieht man dann halt
Änderungen. Und es gibt das BBSR. Das ist
00:30:26.060 --> 00:30:32.345
das Bundesamt für - das muss ich jetzt mal
nachgucken - das Bundesamt für Bauwesen
00:30:32.345 --> 00:30:38.953
und Raumordnung und die haben auch Infos
zu dem Thema. Und ich weiß auch, dass
00:30:38.953 --> 00:30:45.351
Datenjournalistenkollegen von mir dann
auch schon direkt beim BBSR angefragt
00:30:45.351 --> 00:30:51.507
haben, wenn es darum ging, konkret ein
Problem aufzulösen oder quasi eine
00:30:51.507 --> 00:30:57.206
Änderung, die stattgefunden hat, irgendwie
auf die Daten zu übertragen. Das heißt, da
00:30:57.206 --> 00:31:00.611
gibt's durchaus Verfahren, aber man muss
sich damit ein bisschen auseinandersetzen.
00:31:00.611 --> 00:31:04.998
Und es ist nichts von dem, das wir jetzt
einfach automatisiert durch Datenguide
00:31:04.998 --> 00:31:10.662
lösen können. Also ich glaube, das
Stichwort wäre: Liste der Gemeinden bei
00:31:10.662 --> 00:31:18.898
Destatis und im Zweifelsfall das BBSR
kontaktieren bzw. schauen, ob die Infos
00:31:18.898 --> 00:31:25.878
auf ihrer Website parat halten. Ich höre
dich leider nicht, Julia.
00:31:25.878 --> 00:31:30.660
Herald: Vielen Dank dafür. Die nächste
Frage wäre: Muss man sich denn
00:31:30.660 --> 00:31:35.239
identifizieren, um Daten zu bekommen oder
kann man sie anonym bekommen?
00:31:35.239 --> 00:31:39.650
Simon: Also man kann die Daten anonym
bekommen. Sowohl bei uns, als auch bei den
00:31:39.650 --> 00:31:45.620
statistischen Ämtern, wenn man einfach nur
Daten runterladen will. Also ich hab ja im
00:31:45.620 --> 00:31:52.130
Talk erwähnt, dass man teilweise für diese
GENESIS-Datenbanken einen Login braucht
00:31:52.130 --> 00:31:57.752
und da kann man sich meinem Verständnis
nach einfach anmelden. Ich hab das jetzt
00:31:57.752 --> 00:32:02.206
schon eine Weile nicht mehr gemacht, aber
man kann sich glaub ich einfach anmelden,
00:32:02.206 --> 00:32:05.724
ohne dass man Daten angeben muss. Man
braucht, soweit ich das in Erinnerung
00:32:05.724 --> 00:32:10.239
habe, nur eine E-Mail-Adresse und dann
bekommt man quasi einen generierten
00:32:10.239 --> 00:32:15.407
Nutzernamen. Ich glaube, anders ist es,
wenn man Daten wirklich anfragen will von
00:32:15.407 --> 00:32:19.677
den statistischen Ämtern, also genauso,
wie wenn man bei anderen öffentlichen
00:32:19.677 --> 00:32:23.805
Stellen irgendwie eine Anfrage macht. Da
gibt es bestimmte Verfahren, auch bei den
00:32:23.805 --> 00:32:27.646
statistischen Ämtern. Und ich gehe mal
davon aus, dass man sich dann in
00:32:27.646 --> 00:32:33.720
irgendeiner Form identifizieren muss und
sei es nur aus sozialen Gründen, weil man
00:32:33.720 --> 00:32:38.855
halt mit Menschen dort zu tun hat. Aber
grundsätzlich, wenn es darum geht, Daten
00:32:38.855 --> 00:32:42.519
abzufragen aus regionalstatistik.de oder
über Datenguide: Das ist Open Data, das
00:32:42.519 --> 00:32:48.413
einfach im Web zur Verfügung steht.
Einfach gesagt.
00:32:48.413 --> 00:32:52.407
Herald: Okay, dann ist natürlich die
Frage: Du hast gesagt, dass das ultimative
00:32:52.407 --> 00:32:57.218
Ziel ist, den Service irgendwann
abzuschalten, wenn die Statistik Ämter
00:32:57.218 --> 00:33:02.416
selbst mal auf einem gewissen Stand
angekommen sind. Wie realistisch ist das
00:33:02.416 --> 00:33:05.073
denn?
Simon: Ja, ich glaube, das kommt dann
00:33:05.073 --> 00:33:10.780
darauf an, wie man diesen Wissensstand
definiert. Also ich glaube, es hat auf
00:33:10.780 --> 00:33:16.217
jeden Fall eine... das Mindset ändert sich
bei den statistischen Ämtern und die haben
00:33:16.217 --> 00:33:19.173
festgestellt, dass der Bereich
Datenjournalismus und auch vielleicht
00:33:19.173 --> 00:33:24.200
andere zivilgesellschaftliche Initiativen
durchaus wichtige Multiplikatoren für ihre
00:33:24.200 --> 00:33:29.084
Veröffentlichungen sind und dass es auch
in ihrem Interesse ist, in der
00:33:29.084 --> 00:33:35.701
Öffentlichkeit gut dazustehen. Und
dementsprechend hat da eine Änderung des
00:33:35.701 --> 00:33:41.830
Mindsets stattgefunden. Ich glaube, die
Software verändert sich nur sehr langsam
00:33:41.830 --> 00:33:45.102
und deswegen würde ich sagen, es ist
unwahrscheinlich, dass wir irgendwann im
00:33:45.102 --> 00:33:50.004
nächsten oder übernächsten Jahr wirklich
die Arbeit, die wir bei Datenguide machen,
00:33:50.004 --> 00:33:53.742
einstellen. Aber es ist nicht völlig
unrealistisch.
00:33:53.742 --> 00:33:58.850
Herald: Dazu auch direkt die Frage: Wie
ist das mit den Daten der Statistischen
00:33:58.850 --> 00:34:02.789
Landesämter? Weil nämlich hier jemand
versucht hat, anzufragen, wie es zum
00:34:02.789 --> 00:34:06.890
Beispiel in Baden-Württemberg ist, wo erst
einmal niemand wusste, was Open Data ist.
00:34:06.890 --> 00:34:11.077
Und jetzt möchte diese Person wissen, wie
ist das eigentlich mit der föderalen
00:34:11.077 --> 00:34:15.070
Struktur und bekommt man die Daten der
Statistischen Landesämter?
00:34:15.070 --> 00:34:19.508
Simon: Also auf regionalstatistik.de, da
sind ja grundsätzlich mal die Daten der
00:34:19.508 --> 00:34:24.951
Statistischen Landesämter gesammelt. Also
regionalstatistik.de ist so der kleinste
00:34:24.951 --> 00:34:30.665
gemeinsame Nenner, wo die Statistischen
Ämter gewisse Daten zusammentragen. Und
00:34:30.665 --> 00:34:35.593
dann gibt's eben zusätzlich noch Daten,
die halt auf regionaler Ebene, also nur
00:34:35.593 --> 00:34:41.075
auf Ebene der Bundesländer zur Verfügung
stehen. Also spezielle Datensätze, zum
00:34:41.075 --> 00:34:45.065
Beispiel, die dann nur für Brandenburg
oder nur für Baden-Württemberg oder so zur
00:34:45.065 --> 00:34:50.464
Verfügung stehen oder die vielleicht nicht
vergleichbar sind zwischen verschiedenen
00:34:50.464 --> 00:34:56.080
Ländern. Und es gibt eigentlich immer
irgendeine Form von Datenportal. Ich bin
00:34:56.080 --> 00:34:59.884
mir jetzt... tatsächlich bin ich nicht so
firm, was Baden-Württemberg angeht, weil
00:34:59.884 --> 00:35:04.378
ich damit persönlich noch nie etwas zu tun
hatte. Aber ich würde eigentlich erwarten,
00:35:04.378 --> 00:35:09.146
dass es auch ein Datenportal des
Statistischen Landesamts Baden-Württemberg
00:35:09.146 --> 00:35:14.056
gibt. Es ist nicht notwendigerweise auch
eine GENESIS-Instanz, also es gibt auch
00:35:14.056 --> 00:35:17.301
Datenplattformen, die eben nicht auf
Genesis basieren. Aber es gibt
00:35:17.301 --> 00:35:21.499
normalerweise irgendeine Form von
zentraler Veröffentlichung jedes einzelnen
00:35:21.499 --> 00:35:25.226
Statistischen Landesamtes.
Herald: Ich meine, Baden-Württemberg ist
00:35:25.226 --> 00:35:28.159
ein bisschen verrückt. Ich hatte mal
versucht, da drauf zu klicken und dann
00:35:28.159 --> 00:35:30.475
kommt man wieder auf die gleiche Seite,
ohne irgendwie tiefer zu kommen. Also wer
00:35:30.475 --> 00:35:33.680
da mehr weiß, gerne mehr Informationen.
Simon: Ja, also ich kann mir das gerne
00:35:33.680 --> 00:35:37.063
nochmal genauer angucken und vielleicht
noch etwas dazu posten.
00:35:37.063 --> 00:35:41.625
Herald: Da helfen sich nämlich schon sehr
viele Menschen auch untereinander mit den
00:35:41.625 --> 00:35:46.366
verschiedensten Links. Vielleicht nochmal
zurück zur Weiterentwicklung: Wie geht es
00:35:46.366 --> 00:35:50.383
weiter bei euch, plant ihr denn auch
Visualisierungstools direkt auf eurer
00:35:50.383 --> 00:35:55.242
Website zu integrieren?
Simon: Ja, also das ist ein schwieriges
00:35:55.242 --> 00:36:01.531
Thema, tatsächlich. Also wir haben es vor.
Wir haben... also wenn jemand schon
00:36:01.531 --> 00:36:05.948
frühere Versionen dieses Vortrags gesehen
hat, weil es war ja so ein bisschen best-
00:36:05.948 --> 00:36:09.346
of Zusammenfassung aus den letzten drei
Jahren. Wenn ihr eine frühere Version
00:36:09.346 --> 00:36:12.900
dieses Talks gesehen habt oder irgendwann
in der Vergangenheit mal auf der
00:36:12.900 --> 00:36:16.269
Datenguide-Website wart, dann gab's da
durchaus auch so einfache
00:36:16.269 --> 00:36:20.656
Visualisierungen. Wir haben festgestellt,
dass es sehr schwierig ist, die halt so
00:36:20.656 --> 00:36:24.568
generisch zu bauen, dass sie immer
funktionieren, weil die Daten, also die
00:36:24.568 --> 00:36:29.591
Datensätze sind sehr unterschiedlich. Es
gibt so einen Plan, so eine "kleinste
00:36:29.591 --> 00:36:35.667
gemeinsame Nenner Visualisierung" zu haben
für jeden Datensatz. So ähnlich wie die
00:36:35.667 --> 00:36:40.678
Statistischen Ämter das machen auf
regionalstatistik.de oder auf GENESIS
00:36:40.678 --> 00:36:45.959
Online. Aber nur halt ein bisschen
moderner und besser zu benutzen. Aber
00:36:45.959 --> 00:36:51.697
bisher gibt's das nicht. Wenn jemand
Interesse hat, an sowas zu arbeiten, mit
00:36:51.697 --> 00:36:56.621
mir zusammen oder mit jemand von uns
zusammen, dann bin ich gerne bereit, mich
00:36:56.621 --> 00:37:00.690
darüber zu unterhalten, wie man das
konkret im Detail macht. Weil es ist halt
00:37:00.690 --> 00:37:04.245
ein Open-Source-Projekt. Es ist definitiv
nichts, an dem jemand jetzt gerade aktuell
00:37:04.245 --> 00:37:08.734
arbeitet. Aber es steht auf unserer Liste.
Herald: Thema Open-Source-Projekt, dazu
00:37:08.734 --> 00:37:13.922
noch ein kleiner Einwurf: Wie ist das mit
GENESIS? Die Vermutung ist, dass es
00:37:13.922 --> 00:37:18.343
wahrscheinlich proprietär ist. Gibt's da
irgendwelche Bestrebungen? Wenn das
00:37:18.343 --> 00:37:23.131
proprietär ist, ob man das vielleicht auch
OpenSource stellen möchte?
00:37:23.131 --> 00:37:29.262
Simon: Ist mir nicht... also nicht, dass
ich wüsste. Ja, ich bin mir auch nicht
00:37:29.262 --> 00:37:33.240
sicher... GENESIS ist halt ein riesen
Monster, meinem Verständnis nach. Ich hab
00:37:33.240 --> 00:37:37.420
noch nie Code gesehen, aber es ist meinem
Verständnis nach eine Java-Anwendung, die
00:37:37.420 --> 00:37:41.951
es dann Ende der 90er ins Web geschafft
hat. Und das ist auch der Grund dafür,
00:37:41.951 --> 00:37:47.757
warum es eben diese ganze sessionbasierte
Navigation gibt, weil es glaube ich
00:37:47.757 --> 00:37:52.646
ursprünglich... das ist nicht aus der
heutigen Webanwendungen
00:37:52.646 --> 00:37:58.920
Entwicklungsperspektive gestartet worden,
dieses Projekt. Aber ich habe keine, ich
00:37:58.920 --> 00:38:05.075
kann keine geheime Background-Infos zur
Entwicklung von GENESIS Online geben, aber
00:38:05.075 --> 00:38:10.867
ich kann mir, ehrlich gesagt, nicht
vorstellen, dass es in der... dass es als
00:38:10.867 --> 00:38:16.934
Open Source irgendwann in der
Öffentlichkeit landet. Also, wen es im
00:38:16.934 --> 00:38:23.955
Detail interessiert, GENESIS online ist
eine Eigenentwicklung und das wird von
00:38:23.955 --> 00:38:31.803
ITNRW entwickelt. ITNRW ist so eine
Kombination aus regionalem IT-
00:38:31.803 --> 00:38:36.405
Dienstleister für das Land Nordrhein-
Westfalen und dem Statistischen Landesamt
00:38:36.405 --> 00:38:44.597
Nordrhein-Westfalen. Das ist beides quasi
unter diesem Dach. Und die betreiben
00:38:44.597 --> 00:38:50.380
regionalstatistik.de. Und die Software
hinter GENESIS online wird zum Teil auch
00:38:50.380 --> 00:38:54.441
in Wiesbaden beim Statistischen Bundesamt
entwickelt. Es gibt Leute, die im
00:38:54.441 --> 00:39:01.793
öffentlichen Dienst sind und an dieser
Software arbeiten.
00:39:01.793 --> 00:39:06.215
Herald: Okay, sehr gut. Jetzt hab ich noch
sehr viele Fragen von Dateninteressierten,
00:39:06.215 --> 00:39:11.589
die vielleicht ein bisschen über das, was
ihr jetzt als Datenguide anbietet,
00:39:11.589 --> 00:39:16.068
hinausgehen, trotzdem: Hast du eine
Empfehlung für eine Datenquelle für
00:39:16.068 --> 00:39:21.901
internationale Daten?
Simon: Das ist eine gute Frage. Es kommt
00:39:21.901 --> 00:39:25.752
es darauf an, worum es geht. Also es gibt
halt, genauso wie die Statistischen
00:39:25.752 --> 00:39:29.738
Landesämter in Deutschland alle
zusammenarbeiten und dann eine gemeinsame
00:39:29.738 --> 00:39:34.462
Datenveröffentlichung machen, gibt's auf
europäischer Ebene auch gemeinsame
00:39:34.462 --> 00:39:42.564
Datenveröffentlichungen. Also es gibt ein
europäisches Open Data Portal, wo die EU-
00:39:42.564 --> 00:39:49.667
Mitgliedsländer Daten hin liefern. Es gibt
auch ein zweites Open Data Portal, wo die,
00:39:49.667 --> 00:39:54.475
wo es eben alle möglichen Arten von Open
Data von der EU gibt. Und es gibt auch
00:39:54.475 --> 00:40:00.947
eine gemeinsame Plattform von Eurostat,
also Eurostat ist quasi sowas wie die
00:40:00.947 --> 00:40:05.927
gemeinsame Arbeitsgemeinschaft der
statistischen Ämter in den einzelnen
00:40:05.927 --> 00:40:11.342
Mitgliedsländern der EU. Das heißt, es
geht immer so nach oben. Auf europäischer,
00:40:11.342 --> 00:40:17.976
auf internationaler Ebene - also die
Weltbank hat statistische Informationen,
00:40:17.976 --> 00:40:24.455
quasi über alle Länder. Da findet man
Dinge. Und es gibt halt so verschiedene,
00:40:24.455 --> 00:40:30.513
ich sage mal unabhängige Plattformen, z.B.
Our World in Data ist sehr gut. Muss kurz
00:40:30.513 --> 00:40:39.093
nachgucken, ob ich das richtig sage.
Genau, das ist ourworldindata.org. Und die
00:40:39.093 --> 00:40:48.009
sammeln quasi Daten zu allen möglichen
Themen, die halt weltweit zur Verfügung
00:40:48.009 --> 00:40:55.007
stehen. Das ist von der Oxford University
und da findet man sehr viele Datensätze,
00:40:55.007 --> 00:41:01.277
wenn man so internationale Vergleiche
machen möchte, oder ja, Daten zu
00:41:01.277 --> 00:41:06.250
verschiedenen Themen braucht, die wirklich
für verschiedene Länder irgendwie
00:41:06.250 --> 00:41:12.556
vergleichbar zur Verfügung stehen, dann
ist das auch ein guter Startpunkt.
00:41:12.556 --> 00:41:17.343
Herald: Okay, genau so eine ähnliche Frage
wäre: Was ist eigentlich mit
00:41:17.343 --> 00:41:22.121
teilöffentlichen Daten, zum Beispiel von
der Deutschen Bahn? Findet man die bei
00:41:22.121 --> 00:41:27.390
euch auch oder weißt du, wo man die
vielleicht finden könnte, z.B. Wie viele
00:41:27.390 --> 00:41:33.870
Güterzüge fahren nach Hamburg?
Simon: Da bin ich jetzt tatsächlich
00:41:33.870 --> 00:41:41.778
überfragt. Also ich weiß, dass die Bahn...
also es gibt ja eine OpenData-Initiative
00:41:41.778 --> 00:41:45.509
innerhalb der Bahn. Ich könnte mir
vorstellen, dass es da vielleicht
00:41:45.509 --> 00:41:50.980
Veröffentlichungen zu diesem Thema gibt.
Aber sicher bin ich mir da nicht. Ich hab
00:41:50.980 --> 00:41:57.108
mich mit dem Thema noch nicht befasst, ich
würde jetzt nicht völlig ausschließen,
00:41:57.108 --> 00:42:02.760
dass es von den Statistischen Bundesämtern
so im Kontext Verkehr irgendwie Daten zu
00:42:02.760 --> 00:42:08.902
diesem Thema gibt. Aber ich hatte bisher
nie was damit zu tun. Müsste ich jetzt
00:42:08.902 --> 00:42:14.195
auch mal auf den Seiten der Statistischen
Ämter nachgucken. Ansonsten ... es gibt
00:42:14.195 --> 00:42:19.113
ja, heißt es opendata.bahn.de?
Herald: Ich weiß nicht gerade aus dem Kopf
00:42:19.113 --> 00:42:23.288
genau, wie es heißt, aber die Bahn hat
selber auch offene Daten.. Also das ist
00:42:23.288 --> 00:42:28.477
nicht bei euch jetzt direkt mit dabei?
Simon: Nee.
00:42:28.477 --> 00:42:34.389
Herald: Okay, eine andere, sehr konkrete
Frage zu Daten wäre: Gibt's z.B. sowas wie
00:42:34.389 --> 00:42:39.832
die Energieverbrauchsdaten der
Bundesländer für einzelne Gemeinden oder
00:42:39.832 --> 00:42:42.533
auf Bundesebene? Findet man sowas bei
euch?
00:42:42.533 --> 00:42:45.187
Simon: Das ist auch eine sehr spezielle
Frage.
00:42:45.187 --> 00:42:49.193
Herald: Genau das ist richtig. Vielleicht
weißt du es, und sonst kannst du
00:42:49.193 --> 00:42:54.952
vielleicht erklären, wie man dran kommt?
Simon: Also man kann quasi auf... man
00:42:54.952 --> 00:43:02.761
könnte jetzt auf regionalstatistik.de z.B.
mal nach dem Thema Energie suchen. Oder
00:43:02.761 --> 00:43:09.963
Stromversorgung. Und dann schauen, ob es
da Ergebnisse gibt oder eben auf
00:43:09.963 --> 00:43:18.545
Datenguide. Auch dieses Datenguide
Datenportal. Wenn ihr auf Datenportal
00:43:18.545 --> 00:43:25.665
klickt auf der Datenguidewebsite und dann
gibt's da so ein Interface, wo ihr ein
00:43:25.665 --> 00:43:31.452
Suchbegriff eingeben könnt unter Statistik
und da mal mit dem Suchbegriff Strom oder
00:43:31.452 --> 00:43:37.431
Energie. Ansonsten wäre ich mir relativ
sicher, dass es - es gibt ja Europäische
00:43:37.431 --> 00:43:42.963
Energie-Agenturen - dass es irgendwie
Stellen gibt, die Daten dazu
00:43:42.963 --> 00:43:51.678
veröffentlichen. Müsste ich aber auch
recherchieren.
00:43:51.678 --> 00:43:55.473
Herald: Vielen Dank für deine Antworten zu
den sehr spezifischen Fragen. Ich habe
00:43:55.473 --> 00:44:00.412
außerdem noch eine sehr spezifische Frage,
die uns über Twitter erreicht hat, und
00:44:00.412 --> 00:44:05.560
zwar: Es geht um die Verwendung der Daten
der USGS, die aktuell nur noch als PDF
00:44:05.560 --> 00:44:10.140
vorliegen. Ich weiß leider selbst nicht,
was die USGS ist. Weißt du das? Ich habe
00:44:10.140 --> 00:44:15.060
auch nochmal nachgefragt und bisher noch
keine Antwort bekommen.
00:44:15.060 --> 00:44:22.402
Simon: Also das sind Geodaten aus den USA,
glaub ich, aber ich kann dazu nichts
00:44:22.402 --> 00:44:28.342
sagen, leider. Ich weiß, dass es in den
USA ja auch diese... gab es in den letzten
00:44:28.342 --> 00:44:32.653
4 Jahren ja so eine umgekehrte
Entwicklung, wo verschiedene Daten, die
00:44:32.653 --> 00:44:36.540
quasi in der Public Domain oder als Open
Data zur Verfügung standen, jetzt eben
00:44:36.540 --> 00:44:41.010
nicht mehr als Open Data zur Verfügung
stehen, weil es einfach so ist, dass...
00:44:41.010 --> 00:44:46.605
die Obama-Regierung hat sehr viel geöffnet
im Sinne von Open Data und die Trump-
00:44:46.605 --> 00:44:52.658
Regierung hat dann einfach sehr viel
wieder zugemacht und teilweise auch
00:44:52.658 --> 00:44:58.264
Organisationen oder Organisationsformen,
die es gab und die gemeinsam Daten
00:44:58.264 --> 00:45:01.919
veröffentlich haben, in der Form
aufgelöst. Aber jetzt zu dieser konkreten
00:45:01.919 --> 00:45:05.634
Frage kann ich nichts sagen.
Herald: Sind ja auch alles sehr
00:45:05.634 --> 00:45:09.802
spezifische Fragen, die auch schon
eigentlich über euer Angebot so ein
00:45:09.802 --> 00:45:14.548
bisschen hinausgehen, wo man dann merkt:
Okay, hier sitzen die Datennerds, die auch
00:45:14.548 --> 00:45:18.622
bis ins Letzte alles ausschöpfen wollen.
Jetzt ist natürlich so ein bisschen die
00:45:18.622 --> 00:45:22.248
Frage: Was ist denn vielleicht, wenn ich
noch nicht so viel Erfahrung habe, mich
00:45:22.248 --> 00:45:25.631
aber ganz gerne mal mit den Daten bei euch
beschäftigen möchte. Wie kann ich denn
00:45:25.631 --> 00:45:30.569
mitmachen? Wie kann ich einsteigen, wie
kann ich anfangen? Simon: Also der... wenn ich
00:45:30.569 --> 00:45:35.832
jetzt da mit dem Thema anfangen würde,
würde mir glaube ich... also normalerweise
00:45:35.832 --> 00:45:39.292
hat man ja ein Thema, mit dem man sich
auseinandersetzen will, also ein
00:45:39.292 --> 00:45:43.861
inhaltliches Thema, zu dem man Daten
sucht. Dann würde ich mal gucken, was
00:45:43.861 --> 00:45:49.106
gibt's bei den statistischen Ämtern, was
gibt's auf Datenguide zu dem Thema? Und
00:45:49.106 --> 00:45:54.387
dann würde ich mal ein bisschen anfangen,
mit diesen Daten zu arbeiten. Mit... also
00:45:54.387 --> 00:46:00.793
mal die Daten sich genauer angucken, Daten
runterladen und dann mit einem Tool deiner
00:46:00.793 --> 00:46:07.192
Wahl diese Daten zu visualisieren oder zu
gucken, was man da rausziehen kann. Es
00:46:07.192 --> 00:46:13.269
kann so einfach wie Excel sein oder mit
Python oder R oder auch mit einfachen
00:46:13.269 --> 00:46:18.703
Datenvisualisierungstools wie Data Wrapper
oder Flourish Studio. Das sind beides
00:46:18.703 --> 00:46:22.290
Tools, die kann man umsonst im Web
benutzen, da mal die Daten hochladen und
00:46:22.290 --> 00:46:26.550
dann gucken, was man daraus machen kann.
Einfach, um mal so ein Gefühl dafür zu
00:46:26.550 --> 00:46:30.963
kriegen. Und wenn ihr ganz konkret an
Datenguide mitarbeiten wollt, dann ist
00:46:30.963 --> 00:46:36.272
Datenguide natürlich in erster Linie mal
eine Software-Projekt. Das heißt, wir
00:46:36.272 --> 00:46:42.455
haben, wir hätten Tickets, an denen man
arbeiten könnte. Am einfachsten im Moment
00:46:42.455 --> 00:46:47.034
ist, wenn man uns direkt kontaktiert über
die Kanäle, die ich vorhin angezeigt habe
00:46:47.034 --> 00:46:51.484
oder einfach über Datenguide auf Twitter
z.B., mal Kontakt mit uns aufnimmt und
00:46:51.484 --> 00:46:57.317
dann können wir darüber reden. Wir haben
sehr viele Tickets, also ein sehr langes
00:46:57.317 --> 00:47:02.092
Backlog. Es ist glaub ich nicht, es ist
unterschiedlich schwierig, da
00:47:02.092 --> 00:47:07.250
einzusteigen. Aber zusammen würden wir,
glaube ich, auch einfache Tickets, um
00:47:07.250 --> 00:47:14.281
einzusteigen, finden. Und die andere Sache
ist eben, dass wir auch ein Interesse dran
00:47:14.281 --> 00:47:20.780
haben, mehr Arbeit rund um Data Literacy
zu machen. Das heißt, auch wenn ihr nicht
00:47:20.780 --> 00:47:26.127
aus dem Bereich Softwareentwicklung kommt,
aber euch halt für Daten interessiert,
00:47:26.127 --> 00:47:30.908
oder als Nutzer von Daten irgendwie
Erfahrung habt, dann gäbe es auch die
00:47:30.908 --> 00:47:34.876
Möglichkeit, z.B. Workshops zu machen zum
Thema Datenguide und amtlicher Statistik.
00:47:34.876 --> 00:47:39.153
Da haben wir auch schon so ein paar
Materialien. Aber da könnte man eben
00:47:39.153 --> 00:47:44.612
weitere Dinge aufschreiben oder einfach
Workshops halten. Und da ist auch, glaube
00:47:44.612 --> 00:47:49.107
ich, die einfachste Möglichkeit, mal mit
uns Kontakt aufzunehmen. Über die
00:47:49.107 --> 00:47:53.868
genannten Kanäle.
Herald: Okay, dann sehe ich jetzt erstmal
00:47:53.868 --> 00:47:59.720
keine weiteren Fragen mehr. Hast du noch
irgendetwas, was du ergänzen möchtest, was
00:47:59.720 --> 00:48:05.642
dir jetzt vielleicht noch aufgefallen ist?
Simon: Also ich würde mich gerne bedanken.
00:48:05.642 --> 00:48:12.270
Also danke an das Wikipaka-Team, dass sie
das alles auf die Beine gestellt haben.
00:48:12.270 --> 00:48:16.905
Und ich freue mich, wenn ihr uns
kontaktiert im Nachgang von diesem Talk.
00:48:16.905 --> 00:48:21.890
Herald: Genau, das wird jetzt auch noch
gehen. Wir haben noch ein kleines Q&A, das
00:48:21.890 --> 00:48:25.280
wird in einem BigBlueButton Raum
stattfinden. Den Link dafür findet ihr
00:48:25.280 --> 00:48:30.470
auch dann gleich im IRC, also wieder auf
media.ccc.de gehen, wo ihr wahrscheinlich
00:48:30.470 --> 00:48:35.630
seid, wenn ihr diesen Stream schaut, auf
Chat klicken und dann kommt ihr direkt in
00:48:35.630 --> 00:48:38.660
den richtigen Channel rein. Und dort
gibt's dann den Link zum
00:48:38.660 --> 00:48:44.300
Q&A-BigBlueButton-Raum. Da wird dann Simon
noch ein paar Fragen beantworten. Ich
00:48:44.300 --> 00:48:49.190
bedanke mich ganz herzlich für die
Antworten auf diese ganzen Fragen, für die
00:48:49.190 --> 00:48:52.280
Vorstellung eures Projekts und nicht
zuletzt dafür, dass ihr das überhaupt
00:48:52.280 --> 00:48:59.470
macht. Danke und großen virtuellen
Applaus. Und damit beenden wir jetzt
00:48:59.470 --> 00:49:03.212
diesen wunderbaren Talk zu Datenguide.
Dankeschön.
00:49:03.212 --> 00:49:04.759
Simon: Danke.
00:49:04.759 --> 00:49:10.209
rC3 Wikipaka Outro Musik
00:49:10.209 --> 00:49:15.000
Untertitel erstellt von c3subtitles.de
im Jahr 2021. Mach mit und hilf uns!