35c3 Preroll Music
Herald: Deshalb kommen wir zu einem der
Talks, auf die ich mich am meisten freue,
weil ich beide diese Projekte im letzten
Jahr extrem gefeiert habe. Zum einen: Wer
von euch hat was von Open Schufa
mitbekommen? Deshalb seid hier richtig.
Fast alle. Wer von euch hat denn
mitgemacht bei Open Schufa? Immerhin ein
paar Leute hier im Saal. Finde ich total
großartig. Vielleicht können wir diesen
verdammten Algorithmus mal Reverse
Engineeren. Arne ist ja dran mit seinen
Leuten. Und das Zweite was ich richtig
gefeiert habe, waren die offenen Gesetze.
Plötzlich ist da ein Portal, wo alle
Gesetze drin sind und
Applaus
Genau so fand ich das. Also machen wir
schnell jetzt. Der nächste Talk: Court in
the Akten von Stefan Wehrmeyer, Walter
Palmetshofer und Arne Semsrott. Einen
großen Applaus.
Applaus
Arne Semsrott: Guten Morgen. Schön, dass
so viele Leute so früh am Morgen
hergekommen sind zu unserem Talk: Court in
the Akten. Ein Talk-Titel, den ich super
lustig finde, aber ich glaube da bin ich
der einzige zumindest auf dem Panel.
Zuruf aus dem Publikum
AS: Ah, da, einer, noch jemand findet es
lustig. Egal wir machen einen kleinen Talk
zur angewandten Hackerethik, vor allem
über den einen Satz, nämlich öffentliche
Daten nützen, private Daten schützen und
wir haben zwei Projekte mitgebracht, die
glaube ich in sehr unterschiedlicher Art
damit umgehen. Die beide mit privaten
Unternehmen zu tun haben,die sich aber
verhalten, als ob sie Behörden wären.
Zumindest in bestimmten Teilen, nicht in
dem Teil, wo es um Transparenz geht, aber
in den anderen Teilen. Und wir haben zwei
unterschiedliche Herangehensweisen
versucht, um diese beiden Unternehmen zu
knacken. Und wir fangen an mit Open Schufa
und danach geht es um offene Gesetze und
danach haben wir hoffentlich ein bisschen
Zeit, um noch darüber zu quatschen und zu
diskutieren. Offene Daten bei der Schufa
sind natürlich ein sehr sensibles Thema.
Private Daten schützen und öffentliche
Daten nützen. Das beides kommt glaube ich
sehr, sehr interessant zusammen bei der
Schufa. Die Schufa hat Daten über fast 70
Millionen Leute in Deutschland und hat
Daten zu sehr sensiblen Informationen.
Natürlich Finanzinformationen vor allem,
Kreditausfälle, solche Sachen über sehr
viele Menschen. Wahrscheinlich die meisten
Menschen hier im Saal und ganz viele
Menschen, die nicht so viel mit der Schufa
zu tun haben, denken tatsächlich, dass die
Schufa eine Behörde sei. Aber die Schufa
ist ein Unternehmen, das auch die
Berechnungsmethoden von den sogenannten
Schufascores nicht offenlegt. Man redet ja
so von den Schufascores, die die
Wahrscheinlichkeit berechnen sollen
zumindest, nach der jemand einer
Kreditforderung nachkommt oder nicht. Und
es gibt tatsächlich nicht nur einen
Schufascore pro Person, es gibt sehr
viele, knapp, so 16 Scores, die die Schufa
pro Person berechnet und wie sie aber auf
dieses Scores kommt, das ist ein
Geschäftsgeheimnis. Das ist auch schon
gerichtlich so festgestellt worden vom
Bundesgerichtshof. Die Schufa muss diese
Berechnungsmethoden hinter diesem Score
nicht offenlegen. Was die Schufa nicht
verhindern kann ist, dass Leute diesen
Schufascore reverse engineeren. Das ist
nämlich legal und das haben wir versucht
mit Open Schufa. Opne Schufa ein
gemeinsames Projekt von der Open Knowledge
Foundation und Algorithm Watch. Die Idee
dahinter ist, diesen Schufascore, diese
Berechnungsmethode zu reverse engineeren.
Wir haben im Frühjahr dazu ein
Crowdfunding gemacht. Viele von euch haben
da Geld für gespendet. Wir danken euch
sehr herzlich dafür. Das hat es uns
ermöglicht, mit dieser Arbeit anzufangen.
Wir hatten ein Werbevideo dafür. Haben
dafür Nico Semsrott gewinnen können. Sehr
sympathischer Kerl. Super Video auch. Die
Idee von Open Source war oder ist auch
weiterhin, dass alle Menschen eine
Selbstauskunft über sich nach der DSGVO
bzw. davor nach dem
Bundesdatenschutzgesetz anfragen können,
die dann per Post bekommen und über eine
App, die wir entwickelt haben, die dann
einscannen, anonymisieren oder
pseudonymisieren können und uns wiederum
dann spenden können. Das haben auch
ziemlich viele Leute gemacht über
Selbstauskunft.net erst erstmal ihre
Selbstauskunft angefragt und uns das dann
gespendet. Wie waren erstmal so die
Reaktionen darauf? Die Schufa war nicht so
fröhlich über dieses Projekt. Die haben
gleich zu Beginn dieses Crowdfundings
einen großen Banner auf ihre Website
gestellt und haben gesagt: Die OpenSchufa-
Kampagne ist irreführend und gegen
Sicherheit und Datenschutz in Deutschland.
Und das war super. Vielen Dank an die
Schufa dafür.
Applaus
Die Schufa hat nämlich auf
ihrer Startseite Schufa.de ein riesen
Banner der Open Schufa gehabt, deswege, um
darauf zu linken und das hat uns noch mal
ganz schön viel Traffic gebracht. Das war
super. Überhaupt hat sich die Schufa in
diesem ganzen Prozess sehr, sehr
kooperationsunwillig gezeigt. Es gab
ziemlich viele JournalistInnen die versucht
haben zu recherchieren, einzelnen Fällen
hinterher zu gehen und dann die Schufa
damit zu konfrontieren. Hier zum Beispiel
im Bericht von einem Journalisten der
Welt, der ziemlich eindrücklich bewiesen
hat so, wie die Schufa mit Journalisten
umgeht. Die machen wirklich in so gut wie
jedem Fall, wo Journalisten versuchen über
sie Berichterstattung zu machen, massiv
Druck. Die versuchen in der letzten
Sekunde die Berichterstattung zu
verhindern. Die kommen mit solchen Fake
News Vorwürfen und so 'nem Zeug. Und
insofern zeigt sich glaub ich allein
dadurch schon ganz gut, dass die Schufa da
einiges zu verbergen hat. Und was wir da
bisschen an die Öffentlichkeit bringen
konnten, das erzählt Walter.
Walter Palemtshofer: Hallo. Wir haben im
Februar aufgerufen, dass die Daten
angefragt werden und haben im Mai
angefangen, die Daten dann zu sammeln und
jetzt noch einmal zurückkommen auf das
größere Thema mit private Daten schützen,
öffentliche nützen. Hier braucht es quasi
private Daten, dass man die Daten, die
öffentlich sein sollten und das ist aus
unserer Sicht eben dieses Scoring und die
Gewichtung, nachgebaut werden kann, damit
man das dann herausfindet. Insgesamt gab
es 100 000 Anfragen an Auskunftsdateien.
Das war jetzt nicht nur die Schufa. Wir
haben halt mit der Schufa angefangen, das
betonen wir immer wieder, weil das die
bekannteste Marke ist oder Unternehmen in
dem Bereich und es sehr wohl andere
Unternehmen gibt, die noch schlechtere
Daten verwenden oder noch kaputtere
Scoringmechanismen haben, die noch weniger
bekannt sind. Wir sagen immer: Wir fangen
mit der Schufa an, hören aber da nicht auf
und jetzt nochmal - das ist das Schöne, in
anderen Ländern heißt das dann my data -
wir möchten Sie ja our data nennen, wo man
dann, wenn man sich bewusst ist, was die
Daten sind, spenden kann, damit man in
diesem Datenpool was für die Gemeinschaft
rausfinden kann. Und das ist der Übergang
von privaten zu öffentlichen Daten. So
haben wir dann im Laufe von einem halben
Jahr ca. 3000 Schufa-Datenspenden
bekommen. Da gab es dann kleine Probleme
mit denen und zwar wir hatten einen
Medienbruch. Wenn die Leute angefragt
haben bei der Schufa, haben sie die
Auskunft per Post nach Hause geschickt
bekommen und mussten die dann quasi mit
unserer App digitalisieren, einscannen,
schwärzen, wenn sie es wollten. Und da
geht halt gewisse Datenqualität verloren,
da das Licht schlecht war, Ausdruck
blablabla. Und das war der erste Fall, da
hatten wir einen Medienbruch. Und dann
hatten wir einen Datenbruch. Der eine
Datenbruch war ganz einfach, dass die
Leute, die mitgemacht haben, quasi so
besserer demografischer Durchschnitt war
als unser Pendel hier, also es waren 85
Prozent Männer. Der Altersdurchschnitt
eher jung und urban und tech-affin. Das
heißt, da hatten wir dann das Sample nicht
perfekt gehabt und das andere war am 25.
Mai dieses Jahres gab es die DSGVO. Ab dem
Zeitpunkt gab die Schufa dann weniger
Daten her. Das ist relativ witzig in dem
Sinn, weil, wenn es ein Unternehmen in
Deutschland geben hätte sollen, dass sich
auf die DSGVO vorbereiten hätte sollen
sollte, wäre es wahrscheinlich dieses
Unternehmen gewesen, oder? Das ist eines
der großen Unternehmen die persönliche
Daten haben und die haben es quasi
verpeilt, wie der Schreinermeister vom
nebenan, der sich denkt, der muss sich die
Weihnachtspostkarte überlegen, was er
rausschicken kann. Das lag auch daran,
dass höchstwahrscheinlich der hessische
Datenschutzbeauftragte da zu wenig
nachgegangen ist aus unserer Sicht. Das
heißt, die Schufa hatte da cirka sieben
Monate lang einen Freilauf, Daten nicht zu
liefern, die sie eigentlich liefern hätten
sollen. Das auch ein Problem ist, warum a
wir weniger Datenspenden hatten oder von
diesen 3.000 nicht alle verwenden konnten.
Das ist quasi jetzt das Datensample, über
das wir jetzt sprechen. Das heißt, es ist
nicht wirklich repräsentativ und das
ursprüngliche Ziel, dass man 5.000
perfekte Datensätze hätten, wo wir dann
das wirklich schön nachrechnen könnten mit
einem nachmodellierten Schufamodell, da
sind wir noch nicht, aber wir haben ein
paar lustige Findings in den Daten
gefunden. Das war jetzt mal so, wie die
Auskunft war vor der DSGVO. Das war
relativ übersichtlich, da sieht man auch
verschiedene Branchenscores. Und das war
dann ab dem 25. Mai. Das war eher mager.
Wir haben uns dann die Daten angeschaut
und der erste Schritt war: Was sind die
harten Faktoren, die da reinkommen und da
sieht man jetzt, da sind immer so
Variablen, wo wir dachten, die könnten
zutreffen. Da sind jetzt zwei Ausreißer
dabei, die möchte ich kurz näher zeigen.
Das eine ist ein Insolvenzverfahren und
das zweite sind Zwangspfändungen. Also die
haben einen relativ harten Einfluss. Das
ist eine logarithmische Skala, das heißt,
oben ist hundert, unten ist null und das
zweite Stricherl unter 0 ist dann bei 90.
Das heißt, wenn es runtergeht, geht es
wirklich runter. Das sind jetzt Scores,
über die man diskutieren kann für
Kreditwürdigkeit, wo die Sinn machen. Wir
haben das Problem an sich: 95 Prozent vom
Score erreichen circa drei Viertel der
Leute. Und in diesem Bereich für 75
Prozent der Leute wird dann entschieden,
bekommt man einen Mietvertrag oder bekommt
man einen Handyvertrag. Obwohl der Score
relativ hoch ist und die Variablen die
dafür herangezogen werden, um diese
Feinheiten zu berechnen sind relativ aus
unserer Sicht a) schwammig bzw. haben wir
aufgezeigt, dass da Datenfehler
wahrscheinlich drinnen sind. Ein Fall war
z. B. es gibt schlechtes Scores ohne
Negativmerkmale. Das betraf jetzt zum
Beispiel 20 Leute die überhaupt keinen
Negativeintrag hatten und einen
Negativscore bekommen. Hochgerechnet auf
die deutsche Bevölkerung würde das circa
100.000 Leute betreffen. Und die Sache ist
auch noch wenn man selber nie Probleme
gehabt hat mit einer Finanzierung oder
Zurückzahlung, wird man auch nie daran
denken, dass man in dem System drinnen
ist, weil man denkt man hat immer alles
richtig macht. Und da ist jetzt 100.000
aus meiner Sicht eine relativ hohe Zahl.
Der nächste Schritt wäre, es gibt da
angeblich genaue Scores ohne Daten. Das
heißt 75 Prozent der Leute haben weniger
als drei Datenmerkmale. Das ist jetzt für
eben ob man eine Mietwohnung bekommt oder
nicht relativ dünne Suppe, würde ich mal
sagen. Und dann im dritten Teil war noch,
es gibt verschiedene Versionen von Scores.
Das heißt, es gibt einen Bankenscore. Da
gibt es eine Version 1, da gibt es eine
Version 2, da gibt es eine Version 3. Man
weiß nicht, welche Banken genau welche
Scorevariante anfragen und was das dann
auch bedeutet. Es gibt dann quasi
Diskriminierung zwischen den verschiedenen
Scorewerten. Und aus meiner Sicht diese
Scoreversionen zeigen schön auf, was im
Hintergrund passiert. Also es gibt
Unternehmen, die quasi die Daten, die zur
Bewertung verwendet werden, einmal
einsammeln, die sie dann der Schufa
übermitteln. Die stülpt dann ihr nicht
offizielles Modell drauf und dann
verwendet sie jemand Dritter, der sagt ja
da ist das Score. Deswegen kriegst du a
oder b nicht. Und das ist quasi eine
Kette, die intransparent ist und jedes
Ende der Kette sagt - der Erste sagt: ich
sammle ja nur die Daten. Ich mache gar
nichts damit. Der Zweite sagt: Ich hab die
Daten von denen bekommen, berechne dann.
Das gebe ich aber nicht zu, wie das
berechnet ist. Und der Dritte sagt: Ich
habe nichts berechnet. Ich behalte mir nur
die Berechnung und bewerte dann, ob der
Konsument oder die Konsumentin das Produkt
haben kann. Und das ist ein riesengroßes
Problem, wenn in der Kette auch Fehler
passieren. Ein Beispiel ist zum Beispiel
jemand bezahlt den Kredit zurück und dann
nachdem er den Kredit zeitgemäß und ohne
Probleme zurückbezahlt hat, die
Rückbezahlung in dieser Kette nicht
reportet wird. Wenn die Person dann das
nächste Mal einen Kredit anfragt, dann
sagt das System: Hey Alter, du hast hier
noch einen Kredit laufen, deswegen kriegst
Du eine negative Bewertung, weil du schon
einen laufen hast. Und keiner in der Kette
ist zuständig und keiner der sich daran
informieren möchte, hat dann Zugriff dass
er es nachvollziehen kann, was für Daten
sind abgespeichert. Und das ist einer der
großen Kritikpunkte, dass man dann
bezahlen muss, dafür, dass man mal
reinschauen müsste, dass man negativ
bewertet wird, weil irgendeiner in der
Kette einen Bock geschossen hat. Das ist
im Prinzip eine Art von Wegelagerei aus
meiner Sicht. Dann haben wir noch zum
Beispiel die Variablen Alter, Geschlecht
und Umzüge war spannend. Bei Alter und
Geschlecht gibts einen Hinweis darauf,
dass es Diskriminierung gibt, wo Leute ja
nichts dafür können, dass sie a) jung sind
oder b) männlich. Und spannende Sache
waren nur Umzüge, weil die negativ
einwirken. Also die Anzahl der Umzüge kann
man sich anschauen. Das ist die Grafik. Je
öfter man umzieht, desto mehr geht's
runter. Und da gibt es einen Unterschied,
ob ich umziehen muss weil ich quasi von
Problemen davonlaufe oder weil ich einen
Vertreterjob hab, wo mich meine Firma
nötigt, dass ich alle drei Monate quasi in
einem anderen Bundesland bin. Und die
Person, die jetzt Vertreter war, kann sich
aber nicht dagegen wehren und sagen: Hey
Alter, meine Umzüge sind quasi
gerechtfertigt, weil ich nach Bayern muss
oder was auch immer. Da hatte ich schon
selber Pech. Lacher Und eins der schönsten
anderen Findings war noch, wir sehen hier
drei Muster un das ist auf der einen Seite
die Anzahl der Kreditkarten, die Anzahl
der Bankkonten und die Anzahl der
Mobilfunkverträge. Und wir sehen hier sehr
schön überall der Peak, also der beste
Score, ist bei der Zahl 2. Das heißt wenn
man zwei Kreditkarten hat, zwei
Bankverbindungen und zwei Handyverträge,
dann ist der Score wahrscheinlich am
höchsten. Jetzt würde ich natürlich nie
sagen, dass man den Score so nehmen
könnte, das würde in dem Raum ja auch
keiner machen. Aber man könnte sagen, 2
ist besser als 1. Das Gleiche wäre jetzt
beim Umziehen sollte man halt schauen,
dass man wenn man nur temporär wohin
zieht, dass man das vielleicht doch nicht
meldet sondern es ignoriert. Anderer Trick
wäre noch, wenn man ein Kind hat ist das
anscheinend positiver. Das dauert
natürlich meistens. Vielleicht hilft da
nur die Adoption, wenn es schnell gehen
muss. Nebenbei gab es am 30. Oktober eine
Vorstellung von einer Studie der
Verbraucherrechte Scoring vom
Sachverständigenrat des
Justizministeriums. Das ist insofern
interessant wie die relativ klare Aussage
gemacht haben, dass eigentlich die
Kriterien und deren Gewichtung offen
gelegt werden sollten. Das ist aber das
Ministerium, das eigentlich dafür
zuständig ist und es gab da harte Aussagen
dazu, die dann nur verstärkt worden sind
durch die Veröffentlichung vom Bayerischen
Rundfunk und Spiegel Online, also am 28.
November rausgekommen ist. Die haben also
die Datenanalyse publiziert und relativ
gutes Medienecho und die Schufa hat sie
auch wieder ausgezeichnet mit neunseitigen
Schreiben, woraus sie aber nicht zitiert
werden wollte. Das ist halt die Schufa.
Das war jetzt noch "Ministerin Barley
fordert Schufa zu mehr Transparenz" und
das war ein Detail bei der Transparenz
beim Scoring staatliche Aufsicht und
Aufklärungspflicht. Was das dann bewirkt
hat, war die Ankündigung zu dieser
elektronischen Auskunft, die jetzt dann
erfolgen sollte, dass jeder Benutzer dann,
wenn er die Auskunft stellt, ab 2019 einen
Brief nach Hause geschickt bekommt mit
einem Code, wo er dann online seinen Score
abfragen kann, einmalig. Jetzt, wenn wir
schonmal dabei sind, dass wir das einmalig
machen, dann könnte man sagen, wenn es
schon einmal funktioniert, könnte man
einnen Account dazuzugeben, dass man das
regelmäßig machen kann und dass er dann
quasi wie beim Bezahl-Service abfragen
könnte und dann die Möglichkeit hat, die
Daten zu korrigieren.Und das wären dann
eigentlich unsere Forderungen: Wir wollen
das transparent. Also wie wird der
berechnet? Was sind die Merkmale,
Gewichtungen? Und wie kann man seinen
Datenbestand anschauen oder dass man
Notification bekommt? "He, Alter, du hast
einen negativen Score reinbekommen
wegen... von Firma A, dass ich a) das weiß
und b), falls das falsch sein sollte, die
reale Möglichkeit hab, diesen zu
verbessern. Weil das ist jetzt die Fälle,
die wir wissen, dauert das Monate an
intensiver Arbeit bis ich die ganzen
Firmen an den Strang krieg, dass irgendwie
in dieser Verarbeitungskette der Fehler
dann ausgebügelt wird. Das war jetzt mal
kurz, was wir hoffen, was in Zukunft
kommt. Wir sagen immer Schufa ist der
Anfang und nicht das Ende und wir werden
dranbleiben und das Ganze läuft doch
hoffentlich, dass wir sagen (unverst.),
dass wir mal zeigen, was man machen kann,
wenn man Daten shared, wenn man sich auch
bewusst ist, was das bedeutet, wenn man
uns seine privaten Finanzdaten gibt.
Arne: Wir haben noch eine Slide zur
Schufa, (zu Walter:) meine Lieblingsslide
hieraus. Die Frage ist natürlich: Wie kann
man die Schufa dazu kriegen, in Zukunft
wieder mehr Daten rauszugeben. Die geben
jetzt nicht alle Daten raus, die sie über
einzelne Personen haben, sondern
tatsächlich nur Daten, die sie anderen
geben. Wir gehen davon aus, dass
eigentlich die Schufa viel mehr rausgeben
müsste nach der DSGVO. Und es gibt, glaub
ich, zwei Wege die Schufa dazu zu zwingen
mehr Infos wieder rauszugeben. Das eine
ist 'ne Klage auf Basis von DSGVO. Das
andere ist natürlich 'ne gesetzliche
Verpflichtung. Deswegen ist es auch
wichtig, dass die Ministerin Barley das
jetzt gefordert hat. Wir hoffen, dass da
was kommt und (das wird jetzt 'n richtig
smoother Übergang) das wird dann nämlich
ein Gesetz, idealerweise. Und dieses
Gesetz würde dann im Bundesgesetzblatt
verkündet werden und - ja, gut, ne? Ja. -
Applaus
Und auch dafür haben wir was parat.
Stefan.
Stefan: Genau. Offene Gesetze. Am Anfang
wurde ja schon gesagt: Gesetze, wo findet
man die eigentlich? Wenn man nach'm Gesetz
im Internet sucht, dann findet man die auf
unterschiedlichen Seiten. Zum Beispiel
Buse oder dejure. Die offizielle Seite
heißt gesetzeiminternet.de. Da ist das im
Internet ganz wichtig sonst weiß man ja
gar nicht genau, wo man gerade die URL
angibt.
Gelächter
Und das ist eine Seite, da findet man alle
Bundesgesetze und Verordnungen. Und zwar
in der aktuellen Version sozusagen,
einigermaßen aktuell. Es dauert manchmal
ein paar Tage bis da die aktuelle Version
erscheint. Aber wie tritt eigentlich ein
Gesetz in Kraft? Wie kommt es eigentlich
da hin? Und da hab ich das jetzt mal für
das Publikum aufbereitet. Normalerweise,
wenn man sucht "Gesetzgebungsvorhaben",
"Gesetzgebungsprozess", dann findet man
Flowcharts. Ich hab das mal versucht über
ein GIT-Remote-Prozess quasi darzustellen.
Ja, also es gibt dann quasi einen Branch
von den Ministerien, das ist der
Referentenentwurf. Der geht dann an die
Bundesregierung, die das Bundeskabinett
beschließt. Das geht dann an den
Bundestag. Dann gibt es zwischen Bundestag
und Bundesrat vielleicht ein paar Commits.
Diese Remotestauschen dann so'n paar
Commits aus. Und dann geht das, wenn das
dann beschlossen wurde im Bundestag, dann
unterschreibt das die Bundesregierung. Ja,
also macht "git sign" sozusagen "git tag
-s" . Und dann geht es an den
Bundespräsidenten, der das auch nochmal
unterzeichnet. Und dann wird das in den
"production release branch" der
Bundesrepublik Deutschland gemerged. Und
bekommt... und wird dadurch quasi Gesetz.
Dadurch tritt das erst in Kraft. Erst wenn
es auf diesem "production release branch"
ist, ist es tatsächlich in Kraft getreten.
Vorher ist das noch nicht passiert. Ein
bisschenist das aber die Frage: Wo ist
denn dieser "production release branch"?
Wo ist das "git log" dafür? Und das "git
log" für diese Commits auf dem Branch das
ist das Bundesgesetzblatt. Das
Bundesgesetzblatt, auch: BGBL, nicht zu
verwechseln mit dem Bürgerlichen
Gesetzbuch, ist das Verkündungsblatt der
Bundesrepublik Deutschland. Es heißt auch
"Verkündung" und "Verkündigung".
"Verkündung", das ist das: religiöse
Prophezeiungen und Gesetze, die werden
verkündet. Alles andere wird "verkündigt".
Und dort tritt es dann auch erst in Kraft,
wenn es ausgedruckt und dort
veröffentlicht wird. Das sieht dann zum
Beispiel so aus, dass das erste
Bundesgesetzblatt der BRD am 23. Mai
1949... Dort wurde das Grundgesetz dann
veröffentlicht. Und heutzutage sieht das
leider immer noch genauso aus. Und das ist
zum Beispiel so. Das ist jetzt ein
Beispiel: das Gesetz zur Einführung des
Rechts auf Eheschließungen für Personen
gleichen Geschlechts, das ist ein
sogenanntes Artikelgesetz und diese
Gesetze... diese Artikelgesetze, die im
Bundesgesetzblatt veröffentlicht werden,
die verändern bestehende Gesetze. Das
heißt, es ist sozusagen ein Patch. Wenn
man sich das hier anguckt, dann steht da
"Das Bürgerliche Gesetzbuch in der Fassung
der Bekanntmachung von unverst. wird...
ist wie folgt geändert dem Paragraphen
1309. Und da unten steht: Dem §1353
Absatz 1 Satz 1 wird wie folgt gefasst:
"Die Ehe wird von zwei Personen
verschiedenen oder gleichen Geschlechts
auf Lebenszeit geschlossen." Also ich als
Nerd denke immer, das ist furchtbar
kompliziert zu lesen. Ich weiß ja gar
nicht was der Kontext ist und ich kenne
das ja eher so
und das macht auch für mich viel mehr
Sinn, weil dann sehe ich irgendwie,
was wurde hinzugefügt, ne, was
ist weggekommen.
Applaus
Aber die Problematik, dass es das quasi
menschenlesbar und nicht maschinenlesbar
ist, ist leider noch eine andere. "Offene
Gesetze" hat sich eher mit den rechtlichen
Problematiken befasst. Denn das
Bundesgesetzblatt, wenn man das im
Internet sucht, dann findet man die Seite
bgbl.de und die sieht folgendermaßen aus.
Die hat noch so ein schönes 2006 glossy
Reflektionen, finde ich sehr gut. Und wenn
man sich das genauer anguckt, dann man als
erstes das: Bundesanzeiger Verlag. Wem
gehört er denn? Was ist das denn? Der
Bundesanzeiger Verlag ist mittlerweile ein
privater Verlag. Das hat mal dem Bund
gehört, wurde 1998 aber teilprivatisiert,
2006 wurde er dann vollständig
privatisiert und er gehört zu DuMont
Mediengruppe. Die DuMont Mediengruppe, Sie
kennen das vielleicht von der Berliner
Zeitung, der Berliner KURIER, dem Express
in Köln oder der Hamburger MOPO, also
alles Qualitäts-Blätter, und diese DuMont
Mediengruppe, die bringt auch unsere
Gesetze heraus. Okay. Wenn man da ein
bisschen auf der Website weiterklickt,
dann findet man den kostenlosen
Bürgerzugang, kostenlos finde ich immer
super, klick ich sofort drauf und dann
grüßt mich erst mal so eine große grüne
Box, und da drin steht die elektronische
Version des Bundesgesetzes genießt
generell Datenbankschutz nach Paragraf 87a
fortfolgende Urheberrechtsgesetz. Das
heißt, der Bundesanzeiger Verlag
beansprucht Datenbankschutzrecht auf die
Sammlung der Bundesgesetzblätter, die er
veröffentlicht, jedes einzelne Gesetzblatt
ist ein amtliches Werk nach Paragraf 5
Urheberrechtsgesetz und genießt keinen
urheberrechtlichen Schutz, aber die
Sammlung dieser Gesetzblätter könnte man
sagen dass das ein Datenbank-
Leistungsschutzrecht ist, und der wird auf
jeden Fall hier sehr explizit und auch
ganz oben auf der Seite direkt
unübersehbar vom Bundesanzeiger Verlag
beansprucht. Wenn man dann so ein bisschen
weiter versucht sich durch die
Gesetzesblätter zu klicken merkt man, es
gibt keine Suche, man merkt es gibt kein
OCR von PDF vor 98, da sind es einfach nur
Bilder, die PDF sind gegen Copy und Paste
und Ausdrucken geschützt. Weil wir wissen
wie man es vielleicht weg bekommt, aber
der normale Nutzer, der vielleicht einfach
schnell irgendwas raus copy und pasten
will, da sagt dann der eine oder andere
PDF Reader das geht jetzt nicht, weil da
irgendjemand ein Passwort eingeben muss.
Ist natürlich eigentlich Quatsch
und die Gesetzesseiten selbst enthalten
auch Werbung im Footer. Also nicht für
McDonald's oder so, sondern da steht dann
hier auf bgbl.de könnt ihr das Alles
angucken und da ist auch ein Logo vom
Bundesanzeiger Verlag, also einem privaten
Unternehmen. Ich finde es ein bisschen
unwürdig für unsere Gesetze, wenn er im
Footer dann sozusagen noch extra was drauf
getan wird, was halt nichts mit dem
Gesetzgebungsprozess selbst zu tun hatten.
Applaus
Aber man bekommt das natürlich auch
anders. Man kann tatsächlich bei beim
Bundesanzeiger Verlag ein Online-Archiv im
Halbjahres-Abonnement abschließen. Das
kostet dann schlappe 99 Euro pro halbes
Jahr. Dann bekommt man auch eine Suche,
die Dokumente sind auf einmal ausdruckbar.
Es lassen sich Textstellen entnehmen, wie
sie so schön sagen, also per Copy und
Paste, und das Ganze gibt's auch als
E-Mail Newsletter. Wenn ein
Bundesgesetzblatt rauskommt, dann kostet
auch das Halbjahresabonnement, damit man
dieses Gesetzblatt per E-Mail bekommt, 108
Euro. Etwas seltsam. Wir wollten es
genauer wissen, wie hat denn der
Bundesanzeiger Verlag ... wie ist er denn
daran gekommen an diese Privatisierung.
Wir haben versucht diesen Vertrag
anzufragen, dass der Vertrag mit dem
Bundesanzeiger Verlag - die Anfrage findet
ihr auf frag-den-staat, und da ist ganz
interessant, ihr seht es ist viel
geschwärzt. Also quasi fast die Hälfte
würde ich sagen. Wir haben da Widerspruch
eingelegt. Das läuft noch, aber die
Begründung für diese Schwärzung, die
Schwärzungesstellen, da geht es um die
Laufzeit des Verlages, das Inkrafttreten
des Vertrages. Selbst das Inkrafttreten
des Vertrages wurde geschwärzt und wie die
urheberrechtliche Position dieser
Gesetzblätter besser ist. Das heißt, das
konnten wir gar nicht herausfinden. Es
wurde vom Bundesjustizministerium
geschwärzt. Und da heißt es dann "die
Geheimhaltungsinteressen wegen der
unmittelbaren Auswirkung auf die
wirtschaftliche Situation des
Bundesanzeiger Verlages", deswegen musste
das dann geschwärzt werden. Unsere Reaktion
war diese Bundesgesetzblätter alle auf
OffeneGesetze zu veröffentlichen. Hurra.
Applaus
Das haben wir zusammen mit Johannes
Filter, Arne und ich gemacht. Eine Seite,
da könnt ihr die Bundesgesetzblätter
durchsuchen. Ihr könnt sie auch
herunterladen. Es gibt Textversionen und
damit das Justizministerium das auch
findet haben wir das auch noch im Internet
veröffentlicht unter offenegesetze-im-
internet.de. Applaus Hier der Startup Page
Feature-Vergleich, der kostenlose
Bürgerzugang hat überall Nein, wir haben
überall Ja. Die Dokumente sind druckbar,
Volltextsuche, Texte in älteren Ausgaben,
ein Gesamt-Download. Wir stellen sozusagen
tar balls für die Gesetzblätter über
Jahre, aber auch für z.B. das gesamte BGBL
1 und die BGBL 2 Versionen zur Verfügung.
Das in den 6 Gigabyte PDF, wenn ihr die
runterladen wollt und damit irgendwas
Schönes machen wollt, tut das gerne, denn
wir sagen freie Weiterverwendung, alles in
Ordnung. Wir haben auch stabile Links.
BGBL hat leider keine stabilen Links auf
seine PDFs. Das sind alles Sessions Links,
die kann man noch nicht mal direkt darauf
verweisen. Wir haben RSS-Feeds, eine
kleine API und natürlich alle Funktionen
kostenlos.
Applaus
Die Reaktion wurde sehr gut aufgenommen,
habe ich auch gerade hier gehört. Und auch
die Jura Community hat das sehr gut
aufgenommen. Rechtsprofessoren haben
darüber Blogposts geschrieben, haben sich
sehr gefreut, dass sich da jetzt so etwas
ergeben hat. Offenbar gab es da sehr lange
Stillstand in der Rechts-Community und sie
haben das sehr wohlwollend aufgenommen.
Und jetzt kurz vor Weihnachten hat auch
Frau Barley, da ist sie schon wieder,
gesagt, dass sie... also die FAZ titelt:
"Barley nimmt DuMont Verlag das
Gesetzblatt weg". Das klingt jetzt sehr
hart aber es ist schon länger eine
E-Verkündung, also eine elektronische
Verkündung des Bundesgesetzblattes
geplant. Das ist allerdings erst ab 2021
der Fall. Das bedeutet, dass dann das
Gesetz nicht mehr ausgedruckt werden muss
damit es in Kraft tritt sondern dann muss
es nur noch online veröffentlicht werden.
Aber was neu war in dem Artikel, dass auch
die bestehenden Bundesgesetzblätter
durchsuchbar und online dann zur Verfügung
gestellt werden, von der Regierung selbst,
vom Staat und das ist auf jeden Fall ein
Fortschritt. Ich hoffe, wir haben dazu
beigetragen diese Entscheidung da zu
forcieren. Ganz interessant ist auch, dass
die juris GmbH die erste war, die diesen
Tweet von dem F.A.Z. Reporter retweetet
hat. Die juris GmbH, die macht ungefähr
das Gleiche nur mit Urteilen und die müsse
man sich auch mal genauer angucken.
Lachen und Applaus
Wie geht es weiter? Wir warten auf eine
Klage, beziehungsweise wir sind gar nicht
sicher, weil eigentlich wissen wir nicht,
dass wir etwas falsch gemacht haben. Aber
wir gucken mal, wie das beim
Bundesanzeiger Verlag aufgenommen wird.
Wir waren jetzt vier Tage nicht zu Hause
deswegen vielleicht liegt ja schon etwas
im Briefkasten. Wir werden das BGBL noch
ein bisschen weiter aufräumen. Wir haben
festgestellt dass auf der BGBL Seite
selbst, da sind Metadaten auch nicht
vollständig auf falsch Datumsangaben sind
korrupt das Datum funktioniert nicht, das
kann man gar nicht parsen. Und natürlich
sind noch sehr viele andere Gesetzes- und
Amtsblätter. Es gibt zum Beispiel das
gemeinsame Ministerialblatt das auch noch
sehr wichtig ist für die Bundesverordnung.
Aber es gibt noch viele andere auf vielen
verschiedenen Ebenen auf Länderebene und
auch auf Gemeindeebene. Dort gibt es auch
Amtsblätter und die sind wahrscheinlich
alle in den Händen von privaten Verlagen.
Oft sind sie die öffentlich verfügbar in
der Form. Oft muss man aber auch dafür
zahlen. Und da sollten wir gemeinsam daran
arbeiten dass so etwas verfügbar wird. Da
könnte ich auch gerne selber aktiv werden.
Ansonsten war das jetzt OpenSchufa und
offene Gesetze Projekte in Deutschland.
Die Klammer ist ein bisschen dass wir
versuchen die Regeln die sehr
alteingesessene Unternehmen uns versuchen
auf zu oktroyieren ein bisschen
aufzubrechen . Die Schufa und auch der
Bundesanzeiger Verlag sind sehr alte
traditionelle Unternehmen. Das wurde schon
immer ausgedruckt. Das wurde schon immer
so erfasst. Aber ich glaube wir haben
einen neuen Anspruch an Transparenz und
auch an durchsuchbar weiter
Verwendbarkeit. Und das versuchen wir bei
der Open Knowledge Foundation ein bisschen
voranzubringen. Vielen Dank.
Applaus und Lachen
Herald: hat kein Audio
Herald: In anderen Räumen waren die immer
schon an. Dankeschön für den Talk, sehr
interessant. Ich bin mal kurz dazu
gestoßen aber wir haben noch 10 Minütchen
für Q&A, bitte an den Mikrophonen
anstellen. Mikrofon Nr. 2 bitte.
Mic2: Es gab Anfang Mitte des Jahres ging
um, dass durch die DSGVO das gesamte
Geschäftsmodell der Schufa betroffen seien
könnte, um es mal so auszudrücken; ich
habe jetzt nicht verfolgt, wie es sich
weiterentwickelt hat ist da noch was draus
geworden hat mittlerweile ein
Datenschutzbeauftragter gesagt: nee ist
alles okay, oder?
Arne: Es gibt die Schufa noch. Also,
zuständig für die Schufa ist der hessische
Datenschutzbeauftragte. Der geht nicht in
einer Konsequenz gegen die Schufa vor, wie
er es machen müsste aus unserer Sicht. Ich
glaube, wäre die Schufa einem anderen
Bundesland angesiedelt, dann sähe es jetzt
ein bisschen anders aus. Tatsächlich eine
Veränderung, die es gab durch den
Datenschutzbeauftragten ist eben diese
elektronische Auskunft. Die Schufa hat
vorher nur Post zugesandt, hat jetzt
zugesichert an den
Datenschutzbeauftragten, dass sie es ab
Januar dann aber auch wirklich per E-Mail
machen beziehungsweise per Post
Zugangscode - gar nicht per E-Mail - einen
Zugangscode per Post und dann bei denen
Online. Das ist so die eine Veränderung
und tatsächlich was so alles Weitere
angeht haben wir bisher nicht gehört, dass
der Datenschutzbeauftragte in Hessen
Probleme damit hätte. Im Gegenteil, wir
haben eher gehört, dass der ein Problem
mit OpenSchufa hatte.
Walter: Da muss man sagen das
Geschäftsmodell, die Haupteinnahmequelle
der Schufa ist ja nicht, dass sie
Einzelpersonen nötigt, dass sie den
Online-Zugang haben sondern sie machen ja
Datenverkauf an Firmen.
Herald: Mikrofon Nr. 2 nochmal.
Mic2: Ich wollte mal fragen, wie der
Status ist. Sammelt ihr für OpenSchufa
noch Daten?
Arne: Aufgrund dieser wirklich sehr sehr
verkürzten Auskünfte, die es zurzeit gibt,
bringt uns das nicht so viel. Die
Auskünfte, die halt einige Menschen
derzeit bekommen besteht tatsächlich
teilweise nur aus einer Zeile oder noch
nicht einmal. Und das sind dann keine
Daten die man sinnvoll in unserem Modell
derzeit einfügen kann. Deswegen pausiert
es gerade. Wir hoffen aber, dass wenn wir
ordentlich Druck ausgeübt haben auf die
Schufa und da wieder ordentliche längere
Auskünfte kommen, wir damit dann wiederum
etwas anfangen können.
Walter: Wir hoffen dass wird ja
überflüssig, weil das Justizministerium
eingreifen wird.
Arne: Ach so, ok, ja.
Herald: Mikrofon Nr. 1 Bitte.
Mic1: Hallo, ich habe auch eine Frage an
die Macher vom OpenSchufa Projekten und
zwar habt ihr ja nun da eine Menge sehr
wichtiger persönlicher Daten bekommen und
dann ist auch die Datenschutz-
Grundverordnung in Kraft getreten und ich
würde gerne mal einen Einblick in den
eigenen Erfahrungen haben wie ihr damit
umgegangen seid selber Datenschutz
compliant sein.
Walter: Also wir hatten rechtliche
Unterstützung, die Daten gingen auch nur
an zwei Medienunternehmen raus, extern,
die damit gearbeitet haben. Sonst war's
Inhouse von Open Knowledge Foundation oder
Algorithm Watch und Partner.
Arne: Genau, das ist der
Datenschutzbeauftragte Niko Härting. Der
hat das übernommen. Man muss nochmal zu
den Daten dazusagen, wir waren nicht
interessiert an den Namen oder so, die
waren in der Regel nicht dabei, es sei
denn Leute haben beim Uploaden Fehler
gemacht und aus Versehen ihre Daten ihren
Namen und so, sehr einfach
identifizierbare Daten mitgeschickt. Das
heißt idealerweise haben wir diese Daten
überhaupt nicht. Das heißt natürlich
nicht, dass wenn man so ein Schufa-Blatt
hat, dass es komplett anonym ist. Es ist
natürlich eine bestimmte Detailtiefe, dass
man mit bestimmten Verfahren sicherlich
das rückschließen kann auf einzelne Leute.
Wir veröffentlichen diese Daten zum
Beispiel auch nicht. Das ist sicherlich
häufiger an uns herangetragen auch von
anderen Forschern, dass sie gern mit
diesem Datensatz arbeiten würden. Das
machen wir derzeit aber so nicht. Das geht
einfach nicht mit diesem Datensatz.
Applaus
Herald: Wir haben noch eine Frage aus dem
Internet. Der Signal Angel, bitte.
Signal Angel: Habt ihr vor die
Gesetzesblätter als Code Patch Version zu
veröffentlichen bzw. arbeitet hier an
einem maschinenlesbaren Datenformat für
Gesetzesänderungen?
Stefan: Also momentan nur auf die
rechtliche Problematik des ganzen
gestützt. Es gab mal ein Projekt namens
Bundes-Git, was tatsächlich versucht hat
die Bundesgesetze auf GitHub zu
versionieren. Diese Nachversionierung;
also ich hab das selber gemacht und das
war sehr viel Handarbeit. sozusagen zu
reverse-engineeren, wie diese Commits
zustande kommen. Wir haben aber hier so
einen Legal Hack Day gehabt, so ein Hack
Workshop in so einer Assembly und haben halt
geguckt, ist es möglich diese Patche aus
den Bundesgesetzblättern zu extrahieren,
mit neueren Natural Language Processing
Sachen die PDFs auseinander nehmen und
dann so gucken kann man jetzt herausfinden
welcher Paragraph da wie angepasst wurde.
Leider gibt es sehr viele Varianten wie da
stehen kann. Wenn man das von Hand macht,
dann dauert es sehr lange und ist sehr
viel Aufwand. Es gibt da Seiten die machen
das, z.B. BuSa und wir würden
das jetzt... also das Bundes-Git,
vielleicht gibt's da noch mal einen
Neustart, aber das ist kompliziert. Es ist
eine sehr komplizierte Materie, sehr viel
Arbeit und eigentlich hätte ich ja gerne
dass es nicht von Reverse engineert wird,
wie OpenSchufa, sondern dass das auch vom
Gesetzgeber selber so passiert dass man da
herausfinden kann was hat sich denn
wirklich geändert Das würde wahrscheinlich
auch den Gesetzgebungsprozess
vereinfachen. Die Leute tippen dass immer
noch alles in Word Dateien ein und sagen:
okay, wir würden es jetzt gerne so ändern,
anstatt das Gesetz selbst zu ändern und zu
versionieren, werden dann diese
Änderungsgesetze gemacht und das ist
kompliziert vielleicht wird sich das
ändern. Ich habe ein paar Juristen
gesprochen, die sehen das jetzt in
absehbarer Zeit nicht. Also auch diese
E-Verkündung wird eher so weiterlaufen wie
wir das in den aktuellen menschenlesbaren
Patchen gesehen haben. Also, glaube ich
nicht so viel Fortschritt, es sei denn wir
machen das wirklich selbst, ist aber viel
Aufwand.
Arne: Man muss aber schon dazu sagen: Wir
sind natürlich die einzigen, die diese Art
hassen auch die Verwaltung hasst es. Und
auch Bundestagsabgeordnete hassen das. Es
gibt eigentlich so gut wie niemanden der
diese althergebrachte Form eigentlich
wirklich gut findet. Es gibt ein Projekt
im Justizministerium, das heißt die
E-Gesetzgebung, alles E, und die arbeiten
ein bisschen daran. Aber wenn ich das
richtig verstanden habe geht es da darum
vor allem Plug-In für Word zu schaffen.
Gelächter
Herald: Super, Mikrofon Nr. 2 nochmal
bitte.
Mic2: Ja, mich interessiert wo die Daten
wo die Gesetze herkommen die auf
OffeneGesetze dann jetzt gelandet sind,
hat die jemand von Hand aus diesem Bürger
Zugang gekratzt und dann zusätzlich noch
OCR, die die nicht schon OCR waren? Und
wenn das so ist, habt ihr die Werbung raus
entfernt?
Stefan: Also es ist ja keine Werbung mehr
drin. Aber wo das jetzt genau herkommt das
können wir leider jetzt nicht sagen.
Lachen und Applaus
Herald: Wir haben nich Zeit für eine
Frage. Mikrofon 1 bitte.
Mic1: Hi, guter Vortrag. Ich war gerade in
den Lightning Talks und hab gehört von
einem Projekt, das versucht
Gerichtsentscheide zu veröffentlichen.
Habt ihr das auch schon irgendwie
mitbekommen oder arbeit ihr mit denen
zusammen?
Arne: Open Legal Data. Ja, es gibt da
glücklicherweise in diesem Bereich einige
wirklich coole Leute die versuchen nicht
nur Gesetze sondern auch Urteile an die
Öffentlichkeit zu bringen. Wir sind da
schon in Gesprächen wie man sich da so
verklagen lassen könnte.
Lachen
Herald: Super. Herzlichen Dank nochmal.
Riesen Applaus für die Speaker.
Applaus
Pausenmusik
Untertitel erstellt von c3subtitles.de
im Jahr 2020. Mach mit und hilf uns!