-
(Beat) Guten Tag, allerseits.
-
Willkommen zu unserem GLAM-Panel.
-
Bevor wir beginnen, muss ich nur
zwei Ankündigungen zu machen.
-
Bitte nutzen Sie zunächst einmal ausgiebig
unsere Etherpads, um Notizen zu machen.
-
Und die zweite ist an unser Publikum
zu Hause gerichtet
-
oder wo auch immer Sie sind.
-
Wenn Sie Fragen haben,
-
können Sie das auch
in das Etherpad schreiben,
-
und unsere Engel im Raum
werden das im Auge behalten.
-
Also haben wir beschlossen,
dass für das diesjährige Panel,
-
nachdem ich alle eingereichten Beiträge
gesehen habe,
-
werden wir uns auf die Rolle von Wikidata
-
innerhalb von Daten-Ökosystemen
konzentrieren,
-
die über die eigentlichen
Wikimedia-Projekte hinausgehen,
-
was auch absolut im Einklang
-
mit der neuen Strategie
der Wikimedia-Stiftung ist.
-
Und wir haben heute vier
Diskussionsteilnehmer.
-
Drei plus eins.
-
Deshalb möchte ich Sie
auf die Bühne bitten,
-
damit wir Sie vorstellen können.
-
(Schrittgeräusche)
-
Wir haben also Susanna Ånäs.
-
Sie ist seit langem
eine Aktivistin für freies Wissen
-
und ist an vielen
Wiki-Projekten beteiligt.
-
Und sie wird heute berichten
über das Projekt in Zusammenarbeit
-
mit der finnischen Nationalbibliothek.
-
Dann haben wir neben mir Mike Dickison,
-
der in der Reihenfolge
an zweiter Stelle steht.
-
Er ist ein Museumskurator aus Neuseeland.
-
Er ist Zoologe und
Redakteur bei Wikipedia.
-
Und er war Neuseelands erster
Wikipedian-At-Large
-
in den Jahren 2018 und 2019.
-
Und er wird uns über seine Erfahrungen
in dieser Rolle erzählen,
-
und was bei Wikidata zu arbeiten
in diesem Kontext bedeutet.
-
Dann haben wir Joachim Neubert
-
vom Leibniz-Informationszentrum
für Wirtschaftswissenschaften
-
in Kiel und Hamburg.
-
Er hat daran gearbeitet, die größten
öffentlichen Pressearchive weltweit
-
für die Öffentlichkeit zugänglicher
zu machen, und er nutzt dazu Wikidata.
-
Und dann komme ich als Letzter.
Mein Name ist Beat Estermann.
-
Ich arbeite an der Berner Fachhochschule,
-
in der Schweiz.
-
Und ich bin ein langjähriger Förderer
-
des OpenGLAM in der Schweiz und anderswo.
-
Und ich werde heute über
meine Aktivitäten berichten
-
im Zusammenhang mit dem Auftrag
der Canadian Arts Presenting Association
-
mit Schwerpunkt auf darstellende Künsten.
-
Nicht in erster Linie bei Wikidata,
-
aber Sie werden sehen, Wikidata
fängt auch dort an, eine Rolle zu spielen.
-
Die meisten von uns werden jetzt
also hier ihren Platz einnehmen,
-
und ich erteile Susanna das Wort.
-
Okay. Also, hallo.
Mein Name ist Susanna Ånäs,
-
und ich arbeite Teilzeit
für Wikimedia Finnland
-
als GLAM-Koordinator,
-
und ich berate auch
in der offenen Wissenssphäre.
-
Und bei diesem Diskurs
geht es eher um das Letztere.
-
Ich war also an den Arbeiten beteiligt
der geographischen Datengruppe der –
-
Nun, ich habe es nachgeschlagen,
aber es ist nicht auf Englisch,
-
aber die Kulturerbe-Initiative
der finnischen Regierung.
-
Hier geht es also um Ortsnamen
-
und wie sie repräsentiert werden
-
in verschiedenen Repositories
im GLAM-Sektor in Finnland,
-
und wie sie versuchen,
diese verschiedenen Quellen zu verbinden
-
und wie sie durch Modellierung in
Wikidata und anderswo dargestellt werden.
-
Hier sehen wir also die drei Hauptquellen
für diese YSO-Stellen,
-
die Teil der nationalen Ontologie ist –
allgemeine Ontologie.
-
Die AHAA ist für finnische Archive,
-
Melinda ist für finnische Bibliotheken,
-
und KOOKOS ist für finnische Museen.
-
Es gibt also auch drei
Inhaltsverwaltungssysteme,
-
die an diesen YSO-Stellen zusammenkommen.
-
Und es findet bereits
sowohl ein Austausch mit Wikidata statt,
-
als auch mit dem Namensprojekt
der nationalen Landvermessung.
-
Und dann gibt es noch ein drittes Projekt,
das finnische Namensarchiv,
-
das noch nicht dazu beiträgt,
-
aber es gibt schon Pläne dafür.
-
Eine der wichtigsten
Fragen der Modellierung
-
ist also dieser ganze Problembereich,
-
dass es drei Typen von Elementen
-
bei Ortsnamen in diesem Projekt gibt.
-
Einer davon ist der Ort,
derjenige, der einen Standort hat.
-
Und einer davon ist der Ortsname,
das Toponym, zum Beispiel.
-
Und dann gibt es Dokumenten-Quellen,
-
aus denen diese beiden
abgeleitet werden können,
-
oder Ähnliches zur Absicherung.
-
Das YSO setzt – hier, oben rechts,
-
sehen Sie wieder das gleiche Diagramm.
-
Es konzentriert sich
hauptsächlich auf die Orte.
-
Der Betreuer ist
die finnische Nationalbibliothek
-
und das Finto-Projekt.
-
Es gibt jetzt mehr als 7000 Orte
in Finnisch und Schwedisch
-
und über 3000 auf Englisch,
-
und sie sind CC0 lizenziert.
-
Hier sehen Sie also Finto-Dienst.
-
Und einen Ort –
ich habe Sevettijärvi gewählt.
-
Es ist jetzt auch verwandt
mit unserem Sprachprojekt
-
mit den Skolt Sámi –
-
dies ist ein Ort
im äußersten Norden Finnlands,
-
bewohnt von Skolt Sámi.
-
Hier sehen Sie also den Ort,
der zu den –
-
Nun, Sie werden die Daten
zu diesem Ort sehen.
-
Sie können sehen, dass es
mit einem Wikidata verbunden ist,
-
als auch diese Daten
der Nationalen Landvermessung.
-
Da haben wir's. Und Sie werden
dies noch detaillierter sehen.
-
Es ist auch hierarchisch
-
innerhalb dieses Repositorys angeordnet.
-
Nun, eigentlich,
der eigentliche Ort ist nicht zu sehen,
-
aber er befindet sich
unterhalb dieser Gemeinde,
-
sowie die Region,
-
und Finnland als Land,
und die nordischen Länder,
-
die Großregion.
-
Hier können Sie sehen,
dass viele von diesen
-
zuvor mit Wikidata
mit Mix'n'Match abgestimmt wurden
-
und es sind immer noch welche übrig.
-
Aber die Anzahl der Namen
ist nicht so hoch.
-
Es sind nur weniger als 5000.
-
Dann gibt es also dieses andere Repository
-
von dem finnischen Geospatial
Plattform-Projekt –
-
Ortsnamenskarten.
-
Dies sind alle Ortsnamen,
die auf finnischen Karten zu finden sind.
-
Und sie haben die verknüpften Daten,
die mit CC BY 4.0 lizenziert ist.
-
800.000 Kartenbeschriftungen
in finnischer und schwedischer Sprache,
-
und alle drei Saami-Sprachen,
die es in Finnland gibt.
-
Und diese haben
zwei verschiedene Arten von Entitäten.
-
Die anderen sind Orte, und die anderen
-
sind Ortsnamen, Toponyme.
-
Und sie haben beide persistente URIs.
-
Hier ist zum Beispiel
das selbe Sevettijärvi,
-
einmal in finnischer Sprache,
-
und dann in den drei Saami-Sprachen,
sowie die geographischen Daten,
-
und dann gibt es noch mehr Informationen,
wie den Ortstyp et cetera.
-
Hier ist die Karte für den Ortsnamen,
das Toponym, das eine eigene URI hat.
-
Tut mir leid, es wurde scheinbar
nicht in die englische Liste übersetzt.
-
Also, Mehrsprachigkeit
deckt nicht das gesamte Projekt ab.
-
Okay, wir kommen
zum finnischen Namensarchiv.
-
Dies ist ein Projekt des Instituts
für die Sprachen Finnlands,
-
und diese repräsentieren nicht die Orte,
nicht die Ortsnamen,
-
aber sie sind eigentlich
Quellen für diese.
-
Das sind also drei Millionen
Feldnotizen von Ortsnamen,
-
und es ist ein Wikibase-Projekt.
-
Sie befinden sich in einer Wikibase,
-
hauptsächlich auf Finnisch,
einiges auf Schwedisch.
-
Eine herausragende
Sammlung von Saami-Namen,
-
die uns sehr interessieren.
-
Und sie haben die Lizenz CC BY.
-
Und das ist aus der Sicht von Wikidata
auch eine Herausforderung.
-
Aber wenn es eine lokale
finnische Wikibase gäbe,
-
könnten wir vielleicht mit ihnen
in diesem Projekt zusammenarbeiten.
-
Hier ist also ein Screenshot davon,
-
der zeigt, dass es Informationen gibt
über den Ort, die Karten –
-
die alten Karten, die die Sammler
am Anfang verwenden,
-
und die Karte, die sie anhand der
-
von ihnen gesammelten
Informationen erstellen.
-
Also, hier ist eine dieser Karten
-
aufgeschlüsselt nach Daten,
-
die in ihnen enthalten ist.
-
Dann haben sie also
dieses verknüpfte Datenprojekt
-
das Helsinki Digital Humanities Lab
und Semantic Computers übermittelt.
-
Die Computergruppe
der Aalto Universität –
-
und zusammen mit diesem Institut
der Sprachen Finnlands –
-
Der Name ist Sampo.
-
Und dies ist eine aggregierte
Schnittstelle zur Forschung
-
nach mehreren Ortsnamensquellen.
-
Hier können Sie sehen,
dass viele der Quellen
-
sich dort außen
auf der linken Seite befinden,
-
und dann können Sie
verschiedene Arten von Visualisierungen
-
basierend auf diesen Daten erstellen.
-
Und... ja.
-
Also, ich habe diese Idee
-
der Modellierung
einer lokalen Wikibase eingebracht,
-
damit wir mit diesen Daten
etwas anfangen könnten.
-
Aber wenn wir
diese Modellierungsfehlern angehen,
-
wie modellieren wir?
-
Es gibt verschiedene Möglichkeiten,
-
unterschiedliche Traditionen
in jedem dieser Bereiche.
-
So... ja.
-
Und das Gute daran ist,
dass es auch Minderheitensprachen
-
mit sehr geringem Aufwand dienen könnte.
-
Okay. Also, hier haben wir
die beiden grundlegenden Optionen:
-
das SAPO-Modell,
die finnische Raum-Zeit-Ontologie,
-
und das Wikidata-Modell.
-
Hier können Sie sehen,
dass Wikidata-Einträge dazu neigen,
-
sich zu verlangsamen.
-
Im Idealfall bleiben sie gleich
mit den sich ändernden Eigenschaften.
-
Wohingegen im SAPO-Modell
diese Einträge neu erstellt werden,
-
wenn es eine Änderung
gibt, wie zum Beispiel
-
eine Gebiets- und Namensänderung.
-
Kommen wir also zurück
zu dieser Unterteilung
-
zwischen diesen drei verschiedenen
Dimensionen von Orten, Ortsnamen.
-
Sollen diese Ortsnamen
also Entitäten oder Eigenschaften sein?
-
Wikidata verwendet Eigenschaften,
-
während das Landvermessungs-Projekt
Entitäten nutzt.
-
Oder sollten wir sie zu Lexemen machen?
-
Wikidata hat sich entschieden
mit Eigenschaften zu arbeiten,
-
textuelle Eigenschaften
für Ortsnamen über Lexeme.
-
Es tut mir leid, andersherum.
-
Also, die Namen sind...
-
Eigenschaften, nicht Lexeme.
-
Richtig.
-
Und das Problem der Wikibase
-
ist vielleicht der Mangel
an geographischen Formen in diesem –
-
in der Grundausstattung des Programms,
-
also müsste man den Stack
mehr Technologie hinzufügen,
-
um lokale geographische Formen
verwenden zu können.
-
Und eine Verbindung
ist wirklich notwendig,
-
um die Vorteile des Wikidata-Korpus
nutzen zu können.
-
Also, ich bin schon am Ende. Vielen Dank.
-
(Beifall)
-
(Schrittgeräusche)
-
Okay.
-
(spricht auf Maori)
-
Herzlich willkommen.
Mein Name ist Mike Dickison.
-
Und für eine Jahr
-
war ich Neuseelands Wikipedian-At-Large.
-
Sie fragen sich vielleicht
was ein Wikipedian-At-Large ist.
-
Denn wenn man tatsächlich darauf achtet,
gibt es so was nicht, wie wir sehen.
-
Es ist ein Begriff, den ich
in einem Zuschussantrag erfunden habe,
-
was der Stiftung sehr zu gefallen schien.
-
Und so haben wir damit weiter gemacht.
-
Also habe ich ein Jahr lang
35 verschiedene Institutionen,
-
Residenten besucht
-
und in den meisten von ihnen
Trainingseinheiten durchlaufen lassen,
-
öffentliche Veranstaltungen
organisiert und versucht,
-
eine Wikimedia-Strategie
für jeden einzelnen zu entwickeln.
-
Es war eine sehr interessante Erfahrung,
-
und man trifft auf eine breite Palette
von verschiedenen Projekten und Personen.
-
Und ich wollte über einige
verschiedene Projekte reden,
-
die sich mit Wikidata beschäftigten
-
auf interessante oder
vielleicht einleuchtende Art,
-
die nützlich sein könnten,
darüber zu diskutieren.
-
Das Projekt war ursprünglich
ein Wikipedia-Projekt mit diesem Namen,
-
einfach weil es das war,
mit dem die Leute vertraut waren,
-
und so organisierten wir
mehrere verschiedene Ereignisse
-
bei sehr traditionellen Edit-a-thons,
-
die Arbeit mit den geschlechtsspezifischen
Unterschieden und so weiter.
-
Und eine Menge, die Sie sehen
können, [unverständlich],
-
und eine Reihe von sehr erfolgreichen
neuen Redakteuren eingestellt,
-
und so weiter.
-
Wir haben Massen-Uploads
in Commons durchgeführt.
-
In diesem Fall gab es eine Sammlung
von über 1000 Original-Kunstwerken
-
von einem entomologischen Illustrator,
Des Helmore,
-
die auf einer Festplatte lagen,
-
weil zehn Jahre lang die Forschung fehlte
-
und wir waren in der Lage, diese
alle unter der CC BY-Lizenz freizugeben.
-
Also, einfache Erfolge,
die man den Leuten zeigen kann.
-
Jeder versteht viele Bilder von Käfern.
-
Jeder kann Workshops verstehen,
-
die sich der Beseitigung
-
geschlechtsspezifischer
Unterschiede widmet.
-
Aber Wikidata ist viel schwieriger
-
den Menschen im GLAM-Sektor zu verkaufen
-
oder irgendjemand außerhalb
unserer besonderen Bewegung.
-
So begann ich zu erkennen,
-
dass Wikidata
eine größere und wichtigere Rolle
-
für das Wikipedian-At-Large-Projekt
spielen sollte.
-
Im Laufe der Zeit wurde es also
eine immer größere Komponente
-
dessen, was ich tat.
-
Und ich begann, mir selbst auch
mehr über Wikidata beizubringen,
-
weil ich anfing zu sehen,
wie wichtig es war.
-
Also, dieses eine Projekt –
-
der Kakapo ist ein eingeborener
neuseeländischer, flugunfähiger Papagei.
-
Wir arbeiteten mit
dem Department of Conservation,
-
dessen Aufgabe ist,
diese Art vor dem Aussterben zu retten,
-
und ich habe vorgeschlagen,
-
"Was wäre, wenn wir alle
einzelnen Kakapo in Wikidata stellen"?
-
Und es mag lächerlich erscheinen,
-
aber es ist tatsächlich
ein perfekt durchführbares Projekt.
-
Einige von ihnen sind bereits dort drin.
-
Eine wichtige Sache ist,
dass es nicht viele Kakapos gibt.
-
Es ist also eine überschaubare Aufgabe.
-
Es waren 148, als ich anfing,
und dann starb einer.
-
Und sie haben gerade
eine große Zuchtsaison bis 213.
-
Das ist großartig.
-
Das sind die meisten Kakapo
seit über 50 Jahren.
-
Das war also auch eine große Sache.
-
Das war jeden Tag
in Neuseeland in den Nachrichten.
-
[unverständlich]
-
- (Person 1) In der New York Times.
- (Mike) Tatsächlich? Oh, wie schön.
-
Ja, das waren nationale Nachrichten.
Jeder mag diese Vögel.
-
Aber etwas Interessantes an ihnen
-
ist, weil im Gegensatz zu Arten,
die zahlreicher sind,
-
wird einzelne Kakapo benannt,
hat einen eindeutigen Namen
-
und eine eindeutige ID-Nummer,
-
und hat oft gute biographische Daten
-
darüber, wo und wann sie geboren sind,
-
geschlüpft sind,
wer ihr Vater und Mutter war,
-
wann sie starben, wenn sie starben.
-
Es gibt also tatsächlich eine Datenbank
des Ministeriums für Naturschutz
-
mit all diesen Informationen.
-
Und einer der berühmtesten Kakapos
ist natürlich Sirocco,
-
wie Sie sehen können, ist er nach
einem Wind benannt, wurde dort geboren.
-
Sirocco hat einen Twitter-Account,
-
mit dem Wikidata einige Probleme hatte,
-
denn anscheinend können sie
einfach keine Twitter-Accounts haben.
-
Davon wusste ich nichts.
-
Er ist sogar auf einem Albumcover
und so weiter.
-
Es gibt also mehrere Eigenschaften
-
bei diesem wahrscheinlich
berühmtesten einzelnen Kakapo.
-
Also habe ich dem Department
of Conservation vorgeschlagen,
-
"Warum versuchen wir nicht,
dies für jeden einzelnen zu tun?"
-
Und so mussten sie darüber nachdenken,
wie viel von den biographischen Daten
-
veröffentlicht werden könnten.
-
Und sie stellen eine kurze Liste auf.
-
Und jetzt haben wir, glaube ich,
-
212, 210 – ich glaube,
ein Paar ist gestorben –
-
lebende Kakapo,
die jetzt alle Kandidaten sind.
-
Und sie bekommen nur einen Namen,
wenn sie flügge werden.
-
Solange sie noch Babys sind,
erhalten sie bis dahin eine Codenummer.
-
Also, wenn sie ausgewachsen sind,
-
werden wir
eine vollständige Wikidata schaffen,
-
wird die gesamte Art im Wikidata stehen.
-
Aber wir müssen eine Eigenschaft
für DOC ID schaffen.
-
Ich möchte eigentlich
mit den Leuten darüber reden.
-
Sollten wir eine sehr spezifische ID
verwenden,
-
oder sollten wir eine ID ausstellen
-
die für alle einzelnen Vögel
oder Pflanzen oder Tiere
-
funktionieren würde,
-
die in einem wissenschaftlichen
Forschungsprojekt getaggt wurden?
-
Das ist eine gute Frage.
-
Das zweite Projekt
war die Christchurch Kunstgalerie.
-
Es gibt nur sehr wenige Gemälde
von Colin MacCahon,
-
Neuseelands berühmtester
lebender Künstler.
-
Dies ist eine Zeichnung
für das neuseeländische Schuljournal,
-
was von der Regierung finanziert wurde.
-
Es ist also tatsächlich
in den Archiven Neuseelands,
-
die das Urheberrecht dafür besitzen.
-
Dies ist eine sehr
ungewöhnliche Situation.
-
Ich arbeitete also mit
der Christchurch Kunstgalerie,
-
die zusammen
mit der Auckland Kunstgalerie
-
eine Website namens
Find New Zealand Artists betreibt.
-
Ihre Aufgabe ist es, den Überblick
über die Bestände jeder Institution
-
zu behalten, die Bestände
eines neuseeländischen Künstlers hat.
-
Also, etwa 18.000 verschiedene Künstler
in ihrer Datenbank,
-
und die meisten überhaupt
mit sehr wenig Informationen.
-
Wir haben also eine Art
Standard-Mix'n'Match gemacht.
-
Wir haben einen Export derer gemacht,
die mindestens ein Geburtsdatum hatten,
-
oder ein Sterbedatum
oder einen Geburtsort,
-
oder einen Sterbeort.
-
Das schränkt es also nicht sehr ein.
-
Und selbst dann waren wir nicht
in der Lage, einige wenige zuzuordnen,
-
aber wir haben jetzt etwa 1500,
-
die bekannten Künstlern
in Wikidata zugeordnet sind.
-
Was schön ist.
-
Aber was sie reizte –
-
dies ist ihre Website,
-
die wirklich nur die Bestandsverknüpfungen
dort beinhaltet.
-
Aber diese biographischen Daten,
-
die sie derzeit für jeden
einzelnen Künstler von Hand erstellen.
-
Und der Export
und das Einfügen in Mix'n'Match
-
hat zahlreiche Tippfehler und Fehler
und dergleichen aufgedeckt,
-
die sie nicht bemerkt haben.
-
Das passiert, wenn man
die Dinge durch Excel laufen lässt,
-
dann tauchen diese Dinge auf.
-
Und der Wert von Wikidata
wurde ihnen plötzlich bewusst,
-
als ich sagte: "Sie können sich
diese Informationen einfach
-
aus Wikidata raus saugen".
-
Und das hat sie auf einmal
kerzengerade sitzen lassen.
-
Ich denke, dies ist also
eines der Verkaufsargumente.
-
Wenn Sie diese sorgfältig
handkuratierte Website haben
-
mit 18.000 Einträgen,
die voller Fehler sind,
-
und ihnen sagen, dass sie andere Menschen
dazu bringen können
-
einige dieser Fakten zu überprüfen
und für sie korrigieren –
-
dann kommt man zum Ziel.
-
Und dann verkündete ich die Idee,
-
dass sie dieses gesamte Geschichtsbuch
der neuseeländischen Künstler
-
in den 30er Jahren in Christchurch
"wikidatafizieren" können.
-
Und durch – gerade veröffentlicht –
-
laufen und durch
jede einzelne Person laufen,
-
Verbindung, Ort, Ausstellung
und so weiter.
-
Aber es ist ein Projekt
von überschaubarer Größe,
-
und sie sind sehr begeistert darüber.
-
Und drittens wollte ich Ihnen
Maori-Themenüberschriften zeigen.
-
Ein Waka ist ein Maori-Name
für eine bestimmte Art von Kanu,
-
ein Kriegskanu.
-
Also, in der Nationalbibliothek
von Neuseeland,
-
gibt es eine Liste für Waka,
weil die Nationalbibliothek
-
tatsächlich ein eigenes Wörterbuch
von Maori-Themenüberschriften hat,
-
in der Sprache der Maori.
-
Dort definiert wird also ein Waka,
-
auf Maori und Englisch definiert.
-
Aber gibt auch eine ganze Menge
der Maori-Begriffe –
-
Sie können sie dort auf der Seite sehen.
-
Ein typischer Maori-Term wäre Taurapa.
-
Und eine Definition, zuerst auf Maori
und dann auf Englisch.
-
Es ist der geschnitzte Achtersteven,
den Sie dort sehen können.
-
Und auf Englisch Ware das "Sternpost",
-
aber Sie können nicht das Wort
"Sternpost" für Taurapa verwenden,
-
weil Taurapa nur für bestimmte Arten
von Kriegskanus funktioniert.
-
Es gibt also kein englisches
Wortäquivalent dafür.
-
Und mir wurde plötzlich klar,
dass es sich hier um eine ganze Ontologie
-
von kulturspezifischen Begriffen handelt,
sehr sorgfältig ausgearbeitet
-
und von der Nationalen Bibliothek
mit Maori ständig ergänzt,
-
mit Definitionen, mit Beschreibungen
verbessert werden,
-
sowohl auf Englisch als auch auf Maori.
-
Wirklich aufregend.
-
Ich dachte plötzlich, wir könnten
diese ganze Gruppe in Wikidata stellen –
-
zuerst auf Maori, dann auf Englisch
übersetzt, wie erforderlich.
-
Wäre doch eine nette Abwechslung, oder?
-
Und hier ist
die Urheberrechtslizenzierung.
-
Leider NonCommercial-NoDerivs.
-
Jetzt muss ich ein Gespräch
mit ihnen beginnen,
-
warum sie diese Lizenz gewählt haben.
-
Und möglicherweise
weil sie nur von den Maori bekommen,
-
die sich bereit erklärt haben,
dieses Zeug zu machen,
-
wenn es eine Garantie gibt,
dass keine dieser Informationen
-
für kommerzielle Zwecke verwendet wird.
-
Das ist also eine
der frustrierenden Aspekte der Aufgabe,
-
mit dieser Art von Einschränkungen
zurechtzukommen.
-
Das sind also die drei Dinge,
die ich Ihnen vorstellen wollte,
-
um eine Diskussion in Gang zu bringen.
-
Einfügen einer ganzen Art in Wikidata.
-
Wie man tatsächlich die Vorstellung
des Kurators einer Kunstgalerie
-
über den Wert von Wikidata ändert.
-
Und was wir machen,
wenn wir eine vollständige Ontologie
-
in einer anderen Sprache sehen,
-
die leider mit einer restriktiven
Creative-Commons-Lizenz versehen wurde.
-
Ich danke Ihnen.
-
(Beifall)
-
Hallo. Mein Name ist Joachim Neubert.
-
Ich arbeite für die ZBW,
-
das bedeutet Informationszentrum
für Wirtschaft in Hamburg,
-
als wissenschaftlicher
Software-Entwickler.
-
Und eine meiner Aufgaben im letzten Jahr
-
war eine Datenspende
an Wikidata vorzubereiten
-
und ich möchte über
unsere ersten Erfahrungen
-
der Spende von Metadaten
-
aus den Pressearchiven
des 20. Jahrhunderts berichten.
-
Nach unserem besten Wissen,
-
ist dies das größte öffentliche
Pressearchiv der Welt.
-
Es wurde zwischen
1908 und 2005 gesammelt,
-
aus mehr als 1500 Zeitungen
und Zeitschriften aus Deutschland,
-
aber auch international.
-
Und es deckt alles ab,
-
was für Hamburg von Interesse sein könnte,
-
Hamburger Geschäftsleute
-
die über die Welt expandieren wollten.
-
Wie Sie sehen können,
-
wurde dieses Material
aus Zeitungen ausgeschnitten
-
und zu Papier gebracht,
-
und dann in Ordnern gesammelt.
-
Hier sehen Sie eine kleine Ecke
des Personenarchivs,
-
und ähnlich wurden Informationen
über Unternehmen gesammelt,
-
zu allgemeinen Themen, über Waren,
-
über alles, was interessant sein könnte.
-
Diese Ordner sind
-
bis etwa 1949 gescannt worden
-
durch das von der DFG geförderte Projekt
in den Jahren 2004 bis 2007.
-
Ergebnis bisher sind 25.000
thematische Dossiers
-
aus dieser Zeit.
-
Dies enthielt etwa 2 Millionen,
oder mehr als 2 Millionen Seiten.
-
Und diese sind online.
-
Diese Anwendung wurde
seinerzeit von der ZBW entwickelt,
-
die jetzt etwas veraltet aussieht,
-
nicht so hübsch, eher problematisch.
-
Es handelt sich um eine Anwendung,
die auf Oracle-Architektur gebaut wurde,
-
es wurde mit ColdFusion gebaut,
es läuft auf Windows-Servern,
-
also ist es auf lange Sicht
nicht sehr nachhaltig.
-
Und wir haben diskutiert, sollten wir dies
-
auf eine hübschere, verknüpfte
Datenanwendung migrieren,
-
oder sollten wir
einen radikalen Schritt machen
-
und all diese Daten
in die Öffentlichkeit bringen.
-
Wir haben diesen Daten
eine CC0-Lizenz zugewiesen.
-
Und derzeit bewegen wir einige Haupt –
-
Zugriffsschichten zur
Haupt-Entdeckungsschicht –
-
es ist also eine binäre Zugriffsschicht
-
in das offene, verlinkte Datennetz,
-
wo es tatsächlich am sinnvollsten ist,
-
um einige Metadaten
in Wikidata einzufügen,
-
und um sicherzustellen, dass alle Ordner
-
der Sammlungen mit Wikidata verlinkt sind,
-
damit sie auffindbar sind,
-
und dass alle Metadaten über diese Ordner
-
auch in Wikidata übertragen werden.
-
Es kann also dort verwendet werden,
-
und es kann dort möglicherweise
erweitert werden.
-
Diese Daten können korrigiert werden.
-
Aber es wird immer noch
von der ZBW unterhalten,
-
was die Speicherung der Bilder angeht
-
die wir in keiner Weise freigeben können,
-
oder wir können keine
Lizenz dafür erteilen
-
weil diese im Besitz
der ursprünglichen Schöpfer sind.
-
Aber wir sorgen dafür,
-
dass sie durch einige, wiederum,
als Metadaten-Dateien
-
über DFG-Viewer zugänglich sind
-
und in der Zukunft durch IIIF-Manifeste.
-
Und wir werden
einige statische Zielseiten vorbereiten,
-
die als Daten-Referenzpunkte
für Wikidata dienen werden,
-
als auch die Bereitstellung von Daten,
-
die nicht gut in Wikidata passen.
-
Für uns geht es um die Migration
und Datenspende an Wikidata
-
mit unserer
maßgeschneiderten Infrastruktur
-
des SPARQL-Endpunkts mit diesen Daten,
-
und wir haben im Grunde genommen
verbundene Abfragen verwendet
-
zwischen diesem Endpunkt
und dem Wikidata-Abfragedienst,
-
um entsprechende Aussagen zu erstellen
-
durch Verkettung
-
in SPARQL-Abfragen selbst,
oder über ein Skript transformiert,
-
das auch Referenzen
für die Aussagen generiert.
-
Und dann in QuickStatements,
auch Code, um diesen online zu verwenden.
-
Also, das ist, was wir erhalten.
-
Es sind nicht nur einfache Dinge
wie zum Beispiel Geburtsdaten,
-
aber, tut mir leid –
-
aber auch komplexe Aussagen
-
über bereits vorhandene Gegenstände,
-
wie diese Person war
ein Vorstandsmitglied der genannten Firma
-
während dieser Zeitspanne,
-
und referenziert...
-
zur Verwendung
-
im wissenschaftlichen Kontext.
-
Der erste Teil dieser Datenspende
ist beendet.
-
Das Personen-Archiv
ist vollständig mit Wikidata verknüpft.
-
Und es fügt auch eine Menge Informationen
-
vielen Dingen hinzu,
die schon vorhanden waren,
-
aber keine externen Referenzen hatten.
-
Und wir hatten mehr als 6000 Angaben,
-
die jetzt in den Metadaten
des Pressearchivs vorhanden sind.
-
Nun, das war der einfachste Teil,
-
weil Personen leicht in Wikidata
identifizierbar sind.
-
Mehr als 90 Prozent existierten bereits,
-
damit konnten wir
eine Verbindung herstellen.
-
Wir haben für die Fehlenden
etwa 100 Artikel erstellt,
-
Aber jetzt arbeiten wir
-
am Rest des Archivs,
-
insbesondere am Themen-Archiv.
-
Das bedeutet, ein historisches System
zur Wissensorganisation
-
über die ganze Welt zu mappen,
-
materialisiert als Zeitungsausschnitte
in Wikidata.
-
Um Ihnen eine grundlegende Vorstellung
zu geben, das Länder- und Themen-Archiv
-
ist nach einer Hierarchie von Ländern
-
und anderen geographischen
Einheiten organisiert,
-
die ins Englische übersetzt wird,
was es einfacher macht.
-
Und das Deutsch ist tief verschachtelt...
-
eine tief verschachtelte Klassifizierung
der Themen.
-
Und diese Kombination definiert eine...
-
einer [unverständlich].
-
Was wir jetzt also tun wollen, ist,
-
die Daten strukturell an Wikidata
anzupassen und einzubringen.
-
Und ich möchte Sie einladen,
-
sich dieser wirklich schönen
Herausforderung
-
in Bezug auf die Wissensorganisation
anzuschließen.
-
Es gibt ein WikiProjekt,
wo diese Arbeit verfolgt wird,
-
und Sie können dies verfolgen
oder sich daran beteiligen.
-
Und, ja, vielen Dank.
-
(Beifall)
-
(Beat) Also, wir bringen
die darstellenden Künste zu Wikidata.
-
Und wir bringen die darstellenden Künste
in die verknüpfte offene Datenwolke,
-
durch den Aufbau eines verknüpften
offenen Daten-Ökosystems
-
für die darstellenden Künste.
-
Und die Frage,
die ich zu beantworten versuche,
-
und ich hoffe, dass Sie mir
bei der Beantwortung der Fragen
-
helfen werden, auf welchem Ort
in Wikidata und all das ist.
-
Aber lassen Sie mich zuerst
mit meinen Erfahrungen beginnen,
-
die ich dieses Jahr gemacht habe,
-
in der ersten Jahreshälfte,
als ich das Vergnügen hatte
-
mit CAPACOA zu arbeiten,
-
das ist die Canadian Arts
Presenting Association,
-
die tatsächlich ein Projekt namens
Linked Digital Future Initiative
-
gestartet hat, um tatsächlich
den gesamten Kunstsektor in Kanada,
-
in verknüpften offenen Daten zu erfassen.
-
Und sie taten dies
aufgrund der Beobachtung,
-
dass in den letzten fünf Jahren,
-
das immens wichtige Thema
innerhalb der darstellenden Künste
-
die Tatsache war, dass die Metadaten
-
nicht in ausreichender Qualität vorhanden
-
und nicht interoperabel
miteinander verbunden waren.
-
Und das war der Grund
warum einige der Aufführungen,
-
einige der Ereignisse nicht so gut
-
durch Google und durch persönliche
computergestützte Assistenten
-
und so weiter
auffindbar waren.
-
Also, die Vision,
die wir gemeinsam entwickelten,
-
war, dass wir eine Wissensbasis
-
für viele Beteiligte
gleichzeitig haben wollten.
-
Wir haben uns also das gesamte Netzwerk
für die darstellenden Künste angeschaut,
-
haben dort die wichtigsten
Interessenvertreter identifiziert,
-
haben uns die Nutzungsszenarien angesehen,
die wir gerne verfolgen würden,
-
und wir haben irgendwie
in einer gesamten Architektur
-
einer solchen Wissensbasis abgebildet,
oder den verschiedenen Plattformen dort,
-
was natürlich
eine verteilte Architektur ist,
-
und nicht ein großer Monolith.
-
Ich werde das einfach
relativ schnell durchgehen,
-
denn wir haben jeweils
nur zehn Minuten Zeit.
-
Aber ich denke, wir werden heute
Abend oder morgen viel Zeit haben,
-
das zu vertiefen, falls jemand
an den Details interessiert ist.
-
Wir begannen also mit
dem Performing Arts Value Network,
-
das, interessanterweise,
erst letztes Jahr veröffentlicht wurde.
-
Wir haben also das Glück,
dass wir in der Lage sind
-
auf der bisherigen Arbeit aufzubauen,
-
man hat die primäre Wertschöpfungskette
der darstellenden Künste in der Mitte,
-
und verschiedene Interessengruppen
in diesem Bereich.
-
Alles in allem haben wir
20 Interessengruppen identifiziert,
-
die wir dann irgendwie
auf sieben größere Kategorien
-
für jede der Interessengruppen
reduziert haben.
-
Wir haben irgendwie formuliert,
welche Art von Bedürfnissen
-
welche Bedürfnisse sie
in einer solchen Infrastruktur hätten,
-
und was sie erreichen könnten,
wenn das Ganze miteinander verbunden wäre
-
und die Daten öffentlich zugänglich wären.
-
Und so können Sie die Typen hier sehen,
-
die verschiedenen Typen sind Produktion,
dann Präsentation & Werbung,
-
Erfassung und Wiederverwendung,
Live-Publikum,
-
Online-Gebrauch, Erbe,
-
Forschung & Bildung.
-
Und nachdem wir
eine Art großen Tisch aufgestellt hatten,
-
von dem Sie nur
den ersten Teil hier sehen können,
-
haben wir irgendwie verglichen,
einen Blick darauf geworfen,
-
welche Art von Daten
tatsächlich flächendeckend
-
von allen verschiedenen Interessengruppen
eingesetzt wurden.
-
Und es gibt eine ziemlich
große gemeinsame Datenbasis,
-
und das ist wirklich der Bereich,
-
wo es eigentlich sehr sinnvoll ist,
diese zu integrieren und zu behalten,
-
um die Daten gemeinsam zu pflegen.
-
Wenn wir also über
Plattform-Architektur reden
-
können Sie sehen, dass wir
hier vier Schichten haben.
-
Unten zeigt die Datenschicht an.
-
Natürlich spielt Wikidata
dabei eine Rolle,
-
aber auch viele andere Datenbanken,
verteilte Datenbanken,
-
die Daten durch SPARQL-Endpunkte
freigeben können.
-
Der gelbe Teil in der Mitte,
das ist die semantische Ebene.
-
Es ist unsere gemeinsame Sprache,
um unsere Dinge zu beschreiben,
-
Aussagen über Dinge zu machen
rund um die darstellenden Künste,
-
die Ontologie.
-
Dann haben wir eine Anwendungsschicht,
-
die aus verschiedenen Modulen besteht,
zum Beispiel die Datenanalyse,
-
Datenextraktion – also, wie man
tatsächlich unstrukturierte Daten
-
in strukturierte Daten wandeln kann,
-
wie wir das durch Werkzeuge
unterstützen können.
-
Dann gibt es natürlich
eine Visualisierung der Daten –
-
also wenn es große Datenmengen gibt,
-
möchte man diese
auf irgendeine Weise visualisieren.
-
Und oben haben Sie
die Präsentationsschicht,
-
womit die normalen Leute tatsächlich
-
auf täglicher Basis mit interagieren –
-
Suchmaschinen, Enzyklopädien,
kulturelle Agendas,
-
und eine Vielzahl
anderer Dienstleistungen.
-
Wir fangen nicht bei Null an.
-
Einige Arbeiten sind bereits
in diesem Bereich geleistet worden.
-
Ich möchte nur einige Beispiele
aus einem Projekt nennen,
-
an denen ich beteiligt war.
-
Es gibt auch einige andere Dinge.
-
Und so begann ich in diesem Bereich
-
mit dem Schweizer Archiv
der darstellenden Künste.
-
Bis zum Aufbau einer Schweizer
Datenbank für darstellende Künste,
-
haben wir die Ontologie
der darstellenden Künste geschaffen,
-
die derzeit in der RDF implementiert wird.
-
Und da haben wir eine Datenbank
mit etwa 60, 70 Jahren
-
Aufführungsgeschichte in der Schweiz.
-
Das ist also etwas,
worauf man aufbauen kann,
-
und das ist etwas,
das in RDF umgewandelt wird.
-
Und es gab eine Builder-Plattform,
-
wo auf diese Daten
zugegriffen werden kann.
-
Dann haben wir mehrere Einspielungen
in Wikidata gemacht,
-
teilweise aus der Schweiz,
-
teilweise auch von
den Institute der darstellende Künste,
-
wo zum Beispiel Bart Magnus
auch daran beteiligt war.
-
Er war die treibende Kraft dahinter.
-
Es gibt auch Material
aus Wikimedia Commons,
-
aber nicht sehr gut vernetzt
mit all unseren übrigen Metadaten.
-
Und natürlich, während der Einspielung,
-
haben wir auch irgendwie begonnen,
Teile dieses Restate-Modells
-
in Wikidata zu stellen.
-
Dann ist einer der kanadischen
Implementierungspartner
-
Culture Creates.
-
Sie betreiben eine Plattform,
-
die tatsächlich Informationen
von Theater-Websites ausliest,
-
und sie in einen Wissensgraphen eingeben,
-
um sie dann den Suchmaschinen
und andere Suchgeräten auszusetzen.
-
Und auch hier hatten wir irgendwie dies
-
in der Ontologie umzusetzen
und zu erweitern.
-
Und wie Sie auf der Folie sehen können,
gibt es so viele leere Räume,
-
aber es gibt auch Überschneidungen,
-
und eine wichtige Überschneidung,
ist offensichtlich die gemeinsame Sprache,
-
die uns dabei helfen wird,
die verschiedenen Datensätze zu Verlinken.
-
Was natürlich auch wichtig ist,
-
ist, dass wir die gleichen Basisregister
und Autoritätsdateien nutzen.
-
Und dies ist der Ort, an dem Wikidata
-
durch deren Verknüpfung
eine wichtige Rolle spielt.
-
Nun möchte ich die Empfehlungen
-
des Beratungsausschusses der
Linked Data Future Initiatives mitteilen.
-
Zumindest die beiden ersten Empfehlungen.
-
Also, für die Kanadier,
ist es jetzt absolut entscheidend
-
ihren eigenen kanadischen Wissensgraph
der darstellenden Künste zu füllen,
-
denn im Gegensatz zum Schweizer Archiv
der darstellenden Künste,
-
beginnen sie nicht
mit einer bereits vorhandenen Datenbank,
-
sondern sie erstellen von Grund auf neu.
-
Und es ist absolut wichtig,
dort Daten drin zu haben.
-
Und zweitens, wie Sie sehen können,
kommt bereits Wikidata.
-
Wikidata, durch den Beratungsausschuss,
-
wird als komplementär
zu Artsdata.ca, betrachtet,
-
diesen Wissensgraphen,
-
und deshalb sollten Anstrengungen
unternommen werden,
-
einen Beitrag an dieses Publikum mit Daten
zur darstellenden Kunst zu leisten.
-
Und genau daran werden wir
-
in den kommenden Monaten
und Jahren arbeiten,
-
und das ist auch der Grund,
warum ich bin hier auf der Suche bin,
-
um zu sehen, wer sich noch
an diesen Bemühungen beteiligen wird.
-
Also, im Moment, sagen wir,
-
dass sie sich offensichtlich
ergänzen müssen.
-
Wir müssen also
über die Plus- und Minuspunkte
-
der einzelnen Ansätze nachdenken.
-
Und hier sehen Sie einen Vergleich
-
zwischen Wikidata und
dem klassischen Linked Open Data-Ansatz.
-
Ich würde gerne darüber
weiter mit euch diskutieren,
-
wie eure Erfahrungen dort sind.
-
Aber aus meiner Sicht hat Wikidata
-
einen großen Pluspunkt, weil es sich
um eine Crowdsourcing-Plattform handelt,
-
und es ist einfach,
weitere Gruppen einzuladen,
-
um tatsächlich einen Beitrag zu leisten.
-
Auf der negativen Seite
hat man offensichtlich
-
dieses Problem des Kontrollverlustes.
-
Dateneigentümer müssen die Kontrolle
über ihre Diagramme, Datenqualität
-
und Vollständigkeit aufgeben.
-
Auf Wikidata ist es
schwieriger zu verfolgen,
-
als wenn man es
unter eigener Kontrolle hat.
-
Und die andere Stärke von Wikidata
-
ist, dass sie eine sofortige Integration
in diesen weltweiten Graphen erfordert.
-
Und man macht einfach –
-
Schritt für Schritt eine Abstimmung
gegen andere Datenbanken,
-
was einige auch als Vorteil sehen,
-
aber natürlich, wenn man nach Integration
und Interoperabilität sucht,
-
zwingt Wikidata einen dazu,
das von Anfang an zu tun.
-
Und dann natürlich ist die Harmonisierung
der Datenmodellierungspraktiken
-
in beiden Fällen ein Thema.
-
Aber es mag am Anfang den Anschein haben,
-
es wäre einfacher,
das nur in seinen eigenen Silo zu machen,
-
denn irgendwann ist man
mit der Aufgabe fertig,
-
und es wäre
eine fortlaufende Aufgabe auf Wikidata.
-
Wenn es nun darum geht, Prioritäten
für die einzuspielenden Daten zu setzen,
-
das sind irgendwie die Regeln,
nach denen ich im Moment arbeite.
-
Zunächst einmal möchten wir es einlesen,
-
wobei es unklar ist, wer die natürliche
Autorität in dem betreffenden Gebiet wäre.
-
Das sind also definitiv Daten,
die gemeinsam verwaltet werden.
-
Und wir möchten es dort einlesen,
-
wo wir sehen, dass es ein hohes Potenzial
für Crowdsourcing-Ansätze gibt.
-
Wir würden gerne Daten einlesen,
-
bei denen die Daten wahrscheinlich
-
im Zusammenhang mit Wikipedia
wiederverwendet werden.
-
Und es besteht auch die Hoffnung,
-
dass ein Teil
der internationalen Koordination,
-
um die gesamte Datenmodellierung herum,
über die Standardisierung,
-
tatsächlich direkt
auf Wikidata stattfinden könnte,
-
wenn es nicht anderswo stattfindet,
-
weil es die Menschen irgendwie zwingt,
mit der Interaktion zu starten,
-
wenn sie in die gleichen Bereiche
-
einlesen.
-
Und wir möchten uns jetzt als Nächstes
-
auf Basisregistern und
Authoritätsdateien konzentrieren,
-
weil sie uns irgendwie helfen
-
die Verknüpfungen zwischen
verschiedenen Daten
-
und unkontrollierten Vokabularien,
-
als eine Erweiterung
der bestehenden Ontologie zu erstellen.
-
Also, nur noch zwei weitere Folien.
-
Die nächsten Schritte werden sein,
dass wir die Summe aller GLAMs-Ansätze
-
zu Wiki Loves Performing Arts bringen.
-
Das heißt, wir beschreiben
Veranstaltungsorte und Organisationen,
-
und versuchen, die Daten
an Wikipedia weiterzuleiten,
-
in Form von Infoboxen
und Bubble-Templates.
-
Und das andere, die anderen Projekte,
die ich verfolgen werde,
-
ist die COST-Aktion,
die wir nächstes Jahr einreichen werden,
-
um das Linked Open Data-Ökosystem
für die darstellenden Künste herum.
-
COST ist ein europäisches Programm,
das Netzwerkaktivitäten unterstützt,
-
und die zu behandelnden Themen
sind hier aufgeführt.
-
Zwei von ihnen habe ich herausgestellt –
-
eine davon ist die Frage
einer Verbindung zwischen Wikidata
-
und den klassischen, verbundenen,
offenen Datenansätzen.
-
Und die andere, glaube ich,
ist auch sehr wichtig,
-
wo wir noch ein riesiges Potenzial haben,
-
internationale Kampagnen
zur Ergänzung der Daten
-
auf Wikidata durchzuführen.
-
So, das war's. Ich danke Ihnen
für Ihre Aufmerksamkeit.
-
Nun möchte ich meine Kollegen
einladen, hierher zu kommen.
-
Vielleicht kriegen sie auch Mikrofone.
-
Und dann würde ich gerne...
-
Ihnen die Möglichkeit geben,
Fragen zu stellen.
-
Und natürlich auch meine Kollegen fragen,
-
ob sie Fragen aneinander haben.
-
Haben wir vielleicht
eine Frage aus dem Publikum?
-
(Person 2) [unverständlich]
-
Ich möchte Sie alle fragen,
-
wo würden Sie die Grenze ziehen,
-
im Grunde genommen, wie definieren Sie –
-
wann müssen Sie
Ihre eigene Wikibase betreiben,
-
und was möchten Sie
auf Wikidata einstellen?
-
Ist dies eine klare Abgrenzung,
oder was steht hinter der Idee,
-
das hier und dorthin zu tun.
-
(Susanna) Ich kann zuerst antworten,
weil ich das Mikrofon habe.
-
Also, ich habe nachgedacht,
dass eines der Themen die Notabilität ist.
-
Ich spreche das
in einem anderen Projekt an.
-
Und ich denke, die Lizenzierung
könnte ein Thema sein,
-
weil Sie Ihre eigenen Bedingungen in
Ihrer eigenen Datenbank anwenden können,
-
und dann denke ich,
wo immer es möglich ist.
-
Und dann, das dritte ist,
es einfach als Sandbox zu haben,
-
um es für die Einspielung
in Wikidata vorzubereiten.
-
Dies sind die drei wichtigsten Dinge,
die mir jetzt einfallen,
-
aber ich könnte mir
noch weitere einfallen lassen.
-
(Mike) Für mich werden Rechte
immer ein Thema sein.
-
Wenn sich also die Nationalbibliothek
in Richtung Wikibase bewegen wollte,
-
was ihnen ermöglichen würde,
Kontrolle über Lizenzierung zu behalten,
-
für die Arbeit, die sie mit Begriffen
aus der Maori-Sprache geleistet haben.
-
Die Kakapo-Datenbank enthält nur Daten,
von denen das Department of Conservation
-
das Gefühl hat, dass man
das öffentlich machen kann,
-
aber ich vermute,
wenn sie sehen, wenn es läuft,
-
könnten sie in Versuchung geraten,
eine private Wikibase zu benutzen,
-
um ihre eigene Datenbank zu pflegen,
-
einfach wegen einiger
Visualisierungswerkzeuge,
-
die angewendet werden könnte,
-
die vielleicht besser sind,
als das Excel-Spreadsheet-System,
-
das sie derzeit nutzen.
-
(Joachim) Nun, ich denke, das hängt
sehr stark von der Art der Daten ab.
-
Wir sind natürlich mit dem Pressearchiv
in der recht glücklichen Lage,
-
dass es sich dabei um Material handelt,
das veröffentlicht wurde,
-
es wurde damals veröffentlicht,
-
aber die Veröffentlichung war teuer.
-
Das ist also ganz einfach.
-
Ich denke auch Projekte –
-
und dies ist
ein typisches Projektwerkzeug,
-
es wurde eine Zeit lang finanziert,
und dann endete die Finanzierung,
-
und was mit den Daten geschieht,
die in einem Silo eingeschlossen ist,
-
und Software, die nicht ewig laufen wird.
-
Und so macht es für mich absolut Sinn.
-
Damals war Wikidata nicht vorhanden,
aber jetzt ist es da,
-
und es macht absolut Sinn
für unser Projekt,
-
früh über Nachhaltigkeit zu diskutieren,
im Kontext von:
-
wie können wir das in ein größeres
Ökosystem wie Wikidata transferieren,
-
und dies mit der Datengemeinschaft
diskutieren,
-
was ist nennenswert und was macht Sinn,
dies zu Wikidata hinzuzufügen,
-
und was ist sinnvoll,
in proprietärer Form zu behalten.
-
Vielleicht in einer einfacheren Form,
als eine anspruchsvolle Anwendung,
-
aber es auffindbar zu machen und
mit der großen Daten-Cloud zu verknüpfen,
-
anstatt viel Geld zu investieren
-
in irgendein Silo, das keine Zukunft hat.
-
(Beat) Ja, wie ich schon sagte,
-
in dem Projekt,
das ich hier vorgestellt habe,
-
sind Dualitäten zwischen Wikidata
-
und klassischen verknüpften
offenen Datenansätze.
-
Es geht also nicht so sehr um
die Einrichtung einer privaten Wikibase.
-
Eine Herausforderung, die wir hatten,
und natürlich auch bei Wikidata,
-
ist, dass wenn wir
die eigenen Daten dort einspielen,
-
müssen wir auch etwas Haushaltung
-
von Menschen erledigen,
von anderen Menschen, eigentlich.
-
Und das könnte die Menschen abschrecken,
-
oder es bedeutet auch, dass wir uns damit
-
einfach Schritt für Schritt
befassen werden.
-
Also wird es im Moment
-
eine Datenbank in klassisch
verknüpften offenen Daten sein,
-
und wir beginnen,
sie mit Wikidata zu verknüpfen,
-
und es ist ein kontinuierlicher Prozess,
um herauszufinden,
-
für welche Bereiche die meisten Daten
-
schließlich auf Wikidata
zu finden sein werden,
-
und für welche Bereiche sie tatsächlich
auf anderen Datenbanken leben werden.
-
Offensichtlich werden
wir Herausforderungen
-
bezüglich der Synchronisation haben,
-
wie wir sie wahrscheinlich alle haben,
-
weil dieses verknüpfte Datenfeld,
-
wo wir noch verhandeln müssen,
wem wir vertrauen,
-
wer über was Autorität hat.
-
(Moderation) Andere Fragen?
-
(Person 3) Vielen Dank.
-
Also, ich stimme voll und ganz
mit dem Thema überein –
-
wo die Grenze gesetzt werden soll,
warum wir Daten auf Wikidata stellen,
-
oder warum wir sie in lokalen Datenbanken
und für welche Zwecke halten,
-
um in lokalen Datenbanken zu erstellen,
zu verwalten und zu pflegen
-
und für welche Zwecke.
-
Und ich denke, dass dies
eine große Diskussion ist,
-
die über die reine Begeisterung
hinausgeht,
-
Daten auf Wikidata zu stellen,
weil sie öffentlich ist,
-
weil es der Menschheit dient, weil –
-
während es zwei coole Werkzeuge gibt,
-
und die Dinge im wirklichen Leben
komplizierter sind, glaube ich.
-
Nun, trotzdem, es ist
eine recht interessante Diskussion.
-
Und dann ist das auch
noch ein anderes Thema,
-
oder ein anderes Problem,
das diskutiert wird
-
in diesem Fall in verschiedenen Panels.
-
Es ist auf der einen Seite,
die eigene Datenbank zu haben,
-
was auch immer die Technologie ist,
-
und Dinge auf Wikidata veröffentlichen,
-
oder sein eigenes System zu bauen,
-
zur Erstellung und Verwaltung
von Informationen
-
mit der Wikibase-Technologie.
-
Und dann, synchronisieren
oder was auch immer –.
-
Verbindungen herstellen oder Dinge tun,
-
es ist also eine Sache
der verwendeten Technologie,
-
und die Tatsache, dass Sie Wikidata
nur zur Veröffentlichung nutzen,
-
oder die Infrastruktur,
die unter Wikidata liegt,
-
um Ihre Daten zu erstellen
und zu verwalten.
-
Ich meine, wir hatten eine Diskussion
-
über das Wikibase-Panel,
-
und es wird hier
weitere Diskussionen geben,
-
aber die Dinge sind
auf verschiedenen Ebenen, glaube ich.
-
Vielleicht bekommt man
bei dieser Diskussion
-
über Wikibase oder Wikidata –
-
(Beat) Ich halte es für problematisch,
dass wir uns so sehr
-
auf dieser Wikibase-Infrastruktur
konzentrieren,
-
weil es andere Infrastrukturen gibt,
-
wie im Bereich der darstellenden Künste.
-
Wir haben noch eine weitere
ergänzende Gemeinschaft,
-
das ist MusicBrainz,
die auf ihrer eigenen Plattform laufen,
-
die verknüpfte offene Daten
zur Verfügung stellen,
-
und wie ich es verstehe,
-
gibt es Konsens innerhalb
der Wikidata-Gemeinschaft,
-
dass wir nicht alle ihre Daten
verdoppeln wollen –
-
wir werden nicht alle
ihre Daten kopieren,
-
aber wir akzeptieren,
dass sie sich ergänzen.
-
Also, was wird passieren,
-
wenn wir anfangen, diese Daten
in Wikipedia zu integrieren?
-
Infokästen, zum Beispiel.
-
Wären wir in der Lage, diese Daten direkt
von ihrem SPARQL-Endpunkt aus zu ziehen?
-
Oder wären wir verpflichtet,
alle Daten irgendwie zu kopieren,
-
und welche Art von Prozessen
sind daran beteiligt?
-
(Person 4) Die Diskussionen sind,
glaube ich, offen,
-
denn innerhalb dieser Veranstaltung,
-
haben Sie sowohl
interessierte Gemeinschaften –
-
diejenigen,
die an Wikibase interessiert sind,
-
und diejenigen,
die an Wikidata interessiert sind,
-
und diejenigen,
die an beiden interessiert sind.
-
(Beat) Ja, aber wir werden sie
nicht zwingen, zu Wikibase zu wechseln.
-
(Person 4) Nicht unbedingt.
-
(Beat) MusicBrainz läuft nicht
auf Wikibase.
-
(Person 4) Nein, ich wollte nur sagen,
dass Sie separate Probleme haben,
-
manchmal miteinander verbunden,
manchmal nicht vollständig getrennt.
-
Und ich hatte noch eine andere Frage
oder Bemerkung,
-
bezüglich der Verwaltung von Hierarchien
in kontrollierten Vokabularien,
-
wie Thesauris, wie bei Ihnen mit Finto.
-
Sie haben die Orte
-
bei den Maori,
-
Betreffzeilen.
-
Nun, Sie müssen sich mit der
hierarchischen Verwaltung
-
von Konzepten auseinandersetzen.
-
Was ist Ihre Ansicht, Ihre Meinung
-
zur Möglichkeit,
-
diese kontrollierten
Wissensorganisations-Systeme
-
in Wikidata zu verwalten?
-
(Susanna) Ich denke, in diesem Fall
der Finto- und YSO-Instanzen,
-
wird das Repository schließlich
-
eine Sammlung von mehreren Quellen sein.
-
Das ist also ohnehin im Fluss.
-
Wir müssen also nicht unbedingt –
-
Nun, ich vertrete nicht
die Nationalbibliothek,
-
sondern in diesem möglichen Projekt,
-
müssten wir nicht
mit einer existierenden –
-
oder mit einer bestehenden Struktur
kämpfen.
-
In diesem Sinne ist es also
ein offener Forschungsbereich.
-
(Mike) Die Maori-Themenbereiche scheinen,
-
sich ideal für die
Wikidata-Struktur zu eignen.
-
Aber die Lizenzierung
verbietet das natürlich.
-
Ich vermute,
wenn die Lizenzierung anders wäre,
-
und sie in Wikidata aufgenommen würden,
-
sobald jemand entscheidet hat,
dass ihm die Hierarchie nicht gefällt,
-
und anfängt, Dinge zu ändern,
-
würde es einen sofortigen Aufschrei
bei den Menschen geben,
-
die sehr hart daran gearbeitet haben,
diese Struktur zu schaffen
-
und die Genehmigung
von verschiedenen Maori zu erhalten,
-
was die aktuelle Hierarchie war.
-
Das ist also ein Problem,
das es zu lösen gilt.
-
(Joachim) Ich denke,
Wissenorganisationssystemen
-
sind alle unterschiedlich.
-
Und ich bin mir nicht sicher,
ob es eine gute Idee wäre,
-
verschiedene Hierarchien
in Wikidata als solche zu repräsentieren,
-
aber es macht vielleicht Sinn, über
Überlagerungen der Daten nachzudenken,
-
also, um Mappings
auf der Inhaltsebene zu machen.
-
Zum Beispiel, wie die ZBW-Partnerschaft
Thesaurus für Wirtschaftswissenschaften.
-
Und dieser Thesaurus
setzt seine eigene Hierarchie,
-
und natürlich wäre es möglich,
-
die Hierarchie dieses Thesaurus
in Wikidata-Konzepte umzusetzen,
-
ohne tatsächlich diese Art von Struktur
-
als alternative Struktur
innerhalb von Wikidata zu speichern,
-
was eine Menge Verwirrung stiften würde.
-
Aber ich denke, wir sollten uns Wikidata
auch als Pool von Konzepten vorstellen,
-
die schichtweise mit Layern verbunden
werden können, die sich draußen befinden,
-
und die eine andere Sicht
der Welt vermitteln,
-
die nicht unbedingt
die innerhalb von Wikidata ist.
-
(Moderation) In Ordnung.
Einige andere Fragen?
-
Andernfalls... Okay.
-
(Person 5) Joachim, ich wollte nur
diesen letzten Punkt weiterverfolgen.
-
Also, diese Schichten,
wie Sie sich das vorstellen,
-
würden sie extern gepflegt werden
-
und irgendwie mit Wikidata
von der Wikidata-Seite integriert
-
oder haben Sie etwas weiter gedacht,
-
wie das gehandhabt werden könnte?
-
(Joachim) Eigentlich, nein,
ich habe keine –
-
ich habe Experimente
mit der ZBW und Wikidata gemacht.
-
Ich war [unverständlich]
hier bei Wikidata.
-
Aber ich denke, das ist
eine ganz neue komplexe Sache,
-
und es gilt zu diskutieren,
-
um eine gemeinsame Grundlage zu finden,
-
um solche Dinge zu tun,
-
aber dass man herausfinden muss.
-
(Beat) Noch eine weitere?
-
(Person 6) Ah, großartig.
-
Ich habe eine Frage zum Kakapo-Projekt.
-
(Beat) Mhm-hm.
-
(Person 6) Okay. Also,
haben Sie Rückmeldung
-
seitens der Wikidata-Gemeinschaft
bekommen,
-
einzelne Tiere
aus diesen Artikeln zu ziehen?
-
(Mike) Bislang nicht.
-
(Person 6) Hat jemand
schon mal davon gehört?
-
Ist es "nicht so weit",
weil niemand bisher davon gehört hat?
-
(Mike) Es gibt seit geraumer Zeit
eine kleine Diskussion –
-
interessierter Personen
an dieser Art von Dingen in Wikidata,
-
und wir alle scheinen zu denken,
dass es eine natürliche Erweiterung ist,
-
einzelne Wikidata-Elemente wie bei
einem berühmten Rennpferd zu erhalten
-
oder die Katze von jemandem,
das ist ziemlich gut modelliert.
-
Ich schätze, das Wagnis ist,
die gesamte Art dort hineinzubringen.
-
Aber ich denke,
es ist vollkommen überschaubar.
-
(Person 6) Versuchen Sie es
nicht mit Katzen und Ziegen.
-
(Gelächter)
-
(Moderation) Okay.
Ich denke, die Zeit ist um.
-
Vielen Dank, dass Sie teilgenommen haben,
-
Ich denke, es gibt noch Zeit
für Fragen in der Pause.
-
Und viel Spaß.
-
(Beat) Vielen Dank.
-
(Beifall)