(Beat) Guten Tag, allerseits.
Willkommen zu unserem GLAM-Panel.
Bevor wir beginnen, muss ich nur
zwei Ankündigungen zu machen.
Bitte nutzen Sie zunächst einmal ausgiebig
unsere Etherpads, um Notizen zu machen.
Und die zweite ist an unser Publikum
zu Hause gerichtet
oder wo auch immer Sie sind.
Wenn Sie Fragen haben,
können Sie das auch
in das Etherpad schreiben,
und unsere Engel im Raum
werden das im Auge behalten.
Also haben wir beschlossen,
dass für das diesjährige Panel,
nachdem ich alle eingereichten Beiträge
gesehen habe,
werden wir uns auf die Rolle von Wikidata
innerhalb von Daten-Ökosystemen
konzentrieren,
die über die eigentlichen
Wikimedia-Projekte hinausgehen,
was auch absolut im Einklang
mit der neuen Strategie
der Wikimedia-Stiftung ist.
Und wir haben heute vier
Diskussionsteilnehmer.
Drei plus eins.
Deshalb möchte ich Sie
auf die Bühne bitten,
damit wir Sie vorstellen können.
(Schrittgeräusche)
Wir haben also Susanna Ånäs.
Sie ist seit langem
eine Aktivistin für freies Wissen
und ist an vielen
Wiki-Projekten beteiligt.
Und sie wird heute berichten
über das Projekt in Zusammenarbeit
mit der finnischen Nationalbibliothek.
Dann haben wir neben mir Mike Dickison,
der in der Reihenfolge
an zweiter Stelle steht.
Er ist ein Museumskurator aus Neuseeland.
Er ist Zoologe und
Redakteur bei Wikipedia.
Und er war Neuseelands erster
Wikipedian-At-Large
in den Jahren 2018 und 2019.
Und er wird uns über seine Erfahrungen
in dieser Rolle erzählen,
und was bei Wikidata zu arbeiten
in diesem Kontext bedeutet.
Dann haben wir Joachim Neubert
vom Leibniz-Informationszentrum
für Wirtschaftswissenschaften
in Kiel und Hamburg.
Er hat daran gearbeitet, die größten
öffentlichen Pressearchive weltweit
für die Öffentlichkeit zugänglicher
zu machen, und er nutzt dazu Wikidata.
Und dann komme ich als Letzter.
Mein Name ist Beat Estermann.
Ich arbeite an der Berner Fachhochschule,
in der Schweiz.
Und ich bin ein langjähriger Förderer
des OpenGLAM in der Schweiz und anderswo.
Und ich werde heute über
meine Aktivitäten berichten
im Zusammenhang mit dem Auftrag
der Canadian Arts Presenting Association
mit Schwerpunkt auf darstellende Künsten.
Nicht in erster Linie bei Wikidata,
aber Sie werden sehen, Wikidata
fängt auch dort an, eine Rolle zu spielen.
Die meisten von uns werden jetzt
also hier ihren Platz einnehmen,
und ich erteile Susanna das Wort.
Okay. Also, hallo.
Mein Name ist Susanna Ånäs,
und ich arbeite Teilzeit
für Wikimedia Finnland
als GLAM-Koordinator,
und ich berate auch
in der offenen Wissenssphäre.
Und bei diesem Diskurs
geht es eher um das Letztere.
Ich war also an den Arbeiten beteiligt
der geographischen Datengruppe der –
Nun, ich habe es nachgeschlagen,
aber es ist nicht auf Englisch,
aber die Kulturerbe-Initiative
der finnischen Regierung.
Hier geht es also um Ortsnamen
und wie sie repräsentiert werden
in verschiedenen Repositories
im GLAM-Sektor in Finnland,
und wie sie versuchen,
diese verschiedenen Quellen zu verbinden
und wie sie durch Modellierung in
Wikidata und anderswo dargestellt werden.
Hier sehen wir also die drei Hauptquellen
für diese YSO-Stellen,
die Teil der nationalen Ontologie ist –
allgemeine Ontologie.
Die AHAA ist für finnische Archive,
Melinda ist für finnische Bibliotheken,
und KOOKOS ist für finnische Museen.
Es gibt also auch drei
Inhaltsverwaltungssysteme,
die an diesen YSO-Stellen zusammenkommen.
Und es findet bereits
sowohl ein Austausch mit Wikidata statt,
als auch mit dem Namensprojekt
der nationalen Landvermessung.
Und dann gibt es noch ein drittes Projekt,
das finnische Namensarchiv,
das noch nicht dazu beiträgt,
aber es gibt schon Pläne dafür.
Eine der wichtigsten
Fragen der Modellierung
ist also dieser ganze Problembereich,
dass es drei Typen von Elementen
bei Ortsnamen in diesem Projekt gibt.
Einer davon ist der Ort,
derjenige, der einen Standort hat.
Und einer davon ist der Ortsname,
das Toponym, zum Beispiel.
Und dann gibt es Dokumenten-Quellen,
aus denen diese beiden
abgeleitet werden können,
oder Ähnliches zur Absicherung.
Das YSO setzt – hier, oben rechts,
sehen Sie wieder das gleiche Diagramm.
Es konzentriert sich
hauptsächlich auf die Orte.
Der Betreuer ist
die finnische Nationalbibliothek
und das Finto-Projekt.
Es gibt jetzt mehr als 7000 Orte
in Finnisch und Schwedisch
und über 3000 auf Englisch,
und sie sind CC0 lizenziert.
Hier sehen Sie also Finto-Dienst.
Und einen Ort –
ich habe Sevettijärvi gewählt.
Es ist jetzt auch verwandt
mit unserem Sprachprojekt
mit den Skolt Sámi –
dies ist ein Ort
im äußersten Norden Finnlands,
bewohnt von Skolt Sámi.
Hier sehen Sie also den Ort,
der zu den –
Nun, Sie werden die Daten
zu diesem Ort sehen.
Sie können sehen, dass es
mit einem Wikidata verbunden ist,
als auch diese Daten
der Nationalen Landvermessung.
Da haben wir's. Und Sie werden
dies noch detaillierter sehen.
Es ist auch hierarchisch
innerhalb dieses Repositorys angeordnet.
Nun, eigentlich,
der eigentliche Ort ist nicht zu sehen,
aber er befindet sich
unterhalb dieser Gemeinde,
sowie die Region,
und Finnland als Land,
und die nordischen Länder,
die Großregion.
Hier können Sie sehen,
dass viele von diesen
zuvor mit Wikidata
mit Mix'n'Match abgestimmt wurden
und es sind immer noch welche übrig.
Aber die Anzahl der Namen
ist nicht so hoch.
Es sind nur weniger als 5000.
Dann gibt es also dieses andere Repository
von dem finnischen Geospatial
Plattform-Projekt –
Ortsnamenskarten.
Dies sind alle Ortsnamen,
die auf finnischen Karten zu finden sind.
Und sie haben die verknüpften Daten,
die mit CC BY 4.0 lizenziert ist.
800.000 Kartenbeschriftungen
in finnischer und schwedischer Sprache,
und alle drei Saami-Sprachen,
die es in Finnland gibt.
Und diese haben
zwei verschiedene Arten von Entitäten.
Die anderen sind Orte, und die anderen
sind Ortsnamen, Toponyme.
Und sie haben beide persistente URIs.
Hier ist zum Beispiel
das selbe Sevettijärvi,
einmal in finnischer Sprache,
und dann in den drei Saami-Sprachen,
sowie die geographischen Daten,
und dann gibt es noch mehr Informationen,
wie den Ortstyp et cetera.
Hier ist die Karte für den Ortsnamen,
das Toponym, das eine eigene URI hat.
Tut mir leid, es wurde scheinbar
nicht in die englische Liste übersetzt.
Also, Mehrsprachigkeit
deckt nicht das gesamte Projekt ab.
Okay, wir kommen
zum finnischen Namensarchiv.
Dies ist ein Projekt des Instituts
für die Sprachen Finnlands,
und diese repräsentieren nicht die Orte,
nicht die Ortsnamen,
aber sie sind eigentlich
Quellen für diese.
Das sind also drei Millionen
Feldnotizen von Ortsnamen,
und es ist ein Wikibase-Projekt.
Sie befinden sich in einer Wikibase,
hauptsächlich auf Finnisch,
einiges auf Schwedisch.
Eine herausragende
Sammlung von Saami-Namen,
die uns sehr interessieren.
Und sie haben die Lizenz CC BY.
Und das ist aus der Sicht von Wikidata
auch eine Herausforderung.
Aber wenn es eine lokale
finnische Wikibase gäbe,
könnten wir vielleicht mit ihnen
in diesem Projekt zusammenarbeiten.
Hier ist also ein Screenshot davon,
der zeigt, dass es Informationen gibt
über den Ort, die Karten –
die alten Karten, die die Sammler
am Anfang verwenden,
und die Karte, die sie anhand der
von ihnen gesammelten
Informationen erstellen.
Also, hier ist eine dieser Karten
aufgeschlüsselt nach Daten,
die in ihnen enthalten ist.
Dann haben sie also
dieses verknüpfte Datenprojekt
das Helsinki Digital Humanities Lab
und Semantic Computers übermittelt.
Die Computergruppe
der Aalto Universität –
und zusammen mit diesem Institut
der Sprachen Finnlands –
Der Name ist Sampo.
Und dies ist eine aggregierte
Schnittstelle zur Forschung
nach mehreren Ortsnamensquellen.
Hier können Sie sehen,
dass viele der Quellen
sich dort außen
auf der linken Seite befinden,
und dann können Sie
verschiedene Arten von Visualisierungen
basierend auf diesen Daten erstellen.
Und... ja.
Also, ich habe diese Idee
der Modellierung
einer lokalen Wikibase eingebracht,
damit wir mit diesen Daten
etwas anfangen könnten.
Aber wenn wir
diese Modellierungsfehlern angehen,
wie modellieren wir?
Es gibt verschiedene Möglichkeiten,
unterschiedliche Traditionen
in jedem dieser Bereiche.
So... ja.
Und das Gute daran ist,
dass es auch Minderheitensprachen
mit sehr geringem Aufwand dienen könnte.
Okay. Also, hier haben wir
die beiden grundlegenden Optionen:
das SAPO-Modell,
die finnische Raum-Zeit-Ontologie,
und das Wikidata-Modell.
Hier können Sie sehen,
dass Wikidata-Einträge dazu neigen,
sich zu verlangsamen.
Im Idealfall bleiben sie gleich
mit den sich ändernden Eigenschaften.
Wohingegen im SAPO-Modell
diese Einträge neu erstellt werden,
wenn es eine Änderung
gibt, wie zum Beispiel
eine Gebiets- und Namensänderung.
Kommen wir also zurück
zu dieser Unterteilung
zwischen diesen drei verschiedenen
Dimensionen von Orten, Ortsnamen.
Sollen diese Ortsnamen
also Entitäten oder Eigenschaften sein?
Wikidata verwendet Eigenschaften,
während das Landvermessungs-Projekt
Entitäten nutzt.
Oder sollten wir sie zu Lexemen machen?
Wikidata hat sich entschieden
mit Eigenschaften zu arbeiten,
textuelle Eigenschaften
für Ortsnamen über Lexeme.
Es tut mir leid, andersherum.
Also, die Namen sind...
Eigenschaften, nicht Lexeme.
Richtig.
Und das Problem der Wikibase
ist vielleicht der Mangel
an geographischen Formen in diesem –
in der Grundausstattung des Programms,
also müsste man den Stack
mehr Technologie hinzufügen,
um lokale geographische Formen
verwenden zu können.
Und eine Verbindung
ist wirklich notwendig,
um die Vorteile des Wikidata-Korpus
nutzen zu können.
Also, ich bin schon am Ende. Vielen Dank.
(Beifall)
(Schrittgeräusche)
Okay.
(spricht auf Maori)
Herzlich willkommen.
Mein Name ist Mike Dickison.
Und für eine Jahr
war ich Neuseelands Wikipedian-At-Large.
Sie fragen sich vielleicht
was ein Wikipedian-At-Large ist.
Denn wenn man tatsächlich darauf achtet,
gibt es so was nicht, wie wir sehen.
Es ist ein Begriff, den ich
in einem Zuschussantrag erfunden habe,
was der Stiftung sehr zu gefallen schien.
Und so haben wir damit weiter gemacht.
Also habe ich ein Jahr lang
35 verschiedene Institutionen,
Residenten besucht
und in den meisten von ihnen
Trainingseinheiten durchlaufen lassen,
öffentliche Veranstaltungen
organisiert und versucht,
eine Wikimedia-Strategie
für jeden einzelnen zu entwickeln.
Es war eine sehr interessante Erfahrung,
und man trifft auf eine breite Palette
von verschiedenen Projekten und Personen.
Und ich wollte über einige
verschiedene Projekte reden,
die sich mit Wikidata beschäftigten
auf interessante oder
vielleicht einleuchtende Art,
die nützlich sein könnten,
darüber zu diskutieren.
Das Projekt war ursprünglich
ein Wikipedia-Projekt mit diesem Namen,
einfach weil es das war,
mit dem die Leute vertraut waren,
und so organisierten wir
mehrere verschiedene Ereignisse
bei sehr traditionellen Edit-a-thons,
die Arbeit mit den geschlechtsspezifischen
Unterschieden und so weiter.
Und eine Menge, die Sie sehen
können, [unverständlich],
und eine Reihe von sehr erfolgreichen
neuen Redakteuren eingestellt,
und so weiter.
Wir haben Massen-Uploads
in Commons durchgeführt.
In diesem Fall gab es eine Sammlung
von über 1000 Original-Kunstwerken
von einem entomologischen Illustrator,
Des Helmore,
die auf einer Festplatte lagen,
weil zehn Jahre lang die Forschung fehlte
und wir waren in der Lage, diese
alle unter der CC BY-Lizenz freizugeben.
Also, einfache Erfolge,
die man den Leuten zeigen kann.
Jeder versteht viele Bilder von Käfern.
Jeder kann Workshops verstehen,
die sich der Beseitigung
geschlechtsspezifischer
Unterschiede widmet.
Aber Wikidata ist viel schwieriger
den Menschen im GLAM-Sektor zu verkaufen
oder irgendjemand außerhalb
unserer besonderen Bewegung.
So begann ich zu erkennen,
dass Wikidata
eine größere und wichtigere Rolle
für das Wikipedian-At-Large-Projekt
spielen sollte.
Im Laufe der Zeit wurde es also
eine immer größere Komponente
dessen, was ich tat.
Und ich begann, mir selbst auch
mehr über Wikidata beizubringen,
weil ich anfing zu sehen,
wie wichtig es war.
Also, dieses eine Projekt –
der Kakapo ist ein eingeborener
neuseeländischer, flugunfähiger Papagei.
Wir arbeiteten mit
dem Department of Conservation,
dessen Aufgabe ist,
diese Art vor dem Aussterben zu retten,
und ich habe vorgeschlagen,
"Was wäre, wenn wir alle
einzelnen Kakapo in Wikidata stellen"?
Und es mag lächerlich erscheinen,
aber es ist tatsächlich
ein perfekt durchführbares Projekt.
Einige von ihnen sind bereits dort drin.
Eine wichtige Sache ist,
dass es nicht viele Kakapos gibt.
Es ist also eine überschaubare Aufgabe.
Es waren 148, als ich anfing,
und dann starb einer.
Und sie haben gerade
eine große Zuchtsaison bis 213.
Das ist großartig.
Das sind die meisten Kakapo
seit über 50 Jahren.
Das war also auch eine große Sache.
Das war jeden Tag
in Neuseeland in den Nachrichten.
[unverständlich]
- (Person 1) In der New York Times.
- (Mike) Tatsächlich? Oh, wie schön.
Ja, das waren nationale Nachrichten.
Jeder mag diese Vögel.
Aber etwas Interessantes an ihnen
ist, weil im Gegensatz zu Arten,
die zahlreicher sind,
wird einzelne Kakapo benannt,
hat einen eindeutigen Namen
und eine eindeutige ID-Nummer,
und hat oft gute biographische Daten
darüber, wo und wann sie geboren sind,
geschlüpft sind,
wer ihr Vater und Mutter war,
wann sie starben, wenn sie starben.
Es gibt also tatsächlich eine Datenbank
des Ministeriums für Naturschutz
mit all diesen Informationen.
Und einer der berühmtesten Kakapos
ist natürlich Sirocco,
wie Sie sehen können, ist er nach
einem Wind benannt, wurde dort geboren.
Sirocco hat einen Twitter-Account,
mit dem Wikidata einige Probleme hatte,
denn anscheinend können sie
einfach keine Twitter-Accounts haben.
Davon wusste ich nichts.
Er ist sogar auf einem Albumcover
und so weiter.
Es gibt also mehrere Eigenschaften
bei diesem wahrscheinlich
berühmtesten einzelnen Kakapo.
Also habe ich dem Department
of Conservation vorgeschlagen,
"Warum versuchen wir nicht,
dies für jeden einzelnen zu tun?"
Und so mussten sie darüber nachdenken,
wie viel von den biographischen Daten
veröffentlicht werden könnten.
Und sie stellen eine kurze Liste auf.
Und jetzt haben wir, glaube ich,
212, 210 – ich glaube,
ein Paar ist gestorben –
lebende Kakapo,
die jetzt alle Kandidaten sind.
Und sie bekommen nur einen Namen,
wenn sie flügge werden.
Solange sie noch Babys sind,
erhalten sie bis dahin eine Codenummer.
Also, wenn sie ausgewachsen sind,
werden wir
eine vollständige Wikidata schaffen,
wird die gesamte Art im Wikidata stehen.
Aber wir müssen eine Eigenschaft
für DOC ID schaffen.
Ich möchte eigentlich
mit den Leuten darüber reden.
Sollten wir eine sehr spezifische ID
verwenden,
oder sollten wir eine ID ausstellen
die für alle einzelnen Vögel
oder Pflanzen oder Tiere
funktionieren würde,
die in einem wissenschaftlichen
Forschungsprojekt getaggt wurden?
Das ist eine gute Frage.
Das zweite Projekt
war die Christchurch Kunstgalerie.
Es gibt nur sehr wenige Gemälde
von Colin MacCahon,
Neuseelands berühmtester
lebender Künstler.
Dies ist eine Zeichnung
für das neuseeländische Schuljournal,
was von der Regierung finanziert wurde.
Es ist also tatsächlich
in den Archiven Neuseelands,
die das Urheberrecht dafür besitzen.
Dies ist eine sehr
ungewöhnliche Situation.
Ich arbeitete also mit
der Christchurch Kunstgalerie,
die zusammen
mit der Auckland Kunstgalerie
eine Website namens
Find New Zealand Artists betreibt.
Ihre Aufgabe ist es, den Überblick
über die Bestände jeder Institution
zu behalten, die Bestände
eines neuseeländischen Künstlers hat.
Also, etwa 18.000 verschiedene Künstler
in ihrer Datenbank,
und die meisten überhaupt
mit sehr wenig Informationen.
Wir haben also eine Art
Standard-Mix'n'Match gemacht.
Wir haben einen Export derer gemacht,
die mindestens ein Geburtsdatum hatten,
oder ein Sterbedatum
oder einen Geburtsort,
oder einen Sterbeort.
Das schränkt es also nicht sehr ein.
Und selbst dann waren wir nicht
in der Lage, einige wenige zuzuordnen,
aber wir haben jetzt etwa 1500,
die bekannten Künstlern
in Wikidata zugeordnet sind.
Was schön ist.
Aber was sie reizte –
dies ist ihre Website,
die wirklich nur die Bestandsverknüpfungen
dort beinhaltet.
Aber diese biographischen Daten,
die sie derzeit für jeden
einzelnen Künstler von Hand erstellen.
Und der Export
und das Einfügen in Mix'n'Match
hat zahlreiche Tippfehler und Fehler
und dergleichen aufgedeckt,
die sie nicht bemerkt haben.
Das passiert, wenn man
die Dinge durch Excel laufen lässt,
dann tauchen diese Dinge auf.
Und der Wert von Wikidata
wurde ihnen plötzlich bewusst,
als ich sagte: "Sie können sich
diese Informationen einfach
aus Wikidata raus saugen".
Und das hat sie auf einmal
kerzengerade sitzen lassen.
Ich denke, dies ist also
eines der Verkaufsargumente.
Wenn Sie diese sorgfältig
handkuratierte Website haben
mit 18.000 Einträgen,
die voller Fehler sind,
und ihnen sagen, dass sie andere Menschen
dazu bringen können
einige dieser Fakten zu überprüfen
und für sie korrigieren –
dann kommt man zum Ziel.
Und dann verkündete ich die Idee,
dass sie dieses gesamte Geschichtsbuch
der neuseeländischen Künstler
in den 30er Jahren in Christchurch
"wikidatafizieren" können.
Und durch – gerade veröffentlicht –
laufen und durch
jede einzelne Person laufen,
Verbindung, Ort, Ausstellung
und so weiter.
Aber es ist ein Projekt
von überschaubarer Größe,
und sie sind sehr begeistert darüber.
Und drittens wollte ich Ihnen
Maori-Themenüberschriften zeigen.
Ein Waka ist ein Maori-Name
für eine bestimmte Art von Kanu,
ein Kriegskanu.
Also, in der Nationalbibliothek
von Neuseeland,
gibt es eine Liste für Waka,
weil die Nationalbibliothek
tatsächlich ein eigenes Wörterbuch
von Maori-Themenüberschriften hat,
in der Sprache der Maori.
Dort definiert wird also ein Waka,
auf Maori und Englisch definiert.
Aber gibt auch eine ganze Menge
der Maori-Begriffe –
Sie können sie dort auf der Seite sehen.
Ein typischer Maori-Term wäre Taurapa.
Und eine Definition, zuerst auf Maori
und dann auf Englisch.
Es ist der geschnitzte Achtersteven,
den Sie dort sehen können.
Und auf Englisch Ware das "Sternpost",
aber Sie können nicht das Wort
"Sternpost" für Taurapa verwenden,
weil Taurapa nur für bestimmte Arten
von Kriegskanus funktioniert.
Es gibt also kein englisches
Wortäquivalent dafür.
Und mir wurde plötzlich klar,
dass es sich hier um eine ganze Ontologie
von kulturspezifischen Begriffen handelt,
sehr sorgfältig ausgearbeitet
und von der Nationalen Bibliothek
mit Maori ständig ergänzt,
mit Definitionen, mit Beschreibungen
verbessert werden,
sowohl auf Englisch als auch auf Maori.
Wirklich aufregend.
Ich dachte plötzlich, wir könnten
diese ganze Gruppe in Wikidata stellen –
zuerst auf Maori, dann auf Englisch
übersetzt, wie erforderlich.
Wäre doch eine nette Abwechslung, oder?
Und hier ist
die Urheberrechtslizenzierung.
Leider NonCommercial-NoDerivs.
Jetzt muss ich ein Gespräch
mit ihnen beginnen,
warum sie diese Lizenz gewählt haben.
Und möglicherweise
weil sie nur von den Maori bekommen,
die sich bereit erklärt haben,
dieses Zeug zu machen,
wenn es eine Garantie gibt,
dass keine dieser Informationen
für kommerzielle Zwecke verwendet wird.
Das ist also eine
der frustrierenden Aspekte der Aufgabe,
mit dieser Art von Einschränkungen
zurechtzukommen.
Das sind also die drei Dinge,
die ich Ihnen vorstellen wollte,
um eine Diskussion in Gang zu bringen.
Einfügen einer ganzen Art in Wikidata.
Wie man tatsächlich die Vorstellung
des Kurators einer Kunstgalerie
über den Wert von Wikidata ändert.
Und was wir machen,
wenn wir eine vollständige Ontologie
in einer anderen Sprache sehen,
die leider mit einer restriktiven
Creative-Commons-Lizenz versehen wurde.
Ich danke Ihnen.
(Beifall)
Hallo. Mein Name ist Joachim Neubert.
Ich arbeite für die ZBW,
das bedeutet Informationszentrum
für Wirtschaft in Hamburg,
als wissenschaftlicher
Software-Entwickler.
Und eine meiner Aufgaben im letzten Jahr
war eine Datenspende
an Wikidata vorzubereiten
und ich möchte über
unsere ersten Erfahrungen
der Spende von Metadaten
aus den Pressearchiven
des 20. Jahrhunderts berichten.
Nach unserem besten Wissen,
ist dies das größte öffentliche
Pressearchiv der Welt.
Es wurde zwischen
1908 und 2005 gesammelt,
aus mehr als 1500 Zeitungen
und Zeitschriften aus Deutschland,
aber auch international.
Und es deckt alles ab,
was für Hamburg von Interesse sein könnte,
Hamburger Geschäftsleute
die über die Welt expandieren wollten.
Wie Sie sehen können,
wurde dieses Material
aus Zeitungen ausgeschnitten
und zu Papier gebracht,
und dann in Ordnern gesammelt.
Hier sehen Sie eine kleine Ecke
des Personenarchivs,
und ähnlich wurden Informationen
über Unternehmen gesammelt,
zu allgemeinen Themen, über Waren,
über alles, was interessant sein könnte.
Diese Ordner sind
bis etwa 1949 gescannt worden
durch das von der DFG geförderte Projekt
in den Jahren 2004 bis 2007.
Ergebnis bisher sind 25.000
thematische Dossiers
aus dieser Zeit.
Dies enthielt etwa 2 Millionen,
oder mehr als 2 Millionen Seiten.
Und diese sind online.
Diese Anwendung wurde
seinerzeit von der ZBW entwickelt,
die jetzt etwas veraltet aussieht,
nicht so hübsch, eher problematisch.
Es handelt sich um eine Anwendung,
die auf Oracle-Architektur gebaut wurde,
es wurde mit ColdFusion gebaut,
es läuft auf Windows-Servern,
also ist es auf lange Sicht
nicht sehr nachhaltig.
Und wir haben diskutiert, sollten wir dies
auf eine hübschere, verknüpfte
Datenanwendung migrieren,
oder sollten wir
einen radikalen Schritt machen
und all diese Daten
in die Öffentlichkeit bringen.
Wir haben diesen Daten
eine CC0-Lizenz zugewiesen.
Und derzeit bewegen wir einige Haupt –
Zugriffsschichten zur
Haupt-Entdeckungsschicht –
es ist also eine binäre Zugriffsschicht
in das offene, verlinkte Datennetz,
wo es tatsächlich am sinnvollsten ist,
um einige Metadaten
in Wikidata einzufügen,
und um sicherzustellen, dass alle Ordner
der Sammlungen mit Wikidata verlinkt sind,
damit sie auffindbar sind,
und dass alle Metadaten über diese Ordner
auch in Wikidata übertragen werden.
Es kann also dort verwendet werden,
und es kann dort möglicherweise
erweitert werden.
Diese Daten können korrigiert werden.
Aber es wird immer noch
von der ZBW unterhalten,
was die Speicherung der Bilder angeht
die wir in keiner Weise freigeben können,
oder wir können keine
Lizenz dafür erteilen
weil diese im Besitz
der ursprünglichen Schöpfer sind.
Aber wir sorgen dafür,
dass sie durch einige, wiederum,
als Metadaten-Dateien
über DFG-Viewer zugänglich sind
und in der Zukunft durch IIIF-Manifeste.
Und wir werden
einige statische Zielseiten vorbereiten,
die als Daten-Referenzpunkte
für Wikidata dienen werden,
als auch die Bereitstellung von Daten,
die nicht gut in Wikidata passen.
Für uns geht es um die Migration
und Datenspende an Wikidata
mit unserer
maßgeschneiderten Infrastruktur
des SPARQL-Endpunkts mit diesen Daten,
und wir haben im Grunde genommen
verbundene Abfragen verwendet
zwischen diesem Endpunkt
und dem Wikidata-Abfragedienst,
um entsprechende Aussagen zu erstellen
durch Verkettung
in SPARQL-Abfragen selbst,
oder über ein Skript transformiert,
das auch Referenzen
für die Aussagen generiert.
Und dann in QuickStatements,
auch Code, um diesen online zu verwenden.
Also, das ist, was wir erhalten.
Es sind nicht nur einfache Dinge
wie zum Beispiel Geburtsdaten,
aber, tut mir leid –
aber auch komplexe Aussagen
über bereits vorhandene Gegenstände,
wie diese Person war
ein Vorstandsmitglied der genannten Firma
während dieser Zeitspanne,
und referenziert...
zur Verwendung
im wissenschaftlichen Kontext.
Der erste Teil dieser Datenspende
ist beendet.
Das Personen-Archiv
ist vollständig mit Wikidata verknüpft.
Und es fügt auch eine Menge Informationen
vielen Dingen hinzu,
die schon vorhanden waren,
aber keine externen Referenzen hatten.
Und wir hatten mehr als 6000 Angaben,
die jetzt in den Metadaten
des Pressearchivs vorhanden sind.
Nun, das war der einfachste Teil,
weil Personen leicht in Wikidata
identifizierbar sind.
Mehr als 90 Prozent existierten bereits,
damit konnten wir
eine Verbindung herstellen.
Wir haben für die Fehlenden
etwa 100 Artikel erstellt,
Aber jetzt arbeiten wir
am Rest des Archivs,
insbesondere am Themen-Archiv.
Das bedeutet, ein historisches System
zur Wissensorganisation
über die ganze Welt zu mappen,
materialisiert als Zeitungsausschnitte
in Wikidata.
Um Ihnen eine grundlegende Vorstellung
zu geben, das Länder- und Themen-Archiv
ist nach einer Hierarchie von Ländern
und anderen geographischen
Einheiten organisiert,
die ins Englische übersetzt wird,
was es einfacher macht.
Und das Deutsch ist tief verschachtelt...
eine tief verschachtelte Klassifizierung
der Themen.
Und diese Kombination definiert eine...
einer [unverständlich].
Was wir jetzt also tun wollen, ist,
die Daten strukturell an Wikidata
anzupassen und einzubringen.
Und ich möchte Sie einladen,
sich dieser wirklich schönen
Herausforderung
in Bezug auf die Wissensorganisation
anzuschließen.
Es gibt ein WikiProjekt,
wo diese Arbeit verfolgt wird,
und Sie können dies verfolgen
oder sich daran beteiligen.
Und, ja, vielen Dank.
(Beifall)
(Beat) Also, wir bringen
die darstellenden Künste zu Wikidata.
Und wir bringen die darstellenden Künste
in die verknüpfte offene Datenwolke,
durch den Aufbau eines verknüpften
offenen Daten-Ökosystems
für die darstellenden Künste.
Und die Frage,
die ich zu beantworten versuche,
und ich hoffe, dass Sie mir
bei der Beantwortung der Fragen
helfen werden, auf welchem Ort
in Wikidata und all das ist.
Aber lassen Sie mich zuerst
mit meinen Erfahrungen beginnen,
die ich dieses Jahr gemacht habe,
in der ersten Jahreshälfte,
als ich das Vergnügen hatte
mit CAPACOA zu arbeiten,
das ist die Canadian Arts
Presenting Association,
die tatsächlich ein Projekt namens
Linked Digital Future Initiative
gestartet hat, um tatsächlich
den gesamten Kunstsektor in Kanada,
in verknüpften offenen Daten zu erfassen.
Und sie taten dies
aufgrund der Beobachtung,
dass in den letzten fünf Jahren,
das immens wichtige Thema
innerhalb der darstellenden Künste
die Tatsache war, dass die Metadaten
nicht in ausreichender Qualität vorhanden
und nicht interoperabel
miteinander verbunden waren.
Und das war der Grund
warum einige der Aufführungen,
einige der Ereignisse nicht so gut
durch Google und durch persönliche
computergestützte Assistenten
und so weiter
auffindbar waren.
Also, die Vision,
die wir gemeinsam entwickelten,
war, dass wir eine Wissensbasis
für viele Beteiligte
gleichzeitig haben wollten.
Wir haben uns also das gesamte Netzwerk
für die darstellenden Künste angeschaut,
haben dort die wichtigsten
Interessenvertreter identifiziert,
haben uns die Nutzungsszenarien angesehen,
die wir gerne verfolgen würden,
und wir haben irgendwie
in einer gesamten Architektur
einer solchen Wissensbasis abgebildet,
oder den verschiedenen Plattformen dort,
was natürlich
eine verteilte Architektur ist,
und nicht ein großer Monolith.
Ich werde das einfach
relativ schnell durchgehen,
denn wir haben jeweils
nur zehn Minuten Zeit.
Aber ich denke, wir werden heute
Abend oder morgen viel Zeit haben,
das zu vertiefen, falls jemand
an den Details interessiert ist.
Wir begannen also mit
dem Performing Arts Value Network,
das, interessanterweise,
erst letztes Jahr veröffentlicht wurde.
Wir haben also das Glück,
dass wir in der Lage sind
auf der bisherigen Arbeit aufzubauen,
man hat die primäre Wertschöpfungskette
der darstellenden Künste in der Mitte,
und verschiedene Interessengruppen
in diesem Bereich.
Alles in allem haben wir
20 Interessengruppen identifiziert,
die wir dann irgendwie
auf sieben größere Kategorien
für jede der Interessengruppen
reduziert haben.
Wir haben irgendwie formuliert,
welche Art von Bedürfnissen
welche Bedürfnisse sie
in einer solchen Infrastruktur hätten,
und was sie erreichen könnten,
wenn das Ganze miteinander verbunden wäre
und die Daten öffentlich zugänglich wären.
Und so können Sie die Typen hier sehen,
die verschiedenen Typen sind Produktion,
dann Präsentation & Werbung,
Erfassung und Wiederverwendung,
Live-Publikum,
Online-Gebrauch, Erbe,
Forschung & Bildung.
Und nachdem wir
eine Art großen Tisch aufgestellt hatten,
von dem Sie nur
den ersten Teil hier sehen können,
haben wir irgendwie verglichen,
einen Blick darauf geworfen,
welche Art von Daten
tatsächlich flächendeckend
von allen verschiedenen Interessengruppen
eingesetzt wurden.
Und es gibt eine ziemlich
große gemeinsame Datenbasis,
und das ist wirklich der Bereich,
wo es eigentlich sehr sinnvoll ist,
diese zu integrieren und zu behalten,
um die Daten gemeinsam zu pflegen.
Wenn wir also über
Plattform-Architektur reden
können Sie sehen, dass wir
hier vier Schichten haben.
Unten zeigt die Datenschicht an.
Natürlich spielt Wikidata
dabei eine Rolle,
aber auch viele andere Datenbanken,
verteilte Datenbanken,
die Daten durch SPARQL-Endpunkte
freigeben können.
Der gelbe Teil in der Mitte,
das ist die semantische Ebene.
Es ist unsere gemeinsame Sprache,
um unsere Dinge zu beschreiben,
Aussagen über Dinge zu machen
rund um die darstellenden Künste,
die Ontologie.
Dann haben wir eine Anwendungsschicht,
die aus verschiedenen Modulen besteht,
zum Beispiel die Datenanalyse,
Datenextraktion – also, wie man
tatsächlich unstrukturierte Daten
in strukturierte Daten wandeln kann,
wie wir das durch Werkzeuge
unterstützen können.
Dann gibt es natürlich
eine Visualisierung der Daten –
also wenn es große Datenmengen gibt,
möchte man diese
auf irgendeine Weise visualisieren.
Und oben haben Sie
die Präsentationsschicht,
womit die normalen Leute tatsächlich
auf täglicher Basis mit interagieren –
Suchmaschinen, Enzyklopädien,
kulturelle Agendas,
und eine Vielzahl
anderer Dienstleistungen.
Wir fangen nicht bei Null an.
Einige Arbeiten sind bereits
in diesem Bereich geleistet worden.
Ich möchte nur einige Beispiele
aus einem Projekt nennen,
an denen ich beteiligt war.
Es gibt auch einige andere Dinge.
Und so begann ich in diesem Bereich
mit dem Schweizer Archiv
der darstellenden Künste.
Bis zum Aufbau einer Schweizer
Datenbank für darstellende Künste,
haben wir die Ontologie
der darstellenden Künste geschaffen,
die derzeit in der RDF implementiert wird.
Und da haben wir eine Datenbank
mit etwa 60, 70 Jahren
Aufführungsgeschichte in der Schweiz.
Das ist also etwas,
worauf man aufbauen kann,
und das ist etwas,
das in RDF umgewandelt wird.
Und es gab eine Builder-Plattform,
wo auf diese Daten
zugegriffen werden kann.
Dann haben wir mehrere Einspielungen
in Wikidata gemacht,
teilweise aus der Schweiz,
teilweise auch von
den Institute der darstellende Künste,
wo zum Beispiel Bart Magnus
auch daran beteiligt war.
Er war die treibende Kraft dahinter.
Es gibt auch Material
aus Wikimedia Commons,
aber nicht sehr gut vernetzt
mit all unseren übrigen Metadaten.
Und natürlich, während der Einspielung,
haben wir auch irgendwie begonnen,
Teile dieses Restate-Modells
in Wikidata zu stellen.
Dann ist einer der kanadischen
Implementierungspartner
Culture Creates.
Sie betreiben eine Plattform,
die tatsächlich Informationen
von Theater-Websites ausliest,
und sie in einen Wissensgraphen eingeben,
um sie dann den Suchmaschinen
und andere Suchgeräten auszusetzen.
Und auch hier hatten wir irgendwie dies
in der Ontologie umzusetzen
und zu erweitern.
Und wie Sie auf der Folie sehen können,
gibt es so viele leere Räume,
aber es gibt auch Überschneidungen,
und eine wichtige Überschneidung,
ist offensichtlich die gemeinsame Sprache,
die uns dabei helfen wird,
die verschiedenen Datensätze zu Verlinken.
Was natürlich auch wichtig ist,
ist, dass wir die gleichen Basisregister
und Autoritätsdateien nutzen.
Und dies ist der Ort, an dem Wikidata
durch deren Verknüpfung
eine wichtige Rolle spielt.
Nun möchte ich die Empfehlungen
des Beratungsausschusses der
Linked Data Future Initiatives mitteilen.
Zumindest die beiden ersten Empfehlungen.
Also, für die Kanadier,
ist es jetzt absolut entscheidend
ihren eigenen kanadischen Wissensgraph
der darstellenden Künste zu füllen,
denn im Gegensatz zum Schweizer Archiv
der darstellenden Künste,
beginnen sie nicht
mit einer bereits vorhandenen Datenbank,
sondern sie erstellen von Grund auf neu.
Und es ist absolut wichtig,
dort Daten drin zu haben.
Und zweitens, wie Sie sehen können,
kommt bereits Wikidata.
Wikidata, durch den Beratungsausschuss,
wird als komplementär
zu Artsdata.ca, betrachtet,
diesen Wissensgraphen,
und deshalb sollten Anstrengungen
unternommen werden,
einen Beitrag an dieses Publikum mit Daten
zur darstellenden Kunst zu leisten.
Und genau daran werden wir
in den kommenden Monaten
und Jahren arbeiten,
und das ist auch der Grund,
warum ich bin hier auf der Suche bin,
um zu sehen, wer sich noch
an diesen Bemühungen beteiligen wird.
Also, im Moment, sagen wir,
dass sie sich offensichtlich
ergänzen müssen.
Wir müssen also
über die Plus- und Minuspunkte
der einzelnen Ansätze nachdenken.
Und hier sehen Sie einen Vergleich
zwischen Wikidata und
dem klassischen Linked Open Data-Ansatz.
Ich würde gerne darüber
weiter mit euch diskutieren,
wie eure Erfahrungen dort sind.
Aber aus meiner Sicht hat Wikidata
einen großen Pluspunkt, weil es sich
um eine Crowdsourcing-Plattform handelt,
und es ist einfach,
weitere Gruppen einzuladen,
um tatsächlich einen Beitrag zu leisten.
Auf der negativen Seite
hat man offensichtlich
dieses Problem des Kontrollverlustes.
Dateneigentümer müssen die Kontrolle
über ihre Diagramme, Datenqualität
und Vollständigkeit aufgeben.
Auf Wikidata ist es
schwieriger zu verfolgen,
als wenn man es
unter eigener Kontrolle hat.
Und die andere Stärke von Wikidata
ist, dass sie eine sofortige Integration
in diesen weltweiten Graphen erfordert.
Und man macht einfach –
Schritt für Schritt eine Abstimmung
gegen andere Datenbanken,
was einige auch als Vorteil sehen,
aber natürlich, wenn man nach Integration
und Interoperabilität sucht,
zwingt Wikidata einen dazu,
das von Anfang an zu tun.
Und dann natürlich ist die Harmonisierung
der Datenmodellierungspraktiken
in beiden Fällen ein Thema.
Aber es mag am Anfang den Anschein haben,
es wäre einfacher,
das nur in seinen eigenen Silo zu machen,
denn irgendwann ist man
mit der Aufgabe fertig,
und es wäre
eine fortlaufende Aufgabe auf Wikidata.
Wenn es nun darum geht, Prioritäten
für die einzuspielenden Daten zu setzen,
das sind irgendwie die Regeln,
nach denen ich im Moment arbeite.
Zunächst einmal möchten wir es einlesen,
wobei es unklar ist, wer die natürliche
Autorität in dem betreffenden Gebiet wäre.
Das sind also definitiv Daten,
die gemeinsam verwaltet werden.
Und wir möchten es dort einlesen,
wo wir sehen, dass es ein hohes Potenzial
für Crowdsourcing-Ansätze gibt.
Wir würden gerne Daten einlesen,
bei denen die Daten wahrscheinlich
im Zusammenhang mit Wikipedia
wiederverwendet werden.
Und es besteht auch die Hoffnung,
dass ein Teil
der internationalen Koordination,
um die gesamte Datenmodellierung herum,
über die Standardisierung,
tatsächlich direkt
auf Wikidata stattfinden könnte,
wenn es nicht anderswo stattfindet,
weil es die Menschen irgendwie zwingt,
mit der Interaktion zu starten,
wenn sie in die gleichen Bereiche
einlesen.
Und wir möchten uns jetzt als Nächstes
auf Basisregistern und
Authoritätsdateien konzentrieren,
weil sie uns irgendwie helfen
die Verknüpfungen zwischen
verschiedenen Daten
und unkontrollierten Vokabularien,
als eine Erweiterung
der bestehenden Ontologie zu erstellen.
Also, nur noch zwei weitere Folien.
Die nächsten Schritte werden sein,
dass wir die Summe aller GLAMs-Ansätze
zu Wiki Loves Performing Arts bringen.
Das heißt, wir beschreiben
Veranstaltungsorte und Organisationen,
und versuchen, die Daten
an Wikipedia weiterzuleiten,
in Form von Infoboxen
und Bubble-Templates.
Und das andere, die anderen Projekte,
die ich verfolgen werde,
ist die COST-Aktion,
die wir nächstes Jahr einreichen werden,
um das Linked Open Data-Ökosystem
für die darstellenden Künste herum.
COST ist ein europäisches Programm,
das Netzwerkaktivitäten unterstützt,
und die zu behandelnden Themen
sind hier aufgeführt.
Zwei von ihnen habe ich herausgestellt –
eine davon ist die Frage
einer Verbindung zwischen Wikidata
und den klassischen, verbundenen,
offenen Datenansätzen.
Und die andere, glaube ich,
ist auch sehr wichtig,
wo wir noch ein riesiges Potenzial haben,
internationale Kampagnen
zur Ergänzung der Daten
auf Wikidata durchzuführen.
So, das war's. Ich danke Ihnen
für Ihre Aufmerksamkeit.
Nun möchte ich meine Kollegen
einladen, hierher zu kommen.
Vielleicht kriegen sie auch Mikrofone.
Und dann würde ich gerne...
Ihnen die Möglichkeit geben,
Fragen zu stellen.
Und natürlich auch meine Kollegen fragen,
ob sie Fragen aneinander haben.
Haben wir vielleicht
eine Frage aus dem Publikum?
(Person 2) [unverständlich]
Ich möchte Sie alle fragen,
wo würden Sie die Grenze ziehen,
im Grunde genommen, wie definieren Sie –
wann müssen Sie
Ihre eigene Wikibase betreiben,
und was möchten Sie
auf Wikidata einstellen?
Ist dies eine klare Abgrenzung,
oder was steht hinter der Idee,
das hier und dorthin zu tun.
(Susanna) Ich kann zuerst antworten,
weil ich das Mikrofon habe.
Also, ich habe nachgedacht,
dass eines der Themen die Notabilität ist.
Ich spreche das
in einem anderen Projekt an.
Und ich denke, die Lizenzierung
könnte ein Thema sein,
weil Sie Ihre eigenen Bedingungen in
Ihrer eigenen Datenbank anwenden können,
und dann denke ich,
wo immer es möglich ist.
Und dann, das dritte ist,
es einfach als Sandbox zu haben,
um es für die Einspielung
in Wikidata vorzubereiten.
Dies sind die drei wichtigsten Dinge,
die mir jetzt einfallen,
aber ich könnte mir
noch weitere einfallen lassen.
(Mike) Für mich werden Rechte
immer ein Thema sein.
Wenn sich also die Nationalbibliothek
in Richtung Wikibase bewegen wollte,
was ihnen ermöglichen würde,
Kontrolle über Lizenzierung zu behalten,
für die Arbeit, die sie mit Begriffen
aus der Maori-Sprache geleistet haben.
Die Kakapo-Datenbank enthält nur Daten,
von denen das Department of Conservation
das Gefühl hat, dass man
das öffentlich machen kann,
aber ich vermute,
wenn sie sehen, wenn es läuft,
könnten sie in Versuchung geraten,
eine private Wikibase zu benutzen,
um ihre eigene Datenbank zu pflegen,
einfach wegen einiger
Visualisierungswerkzeuge,
die angewendet werden könnte,
die vielleicht besser sind,
als das Excel-Spreadsheet-System,
das sie derzeit nutzen.
(Joachim) Nun, ich denke, das hängt
sehr stark von der Art der Daten ab.
Wir sind natürlich mit dem Pressearchiv
in der recht glücklichen Lage,
dass es sich dabei um Material handelt,
das veröffentlicht wurde,
es wurde damals veröffentlicht,
aber die Veröffentlichung war teuer.
Das ist also ganz einfach.
Ich denke auch Projekte –
und dies ist
ein typisches Projektwerkzeug,
es wurde eine Zeit lang finanziert,
und dann endete die Finanzierung,
und was mit den Daten geschieht,
die in einem Silo eingeschlossen ist,
und Software, die nicht ewig laufen wird.
Und so macht es für mich absolut Sinn.
Damals war Wikidata nicht vorhanden,
aber jetzt ist es da,
und es macht absolut Sinn
für unser Projekt,
früh über Nachhaltigkeit zu diskutieren,
im Kontext von:
wie können wir das in ein größeres
Ökosystem wie Wikidata transferieren,
und dies mit der Datengemeinschaft
diskutieren,
was ist nennenswert und was macht Sinn,
dies zu Wikidata hinzuzufügen,
und was ist sinnvoll,
in proprietärer Form zu behalten.
Vielleicht in einer einfacheren Form,
als eine anspruchsvolle Anwendung,
aber es auffindbar zu machen und
mit der großen Daten-Cloud zu verknüpfen,
anstatt viel Geld zu investieren
in irgendein Silo, das keine Zukunft hat.
(Beat) Ja, wie ich schon sagte,
in dem Projekt,
das ich hier vorgestellt habe,
sind Dualitäten zwischen Wikidata
und klassischen verknüpften
offenen Datenansätze.
Es geht also nicht so sehr um
die Einrichtung einer privaten Wikibase.
Eine Herausforderung, die wir hatten,
und natürlich auch bei Wikidata,
ist, dass wenn wir
die eigenen Daten dort einspielen,
müssen wir auch etwas Haushaltung
von Menschen erledigen,
von anderen Menschen, eigentlich.
Und das könnte die Menschen abschrecken,
oder es bedeutet auch, dass wir uns damit
einfach Schritt für Schritt
befassen werden.
Also wird es im Moment
eine Datenbank in klassisch
verknüpften offenen Daten sein,
und wir beginnen,
sie mit Wikidata zu verknüpfen,
und es ist ein kontinuierlicher Prozess,
um herauszufinden,
für welche Bereiche die meisten Daten
schließlich auf Wikidata
zu finden sein werden,
und für welche Bereiche sie tatsächlich
auf anderen Datenbanken leben werden.
Offensichtlich werden
wir Herausforderungen
bezüglich der Synchronisation haben,
wie wir sie wahrscheinlich alle haben,
weil dieses verknüpfte Datenfeld,
wo wir noch verhandeln müssen,
wem wir vertrauen,
wer über was Autorität hat.
(Moderation) Andere Fragen?
(Person 3) Vielen Dank.
Also, ich stimme voll und ganz
mit dem Thema überein –
wo die Grenze gesetzt werden soll,
warum wir Daten auf Wikidata stellen,
oder warum wir sie in lokalen Datenbanken
und für welche Zwecke halten,
um in lokalen Datenbanken zu erstellen,
zu verwalten und zu pflegen
und für welche Zwecke.
Und ich denke, dass dies
eine große Diskussion ist,
die über die reine Begeisterung
hinausgeht,
Daten auf Wikidata zu stellen,
weil sie öffentlich ist,
weil es der Menschheit dient, weil –
während es zwei coole Werkzeuge gibt,
und die Dinge im wirklichen Leben
komplizierter sind, glaube ich.
Nun, trotzdem, es ist
eine recht interessante Diskussion.
Und dann ist das auch
noch ein anderes Thema,
oder ein anderes Problem,
das diskutiert wird
in diesem Fall in verschiedenen Panels.
Es ist auf der einen Seite,
die eigene Datenbank zu haben,
was auch immer die Technologie ist,
und Dinge auf Wikidata veröffentlichen,
oder sein eigenes System zu bauen,
zur Erstellung und Verwaltung
von Informationen
mit der Wikibase-Technologie.
Und dann, synchronisieren
oder was auch immer –.
Verbindungen herstellen oder Dinge tun,
es ist also eine Sache
der verwendeten Technologie,
und die Tatsache, dass Sie Wikidata
nur zur Veröffentlichung nutzen,
oder die Infrastruktur,
die unter Wikidata liegt,
um Ihre Daten zu erstellen
und zu verwalten.
Ich meine, wir hatten eine Diskussion
über das Wikibase-Panel,
und es wird hier
weitere Diskussionen geben,
aber die Dinge sind
auf verschiedenen Ebenen, glaube ich.
Vielleicht bekommt man
bei dieser Diskussion
über Wikibase oder Wikidata –
(Beat) Ich halte es für problematisch,
dass wir uns so sehr
auf dieser Wikibase-Infrastruktur
konzentrieren,
weil es andere Infrastrukturen gibt,
wie im Bereich der darstellenden Künste.
Wir haben noch eine weitere
ergänzende Gemeinschaft,
das ist MusicBrainz,
die auf ihrer eigenen Plattform laufen,
die verknüpfte offene Daten
zur Verfügung stellen,
und wie ich es verstehe,
gibt es Konsens innerhalb
der Wikidata-Gemeinschaft,
dass wir nicht alle ihre Daten
verdoppeln wollen –
wir werden nicht alle
ihre Daten kopieren,
aber wir akzeptieren,
dass sie sich ergänzen.
Also, was wird passieren,
wenn wir anfangen, diese Daten
in Wikipedia zu integrieren?
Infokästen, zum Beispiel.
Wären wir in der Lage, diese Daten direkt
von ihrem SPARQL-Endpunkt aus zu ziehen?
Oder wären wir verpflichtet,
alle Daten irgendwie zu kopieren,
und welche Art von Prozessen
sind daran beteiligt?
(Person 4) Die Diskussionen sind,
glaube ich, offen,
denn innerhalb dieser Veranstaltung,
haben Sie sowohl
interessierte Gemeinschaften –
diejenigen,
die an Wikibase interessiert sind,
und diejenigen,
die an Wikidata interessiert sind,
und diejenigen,
die an beiden interessiert sind.
(Beat) Ja, aber wir werden sie
nicht zwingen, zu Wikibase zu wechseln.
(Person 4) Nicht unbedingt.
(Beat) MusicBrainz läuft nicht
auf Wikibase.
(Person 4) Nein, ich wollte nur sagen,
dass Sie separate Probleme haben,
manchmal miteinander verbunden,
manchmal nicht vollständig getrennt.
Und ich hatte noch eine andere Frage
oder Bemerkung,
bezüglich der Verwaltung von Hierarchien
in kontrollierten Vokabularien,
wie Thesauris, wie bei Ihnen mit Finto.
Sie haben die Orte
bei den Maori,
Betreffzeilen.
Nun, Sie müssen sich mit der
hierarchischen Verwaltung
von Konzepten auseinandersetzen.
Was ist Ihre Ansicht, Ihre Meinung
zur Möglichkeit,
diese kontrollierten
Wissensorganisations-Systeme
in Wikidata zu verwalten?
(Susanna) Ich denke, in diesem Fall
der Finto- und YSO-Instanzen,
wird das Repository schließlich
eine Sammlung von mehreren Quellen sein.
Das ist also ohnehin im Fluss.
Wir müssen also nicht unbedingt –
Nun, ich vertrete nicht
die Nationalbibliothek,
sondern in diesem möglichen Projekt,
müssten wir nicht
mit einer existierenden –
oder mit einer bestehenden Struktur
kämpfen.
In diesem Sinne ist es also
ein offener Forschungsbereich.
(Mike) Die Maori-Themenbereiche scheinen,
sich ideal für die
Wikidata-Struktur zu eignen.
Aber die Lizenzierung
verbietet das natürlich.
Ich vermute,
wenn die Lizenzierung anders wäre,
und sie in Wikidata aufgenommen würden,
sobald jemand entscheidet hat,
dass ihm die Hierarchie nicht gefällt,
und anfängt, Dinge zu ändern,
würde es einen sofortigen Aufschrei
bei den Menschen geben,
die sehr hart daran gearbeitet haben,
diese Struktur zu schaffen
und die Genehmigung
von verschiedenen Maori zu erhalten,
was die aktuelle Hierarchie war.
Das ist also ein Problem,
das es zu lösen gilt.
(Joachim) Ich denke,
Wissenorganisationssystemen
sind alle unterschiedlich.
Und ich bin mir nicht sicher,
ob es eine gute Idee wäre,
verschiedene Hierarchien
in Wikidata als solche zu repräsentieren,
aber es macht vielleicht Sinn, über
Überlagerungen der Daten nachzudenken,
also, um Mappings
auf der Inhaltsebene zu machen.
Zum Beispiel, wie die ZBW-Partnerschaft
Thesaurus für Wirtschaftswissenschaften.
Und dieser Thesaurus
setzt seine eigene Hierarchie,
und natürlich wäre es möglich,
die Hierarchie dieses Thesaurus
in Wikidata-Konzepte umzusetzen,
ohne tatsächlich diese Art von Struktur
als alternative Struktur
innerhalb von Wikidata zu speichern,
was eine Menge Verwirrung stiften würde.
Aber ich denke, wir sollten uns Wikidata
auch als Pool von Konzepten vorstellen,
die schichtweise mit Layern verbunden
werden können, die sich draußen befinden,
und die eine andere Sicht
der Welt vermitteln,
die nicht unbedingt
die innerhalb von Wikidata ist.
(Moderation) In Ordnung.
Einige andere Fragen?
Andernfalls... Okay.
(Person 5) Joachim, ich wollte nur
diesen letzten Punkt weiterverfolgen.
Also, diese Schichten,
wie Sie sich das vorstellen,
würden sie extern gepflegt werden
und irgendwie mit Wikidata
von der Wikidata-Seite integriert
oder haben Sie etwas weiter gedacht,
wie das gehandhabt werden könnte?
(Joachim) Eigentlich, nein,
ich habe keine –
ich habe Experimente
mit der ZBW und Wikidata gemacht.
Ich war [unverständlich]
hier bei Wikidata.
Aber ich denke, das ist
eine ganz neue komplexe Sache,
und es gilt zu diskutieren,
um eine gemeinsame Grundlage zu finden,
um solche Dinge zu tun,
aber dass man herausfinden muss.
(Beat) Noch eine weitere?
(Person 6) Ah, großartig.
Ich habe eine Frage zum Kakapo-Projekt.
(Beat) Mhm-hm.
(Person 6) Okay. Also,
haben Sie Rückmeldung
seitens der Wikidata-Gemeinschaft
bekommen,
einzelne Tiere
aus diesen Artikeln zu ziehen?
(Mike) Bislang nicht.
(Person 6) Hat jemand
schon mal davon gehört?
Ist es "nicht so weit",
weil niemand bisher davon gehört hat?
(Mike) Es gibt seit geraumer Zeit
eine kleine Diskussion –
interessierter Personen
an dieser Art von Dingen in Wikidata,
und wir alle scheinen zu denken,
dass es eine natürliche Erweiterung ist,
einzelne Wikidata-Elemente wie bei
einem berühmten Rennpferd zu erhalten
oder die Katze von jemandem,
das ist ziemlich gut modelliert.
Ich schätze, das Wagnis ist,
die gesamte Art dort hineinzubringen.
Aber ich denke,
es ist vollkommen überschaubar.
(Person 6) Versuchen Sie es
nicht mit Katzen und Ziegen.
(Gelächter)
(Moderation) Okay.
Ich denke, die Zeit ist um.
Vielen Dank, dass Sie teilgenommen haben,
Ich denke, es gibt noch Zeit
für Fragen in der Pause.
Und viel Spaß.
(Beat) Vielen Dank.
(Beifall)