Return to Video

cdn.media.ccc.de/.../wikidatacon2019-1035-eng-Data_import_process_overview_hd.mp4

  • 0:06 - 0:08
    (Beat) Guten Tag, allerseits.
  • 0:09 - 0:12
    Willkommen zu unserem GLAM-Panel.
  • 0:13 - 0:17
    Bevor wir beginnen, muss ich nur
    zwei Ankündigungen zu machen.
  • 0:17 - 0:23
    Bitte nutzen Sie zunächst einmal ausgiebig
    unsere Etherpads, um Notizen zu machen.
  • 0:24 - 0:28
    Und die zweite ist an unser Publikum
    zu Hause gerichtet
  • 0:28 - 0:30
    oder wo auch immer Sie sind.
  • 0:30 - 0:31
    Wenn Sie Fragen haben,
  • 0:31 - 0:34
    können Sie das auch
    in das Etherpad schreiben,
  • 0:34 - 0:38
    und unsere Engel im Raum
    werden das im Auge behalten.
  • 0:39 - 0:44
    Also haben wir beschlossen,
    dass für das diesjährige Panel,
  • 0:45 - 0:49
    nachdem ich alle eingereichten Beiträge
    gesehen habe,
  • 0:49 - 0:52
    werden wir uns auf die Rolle von Wikidata
  • 0:52 - 0:54
    innerhalb von Daten-Ökosystemen
    konzentrieren,
  • 0:54 - 0:57
    die über die eigentlichen
    Wikimedia-Projekte hinausgehen,
  • 0:57 - 1:00
    was auch absolut im Einklang
  • 1:00 - 1:04
    mit der neuen Strategie
    der Wikimedia-Stiftung ist.
  • 1:05 - 1:08
    Und wir haben heute vier
    Diskussionsteilnehmer.
  • 1:08 - 1:10
    Drei plus eins.
  • 1:10 - 1:14
    Deshalb möchte ich Sie
    auf die Bühne bitten,
  • 1:14 - 1:16
    damit wir Sie vorstellen können.
  • 1:16 - 1:22
    (Schrittgeräusche)
  • 1:22 - 1:25
    Wir haben also Susanna Ånäs.
  • 1:25 - 1:29
    Sie ist seit langem
    eine Aktivistin für freies Wissen
  • 1:29 - 1:31
    und ist an vielen
    Wiki-Projekten beteiligt.
  • 1:32 - 1:36
    Und sie wird heute berichten
    über das Projekt in Zusammenarbeit
  • 1:36 - 1:38
    mit der finnischen Nationalbibliothek.
  • 1:39 - 1:43
    Dann haben wir neben mir Mike Dickison,
  • 1:43 - 1:46
    der in der Reihenfolge
    an zweiter Stelle steht.
  • 1:47 - 1:50
    Er ist ein Museumskurator aus Neuseeland.
  • 1:50 - 1:54
    Er ist Zoologe und
    Redakteur bei Wikipedia.
  • 1:54 - 1:59
    Und er war Neuseelands erster
    Wikipedian-At-Large
  • 1:59 - 2:03
    in den Jahren 2018 und 2019.
  • 2:03 - 2:07
    Und er wird uns über seine Erfahrungen
    in dieser Rolle erzählen,
  • 2:07 - 2:13
    und was bei Wikidata zu arbeiten
    in diesem Kontext bedeutet.
  • 2:16 - 2:18
    Dann haben wir Joachim Neubert
  • 2:18 - 2:21
    vom Leibniz-Informationszentrum
    für Wirtschaftswissenschaften
  • 2:21 - 2:23
    in Kiel und Hamburg.
  • 2:24 - 2:29
    Er hat daran gearbeitet, die größten
    öffentlichen Pressearchive weltweit
  • 2:29 - 2:35
    für die Öffentlichkeit zugänglicher
    zu machen, und er nutzt dazu Wikidata.
  • 2:36 - 2:39
    Und dann komme ich als Letzter.
    Mein Name ist Beat Estermann.
  • 2:39 - 2:42
    Ich arbeite an der Berner Fachhochschule,
  • 2:42 - 2:43
    in der Schweiz.
  • 2:44 - 2:46
    Und ich bin ein langjähriger Förderer
  • 2:46 - 2:50
    des OpenGLAM in der Schweiz und anderswo.
  • 2:50 - 2:54
    Und ich werde heute über
    meine Aktivitäten berichten
  • 2:54 - 2:59
    im Zusammenhang mit dem Auftrag
    der Canadian Arts Presenting Association
  • 2:59 - 3:01
    mit Schwerpunkt auf darstellende Künsten.
  • 3:02 - 3:04
    Nicht in erster Linie bei Wikidata,
  • 3:04 - 3:08
    aber Sie werden sehen, Wikidata
    fängt auch dort an, eine Rolle zu spielen.
  • 3:09 - 3:13
    Die meisten von uns werden jetzt
    also hier ihren Platz einnehmen,
  • 3:13 - 3:17
    und ich erteile Susanna das Wort.
  • 3:18 - 3:23
    Okay. Also, hallo.
    Mein Name ist Susanna Ånäs,
  • 3:23 - 3:26
    und ich arbeite Teilzeit
    für Wikimedia Finnland
  • 3:26 - 3:27
    als GLAM-Koordinator,
  • 3:27 - 3:33
    und ich berate auch
    in der offenen Wissenssphäre.
  • 3:33 - 3:36
    Und bei diesem Diskurs
    geht es eher um das Letztere.
  • 3:36 - 3:46
    Ich war also an den Arbeiten beteiligt
    der geographischen Datengruppe der –
  • 3:48 - 3:51
    Nun, ich habe es nachgeschlagen,
    aber es ist nicht auf Englisch,
  • 3:51 - 3:55
    aber die Kulturerbe-Initiative
    der finnischen Regierung.
  • 3:55 - 4:00
    Hier geht es also um Ortsnamen
  • 4:00 - 4:03
    und wie sie repräsentiert werden
  • 4:03 - 4:07
    in verschiedenen Repositories
    im GLAM-Sektor in Finnland,
  • 4:07 - 4:12
    und wie sie versuchen,
    diese verschiedenen Quellen zu verbinden
  • 4:12 - 4:18
    und wie sie durch Modellierung in
    Wikidata und anderswo dargestellt werden.
  • 4:18 - 4:23
    Hier sehen wir also die drei Hauptquellen
    für diese YSO-Stellen,
  • 4:23 - 4:28
    die Teil der nationalen Ontologie ist –
    allgemeine Ontologie.
  • 4:28 - 4:30
    Die AHAA ist für finnische Archive,
  • 4:30 - 4:32
    Melinda ist für finnische Bibliotheken,
  • 4:32 - 4:34
    und KOOKOS ist für finnische Museen.
  • 4:34 - 4:38
    Es gibt also auch drei
    Inhaltsverwaltungssysteme,
  • 4:38 - 4:40
    die an diesen YSO-Stellen zusammenkommen.
  • 4:41 - 4:48
    Und es findet bereits
    sowohl ein Austausch mit Wikidata statt,
  • 4:48 - 4:53
    als auch mit dem Namensprojekt
    der nationalen Landvermessung.
  • 4:53 - 4:56
    Und dann gibt es noch ein drittes Projekt,
    das finnische Namensarchiv,
  • 4:56 - 5:00
    das noch nicht dazu beiträgt,
  • 5:00 - 5:03
    aber es gibt schon Pläne dafür.
  • 5:03 - 5:06
    Eine der wichtigsten
    Fragen der Modellierung
  • 5:06 - 5:09
    ist also dieser ganze Problembereich,
  • 5:09 - 5:14
    dass es drei Typen von Elementen
  • 5:14 - 5:18
    bei Ortsnamen in diesem Projekt gibt.
  • 5:18 - 5:21
    Einer davon ist der Ort,
    derjenige, der einen Standort hat.
  • 5:21 - 5:25
    Und einer davon ist der Ortsname,
    das Toponym, zum Beispiel.
  • 5:25 - 5:28
    Und dann gibt es Dokumenten-Quellen,
  • 5:28 - 5:31
    aus denen diese beiden
    abgeleitet werden können,
  • 5:31 - 5:33
    oder Ähnliches zur Absicherung.
  • 5:33 - 5:36
    Das YSO setzt – hier, oben rechts,
  • 5:36 - 5:39
    sehen Sie wieder das gleiche Diagramm.
  • 5:39 - 5:41
    Es konzentriert sich
    hauptsächlich auf die Orte.
  • 5:43 - 5:46
    Der Betreuer ist
    die finnische Nationalbibliothek
  • 5:46 - 5:49
    und das Finto-Projekt.
  • 5:50 - 5:56
    Es gibt jetzt mehr als 7000 Orte
    in Finnisch und Schwedisch
  • 5:56 - 5:59
    und über 3000 auf Englisch,
  • 5:59 - 6:03
    und sie sind CC0 lizenziert.
  • 6:03 - 6:06
    Hier sehen Sie also Finto-Dienst.
  • 6:06 - 6:10
    Und einen Ort –
    ich habe Sevettijärvi gewählt.
  • 6:10 - 6:14
    Es ist jetzt auch verwandt
    mit unserem Sprachprojekt
  • 6:14 - 6:15
    mit den Skolt Sámi –
  • 6:15 - 6:19
    dies ist ein Ort
    im äußersten Norden Finnlands,
  • 6:19 - 6:22
    bewohnt von Skolt Sámi.
  • 6:22 - 6:27
    Hier sehen Sie also den Ort,
    der zu den –
  • 6:27 - 6:33
    Nun, Sie werden die Daten
    zu diesem Ort sehen.
  • 6:33 - 6:38
    Sie können sehen, dass es
    mit einem Wikidata verbunden ist,
  • 6:38 - 6:42
    als auch diese Daten
    der Nationalen Landvermessung.
  • 6:43 - 6:47
    Da haben wir's. Und Sie werden
    dies noch detaillierter sehen.
  • 6:49 - 6:52
    Es ist auch hierarchisch
  • 6:52 - 6:56
    innerhalb dieses Repositorys angeordnet.
  • 6:58 - 7:00
    Nun, eigentlich,
    der eigentliche Ort ist nicht zu sehen,
  • 7:00 - 7:06
    aber er befindet sich
    unterhalb dieser Gemeinde,
  • 7:06 - 7:08
    sowie die Region,
  • 7:08 - 7:10
    und Finnland als Land,
    und die nordischen Länder,
  • 7:10 - 7:12
    die Großregion.
  • 7:13 - 7:14
    Hier können Sie sehen,
    dass viele von diesen
  • 7:14 - 7:21
    zuvor mit Wikidata
    mit Mix'n'Match abgestimmt wurden
  • 7:21 - 7:22
    und es sind immer noch welche übrig.
  • 7:22 - 7:28
    Aber die Anzahl der Namen
    ist nicht so hoch.
  • 7:28 - 7:31
    Es sind nur weniger als 5000.
  • 7:32 - 7:34
    Dann gibt es also dieses andere Repository
  • 7:34 - 7:38
    von dem finnischen Geospatial
    Plattform-Projekt –
  • 7:38 - 7:39
    Ortsnamenskarten.
  • 7:39 - 7:42
    Dies sind alle Ortsnamen,
    die auf finnischen Karten zu finden sind.
  • 7:42 - 7:48
    Und sie haben die verknüpften Daten,
    die mit CC BY 4.0 lizenziert ist.
  • 7:49 - 7:52
    800.000 Kartenbeschriftungen
    in finnischer und schwedischer Sprache,
  • 7:52 - 7:56
    und alle drei Saami-Sprachen,
    die es in Finnland gibt.
  • 7:56 - 7:59
    Und diese haben
    zwei verschiedene Arten von Entitäten.
  • 7:59 - 8:01
    Die anderen sind Orte, und die anderen
  • 8:01 - 8:03
    sind Ortsnamen, Toponyme.
  • 8:03 - 8:05
    Und sie haben beide persistente URIs.
  • 8:06 - 8:08
    Hier ist zum Beispiel
    das selbe Sevettijärvi,
  • 8:08 - 8:10
    einmal in finnischer Sprache,
  • 8:10 - 8:14
    und dann in den drei Saami-Sprachen,
    sowie die geographischen Daten,
  • 8:14 - 8:21
    und dann gibt es noch mehr Informationen,
    wie den Ortstyp et cetera.
  • 8:21 - 8:29
    Hier ist die Karte für den Ortsnamen,
    das Toponym, das eine eigene URI hat.
  • 8:30 - 8:34
    Tut mir leid, es wurde scheinbar
    nicht in die englische Liste übersetzt.
  • 8:34 - 8:39
    Also, Mehrsprachigkeit
    deckt nicht das gesamte Projekt ab.
  • 8:40 - 8:43
    Okay, wir kommen
    zum finnischen Namensarchiv.
  • 8:43 - 8:46
    Dies ist ein Projekt des Instituts
    für die Sprachen Finnlands,
  • 8:46 - 8:50
    und diese repräsentieren nicht die Orte,
    nicht die Ortsnamen,
  • 8:50 - 8:53
    aber sie sind eigentlich
    Quellen für diese.
  • 8:53 - 8:57
    Das sind also drei Millionen
    Feldnotizen von Ortsnamen,
  • 8:58 - 9:00
    und es ist ein Wikibase-Projekt.
  • 9:00 - 9:01
    Sie befinden sich in einer Wikibase,
  • 9:01 - 9:03
    hauptsächlich auf Finnisch,
    einiges auf Schwedisch.
  • 9:03 - 9:06
    Eine herausragende
    Sammlung von Saami-Namen,
  • 9:06 - 9:08
    die uns sehr interessieren.
  • 9:08 - 9:10
    Und sie haben die Lizenz CC BY.
  • 9:10 - 9:15
    Und das ist aus der Sicht von Wikidata
    auch eine Herausforderung.
  • 9:15 - 9:18
    Aber wenn es eine lokale
    finnische Wikibase gäbe,
  • 9:18 - 9:23
    könnten wir vielleicht mit ihnen
    in diesem Projekt zusammenarbeiten.
  • 9:23 - 9:25
    Hier ist also ein Screenshot davon,
  • 9:26 - 9:31
    der zeigt, dass es Informationen gibt
    über den Ort, die Karten –
  • 9:31 - 9:35
    die alten Karten, die die Sammler
    am Anfang verwenden,
  • 9:35 - 9:37
    und die Karte, die sie anhand der
  • 9:37 - 9:41
    von ihnen gesammelten
    Informationen erstellen.
  • 9:41 - 9:46
    Also, hier ist eine dieser Karten
  • 9:46 - 9:49
    aufgeschlüsselt nach Daten,
  • 9:49 - 9:51
    die in ihnen enthalten ist.
  • 9:51 - 9:54
    Dann haben sie also
    dieses verknüpfte Datenprojekt
  • 9:54 - 9:58
    das Helsinki Digital Humanities Lab
    und Semantic Computers übermittelt.
  • 9:58 - 10:01
    Die Computergruppe
    der Aalto Universität –
  • 10:01 - 10:07
    und zusammen mit diesem Institut
    der Sprachen Finnlands –
  • 10:07 - 10:08
    Der Name ist Sampo.
  • 10:08 - 10:11
    Und dies ist eine aggregierte
    Schnittstelle zur Forschung
  • 10:11 - 10:14
    nach mehreren Ortsnamensquellen.
  • 10:14 - 10:16
    Hier können Sie sehen,
    dass viele der Quellen
  • 10:16 - 10:18
    sich dort außen
    auf der linken Seite befinden,
  • 10:18 - 10:21
    und dann können Sie
    verschiedene Arten von Visualisierungen
  • 10:21 - 10:23
    basierend auf diesen Daten erstellen.
  • 10:23 - 10:24
    Und... ja.
  • 10:25 - 10:27
    Also, ich habe diese Idee
  • 10:27 - 10:31
    der Modellierung
    einer lokalen Wikibase eingebracht,
  • 10:31 - 10:33
    damit wir mit diesen Daten
    etwas anfangen könnten.
  • 10:33 - 10:37
    Aber wenn wir
    diese Modellierungsfehlern angehen,
  • 10:37 - 10:38
    wie modellieren wir?
  • 10:38 - 10:39
    Es gibt verschiedene Möglichkeiten,
  • 10:39 - 10:42
    unterschiedliche Traditionen
    in jedem dieser Bereiche.
  • 10:42 - 10:45
    So... ja.
  • 10:46 - 10:50
    Und das Gute daran ist,
    dass es auch Minderheitensprachen
  • 10:50 - 10:52
    mit sehr geringem Aufwand dienen könnte.
  • 10:53 - 10:57
    Okay. Also, hier haben wir
    die beiden grundlegenden Optionen:
  • 10:57 - 11:02
    das SAPO-Modell,
    die finnische Raum-Zeit-Ontologie,
  • 11:03 - 11:04
    und das Wikidata-Modell.
  • 11:04 - 11:07
    Hier können Sie sehen,
    dass Wikidata-Einträge dazu neigen,
  • 11:07 - 11:08
    sich zu verlangsamen.
  • 11:08 - 11:13
    Im Idealfall bleiben sie gleich
    mit den sich ändernden Eigenschaften.
  • 11:13 - 11:17
    Wohingegen im SAPO-Modell
    diese Einträge neu erstellt werden,
  • 11:17 - 11:19
    wenn es eine Änderung
    gibt, wie zum Beispiel
  • 11:19 - 11:20
    eine Gebiets- und Namensänderung.
  • 11:21 - 11:26
    Kommen wir also zurück
    zu dieser Unterteilung
  • 11:26 - 11:32
    zwischen diesen drei verschiedenen
    Dimensionen von Orten, Ortsnamen.
  • 11:32 - 11:38
    Sollen diese Ortsnamen
    also Entitäten oder Eigenschaften sein?
  • 11:38 - 11:39
    Wikidata verwendet Eigenschaften,
  • 11:39 - 11:43
    während das Landvermessungs-Projekt
    Entitäten nutzt.
  • 11:44 - 11:46
    Oder sollten wir sie zu Lexemen machen?
  • 11:46 - 11:51
    Wikidata hat sich entschieden
    mit Eigenschaften zu arbeiten,
  • 11:51 - 11:55
    textuelle Eigenschaften
    für Ortsnamen über Lexeme.
  • 11:56 - 11:58
    Es tut mir leid, andersherum.
  • 11:58 - 12:00
    Also, die Namen sind...
  • 12:03 - 12:05
    Eigenschaften, nicht Lexeme.
  • 12:06 - 12:07
    Richtig.
  • 12:07 - 12:11
    Und das Problem der Wikibase
  • 12:11 - 12:16
    ist vielleicht der Mangel
    an geographischen Formen in diesem –
  • 12:16 - 12:21
    in der Grundausstattung des Programms,
  • 12:21 - 12:25
    also müsste man den Stack
    mehr Technologie hinzufügen,
  • 12:25 - 12:30
    um lokale geographische Formen
    verwenden zu können.
  • 12:30 - 12:32
    Und eine Verbindung
    ist wirklich notwendig,
  • 12:32 - 12:38
    um die Vorteile des Wikidata-Korpus
    nutzen zu können.
  • 12:39 - 12:43
    Also, ich bin schon am Ende. Vielen Dank.
  • 12:44 - 12:46
    (Beifall)
  • 12:50 - 12:52
    (Schrittgeräusche)
  • 13:01 - 13:02
    Okay.
  • 13:03 - 13:05
    (spricht auf Maori)
  • 13:05 - 13:08
    Herzlich willkommen.
    Mein Name ist Mike Dickison.
  • 13:08 - 13:10
    Und für eine Jahr
  • 13:10 - 13:13
    war ich Neuseelands Wikipedian-At-Large.
  • 13:14 - 13:17
    Sie fragen sich vielleicht
    was ein Wikipedian-At-Large ist.
  • 13:18 - 13:22
    Denn wenn man tatsächlich darauf achtet,
    gibt es so was nicht, wie wir sehen.
  • 13:23 - 13:26
    Es ist ein Begriff, den ich
    in einem Zuschussantrag erfunden habe,
  • 13:26 - 13:29
    was der Stiftung sehr zu gefallen schien.
  • 13:30 - 13:32
    Und so haben wir damit weiter gemacht.
  • 13:32 - 13:36
    Also habe ich ein Jahr lang
    35 verschiedene Institutionen,
  • 13:37 - 13:39
    Residenten besucht
  • 13:39 - 13:41
    und in den meisten von ihnen
    Trainingseinheiten durchlaufen lassen,
  • 13:41 - 13:44
    öffentliche Veranstaltungen
    organisiert und versucht,
  • 13:44 - 13:47
    eine Wikimedia-Strategie
    für jeden einzelnen zu entwickeln.
  • 13:48 - 13:49
    Es war eine sehr interessante Erfahrung,
  • 13:49 - 13:53
    und man trifft auf eine breite Palette
    von verschiedenen Projekten und Personen.
  • 13:53 - 13:58
    Und ich wollte über einige
    verschiedene Projekte reden,
  • 13:58 - 14:00
    die sich mit Wikidata beschäftigten
  • 14:01 - 14:05
    auf interessante oder
    vielleicht einleuchtende Art,
  • 14:05 - 14:08
    die nützlich sein könnten,
    darüber zu diskutieren.
  • 14:09 - 14:12
    Das Projekt war ursprünglich
    ein Wikipedia-Projekt mit diesem Namen,
  • 14:12 - 14:15
    einfach weil es das war,
    mit dem die Leute vertraut waren,
  • 14:15 - 14:18
    und so organisierten wir
    mehrere verschiedene Ereignisse
  • 14:18 - 14:21
    bei sehr traditionellen Edit-a-thons,
  • 14:21 - 14:24
    die Arbeit mit den geschlechtsspezifischen
    Unterschieden und so weiter.
  • 14:25 - 14:27
    Und eine Menge, die Sie sehen
    können, [unverständlich],
  • 14:27 - 14:30
    und eine Reihe von sehr erfolgreichen
    neuen Redakteuren eingestellt,
  • 14:30 - 14:31
    und so weiter.
  • 14:32 - 14:34
    Wir haben Massen-Uploads
    in Commons durchgeführt.
  • 14:35 - 14:41
    In diesem Fall gab es eine Sammlung
    von über 1000 Original-Kunstwerken
  • 14:41 - 14:46
    von einem entomologischen Illustrator,
    Des Helmore,
  • 14:46 - 14:48
    die auf einer Festplatte lagen,
  • 14:48 - 14:50
    weil zehn Jahre lang die Forschung fehlte
  • 14:50 - 14:54
    und wir waren in der Lage, diese
    alle unter der CC BY-Lizenz freizugeben.
  • 14:54 - 14:58
    Also, einfache Erfolge,
    die man den Leuten zeigen kann.
  • 14:58 - 15:01
    Jeder versteht viele Bilder von Käfern.
  • 15:01 - 15:03
    Jeder kann Workshops verstehen,
  • 15:03 - 15:04
    die sich der Beseitigung
  • 15:04 - 15:07
    geschlechtsspezifischer
    Unterschiede widmet.
  • 15:07 - 15:10
    Aber Wikidata ist viel schwieriger
  • 15:10 - 15:12
    den Menschen im GLAM-Sektor zu verkaufen
  • 15:12 - 15:15
    oder irgendjemand außerhalb
    unserer besonderen Bewegung.
  • 15:16 - 15:19
    So begann ich zu erkennen,
  • 15:19 - 15:23
    dass Wikidata
    eine größere und wichtigere Rolle
  • 15:23 - 15:26
    für das Wikipedian-At-Large-Projekt
    spielen sollte.
  • 15:26 - 15:30
    Im Laufe der Zeit wurde es also
    eine immer größere Komponente
  • 15:30 - 15:32
    dessen, was ich tat.
  • 15:32 - 15:36
    Und ich begann, mir selbst auch
    mehr über Wikidata beizubringen,
  • 15:37 - 15:40
    weil ich anfing zu sehen,
    wie wichtig es war.
  • 15:40 - 15:42
    Also, dieses eine Projekt –
  • 15:42 - 15:46
    der Kakapo ist ein eingeborener
    neuseeländischer, flugunfähiger Papagei.
  • 15:48 - 15:51
    Wir arbeiteten mit
    dem Department of Conservation,
  • 15:51 - 15:54
    dessen Aufgabe ist,
    diese Art vor dem Aussterben zu retten,
  • 15:54 - 15:56
    und ich habe vorgeschlagen,
  • 15:56 - 15:59
    "Was wäre, wenn wir alle
    einzelnen Kakapo in Wikidata stellen"?
  • 16:01 - 16:03
    Und es mag lächerlich erscheinen,
  • 16:03 - 16:06
    aber es ist tatsächlich
    ein perfekt durchführbares Projekt.
  • 16:07 - 16:08
    Einige von ihnen sind bereits dort drin.
  • 16:09 - 16:12
    Eine wichtige Sache ist,
    dass es nicht viele Kakapos gibt.
  • 16:12 - 16:13
    Es ist also eine überschaubare Aufgabe.
  • 16:13 - 16:17
    Es waren 148, als ich anfing,
    und dann starb einer.
  • 16:17 - 16:21
    Und sie haben gerade
    eine große Zuchtsaison bis 213.
  • 16:22 - 16:23
    Das ist großartig.
  • 16:23 - 16:25
    Das sind die meisten Kakapo
    seit über 50 Jahren.
  • 16:26 - 16:28
    Das war also auch eine große Sache.
  • 16:28 - 16:31
    Das war jeden Tag
    in Neuseeland in den Nachrichten.
  • 16:31 - 16:33
    [unverständlich]
  • 16:33 - 16:36
    - (Person 1) In der New York Times.
    - (Mike) Tatsächlich? Oh, wie schön.
  • 16:36 - 16:39
    Ja, das waren nationale Nachrichten.
    Jeder mag diese Vögel.
  • 16:39 - 16:41
    Aber etwas Interessantes an ihnen
  • 16:41 - 16:44
    ist, weil im Gegensatz zu Arten,
    die zahlreicher sind,
  • 16:44 - 16:48
    wird einzelne Kakapo benannt,
    hat einen eindeutigen Namen
  • 16:48 - 16:50
    und eine eindeutige ID-Nummer,
  • 16:50 - 16:52
    und hat oft gute biographische Daten
  • 16:52 - 16:55
    darüber, wo und wann sie geboren sind,
  • 16:55 - 16:57
    geschlüpft sind,
    wer ihr Vater und Mutter war,
  • 16:57 - 16:58
    wann sie starben, wenn sie starben.
  • 16:58 - 17:01
    Es gibt also tatsächlich eine Datenbank
    des Ministeriums für Naturschutz
  • 17:01 - 17:03
    mit all diesen Informationen.
  • 17:03 - 17:07
    Und einer der berühmtesten Kakapos
    ist natürlich Sirocco,
  • 17:07 - 17:10
    wie Sie sehen können, ist er nach
    einem Wind benannt, wurde dort geboren.
  • 17:10 - 17:13
    Sirocco hat einen Twitter-Account,
  • 17:14 - 17:16
    mit dem Wikidata einige Probleme hatte,
  • 17:16 - 17:19
    denn anscheinend können sie
    einfach keine Twitter-Accounts haben.
  • 17:19 - 17:20
    Davon wusste ich nichts.
  • 17:21 - 17:23
    Er ist sogar auf einem Albumcover
    und so weiter.
  • 17:23 - 17:26
    Es gibt also mehrere Eigenschaften
  • 17:26 - 17:28
    bei diesem wahrscheinlich
    berühmtesten einzelnen Kakapo.
  • 17:28 - 17:31
    Also habe ich dem Department
    of Conservation vorgeschlagen,
  • 17:31 - 17:33
    "Warum versuchen wir nicht,
    dies für jeden einzelnen zu tun?"
  • 17:33 - 17:38
    Und so mussten sie darüber nachdenken,
    wie viel von den biographischen Daten
  • 17:38 - 17:39
    veröffentlicht werden könnten.
  • 17:39 - 17:41
    Und sie stellen eine kurze Liste auf.
  • 17:41 - 17:43
    Und jetzt haben wir, glaube ich,
  • 17:43 - 17:47
    212, 210 – ich glaube,
    ein Paar ist gestorben –
  • 17:47 - 17:51
    lebende Kakapo,
    die jetzt alle Kandidaten sind.
  • 17:51 - 17:53
    Und sie bekommen nur einen Namen,
    wenn sie flügge werden.
  • 17:53 - 17:56
    Solange sie noch Babys sind,
    erhalten sie bis dahin eine Codenummer.
  • 17:56 - 17:58
    Also, wenn sie ausgewachsen sind,
  • 17:58 - 18:02
    werden wir
    eine vollständige Wikidata schaffen,
  • 18:02 - 18:04
    wird die gesamte Art im Wikidata stehen.
  • 18:05 - 18:07
    Aber wir müssen eine Eigenschaft
    für DOC ID schaffen.
  • 18:07 - 18:09
    Ich möchte eigentlich
    mit den Leuten darüber reden.
  • 18:09 - 18:11
    Sollten wir eine sehr spezifische ID
    verwenden,
  • 18:11 - 18:13
    oder sollten wir eine ID ausstellen
  • 18:13 - 18:16
    die für alle einzelnen Vögel
    oder Pflanzen oder Tiere
  • 18:16 - 18:18
    funktionieren würde,
  • 18:18 - 18:22
    die in einem wissenschaftlichen
    Forschungsprojekt getaggt wurden?
  • 18:22 - 18:24
    Das ist eine gute Frage.
  • 18:25 - 18:27
    Das zweite Projekt
    war die Christchurch Kunstgalerie.
  • 18:28 - 18:32
    Es gibt nur sehr wenige Gemälde
    von Colin MacCahon,
  • 18:32 - 18:34
    Neuseelands berühmtester
    lebender Künstler.
  • 18:34 - 18:37
    Dies ist eine Zeichnung
    für das neuseeländische Schuljournal,
  • 18:37 - 18:38
    was von der Regierung finanziert wurde.
  • 18:38 - 18:41
    Es ist also tatsächlich
    in den Archiven Neuseelands,
  • 18:41 - 18:42
    die das Urheberrecht dafür besitzen.
  • 18:42 - 18:44
    Dies ist eine sehr
    ungewöhnliche Situation.
  • 18:45 - 18:47
    Ich arbeitete also mit
    der Christchurch Kunstgalerie,
  • 18:47 - 18:49
    die zusammen
    mit der Auckland Kunstgalerie
  • 18:49 - 18:53
    eine Website namens
    Find New Zealand Artists betreibt.
  • 18:53 - 18:56
    Ihre Aufgabe ist es, den Überblick
    über die Bestände jeder Institution
  • 18:56 - 18:59
    zu behalten, die Bestände
    eines neuseeländischen Künstlers hat.
  • 18:59 - 19:03
    Also, etwa 18.000 verschiedene Künstler
    in ihrer Datenbank,
  • 19:03 - 19:06
    und die meisten überhaupt
    mit sehr wenig Informationen.
  • 19:06 - 19:09
    Wir haben also eine Art
    Standard-Mix'n'Match gemacht.
  • 19:09 - 19:14
    Wir haben einen Export derer gemacht,
    die mindestens ein Geburtsdatum hatten,
  • 19:14 - 19:16
    oder ein Sterbedatum
    oder einen Geburtsort,
  • 19:16 - 19:18
    oder einen Sterbeort.
  • 19:18 - 19:21
    Das schränkt es also nicht sehr ein.
  • 19:21 - 19:23
    Und selbst dann waren wir nicht
    in der Lage, einige wenige zuzuordnen,
  • 19:23 - 19:26
    aber wir haben jetzt etwa 1500,
  • 19:26 - 19:29
    die bekannten Künstlern
    in Wikidata zugeordnet sind.
  • 19:29 - 19:30
    Was schön ist.
  • 19:30 - 19:32
    Aber was sie reizte –
  • 19:32 - 19:34
    dies ist ihre Website,
  • 19:34 - 19:39
    die wirklich nur die Bestandsverknüpfungen
    dort beinhaltet.
  • 19:39 - 19:41
    Aber diese biographischen Daten,
  • 19:41 - 19:46
    die sie derzeit für jeden
    einzelnen Künstler von Hand erstellen.
  • 19:46 - 19:49
    Und der Export
    und das Einfügen in Mix'n'Match
  • 19:49 - 19:52
    hat zahlreiche Tippfehler und Fehler
    und dergleichen aufgedeckt,
  • 19:52 - 19:54
    die sie nicht bemerkt haben.
  • 19:54 - 19:56
    Das passiert, wenn man
    die Dinge durch Excel laufen lässt,
  • 19:56 - 19:57
    dann tauchen diese Dinge auf.
  • 19:57 - 20:02
    Und der Wert von Wikidata
    wurde ihnen plötzlich bewusst,
  • 20:02 - 20:05
    als ich sagte: "Sie können sich
    diese Informationen einfach
  • 20:05 - 20:06
    aus Wikidata raus saugen".
  • 20:07 - 20:10
    Und das hat sie auf einmal
    kerzengerade sitzen lassen.
  • 20:10 - 20:12
    Ich denke, dies ist also
    eines der Verkaufsargumente.
  • 20:12 - 20:15
    Wenn Sie diese sorgfältig
    handkuratierte Website haben
  • 20:15 - 20:17
    mit 18.000 Einträgen,
    die voller Fehler sind,
  • 20:17 - 20:21
    und ihnen sagen, dass sie andere Menschen
    dazu bringen können
  • 20:21 - 20:23
    einige dieser Fakten zu überprüfen
    und für sie korrigieren –
  • 20:23 - 20:25
    dann kommt man zum Ziel.
  • 20:25 - 20:27
    Und dann verkündete ich die Idee,
  • 20:27 - 20:30
    dass sie dieses gesamte Geschichtsbuch
    der neuseeländischen Künstler
  • 20:30 - 20:33
    in den 30er Jahren in Christchurch
    "wikidatafizieren" können.
  • 20:33 - 20:35
    Und durch – gerade veröffentlicht –
  • 20:35 - 20:37
    laufen und durch
    jede einzelne Person laufen,
  • 20:37 - 20:40
    Verbindung, Ort, Ausstellung
    und so weiter.
  • 20:40 - 20:42
    Aber es ist ein Projekt
    von überschaubarer Größe,
  • 20:42 - 20:43
    und sie sind sehr begeistert darüber.
  • 20:44 - 20:47
    Und drittens wollte ich Ihnen
    Maori-Themenüberschriften zeigen.
  • 20:47 - 20:51
    Ein Waka ist ein Maori-Name
    für eine bestimmte Art von Kanu,
  • 20:51 - 20:52
    ein Kriegskanu.
  • 20:53 - 20:56
    Also, in der Nationalbibliothek
    von Neuseeland,
  • 20:56 - 20:59
    gibt es eine Liste für Waka,
    weil die Nationalbibliothek
  • 20:59 - 21:03
    tatsächlich ein eigenes Wörterbuch
    von Maori-Themenüberschriften hat,
  • 21:03 - 21:04
    in der Sprache der Maori.
  • 21:04 - 21:06
    Dort definiert wird also ein Waka,
  • 21:07 - 21:10
    auf Maori und Englisch definiert.
  • 21:10 - 21:12
    Aber gibt auch eine ganze Menge
    der Maori-Begriffe –
  • 21:12 - 21:14
    Sie können sie dort auf der Seite sehen.
  • 21:14 - 21:16
    Ein typischer Maori-Term wäre Taurapa.
  • 21:16 - 21:20
    Und eine Definition, zuerst auf Maori
    und dann auf Englisch.
  • 21:20 - 21:22
    Es ist der geschnitzte Achtersteven,
    den Sie dort sehen können.
  • 21:23 - 21:24
    Und auf Englisch Ware das "Sternpost",
  • 21:24 - 21:27
    aber Sie können nicht das Wort
    "Sternpost" für Taurapa verwenden,
  • 21:27 - 21:31
    weil Taurapa nur für bestimmte Arten
    von Kriegskanus funktioniert.
  • 21:31 - 21:34
    Es gibt also kein englisches
    Wortäquivalent dafür.
  • 21:35 - 21:38
    Und mir wurde plötzlich klar,
    dass es sich hier um eine ganze Ontologie
  • 21:38 - 21:42
    von kulturspezifischen Begriffen handelt,
    sehr sorgfältig ausgearbeitet
  • 21:42 - 21:48
    und von der Nationalen Bibliothek
    mit Maori ständig ergänzt,
  • 21:48 - 21:50
    mit Definitionen, mit Beschreibungen
    verbessert werden,
  • 21:50 - 21:52
    sowohl auf Englisch als auch auf Maori.
  • 21:52 - 21:53
    Wirklich aufregend.
  • 21:53 - 21:56
    Ich dachte plötzlich, wir könnten
    diese ganze Gruppe in Wikidata stellen –
  • 21:56 - 22:01
    zuerst auf Maori, dann auf Englisch
    übersetzt, wie erforderlich.
  • 22:01 - 22:02
    Wäre doch eine nette Abwechslung, oder?
  • 22:03 - 22:05
    Und hier ist
    die Urheberrechtslizenzierung.
  • 22:05 - 22:09
    Leider NonCommercial-NoDerivs.
  • 22:10 - 22:12
    Jetzt muss ich ein Gespräch
    mit ihnen beginnen,
  • 22:12 - 22:15
    warum sie diese Lizenz gewählt haben.
  • 22:16 - 22:20
    Und möglicherweise
    weil sie nur von den Maori bekommen,
  • 22:20 - 22:23
    die sich bereit erklärt haben,
    dieses Zeug zu machen,
  • 22:23 - 22:25
    wenn es eine Garantie gibt,
    dass keine dieser Informationen
  • 22:25 - 22:27
    für kommerzielle Zwecke verwendet wird.
  • 22:28 - 22:32
    Das ist also eine
    der frustrierenden Aspekte der Aufgabe,
  • 22:32 - 22:34
    mit dieser Art von Einschränkungen
    zurechtzukommen.
  • 22:34 - 22:37
    Das sind also die drei Dinge,
    die ich Ihnen vorstellen wollte,
  • 22:37 - 22:38
    um eine Diskussion in Gang zu bringen.
  • 22:38 - 22:41
    Einfügen einer ganzen Art in Wikidata.
  • 22:41 - 22:44
    Wie man tatsächlich die Vorstellung
    des Kurators einer Kunstgalerie
  • 22:44 - 22:46
    über den Wert von Wikidata ändert.
  • 22:46 - 22:50
    Und was wir machen,
    wenn wir eine vollständige Ontologie
  • 22:50 - 22:52
    in einer anderen Sprache sehen,
  • 22:52 - 22:56
    die leider mit einer restriktiven
    Creative-Commons-Lizenz versehen wurde.
  • 22:56 - 22:57
    Ich danke Ihnen.
  • 22:57 - 22:59
    (Beifall)
  • 23:11 - 23:14
    Hallo. Mein Name ist Joachim Neubert.
  • 23:14 - 23:16
    Ich arbeite für die ZBW,
  • 23:18 - 23:21
    das bedeutet Informationszentrum
    für Wirtschaft in Hamburg,
  • 23:21 - 23:24
    als wissenschaftlicher
    Software-Entwickler.
  • 23:25 - 23:28
    Und eine meiner Aufgaben im letzten Jahr
  • 23:28 - 23:31
    war eine Datenspende
    an Wikidata vorzubereiten
  • 23:32 - 23:37
    und ich möchte über
    unsere ersten Erfahrungen
  • 23:37 - 23:40
    der Spende von Metadaten
  • 23:40 - 23:43
    aus den Pressearchiven
    des 20. Jahrhunderts berichten.
  • 23:46 - 23:48
    Nach unserem besten Wissen,
  • 23:48 - 23:53
    ist dies das größte öffentliche
    Pressearchiv der Welt.
  • 23:54 - 23:59
    Es wurde zwischen
    1908 und 2005 gesammelt,
  • 24:01 - 24:10
    aus mehr als 1500 Zeitungen
    und Zeitschriften aus Deutschland,
  • 24:10 - 24:13
    aber auch international.
  • 24:15 - 24:17
    Und es deckt alles ab,
  • 24:17 - 24:23
    was für Hamburg von Interesse sein könnte,
  • 24:25 - 24:28
    Hamburger Geschäftsleute
  • 24:28 - 24:32
    die über die Welt expandieren wollten.
  • 24:35 - 24:36
    Wie Sie sehen können,
  • 24:36 - 24:39
    wurde dieses Material
    aus Zeitungen ausgeschnitten
  • 24:39 - 24:41
    und zu Papier gebracht,
  • 24:42 - 24:45
    und dann in Ordnern gesammelt.
  • 24:46 - 24:50
    Hier sehen Sie eine kleine Ecke
    des Personenarchivs,
  • 24:51 - 24:56
    und ähnlich wurden Informationen
    über Unternehmen gesammelt,
  • 24:56 - 25:00
    zu allgemeinen Themen, über Waren,
  • 25:02 - 25:06
    über alles, was interessant sein könnte.
  • 25:07 - 25:10
    Diese Ordner sind
  • 25:10 - 25:16
    bis etwa 1949 gescannt worden
  • 25:16 - 25:23
    durch das von der DFG geförderte Projekt
    in den Jahren 2004 bis 2007.
  • 25:24 - 25:31
    Ergebnis bisher sind 25.000
    thematische Dossiers
  • 25:32 - 25:33
    aus dieser Zeit.
  • 25:34 - 25:38
    Dies enthielt etwa 2 Millionen,
    oder mehr als 2 Millionen Seiten.
  • 25:39 - 25:42
    Und diese sind online.
  • 25:44 - 25:48
    Diese Anwendung wurde
    seinerzeit von der ZBW entwickelt,
  • 25:50 - 25:54
    die jetzt etwas veraltet aussieht,
  • 25:55 - 25:58
    nicht so hübsch, eher problematisch.
  • 25:59 - 26:04
    Es handelt sich um eine Anwendung,
    die auf Oracle-Architektur gebaut wurde,
  • 26:04 - 26:09
    es wurde mit ColdFusion gebaut,
    es läuft auf Windows-Servern,
  • 26:09 - 26:15
    also ist es auf lange Sicht
    nicht sehr nachhaltig.
  • 26:16 - 26:19
    Und wir haben diskutiert, sollten wir dies
  • 26:19 - 26:23
    auf eine hübschere, verknüpfte
    Datenanwendung migrieren,
  • 26:24 - 26:28
    oder sollten wir
    einen radikalen Schritt machen
  • 26:28 - 26:32
    und all diese Daten
    in die Öffentlichkeit bringen.
  • 26:33 - 26:37
    Wir haben diesen Daten
    eine CC0-Lizenz zugewiesen.
  • 26:37 - 26:41
    Und derzeit bewegen wir einige Haupt –
  • 26:42 - 26:44
    Zugriffsschichten zur
    Haupt-Entdeckungsschicht –
  • 26:44 - 26:46
    es ist also eine binäre Zugriffsschicht
  • 26:47 - 26:51
    in das offene, verlinkte Datennetz,
  • 26:51 - 26:57
    wo es tatsächlich am sinnvollsten ist,
  • 26:57 - 27:01
    um einige Metadaten
    in Wikidata einzufügen,
  • 27:02 - 27:07
    und um sicherzustellen, dass alle Ordner
  • 27:08 - 27:11
    der Sammlungen mit Wikidata verlinkt sind,
  • 27:11 - 27:13
    damit sie auffindbar sind,
  • 27:14 - 27:18
    und dass alle Metadaten über diese Ordner
  • 27:18 - 27:23
    auch in Wikidata übertragen werden.
  • 27:23 - 27:25
    Es kann also dort verwendet werden,
  • 27:25 - 27:28
    und es kann dort möglicherweise
    erweitert werden.
  • 27:29 - 27:32
    Diese Daten können korrigiert werden.
  • 27:33 - 27:36
    Aber es wird immer noch
    von der ZBW unterhalten,
  • 27:36 - 27:39
    was die Speicherung der Bilder angeht
  • 27:40 - 27:44
    die wir in keiner Weise freigeben können,
  • 27:46 - 27:47
    oder wir können keine
    Lizenz dafür erteilen
  • 27:47 - 27:51
    weil diese im Besitz
    der ursprünglichen Schöpfer sind.
  • 27:52 - 27:54
    Aber wir sorgen dafür,
  • 27:54 - 28:00
    dass sie durch einige, wiederum,
    als Metadaten-Dateien
  • 28:00 - 28:03
    über DFG-Viewer zugänglich sind
  • 28:03 - 28:06
    und in der Zukunft durch IIIF-Manifeste.
  • 28:07 - 28:11
    Und wir werden
    einige statische Zielseiten vorbereiten,
  • 28:12 - 28:18
    die als Daten-Referenzpunkte
    für Wikidata dienen werden,
  • 28:18 - 28:23
    als auch die Bereitstellung von Daten,
  • 28:23 - 28:26
    die nicht gut in Wikidata passen.
  • 28:31 - 28:37
    Für uns geht es um die Migration
    und Datenspende an Wikidata
  • 28:37 - 28:41
    mit unserer
    maßgeschneiderten Infrastruktur
  • 28:41 - 28:45
    des SPARQL-Endpunkts mit diesen Daten,
  • 28:46 - 28:49
    und wir haben im Grunde genommen
    verbundene Abfragen verwendet
  • 28:50 - 28:54
    zwischen diesem Endpunkt
    und dem Wikidata-Abfragedienst,
  • 28:54 - 28:58
    um entsprechende Aussagen zu erstellen
  • 28:59 - 29:02
    durch Verkettung
  • 29:02 - 29:07
    in SPARQL-Abfragen selbst,
    oder über ein Skript transformiert,
  • 29:08 - 29:12
    das auch Referenzen
    für die Aussagen generiert.
  • 29:13 - 29:20
    Und dann in QuickStatements,
    auch Code, um diesen online zu verwenden.
  • 29:23 - 29:24
    Also, das ist, was wir erhalten.
  • 29:24 - 29:27
    Es sind nicht nur einfache Dinge
    wie zum Beispiel Geburtsdaten,
  • 29:27 - 29:29
    aber, tut mir leid –
  • 29:30 - 29:35
    aber auch komplexe Aussagen
  • 29:35 - 29:40
    über bereits vorhandene Gegenstände,
  • 29:40 - 29:45
    wie diese Person war
    ein Vorstandsmitglied der genannten Firma
  • 29:47 - 29:49
    während dieser Zeitspanne,
  • 29:50 - 29:52
    und referenziert...
  • 29:52 - 29:57
    zur Verwendung
  • 29:57 - 30:02
    im wissenschaftlichen Kontext.
  • 30:08 - 30:11
    Der erste Teil dieser Datenspende
    ist beendet.
  • 30:13 - 30:17
    Das Personen-Archiv
    ist vollständig mit Wikidata verknüpft.
  • 30:18 - 30:23
    Und es fügt auch eine Menge Informationen
  • 30:23 - 30:27
    vielen Dingen hinzu,
    die schon vorhanden waren,
  • 30:27 - 30:30
    aber keine externen Referenzen hatten.
  • 30:31 - 30:36
    Und wir hatten mehr als 6000 Angaben,
  • 30:36 - 30:42
    die jetzt in den Metadaten
    des Pressearchivs vorhanden sind.
  • 30:45 - 30:50
    Nun, das war der einfachste Teil,
  • 30:51 - 30:55
    weil Personen leicht in Wikidata
    identifizierbar sind.
  • 30:56 - 31:00
    Mehr als 90 Prozent existierten bereits,
  • 31:00 - 31:02
    damit konnten wir
    eine Verbindung herstellen.
  • 31:02 - 31:09
    Wir haben für die Fehlenden
    etwa 100 Artikel erstellt,
  • 31:09 - 31:15
    Aber jetzt arbeiten wir
  • 31:15 - 31:18
    am Rest des Archivs,
  • 31:18 - 31:20
    insbesondere am Themen-Archiv.
  • 31:21 - 31:27
    Das bedeutet, ein historisches System
    zur Wissensorganisation
  • 31:27 - 31:30
    über die ganze Welt zu mappen,
  • 31:30 - 31:34
    materialisiert als Zeitungsausschnitte
    in Wikidata.
  • 31:36 - 31:42
    Um Ihnen eine grundlegende Vorstellung
    zu geben, das Länder- und Themen-Archiv
  • 31:43 - 31:49
    ist nach einer Hierarchie von Ländern
  • 31:49 - 31:51
    und anderen geographischen
    Einheiten organisiert,
  • 31:52 - 31:56
    die ins Englische übersetzt wird,
    was es einfacher macht.
  • 31:56 - 32:02
    Und das Deutsch ist tief verschachtelt...
  • 32:04 - 32:08
    eine tief verschachtelte Klassifizierung
    der Themen.
  • 32:08 - 32:12
    Und diese Kombination definiert eine...
  • 32:13 - 32:16
    einer [unverständlich].
  • 32:16 - 32:20
    Was wir jetzt also tun wollen, ist,
  • 32:20 - 32:25
    die Daten strukturell an Wikidata
    anzupassen und einzubringen.
  • 32:25 - 32:29
    Und ich möchte Sie einladen,
  • 32:29 - 32:34
    sich dieser wirklich schönen
    Herausforderung
  • 32:34 - 32:36
    in Bezug auf die Wissensorganisation
    anzuschließen.
  • 32:38 - 32:41
    Es gibt ein WikiProjekt,
    wo diese Arbeit verfolgt wird,
  • 32:41 - 32:46
    und Sie können dies verfolgen
    oder sich daran beteiligen.
  • 32:47 - 32:49
    Und, ja, vielen Dank.
  • 32:50 - 32:52
    (Beifall)
  • 33:04 - 33:07
    (Beat) Also, wir bringen
    die darstellenden Künste zu Wikidata.
  • 33:08 - 33:12
    Und wir bringen die darstellenden Künste
    in die verknüpfte offene Datenwolke,
  • 33:12 - 33:14
    durch den Aufbau eines verknüpften
    offenen Daten-Ökosystems
  • 33:14 - 33:16
    für die darstellenden Künste.
  • 33:16 - 33:21
    Und die Frage,
    die ich zu beantworten versuche,
  • 33:21 - 33:24
    und ich hoffe, dass Sie mir
    bei der Beantwortung der Fragen
  • 33:24 - 33:27
    helfen werden, auf welchem Ort
    in Wikidata und all das ist.
  • 33:27 - 33:31
    Aber lassen Sie mich zuerst
    mit meinen Erfahrungen beginnen,
  • 33:31 - 33:34
    die ich dieses Jahr gemacht habe,
  • 33:35 - 33:38
    in der ersten Jahreshälfte,
    als ich das Vergnügen hatte
  • 33:38 - 33:39
    mit CAPACOA zu arbeiten,
  • 33:39 - 33:42
    das ist die Canadian Arts
    Presenting Association,
  • 33:42 - 33:47
    die tatsächlich ein Projekt namens
    Linked Digital Future Initiative
  • 33:48 - 33:51
    gestartet hat, um tatsächlich
    den gesamten Kunstsektor in Kanada,
  • 33:51 - 33:53
    in verknüpften offenen Daten zu erfassen.
  • 33:53 - 33:57
    Und sie taten dies
    aufgrund der Beobachtung,
  • 33:57 - 33:59
    dass in den letzten fünf Jahren,
  • 34:00 - 34:04
    das immens wichtige Thema
    innerhalb der darstellenden Künste
  • 34:04 - 34:06
    die Tatsache war, dass die Metadaten
  • 34:06 - 34:09
    nicht in ausreichender Qualität vorhanden
  • 34:09 - 34:12
    und nicht interoperabel
    miteinander verbunden waren.
  • 34:12 - 34:16
    Und das war der Grund
    warum einige der Aufführungen,
  • 34:16 - 34:20
    einige der Ereignisse nicht so gut
  • 34:20 - 34:22
    durch Google und durch persönliche
    computergestützte Assistenten
  • 34:23 - 34:25
    und so weiter
    auffindbar waren.
  • 34:26 - 34:30
    Also, die Vision,
    die wir gemeinsam entwickelten,
  • 34:30 - 34:33
    war, dass wir eine Wissensbasis
  • 34:34 - 34:36
    für viele Beteiligte
    gleichzeitig haben wollten.
  • 34:36 - 34:40
    Wir haben uns also das gesamte Netzwerk
    für die darstellenden Künste angeschaut,
  • 34:40 - 34:42
    haben dort die wichtigsten
    Interessenvertreter identifiziert,
  • 34:42 - 34:47
    haben uns die Nutzungsszenarien angesehen,
    die wir gerne verfolgen würden,
  • 34:48 - 34:52
    und wir haben irgendwie
    in einer gesamten Architektur
  • 34:52 - 34:57
    einer solchen Wissensbasis abgebildet,
    oder den verschiedenen Plattformen dort,
  • 34:57 - 35:00
    was natürlich
    eine verteilte Architektur ist,
  • 35:00 - 35:01
    und nicht ein großer Monolith.
  • 35:02 - 35:06
    Ich werde das einfach
    relativ schnell durchgehen,
  • 35:06 - 35:08
    denn wir haben jeweils
    nur zehn Minuten Zeit.
  • 35:09 - 35:13
    Aber ich denke, wir werden heute
    Abend oder morgen viel Zeit haben,
  • 35:13 - 35:16
    das zu vertiefen, falls jemand
    an den Details interessiert ist.
  • 35:16 - 35:19
    Wir begannen also mit
    dem Performing Arts Value Network,
  • 35:19 - 35:23
    das, interessanterweise,
    erst letztes Jahr veröffentlicht wurde.
  • 35:23 - 35:26
    Wir haben also das Glück,
    dass wir in der Lage sind
  • 35:26 - 35:28
    auf der bisherigen Arbeit aufzubauen,
  • 35:28 - 35:31
    man hat die primäre Wertschöpfungskette
    der darstellenden Künste in der Mitte,
  • 35:31 - 35:34
    und verschiedene Interessengruppen
    in diesem Bereich.
  • 35:34 - 35:37
    Alles in allem haben wir
    20 Interessengruppen identifiziert,
  • 35:37 - 35:43
    die wir dann irgendwie
    auf sieben größere Kategorien
  • 35:43 - 35:45
    für jede der Interessengruppen
    reduziert haben.
  • 35:45 - 35:52
    Wir haben irgendwie formuliert,
    welche Art von Bedürfnissen
  • 35:52 - 35:55
    welche Bedürfnisse sie
    in einer solchen Infrastruktur hätten,
  • 35:55 - 35:59
    und was sie erreichen könnten,
    wenn das Ganze miteinander verbunden wäre
  • 35:59 - 36:02
    und die Daten öffentlich zugänglich wären.
  • 36:03 - 36:05
    Und so können Sie die Typen hier sehen,
  • 36:05 - 36:09
    die verschiedenen Typen sind Produktion,
    dann Präsentation & Werbung,
  • 36:09 - 36:12
    Erfassung und Wiederverwendung,
    Live-Publikum,
  • 36:12 - 36:14
    Online-Gebrauch, Erbe,
  • 36:14 - 36:16
    Forschung & Bildung.
  • 36:16 - 36:19
    Und nachdem wir
    eine Art großen Tisch aufgestellt hatten,
  • 36:19 - 36:21
    von dem Sie nur
    den ersten Teil hier sehen können,
  • 36:21 - 36:24
    haben wir irgendwie verglichen,
    einen Blick darauf geworfen,
  • 36:24 - 36:27
    welche Art von Daten
    tatsächlich flächendeckend
  • 36:27 - 36:31
    von allen verschiedenen Interessengruppen
    eingesetzt wurden.
  • 36:31 - 36:37
    Und es gibt eine ziemlich
    große gemeinsame Datenbasis,
  • 36:37 - 36:38
    und das ist wirklich der Bereich,
  • 36:38 - 36:43
    wo es eigentlich sehr sinnvoll ist,
    diese zu integrieren und zu behalten,
  • 36:43 - 36:46
    um die Daten gemeinsam zu pflegen.
  • 36:48 - 36:51
    Wenn wir also über
    Plattform-Architektur reden
  • 36:51 - 36:54
    können Sie sehen, dass wir
    hier vier Schichten haben.
  • 36:54 - 36:56
    Unten zeigt die Datenschicht an.
  • 36:56 - 36:59
    Natürlich spielt Wikidata
    dabei eine Rolle,
  • 36:59 - 37:03
    aber auch viele andere Datenbanken,
    verteilte Datenbanken,
  • 37:03 - 37:08
    die Daten durch SPARQL-Endpunkte
    freigeben können.
  • 37:09 - 37:13
    Der gelbe Teil in der Mitte,
    das ist die semantische Ebene.
  • 37:13 - 37:16
    Es ist unsere gemeinsame Sprache,
    um unsere Dinge zu beschreiben,
  • 37:16 - 37:20
    Aussagen über Dinge zu machen
    rund um die darstellenden Künste,
  • 37:20 - 37:22
    die Ontologie.
  • 37:22 - 37:25
    Dann haben wir eine Anwendungsschicht,
  • 37:25 - 37:31
    die aus verschiedenen Modulen besteht,
    zum Beispiel die Datenanalyse,
  • 37:31 - 37:35
    Datenextraktion – also, wie man
    tatsächlich unstrukturierte Daten
  • 37:35 - 37:36
    in strukturierte Daten wandeln kann,
  • 37:36 - 37:39
    wie wir das durch Werkzeuge
    unterstützen können.
  • 37:39 - 37:42
    Dann gibt es natürlich
    eine Visualisierung der Daten –
  • 37:42 - 37:44
    also wenn es große Datenmengen gibt,
  • 37:44 - 37:47
    möchte man diese
    auf irgendeine Weise visualisieren.
  • 37:48 - 37:50
    Und oben haben Sie
    die Präsentationsschicht,
  • 37:50 - 37:53
    womit die normalen Leute tatsächlich
  • 37:53 - 37:56
    auf täglicher Basis mit interagieren –
  • 37:56 - 38:00
    Suchmaschinen, Enzyklopädien,
    kulturelle Agendas,
  • 38:00 - 38:02
    und eine Vielzahl
    anderer Dienstleistungen.
  • 38:03 - 38:05
    Wir fangen nicht bei Null an.
  • 38:05 - 38:09
    Einige Arbeiten sind bereits
    in diesem Bereich geleistet worden.
  • 38:09 - 38:13
    Ich möchte nur einige Beispiele
    aus einem Projekt nennen,
  • 38:13 - 38:15
    an denen ich beteiligt war.
  • 38:15 - 38:18
    Es gibt auch einige andere Dinge.
  • 38:18 - 38:21
    Und so begann ich in diesem Bereich
  • 38:21 - 38:24
    mit dem Schweizer Archiv
    der darstellenden Künste.
  • 38:25 - 38:28
    Bis zum Aufbau einer Schweizer
    Datenbank für darstellende Künste,
  • 38:28 - 38:31
    haben wir die Ontologie
    der darstellenden Künste geschaffen,
  • 38:31 - 38:34
    die derzeit in der RDF implementiert wird.
  • 38:35 - 38:40
    Und da haben wir eine Datenbank
    mit etwa 60, 70 Jahren
  • 38:40 - 38:43
    Aufführungsgeschichte in der Schweiz.
  • 38:43 - 38:45
    Das ist also etwas,
    worauf man aufbauen kann,
  • 38:45 - 38:49
    und das ist etwas,
    das in RDF umgewandelt wird.
  • 38:50 - 38:53
    Und es gab eine Builder-Plattform,
  • 38:53 - 38:55
    wo auf diese Daten
    zugegriffen werden kann.
  • 38:56 - 39:02
    Dann haben wir mehrere Einspielungen
    in Wikidata gemacht,
  • 39:02 - 39:03
    teilweise aus der Schweiz,
  • 39:03 - 39:09
    teilweise auch von
    den Institute der darstellende Künste,
  • 39:10 - 39:12
    wo zum Beispiel Bart Magnus
    auch daran beteiligt war.
  • 39:13 - 39:15
    Er war die treibende Kraft dahinter.
  • 39:15 - 39:17
    Es gibt auch Material
    aus Wikimedia Commons,
  • 39:17 - 39:21
    aber nicht sehr gut vernetzt
    mit all unseren übrigen Metadaten.
  • 39:21 - 39:25
    Und natürlich, während der Einspielung,
  • 39:25 - 39:29
    haben wir auch irgendwie begonnen,
    Teile dieses Restate-Modells
  • 39:29 - 39:31
    in Wikidata zu stellen.
  • 39:33 - 39:38
    Dann ist einer der kanadischen
    Implementierungspartner
  • 39:38 - 39:39
    Culture Creates.
  • 39:39 - 39:41
    Sie betreiben eine Plattform,
  • 39:41 - 39:44
    die tatsächlich Informationen
    von Theater-Websites ausliest,
  • 39:44 - 39:47
    und sie in einen Wissensgraphen eingeben,
  • 39:48 - 39:54
    um sie dann den Suchmaschinen
    und andere Suchgeräten auszusetzen.
  • 39:56 - 39:59
    Und auch hier hatten wir irgendwie dies
  • 39:59 - 40:03
    in der Ontologie umzusetzen
    und zu erweitern.
  • 40:03 - 40:08
    Und wie Sie auf der Folie sehen können,
    gibt es so viele leere Räume,
  • 40:08 - 40:10
    aber es gibt auch Überschneidungen,
  • 40:10 - 40:13
    und eine wichtige Überschneidung,
    ist offensichtlich die gemeinsame Sprache,
  • 40:13 - 40:19
    die uns dabei helfen wird,
    die verschiedenen Datensätze zu Verlinken.
  • 40:21 - 40:23
    Was natürlich auch wichtig ist,
  • 40:23 - 40:26
    ist, dass wir die gleichen Basisregister
    und Autoritätsdateien nutzen.
  • 40:26 - 40:30
    Und dies ist der Ort, an dem Wikidata
  • 40:30 - 40:34
    durch deren Verknüpfung
    eine wichtige Rolle spielt.
  • 40:35 - 40:38
    Nun möchte ich die Empfehlungen
  • 40:38 - 40:42
    des Beratungsausschusses der
    Linked Data Future Initiatives mitteilen.
  • 40:43 - 40:45
    Zumindest die beiden ersten Empfehlungen.
  • 40:45 - 40:48
    Also, für die Kanadier,
    ist es jetzt absolut entscheidend
  • 40:48 - 40:53
    ihren eigenen kanadischen Wissensgraph
    der darstellenden Künste zu füllen,
  • 40:53 - 40:56
    denn im Gegensatz zum Schweizer Archiv
    der darstellenden Künste,
  • 40:56 - 40:59
    beginnen sie nicht
    mit einer bereits vorhandenen Datenbank,
  • 40:59 - 41:02
    sondern sie erstellen von Grund auf neu.
  • 41:02 - 41:04
    Und es ist absolut wichtig,
    dort Daten drin zu haben.
  • 41:04 - 41:09
    Und zweitens, wie Sie sehen können,
    kommt bereits Wikidata.
  • 41:09 - 41:12
    Wikidata, durch den Beratungsausschuss,
  • 41:12 - 41:16
    wird als komplementär
    zu Artsdata.ca, betrachtet,
  • 41:16 - 41:18
    diesen Wissensgraphen,
  • 41:18 - 41:21
    und deshalb sollten Anstrengungen
    unternommen werden,
  • 41:21 - 41:25
    einen Beitrag an dieses Publikum mit Daten
    zur darstellenden Kunst zu leisten.
  • 41:26 - 41:28
    Und genau daran werden wir
  • 41:28 - 41:31
    in den kommenden Monaten
    und Jahren arbeiten,
  • 41:31 - 41:35
    und das ist auch der Grund,
    warum ich bin hier auf der Suche bin,
  • 41:35 - 41:39
    um zu sehen, wer sich noch
    an diesen Bemühungen beteiligen wird.
  • 41:41 - 41:42
    Also, im Moment, sagen wir,
  • 41:42 - 41:45
    dass sie sich offensichtlich
    ergänzen müssen.
  • 41:45 - 41:48
    Wir müssen also
    über die Plus- und Minuspunkte
  • 41:48 - 41:50
    der einzelnen Ansätze nachdenken.
  • 41:50 - 41:52
    Und hier sehen Sie einen Vergleich
  • 41:52 - 41:56
    zwischen Wikidata und
    dem klassischen Linked Open Data-Ansatz.
  • 41:57 - 42:00
    Ich würde gerne darüber
    weiter mit euch diskutieren,
  • 42:00 - 42:03
    wie eure Erfahrungen dort sind.
  • 42:03 - 42:04
    Aber aus meiner Sicht hat Wikidata
  • 42:04 - 42:08
    einen großen Pluspunkt, weil es sich
    um eine Crowdsourcing-Plattform handelt,
  • 42:08 - 42:10
    und es ist einfach,
    weitere Gruppen einzuladen,
  • 42:10 - 42:12
    um tatsächlich einen Beitrag zu leisten.
  • 42:12 - 42:15
    Auf der negativen Seite
    hat man offensichtlich
  • 42:15 - 42:18
    dieses Problem des Kontrollverlustes.
  • 42:18 - 42:23
    Dateneigentümer müssen die Kontrolle
    über ihre Diagramme, Datenqualität
  • 42:23 - 42:24
    und Vollständigkeit aufgeben.
  • 42:27 - 42:29
    Auf Wikidata ist es
    schwieriger zu verfolgen,
  • 42:29 - 42:31
    als wenn man es
    unter eigener Kontrolle hat.
  • 42:31 - 42:34
    Und die andere Stärke von Wikidata
  • 42:34 - 42:40
    ist, dass sie eine sofortige Integration
    in diesen weltweiten Graphen erfordert.
  • 42:40 - 42:42
    Und man macht einfach –
  • 42:43 - 42:47
    Schritt für Schritt eine Abstimmung
    gegen andere Datenbanken,
  • 42:47 - 42:50
    was einige auch als Vorteil sehen,
  • 42:50 - 42:54
    aber natürlich, wenn man nach Integration
    und Interoperabilität sucht,
  • 42:54 - 42:57
    zwingt Wikidata einen dazu,
    das von Anfang an zu tun.
  • 42:59 - 43:03
    Und dann natürlich ist die Harmonisierung
    der Datenmodellierungspraktiken
  • 43:03 - 43:06
    in beiden Fällen ein Thema.
  • 43:06 - 43:08
    Aber es mag am Anfang den Anschein haben,
  • 43:08 - 43:11
    es wäre einfacher,
    das nur in seinen eigenen Silo zu machen,
  • 43:11 - 43:13
    denn irgendwann ist man
    mit der Aufgabe fertig,
  • 43:13 - 43:17
    und es wäre
    eine fortlaufende Aufgabe auf Wikidata.
  • 43:18 - 43:23
    Wenn es nun darum geht, Prioritäten
    für die einzuspielenden Daten zu setzen,
  • 43:24 - 43:28
    das sind irgendwie die Regeln,
    nach denen ich im Moment arbeite.
  • 43:30 - 43:32
    Zunächst einmal möchten wir es einlesen,
  • 43:32 - 43:36
    wobei es unklar ist, wer die natürliche
    Autorität in dem betreffenden Gebiet wäre.
  • 43:36 - 43:40
    Das sind also definitiv Daten,
    die gemeinsam verwaltet werden.
  • 43:41 - 43:44
    Und wir möchten es dort einlesen,
  • 43:44 - 43:47
    wo wir sehen, dass es ein hohes Potenzial
    für Crowdsourcing-Ansätze gibt.
  • 43:47 - 43:49
    Wir würden gerne Daten einlesen,
  • 43:50 - 43:52
    bei denen die Daten wahrscheinlich
  • 43:52 - 43:54
    im Zusammenhang mit Wikipedia
    wiederverwendet werden.
  • 43:55 - 43:57
    Und es besteht auch die Hoffnung,
  • 43:57 - 44:00
    dass ein Teil
    der internationalen Koordination,
  • 44:00 - 44:04
    um die gesamte Datenmodellierung herum,
    über die Standardisierung,
  • 44:04 - 44:08
    tatsächlich direkt
    auf Wikidata stattfinden könnte,
  • 44:08 - 44:09
    wenn es nicht anderswo stattfindet,
  • 44:09 - 44:13
    weil es die Menschen irgendwie zwingt,
    mit der Interaktion zu starten,
  • 44:13 - 44:14
    wenn sie in die gleichen Bereiche
  • 44:14 - 44:15
    einlesen.
  • 44:16 - 44:18
    Und wir möchten uns jetzt als Nächstes
  • 44:18 - 44:22
    auf Basisregistern und
    Authoritätsdateien konzentrieren,
  • 44:22 - 44:25
    weil sie uns irgendwie helfen
  • 44:25 - 44:27
    die Verknüpfungen zwischen
    verschiedenen Daten
  • 44:27 - 44:29
    und unkontrollierten Vokabularien,
  • 44:29 - 44:33
    als eine Erweiterung
    der bestehenden Ontologie zu erstellen.
  • 44:34 - 44:36
    Also, nur noch zwei weitere Folien.
  • 44:36 - 44:41
    Die nächsten Schritte werden sein,
    dass wir die Summe aller GLAMs-Ansätze
  • 44:41 - 44:43
    zu Wiki Loves Performing Arts bringen.
  • 44:43 - 44:48
    Das heißt, wir beschreiben
    Veranstaltungsorte und Organisationen,
  • 44:48 - 44:51
    und versuchen, die Daten
    an Wikipedia weiterzuleiten,
  • 44:51 - 44:54
    in Form von Infoboxen
    und Bubble-Templates.
  • 44:54 - 44:58
    Und das andere, die anderen Projekte,
    die ich verfolgen werde,
  • 44:58 - 45:03
    ist die COST-Aktion,
    die wir nächstes Jahr einreichen werden,
  • 45:03 - 45:06
    um das Linked Open Data-Ökosystem
    für die darstellenden Künste herum.
  • 45:06 - 45:10
    COST ist ein europäisches Programm,
    das Netzwerkaktivitäten unterstützt,
  • 45:10 - 45:14
    und die zu behandelnden Themen
    sind hier aufgeführt.
  • 45:14 - 45:16
    Zwei von ihnen habe ich herausgestellt –
  • 45:16 - 45:21
    eine davon ist die Frage
    einer Verbindung zwischen Wikidata
  • 45:21 - 45:24
    und den klassischen, verbundenen,
    offenen Datenansätzen.
  • 45:24 - 45:28
    Und die andere, glaube ich,
    ist auch sehr wichtig,
  • 45:28 - 45:31
    wo wir noch ein riesiges Potenzial haben,
  • 45:31 - 45:34
    internationale Kampagnen
    zur Ergänzung der Daten
  • 45:34 - 45:36
    auf Wikidata durchzuführen.
  • 45:38 - 45:41
    So, das war's. Ich danke Ihnen
    für Ihre Aufmerksamkeit.
  • 45:41 - 45:46
    Nun möchte ich meine Kollegen
    einladen, hierher zu kommen.
  • 45:47 - 45:51
    Vielleicht kriegen sie auch Mikrofone.
  • 45:54 - 45:56
    Und dann würde ich gerne...
  • 45:57 - 46:00
    Ihnen die Möglichkeit geben,
    Fragen zu stellen.
  • 46:01 - 46:05
    Und natürlich auch meine Kollegen fragen,
  • 46:06 - 46:08
    ob sie Fragen aneinander haben.
  • 46:12 - 46:15
    Haben wir vielleicht
    eine Frage aus dem Publikum?
  • 46:21 - 46:23
    (Person 2) [unverständlich]
  • 46:24 - 46:27
    Ich möchte Sie alle fragen,
  • 46:27 - 46:31
    wo würden Sie die Grenze ziehen,
  • 46:31 - 46:33
    im Grunde genommen, wie definieren Sie –
  • 46:33 - 46:36
    wann müssen Sie
    Ihre eigene Wikibase betreiben,
  • 46:36 - 46:39
    und was möchten Sie
    auf Wikidata einstellen?
  • 46:39 - 46:43
    Ist dies eine klare Abgrenzung,
    oder was steht hinter der Idee,
  • 46:43 - 46:46
    das hier und dorthin zu tun.
  • 46:48 - 46:51
    (Susanna) Ich kann zuerst antworten,
    weil ich das Mikrofon habe.
  • 46:51 - 46:57
    Also, ich habe nachgedacht,
    dass eines der Themen die Notabilität ist.
  • 46:59 - 47:02
    Ich spreche das
    in einem anderen Projekt an.
  • 47:02 - 47:06
    Und ich denke, die Lizenzierung
    könnte ein Thema sein,
  • 47:06 - 47:10
    weil Sie Ihre eigenen Bedingungen in
    Ihrer eigenen Datenbank anwenden können,
  • 47:10 - 47:14
    und dann denke ich,
    wo immer es möglich ist.
  • 47:14 - 47:20
    Und dann, das dritte ist,
    es einfach als Sandbox zu haben,
  • 47:20 - 47:23
    um es für die Einspielung
    in Wikidata vorzubereiten.
  • 47:23 - 47:26
    Dies sind die drei wichtigsten Dinge,
    die mir jetzt einfallen,
  • 47:26 - 47:29
    aber ich könnte mir
    noch weitere einfallen lassen.
  • 47:30 - 47:32
    (Mike) Für mich werden Rechte
    immer ein Thema sein.
  • 47:32 - 47:37
    Wenn sich also die Nationalbibliothek
    in Richtung Wikibase bewegen wollte,
  • 47:37 - 47:40
    was ihnen ermöglichen würde,
    Kontrolle über Lizenzierung zu behalten,
  • 47:40 - 47:43
    für die Arbeit, die sie mit Begriffen
    aus der Maori-Sprache geleistet haben.
  • 47:43 - 47:48
    Die Kakapo-Datenbank enthält nur Daten,
    von denen das Department of Conservation
  • 47:48 - 47:50
    das Gefühl hat, dass man
    das öffentlich machen kann,
  • 47:50 - 47:53
    aber ich vermute,
    wenn sie sehen, wenn es läuft,
  • 47:53 - 47:56
    könnten sie in Versuchung geraten,
    eine private Wikibase zu benutzen,
  • 47:56 - 47:58
    um ihre eigene Datenbank zu pflegen,
  • 47:58 - 48:01
    einfach wegen einiger
    Visualisierungswerkzeuge,
  • 48:01 - 48:04
    die angewendet werden könnte,
  • 48:04 - 48:06
    die vielleicht besser sind,
    als das Excel-Spreadsheet-System,
  • 48:06 - 48:08
    das sie derzeit nutzen.
  • 48:12 - 48:17
    (Joachim) Nun, ich denke, das hängt
    sehr stark von der Art der Daten ab.
  • 48:18 - 48:22
    Wir sind natürlich mit dem Pressearchiv
    in der recht glücklichen Lage,
  • 48:22 - 48:27
    dass es sich dabei um Material handelt,
    das veröffentlicht wurde,
  • 48:27 - 48:30
    es wurde damals veröffentlicht,
  • 48:30 - 48:32
    aber die Veröffentlichung war teuer.
  • 48:33 - 48:36
    Das ist also ganz einfach.
  • 48:36 - 48:39
    Ich denke auch Projekte –
  • 48:40 - 48:42
    und dies ist
    ein typisches Projektwerkzeug,
  • 48:42 - 48:46
    es wurde eine Zeit lang finanziert,
    und dann endete die Finanzierung,
  • 48:46 - 48:52
    und was mit den Daten geschieht,
    die in einem Silo eingeschlossen ist,
  • 48:52 - 48:55
    und Software, die nicht ewig laufen wird.
  • 48:56 - 48:59
    Und so macht es für mich absolut Sinn.
  • 49:00 - 49:03
    Damals war Wikidata nicht vorhanden,
    aber jetzt ist es da,
  • 49:03 - 49:07
    und es macht absolut Sinn
    für unser Projekt,
  • 49:07 - 49:11
    früh über Nachhaltigkeit zu diskutieren,
    im Kontext von:
  • 49:11 - 49:17
    wie können wir das in ein größeres
    Ökosystem wie Wikidata transferieren,
  • 49:19 - 49:21
    und dies mit der Datengemeinschaft
    diskutieren,
  • 49:21 - 49:27
    was ist nennenswert und was macht Sinn,
    dies zu Wikidata hinzuzufügen,
  • 49:27 - 49:32
    und was ist sinnvoll,
    in proprietärer Form zu behalten.
  • 49:32 - 49:38
    Vielleicht in einer einfacheren Form,
    als eine anspruchsvolle Anwendung,
  • 49:38 - 49:43
    aber es auffindbar zu machen und
    mit der großen Daten-Cloud zu verknüpfen,
  • 49:43 - 49:46
    anstatt viel Geld zu investieren
  • 49:46 - 49:53
    in irgendein Silo, das keine Zukunft hat.
  • 49:55 - 49:58
    (Beat) Ja, wie ich schon sagte,
  • 49:58 - 50:00
    in dem Projekt,
    das ich hier vorgestellt habe,
  • 50:00 - 50:02
    sind Dualitäten zwischen Wikidata
  • 50:02 - 50:05
    und klassischen verknüpften
    offenen Datenansätze.
  • 50:05 - 50:08
    Es geht also nicht so sehr um
    die Einrichtung einer privaten Wikibase.
  • 50:11 - 50:15
    Eine Herausforderung, die wir hatten,
    und natürlich auch bei Wikidata,
  • 50:15 - 50:18
    ist, dass wenn wir
    die eigenen Daten dort einspielen,
  • 50:18 - 50:20
    müssen wir auch etwas Haushaltung
  • 50:21 - 50:24
    von Menschen erledigen,
    von anderen Menschen, eigentlich.
  • 50:24 - 50:26
    Und das könnte die Menschen abschrecken,
  • 50:26 - 50:28
    oder es bedeutet auch, dass wir uns damit
  • 50:28 - 50:30
    einfach Schritt für Schritt
    befassen werden.
  • 50:30 - 50:32
    Also wird es im Moment
  • 50:32 - 50:36
    eine Datenbank in klassisch
    verknüpften offenen Daten sein,
  • 50:36 - 50:38
    und wir beginnen,
    sie mit Wikidata zu verknüpfen,
  • 50:38 - 50:41
    und es ist ein kontinuierlicher Prozess,
    um herauszufinden,
  • 50:42 - 50:44
    für welche Bereiche die meisten Daten
  • 50:44 - 50:48
    schließlich auf Wikidata
    zu finden sein werden,
  • 50:48 - 50:52
    und für welche Bereiche sie tatsächlich
    auf anderen Datenbanken leben werden.
  • 50:53 - 50:55
    Offensichtlich werden
    wir Herausforderungen
  • 50:55 - 50:57
    bezüglich der Synchronisation haben,
  • 50:57 - 50:59
    wie wir sie wahrscheinlich alle haben,
  • 50:59 - 51:02
    weil dieses verknüpfte Datenfeld,
  • 51:02 - 51:05
    wo wir noch verhandeln müssen,
    wem wir vertrauen,
  • 51:05 - 51:09
    wer über was Autorität hat.
  • 51:14 - 51:16
    (Moderation) Andere Fragen?
  • 51:24 - 51:26
    (Person 3) Vielen Dank.
  • 51:26 - 51:31
    Also, ich stimme voll und ganz
    mit dem Thema überein –
  • 51:34 - 51:41
    wo die Grenze gesetzt werden soll,
    warum wir Daten auf Wikidata stellen,
  • 51:43 - 51:47
    oder warum wir sie in lokalen Datenbanken
    und für welche Zwecke halten,
  • 51:47 - 51:51
    um in lokalen Datenbanken zu erstellen,
    zu verwalten und zu pflegen
  • 51:51 - 51:53
    und für welche Zwecke.
  • 51:54 - 51:57
    Und ich denke, dass dies
    eine große Diskussion ist,
  • 51:57 - 52:02
    die über die reine Begeisterung
    hinausgeht,
  • 52:02 - 52:07
    Daten auf Wikidata zu stellen,
    weil sie öffentlich ist,
  • 52:07 - 52:11
    weil es der Menschheit dient, weil –
  • 52:11 - 52:13
    während es zwei coole Werkzeuge gibt,
  • 52:13 - 52:18
    und die Dinge im wirklichen Leben
    komplizierter sind, glaube ich.
  • 52:19 - 52:24
    Nun, trotzdem, es ist
    eine recht interessante Diskussion.
  • 52:24 - 52:27
    Und dann ist das auch
    noch ein anderes Thema,
  • 52:27 - 52:30
    oder ein anderes Problem,
    das diskutiert wird
  • 52:30 - 52:36
    in diesem Fall in verschiedenen Panels.
  • 52:36 - 52:41
    Es ist auf der einen Seite,
    die eigene Datenbank zu haben,
  • 52:41 - 52:43
    was auch immer die Technologie ist,
  • 52:43 - 52:47
    und Dinge auf Wikidata veröffentlichen,
  • 52:47 - 52:51
    oder sein eigenes System zu bauen,
  • 52:51 - 52:55
    zur Erstellung und Verwaltung
    von Informationen
  • 52:55 - 52:58
    mit der Wikibase-Technologie.
  • 52:59 - 53:02
    Und dann, synchronisieren
    oder was auch immer –.
  • 53:02 - 53:04
    Verbindungen herstellen oder Dinge tun,
  • 53:04 - 53:08
    es ist also eine Sache
    der verwendeten Technologie,
  • 53:09 - 53:15
    und die Tatsache, dass Sie Wikidata
    nur zur Veröffentlichung nutzen,
  • 53:15 - 53:19
    oder die Infrastruktur,
    die unter Wikidata liegt,
  • 53:19 - 53:23
    um Ihre Daten zu erstellen
    und zu verwalten.
  • 53:27 - 53:31
    Ich meine, wir hatten eine Diskussion
  • 53:31 - 53:34
    über das Wikibase-Panel,
  • 53:34 - 53:37
    und es wird hier
    weitere Diskussionen geben,
  • 53:37 - 53:41
    aber die Dinge sind
    auf verschiedenen Ebenen, glaube ich.
  • 53:42 - 53:45
    Vielleicht bekommt man
    bei dieser Diskussion
  • 53:45 - 53:48
    über Wikibase oder Wikidata –
  • 53:49 - 53:52
    (Beat) Ich halte es für problematisch,
    dass wir uns so sehr
  • 53:52 - 53:54
    auf dieser Wikibase-Infrastruktur
    konzentrieren,
  • 53:55 - 53:56
    weil es andere Infrastrukturen gibt,
  • 53:56 - 53:59
    wie im Bereich der darstellenden Künste.
  • 54:00 - 54:03
    Wir haben noch eine weitere
    ergänzende Gemeinschaft,
  • 54:03 - 54:07
    das ist MusicBrainz,
    die auf ihrer eigenen Plattform laufen,
  • 54:07 - 54:09
    die verknüpfte offene Daten
    zur Verfügung stellen,
  • 54:10 - 54:13
    und wie ich es verstehe,
  • 54:14 - 54:17
    gibt es Konsens innerhalb
    der Wikidata-Gemeinschaft,
  • 54:17 - 54:20
    dass wir nicht alle ihre Daten
    verdoppeln wollen –
  • 54:20 - 54:22
    wir werden nicht alle
    ihre Daten kopieren,
  • 54:22 - 54:24
    aber wir akzeptieren,
    dass sie sich ergänzen.
  • 54:25 - 54:26
    Also, was wird passieren,
  • 54:26 - 54:30
    wenn wir anfangen, diese Daten
    in Wikipedia zu integrieren?
  • 54:30 - 54:32
    Infokästen, zum Beispiel.
  • 54:32 - 54:36
    Wären wir in der Lage, diese Daten direkt
    von ihrem SPARQL-Endpunkt aus zu ziehen?
  • 54:37 - 54:40
    Oder wären wir verpflichtet,
    alle Daten irgendwie zu kopieren,
  • 54:40 - 54:42
    und welche Art von Prozessen
    sind daran beteiligt?
  • 54:42 - 54:45
    (Person 4) Die Diskussionen sind,
    glaube ich, offen,
  • 54:45 - 54:47
    denn innerhalb dieser Veranstaltung,
  • 54:47 - 54:50
    haben Sie sowohl
    interessierte Gemeinschaften –
  • 54:50 - 54:52
    diejenigen,
    die an Wikibase interessiert sind,
  • 54:52 - 54:54
    und diejenigen,
    die an Wikidata interessiert sind,
  • 54:54 - 54:56
    und diejenigen,
    die an beiden interessiert sind.
  • 54:56 - 55:00
    (Beat) Ja, aber wir werden sie
    nicht zwingen, zu Wikibase zu wechseln.
  • 55:00 - 55:01
    (Person 4) Nicht unbedingt.
  • 55:01 - 55:03
    (Beat) MusicBrainz läuft nicht
    auf Wikibase.
  • 55:03 - 55:07
    (Person 4) Nein, ich wollte nur sagen,
    dass Sie separate Probleme haben,
  • 55:07 - 55:11
    manchmal miteinander verbunden,
    manchmal nicht vollständig getrennt.
  • 55:12 - 55:17
    Und ich hatte noch eine andere Frage
    oder Bemerkung,
  • 55:17 - 55:22
    bezüglich der Verwaltung von Hierarchien
    in kontrollierten Vokabularien,
  • 55:22 - 55:26
    wie Thesauris, wie bei Ihnen mit Finto.
  • 55:28 - 55:31
    Sie haben die Orte
  • 55:32 - 55:35
    bei den Maori,
  • 55:36 - 55:41
    Betreffzeilen.
  • 55:42 - 55:46
    Nun, Sie müssen sich mit der
    hierarchischen Verwaltung
  • 55:46 - 55:48
    von Konzepten auseinandersetzen.
  • 55:48 - 55:52
    Was ist Ihre Ansicht, Ihre Meinung
  • 55:52 - 55:55
    zur Möglichkeit,
  • 55:55 - 56:01
    diese kontrollierten
    Wissensorganisations-Systeme
  • 56:01 - 56:02
    in Wikidata zu verwalten?
  • 56:07 - 56:10
    (Susanna) Ich denke, in diesem Fall
    der Finto- und YSO-Instanzen,
  • 56:11 - 56:15
    wird das Repository schließlich
  • 56:15 - 56:19
    eine Sammlung von mehreren Quellen sein.
  • 56:19 - 56:22
    Das ist also ohnehin im Fluss.
  • 56:22 - 56:25
    Wir müssen also nicht unbedingt –
  • 56:25 - 56:28
    Nun, ich vertrete nicht
    die Nationalbibliothek,
  • 56:28 - 56:32
    sondern in diesem möglichen Projekt,
  • 56:32 - 56:36
    müssten wir nicht
    mit einer existierenden –
  • 56:36 - 56:39
    oder mit einer bestehenden Struktur
    kämpfen.
  • 56:39 - 56:45
    In diesem Sinne ist es also
    ein offener Forschungsbereich.
  • 56:49 - 56:51
    (Mike) Die Maori-Themenbereiche scheinen,
  • 56:51 - 56:54
    sich ideal für die
    Wikidata-Struktur zu eignen.
  • 56:54 - 56:57
    Aber die Lizenzierung
    verbietet das natürlich.
  • 56:57 - 56:59
    Ich vermute,
    wenn die Lizenzierung anders wäre,
  • 56:59 - 57:02
    und sie in Wikidata aufgenommen würden,
  • 57:02 - 57:05
    sobald jemand entscheidet hat,
    dass ihm die Hierarchie nicht gefällt,
  • 57:05 - 57:06
    und anfängt, Dinge zu ändern,
  • 57:06 - 57:09
    würde es einen sofortigen Aufschrei
    bei den Menschen geben,
  • 57:09 - 57:12
    die sehr hart daran gearbeitet haben,
    diese Struktur zu schaffen
  • 57:12 - 57:16
    und die Genehmigung
    von verschiedenen Maori zu erhalten,
  • 57:16 - 57:18
    was die aktuelle Hierarchie war.
  • 57:18 - 57:21
    Das ist also ein Problem,
    das es zu lösen gilt.
  • 57:24 - 57:27
    (Joachim) Ich denke,
    Wissenorganisationssystemen
  • 57:27 - 57:28
    sind alle unterschiedlich.
  • 57:28 - 57:32
    Und ich bin mir nicht sicher,
    ob es eine gute Idee wäre,
  • 57:32 - 57:37
    verschiedene Hierarchien
    in Wikidata als solche zu repräsentieren,
  • 57:38 - 57:45
    aber es macht vielleicht Sinn, über
    Überlagerungen der Daten nachzudenken,
  • 57:45 - 57:48
    also, um Mappings
    auf der Inhaltsebene zu machen.
  • 57:49 - 57:54
    Zum Beispiel, wie die ZBW-Partnerschaft
    Thesaurus für Wirtschaftswissenschaften.
  • 57:55 - 57:59
    Und dieser Thesaurus
    setzt seine eigene Hierarchie,
  • 58:00 - 58:02
    und natürlich wäre es möglich,
  • 58:02 - 58:08
    die Hierarchie dieses Thesaurus
    in Wikidata-Konzepte umzusetzen,
  • 58:08 - 58:12
    ohne tatsächlich diese Art von Struktur
  • 58:12 - 58:15
    als alternative Struktur
    innerhalb von Wikidata zu speichern,
  • 58:15 - 58:19
    was eine Menge Verwirrung stiften würde.
  • 58:19 - 58:25
    Aber ich denke, wir sollten uns Wikidata
    auch als Pool von Konzepten vorstellen,
  • 58:25 - 58:30
    die schichtweise mit Layern verbunden
    werden können, die sich draußen befinden,
  • 58:30 - 58:33
    und die eine andere Sicht
    der Welt vermitteln,
  • 58:34 - 58:39
    die nicht unbedingt
    die innerhalb von Wikidata ist.
  • 58:46 - 58:48
    (Moderation) In Ordnung.
    Einige andere Fragen?
  • 58:49 - 58:52
    Andernfalls... Okay.
  • 58:55 - 58:58
    (Person 5) Joachim, ich wollte nur
    diesen letzten Punkt weiterverfolgen.
  • 58:58 - 59:01
    Also, diese Schichten,
    wie Sie sich das vorstellen,
  • 59:02 - 59:04
    würden sie extern gepflegt werden
  • 59:04 - 59:12
    und irgendwie mit Wikidata
    von der Wikidata-Seite integriert
  • 59:12 - 59:17
    oder haben Sie etwas weiter gedacht,
  • 59:17 - 59:19
    wie das gehandhabt werden könnte?
  • 59:22 - 59:25
    (Joachim) Eigentlich, nein,
    ich habe keine –
  • 59:25 - 59:30
    ich habe Experimente
    mit der ZBW und Wikidata gemacht.
  • 59:31 - 59:33
    Ich war [unverständlich]
    hier bei Wikidata.
  • 59:33 - 59:39
    Aber ich denke, das ist
    eine ganz neue komplexe Sache,
  • 59:39 - 59:42
    und es gilt zu diskutieren,
  • 59:44 - 59:46
    um eine gemeinsame Grundlage zu finden,
  • 59:46 - 59:48
    um solche Dinge zu tun,
  • 59:48 - 59:50
    aber dass man herausfinden muss.
  • 59:57 - 59:58
    (Beat) Noch eine weitere?
  • 59:58 - 60:00
    (Person 6) Ah, großartig.
  • 60:00 - 60:03
    Ich habe eine Frage zum Kakapo-Projekt.
  • 60:04 - 60:05
    (Beat) Mhm-hm.
  • 60:05 - 60:08
    (Person 6) Okay. Also,
    haben Sie Rückmeldung
  • 60:08 - 60:11
    seitens der Wikidata-Gemeinschaft
    bekommen,
  • 60:11 - 60:15
    einzelne Tiere
    aus diesen Artikeln zu ziehen?
  • 60:16 - 60:17
    (Mike) Bislang nicht.
  • 60:17 - 60:19
    (Person 6) Hat jemand
    schon mal davon gehört?
  • 60:19 - 60:22
    Ist es "nicht so weit",
    weil niemand bisher davon gehört hat?
  • 60:23 - 60:26
    (Mike) Es gibt seit geraumer Zeit
    eine kleine Diskussion –
  • 60:26 - 60:29
    interessierter Personen
    an dieser Art von Dingen in Wikidata,
  • 60:29 - 60:32
    und wir alle scheinen zu denken,
    dass es eine natürliche Erweiterung ist,
  • 60:32 - 60:36
    einzelne Wikidata-Elemente wie bei
    einem berühmten Rennpferd zu erhalten
  • 60:36 - 60:40
    oder die Katze von jemandem,
    das ist ziemlich gut modelliert.
  • 60:40 - 60:44
    Ich schätze, das Wagnis ist,
    die gesamte Art dort hineinzubringen.
  • 60:44 - 60:48
    Aber ich denke,
    es ist vollkommen überschaubar.
  • 60:48 - 60:50
    (Person 6) Versuchen Sie es
    nicht mit Katzen und Ziegen.
  • 60:50 - 60:52
    (Gelächter)
  • 60:52 - 60:54
    (Moderation) Okay.
    Ich denke, die Zeit ist um.
  • 60:54 - 60:56
    Vielen Dank, dass Sie teilgenommen haben,
  • 60:56 - 60:59
    Ich denke, es gibt noch Zeit
    für Fragen in der Pause.
  • 60:59 - 61:01
    Und viel Spaß.
  • 61:01 - 61:02
    (Beat) Vielen Dank.
  • 61:02 - 61:04
    (Beifall)
Title:
cdn.media.ccc.de/.../wikidatacon2019-1035-eng-Data_import_process_overview_hd.mp4
Video Language:
English
Duration:
54:29

German subtitles

Revisions