Return to Video

cdn.media.ccc.de/.../wikidatacon2019-3-eng-Glimpse_over_Wikidata_hd.mp4

  • 0:00 - 0:06
    Ein Blick über Wikidata
  • 0:06 - 0:08
    (Lydia) Hallo, miteinander.
  • 0:09 - 0:12
    Es ist großartig,
    dass so viele von Ihnen hier sind.
  • 0:12 - 0:13
    Es ist wirklich, wirklich großartig.
  • 0:15 - 0:20
    Lea hat also schon viel
    über dieses Ereignis geredet,
  • 0:20 - 0:23
    und ich werde ein bisschen
    über Wikidata selbst reden
  • 0:23 - 0:26
    und was im letzten Jahr passiert ist
  • 0:26 - 0:28
    und wo wir hinwollen.
  • 0:29 - 0:33
    Also... was ist das? Entschuldigung.
  • 0:33 - 0:39
    Ein Blick über Wikidata
    Wo sind wir? Wo gehen wir hin?
  • 0:40 - 0:44
    Also... wo sind wir?
    Wo gehen wir hin?
  • 0:45 - 0:50
    Im letzten Jahr gab es so viel zu feiern,
  • 0:50 - 0:52
    und ich möchte einiges davon hervorheben,
  • 0:52 - 0:55
    weil es manchmal unbemerkt bleibt.
  • 0:57 - 1:01
    Und zunächst möchte ich
    Ihnen einige Statistiken
  • 1:01 - 1:04
    zu den Editoren
  • 1:04 - 1:07
    und unserem Inhalt erläutern,
    und wie unsere Daten verwendet werden.
  • 1:10 - 1:15
    Während des letzten Jahres
    haben wir unsere Gemeinschaft vergrößert,
  • 1:15 - 1:17
    was fantastisch ist.
  • 1:17 - 1:21
    Wir haben etwa 3000 neue Menschen,
  • 1:21 - 1:26
    die innerhalb von 30 Tagen
    einmal oder mehrmals editieren.
  • 1:26 - 1:30
    Das sind also 3000 neue Wikidatans, hurra!
  • 1:32 - 1:34
    Wenn man sich nun die Leute ansieht,
  • 1:34 - 1:37
    die mindestens fünf Bearbeitungen
    in 30 Tagen machen,
  • 1:37 - 1:41
    sind das etwa 1200 mehr.
  • 1:41 - 1:44
    Und wenn Sie sich die Leute anschauen,
    die 100 oder mehr Bearbeitungen machen –
  • 1:45 - 1:47
    Ich hoffe, dass viele von Ihnen
    in diesem Raum sind –
  • 1:47 - 1:49
    sind es 300 mehr.
  • 1:49 - 1:52
    Heben Sie Ihre Hand,
    wenn Sie in dieser letzten Gruppe sind.
  • 1:53 - 1:56
    Was! Sie sind fantastisch!
  • 1:58 - 2:04
    Und während die Anzahl der Bearbeitungen
    normalerweise nicht etwas ist,
  • 2:04 - 2:09
    dem wir viel Aufmerksamkeit schenken,
  • 2:09 - 2:10
    haben wir im diesem Jahr
    die Grenze von über
  • 2:10 - 2:13
    1 Milliarde Editierungen überschritten.
  • 2:13 - 2:15
    (Beifall)
  • 2:22 - 2:24
    Gut, sehen wir uns den Inhalt an.
  • 2:28 - 2:31
    Wir sind jetzt also
    bei 65 Millionen Artikeln angelangt,
  • 2:31 - 2:34
    also Entitäten,
    um die Welt zu beschreiben,
  • 2:34 - 2:41
    und wir haben dabei
    rund 6700 Eigenschaften.
  • 2:44 - 2:48
    Davon sind etwa 4300
    externe Identifikatoren,
  • 2:48 - 2:53
    was uns eine Menge Verknüpfungen
    zu anderen Katalogen, Datenbanken,
  • 2:53 - 2:56
    Websites und mehr ermöglicht
  • 2:56 - 2:59
    und Wikidata wirklich zur zentralen Stelle
  • 2:59 - 3:02
    in einem verknüpften
    offenen Datennetz macht.
  • 3:02 - 3:07
    Also die Verwendung
    dieser Eigenschaften und Objekte,
  • 3:07 - 3:12
    haben wir jetzt
    etwa 800 Millionen Angaben,
  • 3:12 - 3:16
    und im Vergleich zum letzten Jahr,
    haben wir etwa eine halbe Aussage mehr
  • 3:16 - 3:18
    für jeden einzelnen Artikel.
  • 3:19 - 3:20
    (Gelächter)
  • 3:23 - 3:25
    Also, ja, Wikidata ist schlauer geworden.
  • 3:27 - 3:30
    Aber wir haben nicht nur Objekte
    und Eigenschaften,
  • 3:30 - 3:34
    wir haben auch neue Sachen wie Lexeme
  • 3:34 - 3:38
    und wir sind jetzt bei 204.000 Lexemen,
  • 3:38 - 3:42
    die Worte in vielen verschiedenen
    Sprachen beschreiben.
  • 3:42 - 3:43
    Das ist sehr cool.
  • 3:44 - 3:48
    Ich werde heute mehr darüber
    in einer späteren Sitzung sprechen.
  • 3:49 - 3:53
    Zuletzt, die neuste Ergänzung
    sind Entitätsschemata,
  • 3:53 - 3:59
    die uns helfen, herauszufinden,
    wie man Daten
  • 3:59 - 4:01
    in einem bestimmten Gebiet
    konsistent modelliert.
  • 4:02 - 4:04
    Und von diesen haben wir jetzt etwa 140.
  • 4:08 - 4:11
    Jetzt sind Zahlen nicht alles,
    was den Inhalt angeht,
  • 4:11 - 4:15
    die Menge des Inhalts – wir kümmern uns
    auch um über die Qualität des Inhalts.
  • 4:16 - 4:22
    Und wir haben jetzt
    ein maschinelles Lernsystem trainiert,
  • 4:22 - 4:25
    um die Qualität eines Objekts
    zu beurteilen.
  • 4:26 - 4:30
    Das ist bei weitem nicht perfekt,
    aber es gibt Ihnen eine Vorstellung.
  • 4:30 - 4:35
    Jedes Objekt in Wikidata erhält
    also eine Punktzahl zwischen 1 und 5.
  • 4:35 - 4:38
    Eins ist ziemlich schrecklich,
    fünf ist fantastisch.
  • 4:38 - 4:42
    Und es beurteilt die Dinge danach,
    wie viele Aussagen es hat,
  • 4:42 - 4:44
    wie viele externe Identifikatoren es hat,
  • 4:44 - 4:46
    wie viele Referenzen es gibt,
  • 4:46 - 4:49
    wie viele verschiedene Bezeichnungen
    es in verschiedenen Sprachen gibt,
  • 4:49 - 4:51
    und so weiter.
  • 4:51 - 4:55
    Und dann schauten wir uns
    Wikidata im Laufe der Zeit an,
  • 4:55 - 5:00
    und wie Sie sehen können,
    auf der Grundlage dieser Maßnahmen,
  • 5:00 - 5:04
    sind wir von ziemlich schrecklich
    zu viel besser gekommen.
  • 5:04 - 5:05
    (Gelächter)
  • 5:06 - 5:07
    Das ist also gut.
  • 5:07 - 5:12
    Aber was Sie auch sehen können,
    es gibt noch viel Raum bis zur 5.
  • 5:14 - 5:20
    Ich glaube nicht,
    dass wir dort hinkommen, oder?
  • 5:20 - 5:23
    Nicht jeder Eintrag
    wird absolut perfekt sein
  • 5:23 - 5:26
    gemäß den Maßnahmen,
    die wir getroffen haben.
  • 5:26 - 5:31
    Aber ich bin wirklich froh, zu sehen,
    dass die Qualität unserer Daten
  • 5:31 - 5:32
    konsistent immer besser und besser wird.
  • 5:37 - 5:43
    Okay, aber es reicht nicht,
    nur diese Daten zu erstellen.
  • 5:44 - 5:47
    Wir wollen dies –
    wir tun dies aus einem Grund.
  • 5:47 - 5:49
    Wir wollen, dass sie genutzt werden.
  • 5:49 - 5:55
    Und nun haben wir uns angesehen,
  • 5:55 - 5:59
    wie viele Artikel zu jedem der
    anderen Wikimedia-Projekte
  • 5:59 - 6:01
    Daten aus Wikidata verwenden,
  • 6:02 - 6:07
    und wir haben uns den Prozentsatz
    aller Artikel dieser Projekte angeschaut.
  • 6:07 - 6:10
    Wenn Sie nun quer
    durch die gesamte Wikimedia schauen
  • 6:10 - 6:12
    und alle Artikel dort,
  • 6:12 - 6:19
    dann verwenden 56,35 Prozent
    heute einige Daten aus Wikidata.
  • 6:20 - 6:22
    Was ich ziemlich gut finde,
  • 6:22 - 6:27
    aber es gibt natürlich
    noch viel Raum bis zur 100.
  • 6:29 - 6:34
    Und dann schaute ich mir an,
    welche Projekte machen tatsächlich
  • 6:34 - 6:36
    den größten Gebrauch von Wikidata-Daten
  • 6:36 - 6:39
    und ich teilte diese
    nach Sprachversionen auf und so weiter.
  • 6:40 - 6:45
    Und was denken Sie,
    was die fünf wichtigsten Projekte sind –
  • 6:46 - 6:48
    Welche sind das?
  • 6:48 - 6:51
    Zu welcher Projektfamilie gehören sie?
  • 6:51 - 6:53
    (mehrere im Publikum) Commons.
  • 6:53 - 6:57
    Okay, das ist ziemlich
    einheitlich Commons.
  • 6:57 - 6:59
    Sie würden sich tatsächlich irren.
  • 6:59 - 7:02
    Die fünf besten sind alle Wikivoyage.
  • 7:02 - 7:04
    (Publikum) Oh!
  • 7:04 - 7:05
    (Gelächter)
  • 7:05 - 7:08
    Also ja, Applaus für Wikivoyage.
  • 7:09 - 7:11
    (Beifall)
  • 7:17 - 7:20
    Wenn Sie überprüfen möchten,
    wo Commons tatsächlich steht
  • 7:20 - 7:22
    und wo all Ihre anderen Projekte sind,
  • 7:22 - 7:24
    dafür gibt es ein Dashboard.
  • 7:24 - 7:25
    Kommen Sie zu mir,
    und wir können das überprüfen.
  • 7:28 - 7:30
    Natürlich ist innerhalb Wikimedia
    nicht der einzige Ort,
  • 7:31 - 7:32
    wo unsere Daten verwendet werden.
  • 7:32 - 7:35
    Es wird auch draußen verwendet,
    und es ist so viel passiert.
  • 7:35 - 7:39
    Ich kann gar nicht alles erwähnen,
    aber um einige hervorzuheben:
  • 7:40 - 7:44
    Unsere Daten werden in großem Umfang
    an der Met, beim Wellcome Trust,
  • 7:44 - 7:46
    in der Bibliothek des Kongresses,
  • 7:46 - 7:48
    in GeneWiki und so viele anderen genutzt.
  • 7:48 - 7:51
    Und wenn Sie zu einigen der späteren
    Veranstaltungen im Programm gehen,
  • 7:51 - 7:53
    werden Sie über einige von diesen hören.
  • 7:57 - 7:59
    In Ordnung, genug Statistik.
  • 8:00 - 8:02
    Lassen Sie uns einige
    andere Highlights betrachten.
  • 8:03 - 8:04
    Wir haben also bereits
  • 8:04 - 8:07
    über die Verbesserung
    der Datenqualität gesprochen,
  • 8:07 - 8:11
    und wenn Sie die Datenqualität betrachten,
    gibt es viele Dimensionen,
  • 8:11 - 8:16
    die Sie sich anschauen können,
    und wir haben einige davon verbessert:
  • 8:16 - 8:19
    Wie genau die Daten sind,
  • 8:19 - 8:21
    wie vertrauenswürdig die Daten sind,
  • 8:21 - 8:23
    wie referenziert sie sind,
  • 8:23 - 8:25
    wie konsistent modelliert sie sind,
  • 8:26 - 8:29
    wie abgeschlossen sie sind und so weiter.
  • 8:31 - 8:35
    Nur um eine herauszupicken –
    für die Konsistenz zum Beispiel,
  • 8:36 - 8:39
    haben wir die Möglichkeit geschaffen,
  • 8:39 - 8:42
    die Entitätsschemata
    jetzt in Wikidata zu speichern,
  • 8:42 - 8:44
    sodass Sie beschreiben können,
  • 8:44 - 8:47
    wie bestimmte Bereiche
    modelliert werden sollten.
  • 8:47 - 8:49
    Also können Sie
  • 8:50 - 8:54
    ein Entitätsschema anlegen,
    zum Beispiel für niederländische Maler,
  • 8:54 - 8:56
    und dann können Sie schauen, wie –
  • 8:56 - 8:59
    welche Objekte
    für niederländische Maler
  • 8:59 - 9:02
    zum Beispiel nicht ein Geburtsdatum haben,
    aber haben sollten,
  • 9:02 - 9:05
    und ähnliche Dinge.
  • 9:06 - 9:10
    Und ich hoffe, dass noch viel
    mehr Wiki-Projekte und so weiter
  • 9:10 - 9:12
    in der Lage sein werden,
    Entitätsschemata zu nutzen,
  • 9:13 - 9:14
    um deren Daten gut zu pflegen,
  • 9:14 - 9:16
    und wenn Sie lernen wollen,
    wie man das macht,
  • 9:16 - 9:18
    gibt es auch später
    eine Sitzung im Programm,
  • 9:18 - 9:21
    geleitet von Menschen,
    die alles darüber wissen
  • 9:21 - 9:24
    damit dies für Sie klarer wird.
  • 9:28 - 9:29
    In Ordnung.
  • 9:31 - 9:35
    Eine weitere Sache, die im letzten Jahr
    wirklich in Gang gekommen ist,
  • 9:35 - 9:38
    ist das Wikibase-Ökosystem, richtig?
  • 9:38 - 9:42
    Diese Idee, dass nicht alle offenen Daten
  • 9:42 - 9:45
    in Wikidata sein sollen und müssen.
  • 9:45 - 9:47
    Stattdessen wollen wir
    ein blühendes Ökosystem
  • 9:47 - 9:51
    von verschiedenen Orten,
    von verschiedenen Akteuren,
  • 9:51 - 9:54
    wie Institutionen, Unternehmen,
  • 9:54 - 9:57
    freiwillige Projekte,
    die ihre Daten auf ähnliche Weise
  • 9:57 - 10:00
    wie Wikidata öffnen und dann
    alles miteinander verbinden,
  • 10:00 - 10:03
    Daten zwischen diesen austauschen,
    diese Daten verknüpfen.
  • 10:04 - 10:09
    Und im letzten Jahr
    ist das Interesse daran
  • 10:09 - 10:11
    und das Interesse von Institutionen
  • 10:11 - 10:14
    und Menschen,
    die ihre eigene Wikibase-Instanz haben,
  • 10:14 - 10:20
    wirklich explodiert,
    insbesondere im Bibliotheken-Sektor.
  • 10:24 - 10:26
    Es gibt eine Menge Tests,
    die ausgewertet werden,
  • 10:26 - 10:29
    und, um ehrlich zu sein, bahnbrechend,
  • 10:29 - 10:34
    was dort derzeit passiert,
    wo abenteuerlustige Institutionen
  • 10:34 - 10:38
    mit uns zusammenarbeiten,
    um wirklich herauszufinden,
  • 10:38 - 10:40
    wie Wikibase für ihre Sammlungen,
  • 10:40 - 10:42
    für ihre Kataloge
    und so weiter funktionieren kann.
  • 10:43 - 10:45
    Darunter auch
    die Deutsche Nationalbibliothek,
  • 10:45 - 10:47
    die französische Nationalbibliothek,
  • 10:47 - 10:49
    OCLC und das ist wirklich
    spannend zu sehen.
  • 10:55 - 10:57
    Einer der Gründe,
    warum ich das so aufregend finde,
  • 10:57 - 11:03
    ist, dass wir diesen Institutionen helfen,
    Daten auf eine Weise zu öffnen,
  • 11:03 - 11:06
    und zwar nicht einfach
    nur auf eine Website stellen,
  • 11:06 - 11:08
    damit jemand darauf zugreifen kann,
  • 11:08 - 11:12
    aber wenn ich wirklich darüber nachdenke –
    der nächste logische Schritt,
  • 11:12 - 11:15
    sich von Leuten bei der Instandhaltung
    diese Daten helfen zu lassen,
  • 11:15 - 11:18
    diese Daten zu ergänzen,
    sie zu bereichern,
  • 11:18 - 11:20
    und das ist wirklich eine Veränderung,
  • 11:20 - 11:25
    die, wie ich hoffe, Gutes bringen wird.
  • 11:26 - 11:28
    Und die andere Sache,
    bei der es uns hilft,
  • 11:28 - 11:31
    ist, dass es Experten die Daten
    in deren Raum kuratieren lässt,
  • 11:31 - 11:35
    in gutem Zustand halten,
  • 11:35 - 11:41
    sodass wir dann Synchronisierungsprozesse
    zum Beispiel zu Wikidata aufsetzen können,
  • 11:42 - 11:46
    anstatt sich die ganze Zeit
    selbst darum kümmern zu müssen.
  • 11:47 - 11:50
    Und am Ende des Tages,
    hoffe ich, dass es etwas
  • 11:50 - 11:54
    Druck von Wikidata nimmt,
    als dieser Ort, wo alles hin muss.
  • 11:58 - 12:00
    Lexikografische Daten.
  • 12:02 - 12:07
    Während des letzten Jahres
    begannen Menschen Wörter
  • 12:07 - 12:11
    in ihrer Sprache in Wikidata
    zu beschreiben, damit wir Dinge
  • 12:11 - 12:15
    wie automatisierte Übersetzungswerkzeuge
    aufbauen können,
  • 12:16 - 12:21
    und wir sind an dem Punkt angelangt,
    wo in einigen Sprachen
  • 12:21 - 12:25
    wir beginnen
    dieser kritische Masse näher zu kommen,
  • 12:26 - 12:29
    die benötigt wird, um tatsächlich
    eine seriöse Anwendung erstellen.
  • 12:30 - 12:33
    Bei vielen Sprachen haben wir
    noch einen langen Weg vor uns,
  • 12:33 - 12:35
    aber bei einigen fangen wir wirklich an,
    dahin zu kommen,
  • 12:35 - 12:37
    und das ist wirklich toll zu sehen.
  • 12:39 - 12:40
    Wenn Sie mehr darüber wissen wollen,
  • 12:40 - 12:42
    kommen Sie heute später zu meiner Sitzung.
  • 12:46 - 12:49
    Und natürlich nicht zu vergessen,
  • 12:49 - 12:51
    strukturierte Daten in Commons.
  • 12:51 - 12:52
    (Zuschauer pfeifen)
  • 12:52 - 12:54
    Ja! (lacht)
  • 12:54 - 12:56
    (Beifall)
  • 12:59 - 13:04
    Die strukturierten Daten bei Commons
    bei der Foundation hat wirklich
  • 13:07 - 13:11
    alles zusammen bekommen
    und machte es möglich
  • 13:11 - 13:15
    Aussagen zu Dateien zu den Commons
    im vergangenen Jahr hinzufügen,
  • 13:16 - 13:19
    und die Leute fangen an,
    diese Aussagen zu Bildern hinzuzufügen,
  • 13:19 - 13:23
    um sie dann leichter zu finden,
    um bessere Anwendungen darauf aufzubauen,
  • 13:23 - 13:24
    und so viel mehr.
  • 13:24 - 13:27
    Es ist wirklich spannend zu sehen,
    wie das wächst,
  • 13:27 - 13:30
    und ich denke, was wirklich wichtig
  • 13:30 - 13:33
    für die Wikidata-Gemeinschaft
    hier zu verstehen ist,
  • 13:33 - 13:37
    ist, dass wenn Sie "Abbilder" sehen
  • 13:37 - 13:42
    oder "Hauskatze" oder "sitzend",
    "Eidechse" und "Wand" hier,
  • 13:42 - 13:45
    sind das Links zu Wikidata-Objeten
    und Eigenschaften.
  • 13:45 - 13:50
    Das bedeutet, wenn wir Elemente
    und Eigenschaften erstellen,
  • 13:50 - 13:54
    stellen die nicht nur
    das Vokabular für Wikidata selbst dar.
  • 13:54 - 13:58
    Sie stellen das Vokabular
    auch für Commons zur Verfügung.
  • 13:58 - 14:01
    Und das wird immer mehr
    und mehr der Fall sein,
  • 14:01 - 14:03
    also müssen wir viel mehr Aufmerksamkeit
  • 14:03 - 14:07
    dafür aufbringen,
    wie unsere Ontologie, unser Vokabular
  • 14:07 - 14:10
    tatsächlich an anderen Orten
    verwendet wird als zuvor.
  • 14:14 - 14:18
    Und zuletzt haben wir begonnen,
  • 14:18 - 14:22
    stärkere Brücken zu den anderen
    Wikimedia-Projekten zu bauen.
  • 14:23 - 14:26
    Mein Team und ich arbeiten
    an einem Projekt namens Wikidata Bridge,
  • 14:26 - 14:29
    und Sie sollten unbedingt
    zum UX-Stand kommen
  • 14:29 - 14:32
    und einige Tests
    mit der aktuellen Version durchführen.
  • 14:33 - 14:36
    Das wird zum Beispiel
    Wikipedia-Redakteure
  • 14:36 - 14:39
    Wikidata direkt
    aus ihren Projekten bearbeiten lassen,
  • 14:39 - 14:41
    ohne zu Wikidata gehen zu müssen
  • 14:41 - 14:44
    und alles darüber verstehen zu müssen.
  • 14:44 - 14:49
    Ich hoffe, dass dies
    eine weitere Hürde eliminiert,
  • 14:49 - 14:52
    die es für Wikimedia-Projekte
    schwierig macht,
  • 14:52 - 14:55
    mehr Daten aus Wikidata zu übernehmen.
  • 14:57 - 15:01
    Gut, nun zu den Strategien
    und wo wollen wir hin?
  • 15:03 - 15:07
    Seit Dezember haben das Wikidata-Team
    bei Wikimedia Deutschland,
  • 15:07 - 15:12
    und Leute von der Wikimedia Foundation
    an Strategien gearbeitet,
  • 15:12 - 15:15
    Papiere rund um Wikidata erstellt.
  • 15:15 - 15:16
    Es geht im Grunde genommen darum,
  • 15:16 - 15:20
    das aufzuschreiben,
    worüber viele von uns schon
  • 15:20 - 15:23
    in den letzten vier oder fünf Jahren
    geredet haben.
  • 15:24 - 15:29
    Und ich weiß nicht, ob Sie alle
    diese Papiere gelesen haben.
  • 15:29 - 15:34
    Sie werden bis zum Ende des Monats
    auf Meta Commons veröffentlicht.
  • 15:34 - 15:36
    Wenn Sie sie noch nicht gelesen haben,
    wäre es großartig,
  • 15:36 - 15:39
    dass Sie sie lesen,
    Kommentare hinterlassen und so weiter.
  • 15:40 - 15:44
    Nun der sehr schnelle Überblick,
    was da drin steht,
  • 15:44 - 15:51
    ist, dass wir über Wikidata
    und Wikibase in drei Teilen nachdenken.
  • 15:52 - 15:55
    Der erste ist Wikidata als Plattform.
  • 15:55 - 15:57
    Sie können es in der unteren Ecke sehen,
  • 15:57 - 16:04
    und da geht es wirklich darum,
    dass Wikidata jeder Person
  • 16:04 - 16:06
    Zugang zu und Austausch von Informationen,
  • 16:06 - 16:09
    unabhängig von ihrer Sprache
    und Technologie zu ermöglichen,
  • 16:09 - 16:14
    und das tun wir, indem wir allgemeine
    Daten über die Welt zur Verfügung stellen.
  • 16:14 - 16:18
    Also im Grunde das, was Sie jeden Tag tun.
  • 16:21 - 16:25
    Das zweite ist der Teil
    des Wikibase-Ökosystems,
  • 16:25 - 16:30
    wo Wikibase, die Software,
    auf der Wikidata läuft,
  • 16:30 - 16:32
    nicht nur Wikidata laufen lässt,
  • 16:32 - 16:34
    sondern ein blühendes offenes Datennetz,
  • 16:34 - 16:36
    dass das Rückgrat freien
    und offenen Wissens ist.
  • 16:38 - 16:43
    Und die dritte und letzte Sache ist,
    Wikidata für die Wikimedia-Projekte,
  • 16:43 - 16:47
    ganz oben, wo Wikidata da ist,
  • 16:47 - 16:50
    um den Wikimedia-Projekten zu helfen,
  • 16:51 - 16:54
    sie auf die Zukunft vorzubereiten.
  • 16:58 - 17:03
    Was bedeutet das konkret
    für die nahe oder mittelfristige Zukunft?
  • 17:04 - 17:06
    Wikidata als Plattform –
  • 17:07 - 17:09
    Wir wollen bessere Datenqualität haben,
  • 17:09 - 17:12
    also werden wir weiter
    an besseren Werkzeuge arbeiten,
  • 17:12 - 17:15
    die Verbesserung der uns zur Verfügung
    stehenden Instrumente und so weiter.
  • 17:15 - 17:21
    Wir müssen unsere Daten
    durch bessere APIs zugänglicher machen,
  • 17:22 - 17:24
    einen robusteren SPARQL-Endpunkt,
  • 17:24 - 17:27
    aber auch durch Dinge, wie konsequentere
    Modellierung unserer Daten,
  • 17:27 - 17:31
    sodass sie tatsächlich leicht in
    Anwendungen wiederverwendet werden können.
  • 17:32 - 17:37
    Und zuletzt habe ich
    die Einrichtung von Feedback-Prozessen
  • 17:37 - 17:39
    mit unseren Partnern.
  • 17:40 - 17:43
    Im Gegensatz zu Wikipedia
    ist Wikidata nicht das,
  • 17:43 - 17:46
    was ich ein Zielprojekt
    nennen würde, richtig?
  • 17:46 - 17:48
    Jemand geht zu Wikipedia und liest,
  • 17:49 - 17:53
    während jemand normalerweise
    nicht zu Wikidata geht und liest.
  • 17:53 - 17:58
    Das wäre großartig,
    aber realistisch ist das nicht, oder?
  • 17:58 - 18:01
    Viele Menschen, die mit
    unseren Daten konfrontiert werden,
  • 18:01 - 18:03
    sind nicht auf Wikidata selbst,
  • 18:03 - 18:07
    aber sie sehen es auf Wikipedia
    und vielen anderen Orten.
  • 18:08 - 18:12
    Nun erhalten diese anderen Orte
    Feedback zu diesen Daten, nicht wahr?
  • 18:12 - 18:15
    Ihre Benutzer sagen ihnen,
    "Hey, hier stimmt was nicht,"
  • 18:17 - 18:21
    und ich möchte das haben,
    damit wir das den Personen auf Wikidata,
  • 18:21 - 18:24
    also Sie, zur Verfügung stellen können.
  • 18:24 - 18:27
    Und herauszufinden, wie man das
    auf sinnvolle Art und Weise macht,
  • 18:27 - 18:32
    ohne alle zu überfordern,
    wird eines der Dinge sein,
  • 18:32 - 18:33
    die wir im nächsten Jahr tun müssen.
  • 18:35 - 18:37
    Also gut, Wikibase-Ökosystem.
  • 18:37 - 18:41
    Dort werden wir die Arbeit
    mit den Bibliotheken fortsetzen,
  • 18:41 - 18:45
    aber auch zum Beispiel
    in die Wissenschaft schauen,
  • 18:45 - 18:46
    und noch mehr.
  • 18:46 - 18:50
    Im Laufe des Tages gibt es
    eine Wikibase-Vorstellung,
  • 18:50 - 18:53
    wo Sie auf jeden Fall hingehen sollten
    und sehen, was bereits vorhanden ist
  • 18:53 - 18:56
    und was die Menschen
    mit Wikibase bereits machen.
  • 18:56 - 18:57
    Es ist es wirklich wert.
  • 18:58 - 19:04
    Und was dort auch notwendig ist,
    ist gute Prozesse dafür einzurichten.
  • 19:04 - 19:08
    Den Menschen helfen, herauszufinden,
    mit wem sie über was sprechen können,
  • 19:08 - 19:10
    wo sie Hilfe finden können,
  • 19:10 - 19:12
    all diese Dinge.
  • 19:13 - 19:17
    Und natürlich die Installation
    und die Wartung einer Wikibase
  • 19:17 - 19:20
    leichter zu machen, denn das ist
    immer noch ein wenig schmerzhaft.
  • 19:21 - 19:25
    Und zuletzt die Verbindung,
    die im Wesentlichen
  • 19:25 - 19:27
    worüber wir früher schon
    bei Commons gesprochen haben,
  • 19:27 - 19:31
    wo Commons Wikidatas Objekte
    und Eigenschaften verwendet,
  • 19:31 - 19:34
    aber für andere Wikibase-Instanzen
    da draußen, damit sie auch
  • 19:34 - 19:37
    das Vokabular von Wikidata
    verwenden können.
  • 19:38 - 19:42
    Und, wie ich vorhin schon sagte,
    steigert das noch einmal
  • 19:42 - 19:45
    die Notwendigkeit, aufmerksam zu bleiben,
  • 19:45 - 19:48
    wie unser Vokabular dort
    draußen verwendet wird,
  • 19:48 - 19:51
    mehr als je zuvor.
  • 19:54 - 19:57
    Und Wikidata für die Wikimedia-Projekte
  • 19:57 - 20:01
    natürlich, eine engere Integration
    über die Wikidata Bridge
  • 20:01 - 20:04
    und den Leuten beim direkten Editieren
    aus ihren Projekten heraus zu helfen,
  • 20:04 - 20:09
    und die andere Sache, über die wir alle
    gemeinsam nachzudenken sollten, denke ich,
  • 20:09 - 20:15
    ist herauszufinden, wie man
    die Sprachbarrieren reduziert.
  • 20:15 - 20:19
    Je mehr Wikidata
    in den Wikimedia-Projekten integriert ist,
  • 20:19 - 20:22
    desto mehr Menschen werden
    das Bedürfnis haben,
  • 20:22 - 20:26
    miteinander über diese Daten zu reden,
    ohne die gleiche Sprache zu sprechen,
  • 20:26 - 20:32
    und wir müssen herausfinden,
    wie man damit umgeht.
  • 20:33 - 20:37
    Wenn einige Leute kluge Ideen haben,
    würde ich gerne mit Ihnen sprechen.
  • 20:39 - 20:41
    Und damit komme ich
    zum Ende meines Vortrags.
  • 20:42 - 20:44
    Ich danke Ihnen allen, dass Sie jeden Tag
  • 20:44 - 20:46
    mehr Menschen mehr Zugang
    zu mehr Wissen geben.
  • 20:47 - 20:49
    (Beifall)
  • 20:58 - 21:00
    (Moderation) Wir haben
    etwas Zeit für Fragen,
  • 21:00 - 21:02
    Wenn es also Fragen im Publikum gibt
  • 21:02 - 21:05
    oder wenn Sie aus der Ferne
    den Livestream sehen – Hi, Mom –
  • 21:05 - 21:08
    können Sie die Frage
    über das EtherPad stellen
  • 21:08 - 21:11
    oder auf dem Telegram Channel
    und wir werden unser Bestes tun.
  • 21:11 - 21:13
    Und?
  • 21:16 - 21:17
    Ah.
  • 21:21 - 21:25
    (Person 1) Hallo, allerseits,
    das ist mehr ein Meme als eine Frage,
  • 21:25 - 21:32
    also, wann wird die Zeit-Erweiterung
    auch in der Lage sein,
  • 21:32 - 21:36
    Stunden und Minuten
    und Sekunden zu erhalten,
  • 21:36 - 21:38
    denn bis jetzt ist die Position
    nur auf Tage gesetzt.
  • 21:38 - 21:42
    - Ich weiß... das ist nicht meine Frage –
    - (Lydia) (lacht)
  • 21:42 - 21:44
    (Person 1) Deshalb sagte ich,
    es ist ein Meme.
  • 21:44 - 21:46
    Jedes Mal ist es immer so,
  • 21:46 - 21:49
    aber es kommt immer von weit her, also...
  • 21:50 - 21:53
    (Lydia) Darauf habe ich
    keine sehr gute Antwort.
  • 21:53 - 21:54
    Es tut mir leid.
  • 21:56 - 22:01
    Aber vielleicht als Hintergrund,
    die Leute brauchen das,
  • 22:01 - 22:04
    auch um noch mehr Bilder
    auf Commons zu beschreiben.
  • 22:04 - 22:08
    Damit kann es in der langen Liste
    nach oben kommen,
  • 22:08 - 22:11
    sodass die Dinge, die zu tun sind,
    ein bisschen schneller gehen.
  • 22:15 - 22:16
    Haben Sie noch Fragen?
  • 22:25 - 22:28
    (Person 2) Linda aus dem Wikimedia-
    Foundation-Forschungsteam –
  • 22:28 - 22:31
    Ich habe eine Frage zu Ihren Gedanken
  • 22:31 - 22:35
    über Patrouillen, und
    möglicherweise in Zusammenhang
  • 22:35 - 22:38
    mit der Qualität der Inhalte auf Wikidata,
  • 22:38 - 22:40
    wenn Sie dazu etwas sagen könnten,
  • 22:40 - 22:42
    wie denken Sie,
    dass sich die Patrouillenarbeit
  • 22:42 - 22:43
    in der nahe Zukunft sich ändern wird,
  • 22:43 - 22:46
    insbesondere mit dem Bridge-Projekt,
  • 22:46 - 22:48
    wo ich mich freue, das ausprobieren.
  • 22:48 - 22:49
    Ja, danke.
  • 22:52 - 22:57
    (Lydia) Also, wie Sie sagen,
    wie wir es bei Bridge getan haben,
  • 22:59 - 23:01
    müssen noch viel mehr Anstrengungen
  • 23:01 - 23:03
    bei der Patrouille
    unternommen werden, glaube ich.
  • 23:04 - 23:06
    Aber wir sind bei einer Größe angelangt,
  • 23:06 - 23:09
    wo das wahrscheinlich
    nicht mehr durchführbar ist,
  • 23:09 - 23:11
    das mit Menschen manuell zu tun,
  • 23:11 - 23:15
    wir müssen also viel mehr Aufwand
    bei der Verbesserung betreiben,
  • 23:15 - 23:17
    zum Beispiel mit ORES,
    dem System für maschinelles Lernen,
  • 23:17 - 23:18
    um uns dabei zu helfen,
  • 23:18 - 23:25
    um herauszufinden, welche Bearbeitungen
    sich wirklich ein Mensch anschauen muss,
  • 23:25 - 23:26
    und das ist wahrscheinlich so wie,
  • 23:26 - 23:30
    ja, das übliche Zeug,
    das brauche ich mir nicht anzusehen.
  • 23:34 - 23:38
    Derzeit ist ORES nicht super gut
    bei der Beurteilung dessen, was –
  • 23:38 - 23:41
    ob eine Bearbeitung
    auf Wikidata gut oder schlecht ist.
  • 23:41 - 23:44
    Derzeit läuft eine Kampagne
  • 23:45 - 23:51
    das maschinelle Lernsystem auszubilden,
  • 23:51 - 23:54
    mit Ihrer Hilfe ihm
    im Wesentlichen beizubringen,
  • 23:54 - 23:57
    was eine gute Bearbeitung ist
    und was eine schlechte Bearbeitung ist,
  • 23:57 - 24:03
    und wir haben noch nicht genügend
    Menschen, die ihm das beibringen,
  • 24:03 - 24:08
    um es wirklich zu verbessern,
    aber wenn Sie ein paar Minuten Zeit haben,
  • 24:08 - 24:10
    wäre es großartig,
    wenn Sie mithelfen würden,
  • 24:10 - 24:13
    ORES bessere Entscheidungen über die
    Wikidata-Bearbeitungen treffen zu lassen.
  • 24:14 - 24:16
    Und es ist wirklich einfach.
    es zeigt eine Bearbeitung an,
  • 24:16 - 24:18
    und Sie sagen, das ist
    eine gute Bearbeitung,
  • 24:18 - 24:20
    das ist eine schlechte Bearbeitung,
    und das war's.
  • 24:20 - 24:23
    Sie können dies vor dem Fernseher
    abends auf der Couch tun.
  • 24:26 - 24:27
    (Person 3) Senden Sie einen Link.
  • 24:28 - 24:31
    (Lydia) Ja, wir werden einen Link
    in der Telegram-Gruppe teilen,
  • 24:32 - 24:36
    Und sobald wir die Schwelle erreichen,
    die wir benötigen –
  • 24:36 - 24:39
    Ich glaube, es sind etwa 7000,
    aber ich könnte mich irren –
  • 24:40 - 24:44
    dann können wir das Training
    für ORES wiederholen
  • 24:44 - 24:46
    und dann wird es hoffentlich
    erheblich besser
  • 24:46 - 24:49
    bei der Beurteilung
    der Bearbeitungen auf Wikidata.
  • 24:50 - 24:52
    Und dann hoffe ich, dass mehr
    von Ihnen das nutzen können,
  • 24:52 - 24:56
    um zum Beispiel aktuelle Änderungen
    zu filtern, oder Ihre Beobachtungsliste
  • 24:56 - 24:59
    für Bearbeitungen, die wirklich
    Ihre Aufmerksamkeit benötigen.
  • 24:59 - 25:00
    Ja.
  • 25:02 - 25:04
    Hallo.
  • 25:07 - 25:10
    (Person 4) Ich bin nur neugierig,
    und das ist keine Frage von mir,
  • 25:10 - 25:13
    sondern von Partnern,
    mit denen ich gearbeitet habe,
  • 25:13 - 25:16
    je mehr Partner sich Wikidata anschließen
  • 25:16 - 25:19
    und beginnen,
    mit Anfragen zu experimentieren,
  • 25:20 - 25:23
    desto mehr Probleme werden wir
    mit Timeout der Abfragen haben,
  • 25:23 - 25:26
    was passiert also damit?
  • 25:28 - 25:30
    (Lydia) Also, einige Leute
    bei der Wikimedia Foundation
  • 25:30 - 25:34
    untersuchen das, und – kleiner Spoiler –
  • 25:34 - 25:37
    bei der Geburtstagsgeschenksitzung
    dabei sein.
  • 25:37 - 25:38
    (Gelächter)
  • 25:43 - 25:46
    (Person 5) Hallo, ich bin Bart Magnus
    aus Belgien (PACKED).
  • 25:46 - 25:49
    Ich würde gerne wissen,
    wie der aktuelle Stand
  • 25:49 - 25:52
    bei der Vereinigung ist,
    dass man Eigenschaften
  • 25:52 - 25:54
    in der eigenen Wikibase-Instanz
    erhöhen können –
  • 25:54 - 25:57
    Gibt es dazu etwas Erwähnenswertes?
  • 25:57 - 26:01
    (Lydia) Also im letzten Jahr,
    haben uns viele Leute gesagt
  • 26:01 - 26:04
    dass sie Vereinigung wollen, nicht wahr?
  • 26:04 - 26:07
    Aber das Problem war, dass viele Leute
    verschiedene Dinge meinten,
  • 26:07 - 26:09
    wenn sie Vereinigung sagten.
  • 26:11 - 26:14
    Einige dieser Dinge
    waren sehr leicht machbar.
  • 26:14 - 26:16
    Einige dieser Dinge
    waren wirklich, wirklich hart.
  • 26:17 - 26:21
    Und mein Team und ich haben uns
    mit vielen Menschen unterhalten,
  • 26:21 - 26:25
    zum Beispiel, die Partner, mit denen
    wir in Bibliotheken zusammenarbeiten,
  • 26:25 - 26:27
    um herauszufinden, was es eigentlich ist
  • 26:27 - 26:29
    was sie genau brauchen.
  • 26:30 - 26:34
    Und das haben wir jetzt beendet,
    obwohl ich natürlich glücklich bin,
  • 26:34 - 26:37
    darüber mehr Feedback zu erhalten,
    wenn Sie mit mir darüber reden wollen,
  • 26:37 - 26:40
    und jetzt bin ich
    an einem Punkt angelangt,
  • 26:40 - 26:41
    an dem ich einfach sagen kann,
  • 26:41 - 26:43
    "Okay, wir werden damit anfangen."
  • 26:45 - 26:48
    Und ich würde sagen, das wird in den
    nächsten zwei oder drei Monaten sein,
  • 26:48 - 26:51
    dass wir tatsächlich die ersten Zeilen
    des Codes schreiben können,
  • 26:51 - 26:56
    und dann hoffentlich Menschen haben,
    die es Anfang nächsten Jahres testen,
  • 26:56 - 26:57
    würde ich sagen.
  • 27:00 - 27:01
    (Moderation) Okay, letzte Fragen.
  • 27:02 - 27:06
    (Person 6) Finn Årup Nielsen
    aus Kopenhagen, Dänemark.
  • 27:06 - 27:10
    In Bezug auf die andere Sprache,
    gab es eine Art Diskussion
  • 27:10 - 27:13
    in der WikiCite-Gemeinschaft darüber,
  • 27:13 - 27:16
    ob wir weitermachen sollten, mehr
    wissenschaftliche Arbeiten einzufügen –
  • 27:16 - 27:20
    dies bezieht sich darauf, wie viele Daten
    wir in Wikidata einstellen können.
  • 27:20 - 27:23
    Zeitüberschreitung
    im Wikidata-Abfragedienst ist ein Thema,
  • 27:23 - 27:24
    aber auch die Aufrechterhaltung,
  • 27:24 - 27:30
    also, was denken Sie über...
  • 27:31 - 27:35
    Fängt die Größe von Wikidata
    im Allgemeinen an, ein Problem zu werden?
  • 27:36 - 27:39
    Sollen wir aufhören,
    Lexeme-Daten einzugeben?
  • 27:39 - 27:42
    Sollten wir aufhören, wissenschaftliche
    Daten in Wikidata einzugeben,
  • 27:42 - 27:46
    oder haben wir irgendwelche Forschung
    zu diesem Thema
  • 27:46 - 27:50
    oder technische Probleme beim Skalieren?
  • 27:50 - 27:51
    (Lydia) Ja...
  • 27:53 - 27:57
    Wikidata kommt definitiv zu einigen...
  • 27:59 - 28:03
    Skalierbarkeitsgrenzen, sagen wir mal,
  • 28:04 - 28:06
    sowohl technisch als auch sozial.
  • 28:06 - 28:09
    Und für beides brauchen
    wir Lösungen, nicht wahr?
  • 28:09 - 28:13
    Gesellschaftlich haben wir Dinge
    wie mehr Redakteure
  • 28:13 - 28:15
    und die letzten Änderungen
    bis zu dem Punkt,
  • 28:15 - 28:17
    wo es für einen Menschen
    völlig undurchführbar ist,
  • 28:17 - 28:20
    zu patrouillieren,
    weil es einfach zu viel ist.
  • 28:21 - 28:26
    Aber auch technisch,
    und wir haben einige davon angesprochen.
  • 28:26 - 28:30
    Zum Beispiel eine
    Datenbank-Rearchitekturierung
  • 28:30 - 28:34
    um die WB-Begriffstabelle herum,
    wenn das jemandem etwas sagt.
  • 28:36 - 28:38
    Aber das bringt uns nur so weit,
  • 28:38 - 28:41
    und eines der Dinge, die wir uns
    das nächste Jahr anschauen wollen,
  • 28:41 - 28:45
    ist, wo die anderen Schmerzpunkte sind
  • 28:45 - 28:48
    und was man dagegen
    auf der technischen Seite tun kann.
  • 28:49 - 28:51
    Das ist also der allgemeines Stand.
  • 28:51 - 28:55
    Gleichzeitig bin ich sehr vorsichtig,
    jemandem zu sagen:
  • 28:55 - 28:58
    "Nein, nein, nein, hören Sie auf,
    Daten in Wikidata einzustellen".
  • 28:58 - 29:02
    Das würde den Zweck irgendwie verfehlen.
  • 29:04 - 29:07
    Aber zum Beispiel das Wikibase-Ökosystem
  • 29:07 - 29:09
    ist eine Möglichkeit,
    dies zu thematisieren, nicht wahr,
  • 29:09 - 29:14
    nicht alles in Wikidata zu verlangen.
  • 29:14 - 29:16
    Das ist das Schöne
    an verknüpften offenen Daten.
  • 29:16 - 29:18
    Sie brauchen nicht alles am selben Ort.
  • 29:18 - 29:21
    Sie können verschiedene Orte verbinden.
    Es ist erstaunlich.
  • 29:22 - 29:28
    Also speziell bei WikiCites, ja –
  • 29:30 - 29:33
    okay, speziell WikiCites, denke ich,
  • 29:33 - 29:36
    müssen wir im richtigen Verhältnis
    betrachten.
  • 29:36 - 29:41
    Ich habe keinen genauen Prozentsatz,
    welcher Prozentsatz der Einträge
  • 29:41 - 29:45
    in Wikidata WikiCite-Themen sind,
  • 29:45 - 29:47
    aber es ist ein großer Prozentsatz.
  • 29:47 - 29:52
    Und vielleicht ist das die Sache,
    über die wir in der Pause reden sollten...
  • 29:53 - 29:55
    Vielen Dank!
  • 29:55 - 29:56
    (Beifall)
Title:
cdn.media.ccc.de/.../wikidatacon2019-3-eng-Glimpse_over_Wikidata_hd.mp4
Video Language:
English
Duration:
30:07

German subtitles

Revisions