0:00:01.201,0:00:04.486
WikiData und Sprachen
0:00:06.303,0:00:07.362
(Lydia) Vielen Dank.
0:00:07.362,0:00:11.244
Also, in dieser Konferenz sind[br]einige der großen Themen die Sprachen.
0:00:14.220,0:00:18.088
Ich möchte Ihnen einen Überblick[br]darüber geben, wo wir derzeit
0:00:18.088,0:00:19.812
beim Thema Sprachen stehen
0:00:20.264,0:00:22.167
und wie wir von hier aus[br]weitermachen können.
0:00:26.491,0:00:28.851
[Mehr Leuten mehr Zugang[br]zu mehr Wissen geben]
0:00:29.036,0:00:32.580
Bei Wikidata geht es darum, mehr Menschen[br]mehr Zugang zu mehr Wissen zu geben,
0:00:32.580,0:00:37.168
und Sprache ist ein wichtiger Teil davon,[br]dies Wirklichkeit werden zu lassen,
0:00:38.205,0:00:43.291
zumal immer mehr unseres Lebens[br]von der Technologie abhängt.
0:00:44.114,0:00:48.873
Und wie unser Hauptredner vorhin sagte,
0:00:49.723,0:00:52.488
fallen durch einen Teil der Technologie[br]die Menschen einfach zurück,
0:00:52.488,0:00:55.020
weil sie eine bestimmte Sprache[br]einfach nicht sprechen können,
0:00:55.320,0:00:57.303
und das ist nicht in Ordnung.
0:00:58.633,0:01:02.097
Deshalb wollen wir etwas[br]dagegen unternehmen.
0:01:02.927,0:01:05.841
Und um das zu ändern,[br]braucht man mindestens zwei Dinge.
0:01:06.411,0:01:11.010
Erstens muss man den Leuten Inhalte[br]in ihrer Sprache zur Verfügung stellen,
0:01:11.010,0:01:12.955
und zweitens muss man ihnen
0:01:12.955,0:01:15.910
in diesen Anwendungen[br]oder was immer man hat,
0:01:15.910,0:01:19.189
Interaktion in ihrer Sprache ermöglichen.
0:01:20.367,0:01:24.980
Und Wikidata hilft bei beiden davon.
0:01:24.980,0:01:28.268
Und die erste Sache,[br]der Inhalt in Ihrer Sprache,
0:01:28.268,0:01:31.089
das ist im Grunde das, was wir[br]an Objekten und Eigenschaften haben,
0:01:31.319,0:01:33.082
wie wir die Welt beschreiben.
0:01:33.082,0:01:35.175
Nun, das ist sicherlich nicht alles,[br]was man braucht,
0:01:35.175,0:01:39.294
aber es bringt einen ziemlich weit voran.
0:01:39.764,0:01:41.927
Die andere Sache ist[br]die Interaktion in Ihrer Sprache,
0:01:41.927,0:01:46.281
und hier kommen Lexeme ins Spiel.
0:01:46.281,0:01:49.382
Wenn Sie mit Ihrem digitalen[br]persönlichen Assistenten sprechen wollen
0:01:49.382,0:01:54.918
oder wenn Sie Ihr Gerät einen Text[br]und solche Dinge übersetzen lassen wollen.
0:01:56.404,0:01:59.254
Na gut, sehen wir uns[br]den Inhalt in Ihrer Sprache an.
0:01:59.254,0:02:03.396
Also, was wir an Objekten[br]und Eigenschaften haben.
0:02:05.406,0:02:09.696
Dafür sind Bezeichnungen in den Objekten[br]und Eigenschaften entscheidend.
0:02:10.236,0:02:14.866
Wir müssen wissen, wie diese Entität[br]genannt wird, über die wir sprechen.
0:02:15.656,0:02:19.767
Und anstatt über Q5 zu sprechen,
0:02:19.767,0:02:22.310
jemand, der Englisch spricht, weiß,[br]dass das ein "human" ist,
0:02:22.310,0:02:24.706
jemand, der Deutsch spricht, weiß,[br]dass das ein "Mensch" ist,
0:02:24.706,0:02:26.254
und ähnliche Dinge.
0:02:26.254,0:02:29.742
Also überbrücken diese Bezeichnungen[br]auf Objekten und Eigenschaften
0:02:29.742,0:02:33.499
die Kluft zwischen Mensch und Maschine.
0:02:33.499,0:02:35.439
Und Menschen und Menschen
0:02:35.439,0:02:40.115
machen mehr vorhandenes Wissen[br]für sie zugänglich.
0:02:43.270,0:02:45.963
Das ist ein schönes Ziel zum Anstreben.
0:02:45.963,0:02:48.092
Wie sieht es eigentlich aus?
0:02:48.092,0:02:49.507
Es sieht so aus.
0:02:50.947,0:02:52.786
Was Sie hier sehen, ist,
0:02:52.786,0:02:58.496
dass die meisten Objekte auf Wikidata[br]zwei Bezeichnungen haben,
0:02:58.496,0:03:00.767
also Bezeichnungen in zwei Sprachen.
0:03:01.697,0:03:03.851
Und danach nur eines und dann drei,
0:03:03.851,0:03:05.948
und dann wird es sehr düster.
0:03:06.781,0:03:08.581
(leises Lachen)
0:03:10.047,0:03:12.713
Ich denke, wir müssen es besser machen.
0:03:14.185,0:03:16.079
Aber andererseits[br]habe ich eigentlich erwartet,
0:03:16.079,0:03:17.578
dass es schlimmer sein würde.
0:03:17.578,0:03:19.860
Ich habe erwartet,[br]dass der Durchschnitt eines sein würde.
0:03:19.860,0:03:22.503
Deshalb war ich ziemlich froh,[br]zwei zu sehen. (lacht)
0:03:24.661,0:03:25.926
In Ordnung.
0:03:27.156,0:03:29.527
Aber es ist nicht nur interessant[br]zu wissen,
0:03:29.527,0:03:33.742
wie viele Bezeichnungen unsere[br]Objekte und Eigenschaften haben.
0:03:33.742,0:03:36.565
Es ist auch interessant zu sehen,[br]in welchen Sprachen.
0:03:38.045,0:03:43.764
Hier sehen Sie eine Grafik der Sprachen,
0:03:43.764,0:03:46.838
für die wir Bezeichnungen[br]auf den Objekten haben.
0:03:46.838,0:03:50.669
Der größte Teil davon ist also Sonstiges.
0:03:51.229,0:03:53.863
Ich habe also nur[br]die 100 wichtigsten Sprachen ausgewählt
0:03:54.533,0:03:58.902
und alles andere ist Sonstiges,[br]um diese Grafik lesbar zu machen.
0:03:59.542,0:04:02.142
Und dann gibt es noch[br]Englisch und Niederländisch,
0:04:03.002,0:04:04.254
Französisch
0:04:05.924,0:04:09.129
und, nicht zu vergessen, Asturisch.
0:04:09.659,0:04:11.889
- (Person 1) Juhu! [br]- (Lydia) Juhuu, jawohl!
0:04:13.899,0:04:16.954
Was Sie hier sehen,[br]ist also ein ziemliches Ungleichgewicht
0:04:16.954,0:04:20.114
und immer noch eine starke Konzentration[br]auf Englisch.
0:04:21.236,0:04:24.367
Eine andere Sache ist, wenn Sie sich[br]das Gleiche für Eigenschaften ansehen,
0:04:24.367,0:04:25.999
sieht es eigentlich besser aus.
0:04:27.399,0:04:32.620
Und teilweise kommt das davon, dass es[br]einfach viel weniger Eigenschaften waren.
0:04:32.620,0:04:36.650
Also haben auch kleinere Communites[br]eine Chance, damit Schritt zu halten.
0:04:36.650,0:04:39.173
Aber es ist auch ein ziemlich[br]wichtiger Teil von Wikidata,
0:04:39.173,0:04:41.159
dass man in seine Sprache[br]lokalisieren kann.
0:04:41.159,0:04:42.384
Das ist also gut.
0:04:45.752,0:04:48.268
Was ich hier mit Asturisch[br]hervorheben möchte, ist,
0:04:48.268,0:04:53.698
dass eine kleine Gemeinschaft[br]mit etwas Hingabe und Arbeit
0:04:54.448,0:04:57.085
wirklich einen großen Unterschied[br]machen kann,
0:04:57.085,0:04:58.420
und das ist wirklich cool.
0:05:01.846,0:05:03.380
Ein kleines Quiz für Sie.
0:05:03.380,0:05:05.493
Wenn Sie alle Eigenschaften[br]auf Wikidata nehmen,
0:05:05.493,0:05:07.687
die keine externen Identifikatoren sind,
0:05:07.687,0:05:10.498
welche hat dann die meisten Bezeichnungen,[br]also die meisten Sprachen?
0:05:10.977,0:05:13.847
(Publikum) [Gemurmel]
0:05:13.847,0:05:16.786
Ich höre eine gewisse Übereinstimmung[br]über die Instanz von?
0:05:17.506,0:05:19.363
Sie würden sich irren.
0:05:19.983,0:05:22.210
Es ist Bild. (lacht)
0:05:23.230,0:05:26.366
Also, ja, das sagt Ihnen,[br]wenn Sie eine der Sprachen sprechen,
0:05:26.366,0:05:28.621
in denen Instanz von[br]noch keine Bezeichnung hat,
0:05:28.621,0:05:30.350
sollten Sie sie vielleicht hinzufügen.
0:05:32.102,0:05:35.532
Es hat also derzeit 148 Bezeichnungen.
0:05:37.688,0:05:41.249
Aber das ist eine andere Folie.
0:05:42.631,0:05:44.520
Diese Grafik sagt uns etwas darüber,
0:05:44.520,0:05:49.026
wie viel Inhalt wir in einer bestimmten[br]Sprache zur Verfügung stellen
0:05:49.026,0:05:51.922
und wie viel von diesem Inhalt[br]tatsächlich genutzt wird.
0:05:51.922,0:05:55.332
Was Sie also sehen,[br]ist im Grunde eine Kurve,
0:05:55.332,0:05:59.487
bei der die meisten Inhalte[br]englische Beschriftungen haben,
0:05:59.487,0:06:04.005
in Englisch verfügbar sind[br]und viel genutzt werden.
0:06:04.005,0:06:06.449
Und dann geht sie abwärts.
0:06:06.449,0:06:09.294
Aber was Sie wiederum sehen,[br]sind Ausreißer,
0:06:09.294,0:06:14.971
die viel mehr Inhalte haben,[br]als Sie unbedingt erwarten würden,
0:06:16.903,0:06:19.539
und das ist wirklich, wirklich gut.
0:06:20.839,0:06:24.775
Das Problem ist immer noch,[br]dass es nicht oft verwendet wird.
0:06:25.565,0:06:28.522
Asturisch und Niederländisch[br]sollten höher stehen,
0:06:28.522,0:06:31.994
und ich denke, dass es echt nützlich ist,
0:06:33.266,0:06:35.563
diesen Gemeinden dabei zu helfen,
0:06:35.563,0:06:37.532
die Nutzung der gesammelten Daten[br]zu erhöhen.
0:06:42.910,0:06:48.110
Was diese und andere Analysen[br]uns gezeigt haben, ist eine gute Sache,
0:06:48.300,0:06:51.378
denn wir sehen,[br]dass stark genutzte Artikel
0:06:51.378,0:06:55.295
auch dazu neigen,[br]mehr Bezeichnungen zu haben
0:06:55.295,0:06:58.188
oder umgekehrt - das ist nicht ganz klar.
0:07:02.513,0:07:04.376
Und dann stellt sich die Frage,
0:07:04.806,0:07:07.009
ob wir nur die mächtigen Sprachen[br]bedienen.
0:07:07.899,0:07:10.997
Oder dienen wir allen?
0:07:12.757,0:07:17.533
Und was Sie hier sehen,[br]ist eine Gruppierung der Sprachen.
0:07:17.533,0:07:21.832
Die Sprachen, die in einer Gruppe sind,[br]haben oft gemeinsame Bezeichnungen.
0:07:26.042,0:07:28.599
Und Sie sehen, dass diese sich gruppieren.
0:07:28.599,0:07:34.775
Hier ist eine ähnliche Gruppierung,[br]in Farbe, basierend darauf,
0:07:34.775,0:07:39.395
wie lebendig, wie oft verwendet
0:07:40.455,0:07:43.026
und wie gefährdet die Sprache ist.
0:07:43.026,0:07:44.772
Und eine gute Sache, die Sie hier sehen,
0:07:44.772,0:07:49.039
ist, dass sichere Sprachen[br]und gefährdete Sprachen
0:07:49.239,0:07:53.653
nicht zwei verschiedene Cluster bilden,
0:07:53.653,0:07:58.872
sondern sie sind alle[br]miteinander vermischt,
0:08:00.262,0:08:04.625
was viel besser ist als umgekehrt,
0:08:04.625,0:08:09.377
wenn die sicheren Sprachen,[br]die mächtigen Sprachen,
0:08:10.197,0:08:12.164
sich nur gegenseitig aushelfen würden.
0:08:12.744,0:08:14.356
Nein, das ist nicht der Fall.
0:08:14.356,0:08:17.417
Und das ist wirklich eine gute Sache.
0:08:17.417,0:08:20.042
Als ich das sah, fand ich das sehr gut.
0:08:23.474,0:08:25.169
Hier ist eine ähnliche Sache,
0:08:26.239,0:08:28.800
bei der wir uns
0:08:30.230,0:08:33.982
den Status der Sprachen
0:08:33.982,0:08:36.225
und die Anzahl der Bezeichnungen[br]angesehen haben.
0:08:39.367,0:08:42.937
Was Sie sehen, ist ein klarer Sieg[br]für ungefährdete Sprachen,
0:08:42.937,0:08:44.248
wie zu erwarten ist.
0:08:45.508,0:08:47.093
Aber was Sie auch sehen, ist,
0:08:47.093,0:08:53.967
dass die Sprachen in Kategorie 2[br]und 3 und vielleicht sogar 4
0:08:53.967,0:08:58.960
eigentlich gar nicht so schlecht sind,
0:08:58.960,0:09:02.367
was ihre Darstellung in Wikidata[br]und anderen angeht.
0:09:03.287,0:09:05.978
Das festzustellen, ist wirklich gut.
0:09:07.646,0:09:09.609
Wenn man sich nun[br]die gleiche Sache anschaut,
0:09:09.609,0:09:12.418
wie viel von dem Inhalt[br]dieser Bezeichnungen
0:09:12.418,0:09:15.265
beispielsweise auf Wikipedia[br]tatsächlich verwendet wird,
0:09:17.455,0:09:22.563
dann sehen wir ein ähnliches Bild,[br]das wieder auftaucht.
0:09:23.603,0:09:29.633
Es zeigt uns, dass diese Communities[br]ihre Zeit tatsächlich gut nutzen,
0:09:29.633,0:09:34.504
indem sie beispielsweise Bezeichnungen[br]für stärker verwendete Artikel eintragen.
0:09:36.410,0:09:40.493
Es gibt Ausreißer, bei denen wir[br]meiner Meinung nach helfen können,
0:09:41.683,0:09:44.251
um diesen Communities zu helfen,
0:09:44.251,0:09:48.141
die Orte zu finden,[br]wo ihre Arbeit am wertvollsten wäre.
0:09:49.312,0:09:52.663
Aber insgesamt bin ich[br]mit diesem Bild zufrieden.
0:09:54.823,0:09:59.734
Nun, das war der Teil der Objekte[br]und Eigenschaften von Wikidata.
0:10:00.714,0:10:03.033
Betrachten wir nun die Interaktion[br]in Ihren Sprachen.
0:10:03.033,0:10:05.203
Also die Lexeme-Teile von Wikidata,
0:10:05.203,0:10:09.394
in denen wir Wörter und ihre Formen[br]und ihre Bedeutungen beschreiben.
0:10:10.167,0:10:13.301
Wir machen das jetzt[br]seit Mai letzten Jahres,
0:10:16.461,0:10:19.127
und der Inhalt ist gewachsen.
0:10:20.114,0:10:22.149
Sie können hier in Blau die Lexeme sehen
0:10:22.149,0:10:25.938
und dann in rot die Formen[br]auf diesen Lexemen
0:10:25.938,0:10:29.910
und in gelb die Bedeutung[br]auf diesen Lexemen.
0:10:30.991,0:10:34.251
Einige Communities--[br]dazu kommen wir später --
0:10:34.251,0:10:39.793
haben also viel Zeit damit verbracht,[br]Formen und Bedeutungen für ihre Lexeme
0:10:39.793,0:10:42.753
zu erstellen, was wirklich nützlich ist,
0:10:42.753,0:10:47.993
denn das bildet den Kern[br]des Datensatzes, den Sie benötigen.
0:10:50.562,0:10:55.133
Nun haben wir uns alle Sprachen angesehen,
0:10:55.133,0:10:57.906
die Lexeme auf Wikidata haben.
0:10:57.906,0:11:01.003
Die Wörter, die wir haben,
0:11:01.713,0:11:04.404
das sind im Moment 310 Sprachen.
0:11:04.884,0:11:08.290
Was ist Ihrer Meinung nach[br]die wichtigste Sprache,
0:11:08.290,0:11:11.949
wenn es um die Anzahl der Lexeme geht,[br]die derzeit in Wikidata enthalten sind?
0:11:12.933,0:11:14.700
(Publikum) [mehrere Zwischenrufe]
0:11:19.183,0:11:20.216
(Lydia) Hm?
0:11:20.216,0:11:21.741
(Person 2) Deutsch.
0:11:21.741,0:11:24.022
(Lydia) Entschuldigung,[br]ich habe es schon mal gehört.
0:11:24.022,0:11:25.411
Es ist Russisch.
0:11:28.011,0:11:29.754
Russisch hat einen großen Vorsprung.
0:11:31.897,0:11:33.832
Und nur um Ihnen[br]einen Eindruck zu geben,
0:11:35.482,0:11:37.036
es gibt verschiedene Meinungen,
0:11:37.036,0:11:41.705
aber ich habe zum Beispiel gelesen,[br]dass 1.000 bis 3.000 Wörter
0:11:41.705,0:11:45.450
Sie ungefähr auf Konversationsniveau[br]in einer anderen Sprache bringen
0:11:45.450,0:11:49.461
und 4.000 bis 10.000 Wörter[br]auf ein fortgeschrittenes Niveau.
0:11:51.591,0:11:55.022
Wir müssen also noch ein wenig aufholen.
0:11:58.483,0:12:02.792
Eine Sache, die Sie beachten sollten,[br]ist Baskisch hier
0:12:03.272,0:12:07.524
mit ungefähr 10.000 Lexemen.
0:12:09.244,0:12:13.003
Wenn man sich die Anzahl der Formen[br]für diese Lexeme ansieht,
0:12:14.163,0:12:16.277
ist Baskisch weit oben,
0:12:18.257,0:12:20.006
was wirklich cool ist,
0:12:20.006,0:12:24.930
und Sie sollten zu einem Vortrag gehen,[br]der Ihnen erklärt, warum das der Fall ist.
0:12:27.341,0:12:29.576
Wenn man sich nun die Anzahl[br]der Bedeutungen anschaut,
0:12:29.576,0:12:31.078
also was bedeuten die Wörter,
0:12:31.728,0:12:34.721
steht Baskisch sogar[br]ganz oben auf der Liste.
0:12:34.721,0:12:36.820
Ich denke, das verdient einen Applaus.
0:12:36.820,0:12:38.921
(Beifall)
0:12:45.678,0:12:47.118
Noch ein kurzes Quiz.
0:12:47.118,0:12:50.181
Welches ist das Lexem[br]mit den meisten Übersetzungen derzeit?
0:12:50.651,0:12:55.414
(Publikum) Katzen, Katzen, [unhörbar],[br]Douglas Adams, [unhörbar]
0:12:56.766,0:13:00.014
(Lydia) Alles gute Ratschläge, aber nein.
0:13:01.012,0:13:04.027
Es ist dies,[br]das russische Wort für "Wasser".
0:13:09.571,0:13:12.753
Also gut, wir haben jetzt[br]viel darüber gesprochen,
0:13:12.753,0:13:16.412
wie viele Lexeme, Formen[br]und Bedeutungen wir haben,
0:13:16.412,0:13:20.493
aber das ist nur eine Sache,[br]die man braucht.
0:13:20.493,0:13:21.705
Die andere Sache ist,
0:13:21.705,0:13:25.161
diese Lexeme, Formen und Bedeutungen
0:13:25.161,0:13:27.364
in maschinenlesbarer Form zu beschreiben.
0:13:27.364,0:13:30.039
Und dazu hat man Aussagen,[br]wie zum Beispiel zu Objekten.
0:13:31.479,0:13:34.752
Und eine der Eigenschaften,[br]die man verwendet,
0:13:34.752,0:13:36.362
ist ein Anwendungsbeispiel.
0:13:36.362,0:13:38.582
Wer also diese Daten verwendet,
0:13:38.582,0:13:42.089
kann verstehen, wie dieses Wort[br]im Kontext zu verwenden ist,
0:13:42.089,0:13:44.158
so dass es zum Beispiel[br]ein Zitat sein könnte.
0:13:45.396,0:13:47.113
Und hier liegt Polnisch ganz vorne.
0:13:47.900,0:13:49.764
Gute Arbeit, Polnisch-Sprecher.
0:13:54.219,0:13:57.680
Eine weitere Eigenschaft,[br]die wirklich nützlich ist, ist IPA,
0:13:57.680,0:13:59.968
also wie spricht man dieses Wort aus.
0:14:00.876,0:14:07.497
Russisch braucht offenbar[br]viele IPA-Erklärungen.
0:14:10.419,0:14:13.314
Aber noch einmal kommt Polnisch[br]gleich hinterher.
0:14:17.148,0:14:20.753
Und zu guter Letzt haben wir[br]auch noch eine Audioaussprache.
0:14:20.753,0:14:23.372
Das sind also Links[br]zu Dateien auf Commons,
0:14:23.372,0:14:25.959
in denen jemand das Wort ausspricht,
0:14:25.959,0:14:27.703
so dass Sie hören können,
0:14:27.703,0:14:29.913
wie ein Muttersprachler[br]das Wort ausspricht,
0:14:29.913,0:14:32.741
falls Sie zum Beispiel[br]IPA nicht lesen können.
0:14:34.959,0:14:39.015
Und es gibt ein wirklich nettes,[br]auf Wiki basierendes Projekt
0:14:39.015,0:14:40.474
namens Lingua Libre,
0:14:40.884,0:14:45.173
bei dem Sie mithelfen können,[br]Wörter in Ihrer Sprache aufzunehmen,
0:14:45.173,0:14:47.836
die dann zu den Lexemen auf Wikidata[br]hinzugefügt werden können,
0:14:48.446,0:14:51.923
damit andere Leute verstehen können,[br]wie Ihre Wörter ausgesprochen werden.
0:14:53.663,0:14:55.694
(Person 2) [undeutlich]
0:14:55.694,0:14:57.665
(Lydia) Wenn Sie[br]nach "Lingua Libre" suchen,
0:14:57.665,0:15:00.981
und ich bin sicher, dass es jemand[br]im Telegrammkanal posten kann.
0:15:03.138,0:15:04.621
Die Leute sind der Hammer.
0:15:04.621,0:15:06.726
Sie haben wirklich coole Sachen[br]mit Wikibase gemacht.
0:15:09.416,0:15:10.617
In Ordnung.
0:15:12.706,0:15:16.980
Dann ist die Frage, wie geht es weiter?
0:15:19.165,0:15:22.010
Basierend auf den Zahlen,[br]die ich Ihnen gerade gezeigt habe,
0:15:23.030,0:15:25.172
haben wir einen langen Weg zurückgelegt,
0:15:25.172,0:15:28.430
um mehr Menschen mehr Zugang[br]zu mehr Wissen zu geben,
0:15:28.430,0:15:31.040
was Sprachen auf Wikidata betrifft.
0:15:32.530,0:15:36.392
Aber es liegt auch noch[br]eine Menge Arbeit vor uns.
0:15:38.992,0:15:42.341
Einige der Dinge, die Sie[br]tun können, um zu helfen,
0:15:42.341,0:15:44.921
sind zum Beispiel Label-a-Thons,
0:15:44.921,0:15:50.124
wie Leute zusammenzubringen,[br]um Objekte in Wikidata zu bezeichnen,
0:15:50.914,0:15:55.121
oder einen Edit-a-Thon, um Lexeme[br]in Ihrer Sprache zu vervollständigen,
0:15:55.121,0:15:59.002
um die am häufigsten verwendeten Wörter[br]in Ihrer Sprache in Wikidata zu bestimmen.
0:16:00.773,0:16:03.285
Oder Sie können ein Werkzeug[br]wie Terminator verwenden,
0:16:03.285,0:16:08.273
das Ihnen hilft, die wichtigsten Elemente[br]in Ihrer Sprache zu finden,
0:16:08.273,0:16:11.549
bei denen noch keine Bezeichnung[br]vorhanden ist.
0:16:13.274,0:16:17.509
Am wichtigsten ist es, zu messen,
0:16:17.509,0:16:22.253
wie oft es in anderen Wikidata-Elementen[br]als Links in Aussagen verwendet wird.
0:16:25.768,0:16:30.022
Und beim Lexeme-Teil
0:16:31.342,0:16:35.169
geht es natürlich auch darum,[br]diese Lexeme zu erweitern
0:16:35.169,0:16:41.013
und weitere Aussagen hinzuzufügen,
0:16:41.013,0:16:44.031
so dass sie tatsächlich die Basis
0:16:44.031,0:16:47.281
für sinnvolle Anwendungen bilden können,[br]die darauf aufbauen.
0:16:48.141,0:16:50.795
Denn wir nähern uns[br]dieser kritischen Masse,
0:16:50.795,0:16:53.366
aber wir sind noch weit davon entfernt,
0:16:53.366,0:16:56.624
dass man darauf ernsthafte[br]Anwendungen aufbauen könnte.
0:16:58.277,0:17:01.680
Und ich hoffe, dass Sie alle [br]sich uns dabei anschließen werden.
0:17:02.583,0:17:06.813
Und damit komme ich schon
0:17:06.813,0:17:09.387
zu einer kleinen Hilfe[br]von unseren Freunden,
0:17:09.597,0:17:12.542
und Bruno, wollen Sie zu uns kommen
0:17:13.882,0:17:16.854
und mit uns über[br]lexikalische Masken sprechen?
0:17:17.231,0:17:18.567
(Bruno) Danke, Lydia.
0:17:18.567,0:17:21.519
Danke, dass Sie mir[br]die Zeit gegeben haben,
0:17:21.519,0:17:24.550
um diese Arbeit vorzustellen,[br]die wir bei Google Denny machen
0:17:24.550,0:17:29.319
und von der viele von Ihnen schon[br]gehört haben oder wissen.
0:17:30.126,0:17:32.030
Denn bei Google bin ich Linguist.
0:17:32.030,0:17:35.780
Ich freue mich also sehr, hier unter[br]anderen Sprachbegeisterten zu sein.
0:17:36.620,0:17:39.278
Wir bauen auch einige Lexika auf,
0:17:39.278,0:17:41.766
und wir haben diese Technologie
0:17:41.766,0:17:45.589
oder diesen Ansatz aufgebaut, von dem[br]wir glauben, dass er nützlich sein kann.
0:17:46.369,0:17:48.455
Nur um ein wenig[br]Hintergrundinformationen zu geben,
0:17:48.455,0:17:52.068
hier ist mein lexikografischer[br]Hintergrund, über den ich hier spreche.
0:17:52.558,0:17:54.637
Wenn wir eine Lexikon-Datenbank aufbauen,
0:17:54.637,0:17:58.623
ist es sehr schwierig, sie zu pflegen,[br]konsistent zu halten
0:17:58.623,0:18:00.125
und Daten auszutauschen,
0:18:00.125,0:18:01.847
wie Sie wahrscheinlich wissen.
0:18:02.517,0:18:05.927
Es gibt mehrere Versuche, die Funktionen[br]und die Eigenschaften zu vereinheitlichen,
0:18:05.927,0:18:08.964
die diese Lexeme[br]und diese Formen beschreiben,
0:18:08.964,0:18:10.936
und es ist kein gelöstes Problem.
0:18:10.936,0:18:13.728
Es gibt einige Vereinheitlichungsversuche[br]auf dieser Seite.
0:18:13.728,0:18:15.209
Aber was wirklich fehlt--
0:18:15.209,0:18:18.732
und dieses Problem hatten wir[br]zu Beginn unseres Projekts bei Google--
0:18:18.732,0:18:21.607
ist der Versuch,[br]eine interne Struktur zu schaffen,
0:18:22.197,0:18:25.910
die beschreibt, wie ein[br]lexikalischer Eintrag aussehen sollte,
0:18:25.910,0:18:28.581
welche Art von Daten oder welche Art[br]von Informationen wir haben
0:18:28.581,0:18:31.987
und welche Spezifikationen[br]erwartet werden.
0:18:32.247,0:18:38.447
Das ist es also, was wir mit dieser Sache[br]namens Lexikon-Maske herausgefunden haben.
0:18:38.897,0:18:44.261
Eine Lexikonmaske beschreibt,[br]was für einen Eintrag,
0:18:44.261,0:18:47.355
einen lexikografischen Eintrag,[br]erwartet wird, um vollständig zu sein,
0:18:47.355,0:18:51.436
sowohl in Bezug auf die Anzahl der Formen,[br]die Sie für ein Lexem erwarten,
0:18:51.436,0:18:55.472
als auch auf die Anzahl der Merkmale,[br]die Sie für jede dieser Formen erwarten.
0:18:56.257,0:18:58.329
Hier ist ein Beispiel[br]für italienische Adjektive.
0:18:58.329,0:19:02.002
Sie erwarten, dass Ihre Adjektive[br]auf Italienisch vier Formen haben,
0:19:02.002,0:19:05.383
und jede dieser Formen[br]hat eine spezifische Kombination
0:19:05.383,0:19:07.776
von Geschlechts- und Numerusmerkmalen.
0:19:08.606,0:19:12.392
Das erwarten wir[br]für die italienischen Adjektive.
0:19:12.392,0:19:15.996
Natürlich können Sie[br]sehr komplexe Masken haben,
0:19:15.996,0:19:18.508
wie die Konjugation[br]der französischen Verben,
0:19:18.508,0:19:20.366
die sehr umfangreich ist,
0:19:20.366,0:19:23.357
und ich zeige Ihnen nicht[br]weitere russische Masken,
0:19:23.357,0:19:25.378
weil diese nicht[br]auf den Bildschirm passen.
0:19:26.308,0:19:29.531
Und wir haben auch[br]einige detaillierte Spezifikationen,
0:19:29.531,0:19:33.421
weil wir unterscheiden auf der Formebene.
0:19:33.421,0:19:37.384
Hier haben Sie also russische Substantive,[br]die drei Numeri
0:19:37.384,0:19:40.048
und eine Reihe von Fällen[br]mit unterschiedlichen Formen haben,
0:19:40.048,0:19:43.086
aber sie haben auch eine Spezifikation[br]auf der Einstiegsebene,
0:19:43.086,0:19:45.590
die besagt, dass ein Substantiv vor allem
0:19:45.590,0:19:50.133
ein inhärentes Geschlecht[br]und ein inhärentes Belebtheitsmerkmal hat,
0:19:50.133,0:19:52.488
das ebenfalls in der Maske angegeben ist.
0:19:54.518,0:19:57.729
Wir wollen auch unterscheiden,[br]dass eine Maske
0:19:57.729,0:20:01.724
eine Spezifikation dafür gibt,[br]wie ein Eintrag aussehen sollte.
0:20:01.724,0:20:07.048
Aber Sie können kleinere Masken[br]für fehlerhafte Aspekte der Form
0:20:07.048,0:20:11.282
oder fehlerhafte Aspekte des Lexems haben,[br]die in der Sprache vorkommen.
0:20:11.282,0:20:14.537
Hier ist also die einfachste Version[br]der französischen Verben,
0:20:14.537,0:20:19.729
die nur die dritte Person Singular[br]für alle Wetterverben haben,
0:20:19.729,0:20:23.804
wie "es regnet" oder "es schneit",[br]wie im Englischen.
0:20:24.537,0:20:26.493
Wir unterscheiden also[br]diese beiden Stufen.
0:20:26.923,0:20:29.962
Und wie wir das bei Google verwenden,
0:20:29.962,0:20:32.643
ist, dass wir, wenn wir ein Lexikon haben,[br]das wir verwenden wollen,
0:20:33.063,0:20:37.469
die Maske benutzen, um die Lexika,[br]also alle Einträge,
0:20:37.469,0:20:40.163
wirklich buchstäblich[br]durch die Maske zu werfen
0:20:40.163,0:20:44.303
und zu sehen, welcher Eintrag[br]ein Problem in Bezug auf die Struktur hat.
0:20:44.303,0:20:46.523
Fehlt uns eine Form?[br]Fehlt uns ein Merkmal?
0:20:46.523,0:20:51.247
Und wenn es ein Problem gibt, führen wir[br]eine menschliche Validierung durch
0:20:51.247,0:20:53.751
oder einfach nur, um zu sehen,[br]ob es die Maske passiert.
0:20:53.751,0:20:55.940
Es ist also ein extrem[br]leistungsfähiges Werkzeug,
0:20:55.940,0:20:58.132
um die Qualität der Struktur[br]zu überprüfen.
0:20:59.427,0:21:01.964
Wir freuen uns also,[br]heute bekannt geben zu können,
0:21:01.964,0:21:05.408
dass wir grünes Licht erhalten haben,[br]unsere Maske freizugeben.
0:21:05.948,0:21:07.573
Dies ist also ein Schema.
0:21:07.573,0:21:09.547
Wenn Sie das wollen,[br]können wir es veröffentlichen
0:21:09.547,0:21:13.483
und wir werden es Wikidata[br]als ShEx-Dateien zur Verfügung stellen.
0:21:13.483,0:21:16.688
Dies ist eine ShEx-Datei[br]für deutsche Substantive,
0:21:16.688,0:21:20.428
und Denny arbeitet an der Konvertierung[br]von unserer internen Spezifikation
0:21:20.428,0:21:23.516
in eine Open-Source-Spezifikation.
0:21:23.516,0:21:27.242
Derzeit decken wir[br]mehr als 25 Sprachen ab.
0:21:27.242,0:21:29.315
Wir erwarten also Wachstum[br]auf unserer Seite,
0:21:29.315,0:21:34.033
aber wir suchen auch nach der Möglichkeit,[br]für andere Sprachen zusammenzuarbeiten.
0:21:34.033,0:21:39.993
Und eine der laufenden Kooperationen,[br]die zwischen Denny und Lukas stattfindet,
0:21:40.503,0:21:45.052
Lukas hat diese großartigen Werkzeuge,[br]um eine Benutzeroberfläche zu haben,
0:21:45.052,0:21:48.524
die dem Benutzer[br]oder dem Beitragenden hilft,
0:21:48.524,0:21:50.811
weitere Formen hinzuzufügen.
0:21:50.811,0:21:54.151
Wenn Sie also ein Adjektiv[br]auf Französisch hinzufügen möchten,
0:21:54.151,0:21:58.897
sagt Ihnen die Benutzeroberfläche,[br]wie viele Formen erwartet werden
0:21:58.897,0:22:01.562
und welche Art von Funktionen[br]diese Form haben sollte.
0:22:01.562,0:22:06.047
Unsere Maske hilft Ihnen, das Werkzeug[br]zu definieren und zu erweitern.
0:22:07.238,0:22:08.385
Das ist alles.
0:22:08.791,0:22:10.358
(Lydia) Ich danke Ihnen vielmals.
0:22:10.358,0:22:11.993
(Beifall)
0:22:14.249,0:22:16.741
In Ordnung. Gibt es Fragen?
0:22:16.741,0:22:19.035
Wollen Sie mehr über Lexeme sprechen?
0:22:19.817,0:22:21.475
- (Person 3) Ja. [br]- (Lydia) Ja. (lacht)
0:22:33.485,0:22:35.520
(Person 3) Meine Frage,[br]weil Sie davon sprachen,
0:22:35.520,0:22:38.916
mehr Menschen in mehr Sprachen[br]Zugang zu gewähren.
0:22:38.916,0:22:41.112
Aber es gibt eine Menge Sprachen,[br]die in Wikidata
0:22:41.112,0:22:42.524
nicht verwendet werden können.
0:22:42.524,0:22:44.528
Welche Lösung haben Sie also dafür?
0:22:45.789,0:22:48.416
(Lydia) Wenn Sie sagen, dass Wikidata[br]nicht verwendet werden kann,
0:22:48.416,0:22:50.308
sprechen Sie von der Eingabe[br]von Bezeichnungen?
0:22:50.308,0:22:51.938
(Person 3) Bezeichnungen,[br]Beschreibungen.
0:22:51.938,0:22:55.498
(Lydia) Richtig.[br]Bei Lexemes ist es also etwas anders,
0:22:55.498,0:22:57.793
weil wir dort diese Einschränkung[br]nicht haben.
0:22:58.923,0:23:02.812
Für Bezeichnungen[br]von Objekten und Eigenschaften
0:23:02.812,0:23:05.072
gibt es eine gewisse Einschränkung,
0:23:05.252,0:23:11.772
weil wir sicherstellen wollten,[br]dass nicht jeder
0:23:12.411,0:23:14.229
etwas völlig anderes macht
0:23:14.229,0:23:17.243
und es unüberschaubar wird.
0:23:19.349,0:23:21.197
Sogar eine kleine Communties,
0:23:21.197,0:23:23.758
die eine einzige Sprache wollen[br]und daran arbeiten möchten,
0:23:23.758,0:23:26.757
kommt zu uns und sprecht mit uns,[br]wir werden das einrichten.
0:23:26.757,0:23:29.222
(Person 3) Wir haben das[br]beim Prager Hackathon im Mai getan,
0:23:29.222,0:23:32.459
und wir haben bis fast August gebraucht,[br]um unsere Sprache verwenden zu können.
0:23:32.459,0:23:35.036
- (Lydia) Ja. [br]- (Person 3) Also, es ist sehr langsam.
0:23:35.036,0:23:37.383
(Lydia) Ja, es ist leider sehr langsam.
0:23:37.623,0:23:39.883
Wir arbeiten derzeit[br]mit dem Sprachausschuss
0:23:39.883,0:23:45.746
an der Lösung einiger grundlegender...
0:23:49.537,0:23:52.125
Zum Beispiel, eine Einigung[br]darüber zu erzielen,
0:23:52.125,0:23:55.272
welche Arten von Sprachen[br]tatsächlich "erlaubt" sind,
0:23:55.742,0:23:59.055
und das hat zu lange gedauert,
0:23:59.988,0:24:02.768
weshalb Ihre Anfrage wahrscheinlich[br]länger gedauert hat,
0:24:02.768,0:24:04.398
als sie hätte sein sollen.
0:24:04.778,0:24:05.963
(Person 3) Danke.
0:24:06.815,0:24:07.950
(Person 4) Vielen Dank.
0:24:07.950,0:24:10.938
Lydia, wenn Sie sich an die Statistiken[br]erinnern, die Sie gezeigt haben,
0:24:10.938,0:24:12.886
die Anzahl der Lexeme pro Sprache.
0:24:12.886,0:24:17.599
Haben Sie also alle Formen[br]als Datenpunkt gezählt
0:24:17.599,0:24:19.757
oder nur Lexeme?
0:24:21.289,0:24:22.931
(Lydia) Meinen Sie das?
0:24:22.931,0:24:24.053
Welches meinen Sie?
0:24:24.053,0:24:25.529
(Person 4) Ja, genau.
0:24:25.797,0:24:28.341
Wenn Sie sich erinnern,[br]zählt diese Zahl [unhörbar]
0:24:28.341,0:24:31.654
alle Formen für alle Lexeme[br]oder nur, wie viele Lexeme es gibt?
0:24:31.654,0:24:33.795
(Lydia) Nein, dies ist nur[br]die Anzahl von Lexemen.
0:24:33.795,0:24:35.515
(Person 4) Nur eine Anzahl[br]von Lexemen, okay.
0:24:35.515,0:24:37.083
Dann ist es also nur eine Statistik,
0:24:37.083,0:24:39.390
denn wenn es dann die Formen[br]zusammensetzen würde--
0:24:39.390,0:24:40.614
deshalb frage ich--
0:24:40.614,0:24:42.817
dann haben alle Sprachen[br]mit der Flexionsmorphologie,
0:24:42.817,0:24:45.027
wie Russisch, Serbisch,[br]Slowenisch und so weiter,
0:24:45.027,0:24:47.616
einen natürlichen Vorteil,[br]weil sie so viele haben.
0:24:47.616,0:24:51.860
(Lydia) Das wirkt sich also[br]auf diese Anzahl von Formen aus.
0:24:51.860,0:24:53.851
(Person 4) Ja, das war diese hier. Danke.
0:24:56.546,0:25:00.224
(Person 5) Also, ich hatte[br]eine kurze Frage über die...
0:25:00.644,0:25:06.824
Wenn wir über die eigentlichen[br]Objekte und Eigenschaften sprechen,
0:25:07.124,0:25:08.901
soweit ich weiß,
0:25:08.901,0:25:11.955
gibt es derzeit keine Möglichkeit,[br]eine tatsächliche Quelle
0:25:11.955,0:25:14.726
für die angegebenen Bezeichnungen[br]und Beschreibungen anzugeben.
0:25:14.726,0:25:17.542
Zum Beispiel, weil man,
0:25:17.542,0:25:20.741
wenn es sich um eine Eigenschaft[br]eines Objekts handelt,
0:25:20.741,0:25:24.389
kann man zum Beispiel[br]widersprüchliche Bezeichnungen erhalten.
0:25:24.389,0:25:25.539
(Lydia) Ja.
0:25:25.539,0:25:27.662
(Person 5) Diese Person ist also wie...
0:25:28.332,0:25:31.021
Wir haben zum Beispiel schon einmal[br]über indigene Dinge gesprochen.
0:25:31.021,0:25:35.775
Diese Person ist also nach dieser Quelle[br]ein norwegischer Künstler,
0:25:35.775,0:25:38.750
und nach dieser Quelle[br]ein samischer Künstler.
0:25:39.550,0:25:42.883
Oder, zum Beispiel, in der[br]estnischen Sprache hatten wir ein Problem,
0:25:42.883,0:25:47.556
bei dem wir die Terminologie[br]auf die offizielle Terminologie
0:25:47.556,0:25:49.482
in den offiziellen Lexika[br]umstellen mussten,
0:25:49.482,0:25:52.072
aber wir haben keine Möglichkeit,[br]wirklich anzugeben, warum,
0:25:52.072,0:25:53.596
was die Ursache dafür war
0:25:53.596,0:25:55.561
und warum das besser war[br]und was vorher da war.
0:25:55.561,0:25:57.150
Es war nur ich als zufällige Person,
0:25:57.150,0:25:59.615
die die Sache umgestellt hat[br]für jeden, der das sieht.
0:25:59.615,0:26:02.520
Gibt es also einen Plan, um dies[br]in irgendeiner Weise zu ermöglichen,
0:26:02.520,0:26:06.224
damit wir tatsächlich die richtigen[br]Quellen für die Sprachdaten haben?
0:26:07.045,0:26:11.498
(Lydia) Also, es ist teilweise möglich.
0:26:11.498,0:26:15.743
Wenn Sie zum Beispiel ein Objekt[br]für eine Person haben,
0:26:16.968,0:26:21.032
dann haben Sie eine Aussage,[br]den Vornamen, den Nachnamen
0:26:21.032,0:26:22.720
und so weiter, dieser Person,
0:26:22.720,0:26:26.019
und dann können Sie dort[br]die Referenz dafür angeben.
0:26:28.211,0:26:32.004
Ich zögere noch, mehr Komplexität
0:26:32.004,0:26:35.397
für Referenzen auf Bezeichnungen[br]und Beschreibungen hinzuzufügen,
0:26:35.397,0:26:38.624
aber wenn die Leute wirklich,[br]wirklich denken,
0:26:38.624,0:26:43.021
dass dies etwas ist,[br]das nicht durch eine Referenz
0:26:43.021,0:26:44.952
zu der Aussage abgedeckt ist,
0:26:44.952,0:26:46.753
dann lassen Sie uns darüber reden.
0:26:49.079,0:26:52.983
Aber ich fürchte, es wird[br]eine Menge Komplexität
0:26:52.983,0:26:56.363
für hoffentlich wenige Fälle hinzufügen,
0:26:57.393,0:27:00.188
aber ich bin bereit, mich vom Gegenteil[br]überzeugen zu lassen,
0:27:00.188,0:27:03.977
wenn die Leute wirklich[br]sehr stark davon überzeugt sind.
0:27:03.977,0:27:07.997
(Person 5) Wenn es hinzugefügt wird,[br]sollte es nicht Standardeinstellung sein,
0:27:07.997,0:27:12.272
das allen Anfängern der Benutzer [br]zu zeigen, auf jeden Fall.
0:27:12.272,0:27:16.010
Eher so: "Klicken Sie hier, wenn Sie[br]etwas Bestimmtes dazu sagen müssen".
0:27:17.632,0:27:23.228
(Lydia) Haben wir ein Gefühl dafür,[br]wie oft das eine Rolle spielen würde?
0:27:24.520,0:27:26.423
(Person 5) Auf Estnisch, zum Beispiel--
0:27:26.423,0:27:28.844
ich nehme an, das gilt auch[br]für andere Sprachen--
0:27:29.274,0:27:34.023
gibt es einen offiziellen Namen,[br]die tatsächlich legitime Übersetzung,
0:27:34.023,0:27:36.036
zum Beispiel ins Englische,
0:27:36.036,0:27:40.314
einer bestimmten Art[br]von Stadtgemeinde ist.
0:27:40.614,0:27:42.402
Das war zum Beispiel mein Anwendungsfall,
0:27:42.402,0:27:44.409
wo wir das Wort "Gemeinde"[br]verwendet haben,
0:27:45.159,0:27:50.715
das im estnischen Original[br]wie eine Kirchengemeinde gemeint war,
0:27:50.715,0:27:51.899
und das war der Ursprung,
0:27:51.899,0:27:54.809
aber das ist nicht die offizielle[br]Übersetzung, die Estland jetzt hat.
0:27:55.189,0:27:58.993
(Lydia) In diesem Fall würde ich es[br]als offizielle Namensangabe hinzufügen
0:27:58.993,0:28:00.817
und dort den Verweis hinzufügen.
0:28:02.032,0:28:03.158
(Person 5) Okay.
0:28:05.186,0:28:06.572
(Lydia) Weitere Fragen, ja?
0:28:07.682,0:28:10.044
(Person 6) Ich habe zwei kurze Kommentare.
0:28:10.044,0:28:13.934
Sie haben ausdrücklich Asturisch als eine[br]Sprache genannt, die gut funktioniert,
0:28:13.934,0:28:16.285
und ich denke,[br]das ist ein falsches Artefakt.
0:28:16.285,0:28:17.724
(Lydia) Erzählen Sie mir davon.
0:28:17.724,0:28:19.748
(Person 6) Ich glaube, es ist nur ein Bot,
0:28:19.748,0:28:23.784
der Personennamen wie Eigennamen einfügt
0:28:23.784,0:28:26.902
und sagt: "Nun, das ist genau[br]wie im Französischen oder Spanischen",
0:28:26.902,0:28:28.558
und es einfach massiv kopiert.
0:28:28.558,0:28:33.316
Ein Beweis dafür ist, dass man[br]diese Energie im Asturischen
0:28:33.316,0:28:37.205
nicht in Dingen sieht, die eigentlich[br]übersetzt werden müssen, wie Eigennamen
0:28:37.205,0:28:39.648
oder Namen von Objekten,[br]die keine Eigennamen sind.
0:28:39.648,0:28:41.219
(Lydia) Asaf, du brichst mir das Herz.
0:28:41.219,0:28:43.198
(Person 6) Ich weiß,[br]ich vermassle immer die Show,
0:28:43.198,0:28:48.458
aber ich habe auch gute Neuigkeiten,[br]was die Zahlen zur Aussprache betrifft.
0:28:49.408,0:28:53.515
Wie Sie wahrscheinlich wissen,[br]ist Commons voll von Aussprachedateien,
0:28:53.515,0:28:54.668
und zum Beispiel
0:28:54.668,0:28:59.632
gibt es im Niederländischen nicht weniger[br]als 300.000 Aussprachedateien
0:28:59.632,0:29:01.272
schon unter Commons
0:29:01.912,0:29:05.051
die nur irgendwie[br]aufgenommen werden müssen.
0:29:05.051,0:29:07.517
Wenn also jemand[br]nach einem Nebenprojekt sucht,
0:29:07.517,0:29:08.997
gibt es tonnenweise
0:29:08.997,0:29:13.280
klassifizierte, kategorisierte[br]Aussprachedateien unter Commons
0:29:13.280,0:29:16.893
unter der Kategorie "Aussprache"[br]nach Sprache.
0:29:16.893,0:29:20.402
Das wartet nur darauf,[br]mit Lexemen abgeglichen
0:29:20.402,0:29:23.180
und auf Lexeme gesetzt zu werden.
0:29:23.180,0:29:26.585
Und ich habe mich gefragt, ob Sie etwas[br]über den Fahrplan sagen können,
0:29:26.585,0:29:28.757
etwas darüber, wie viel Investitionen
0:29:28.757,0:29:31.995
oder was wir im kommenden Jahr[br]von Lexeme erwarten können,
0:29:31.995,0:29:33.830
denn ich kann es kaum erwarten.
0:29:34.949,0:29:37.044
(Lydia) Sie können nicht warten? (lacht)
0:29:37.044,0:29:39.118
- (Person 6) Auf mehr. [br]- (Lydia) Ja.
0:29:44.541,0:29:49.293
Im Moment konzentrieren wir uns[br]auf mehr über Wikibase und Datenqualität,
0:29:51.493,0:29:55.087
um zu sehen, wie viel Fahrt das bekommt,
0:29:55.087,0:30:01.496
und dann mehr Information darüber,[br]wo die Schwachpunkte als Nächstes liegen,
0:30:01.496,0:30:06.003
und dann wieder zur weiteren Verbesserung[br]der lexikografischen Daten zurückzukehren.
0:30:06.903,0:30:09.790
Und eines der Dinge, die ich[br]gerne von Ihnen hören würde,
0:30:09.790,0:30:14.136
ist, wo genau Sie[br]die nächsten Schritte sehen,
0:30:14.136,0:30:15.966
wo Sie Verbesserungen sehen wollen,
0:30:15.966,0:30:20.340
damit wir dann herausfinden können,[br]wie wir das erreichen können.
0:30:21.125,0:30:22.810
Aber natürlich haben Sie Recht,
0:30:22.810,0:30:25.712
es gibt noch so viel zu tun,[br]auch von der technischen Seite her.
0:30:30.573,0:30:33.797
(Person 7) Okay, als wir[br]die baskischen Wörter
0:30:33.797,0:30:35.848
mit Formen hochgeladen haben,
0:30:35.848,0:30:37.768
und Sie werden einige dieser Dinge sehen,
0:30:37.768,0:30:41.329
sagten wir beide letzte Woche:[br]"Oh, wir sind die Ersten bei etwas.
0:30:42.919,0:30:44.928
Es erscheint in der Presse,[br]und es ist wie:
0:30:44.928,0:30:49.218
"Oh, Baskisch, es ist das erste Mal,[br]das sie bei etwas die ersten sind".
0:30:49.218,0:30:50.606
(Lachen)
0:30:50.606,0:30:53.002
Und dann fragen die Leute:[br]"Okay, aber wofür ist das?"
0:30:54.678,0:30:56.849
Wir haben keine wirklich gute Antwort.
0:30:56.849,0:30:58.008
Ich meine, "Okay,
0:30:58.008,0:31:01.761
das wird Computern helfen,[br]unsere Sprache besser zu verstehen, ja,
0:31:01.761,0:31:05.279
aber was für Werkzeuge können wir[br]in der Zukunft herstellen?"
0:31:05.279,0:31:07.467
Und darauf haben wir keine gute Antwort.
0:31:07.467,0:31:10.452
Ich weiß also nicht, ob Sie[br]eine gute Antwort darauf haben.
0:31:10.452,0:31:13.102
(Lydia) (lacht) Ich weiß nicht,[br]ob ich eine gute Antwort habe,
0:31:13.102,0:31:14.746
aber ich habe eine Antwort.
0:31:15.480,0:31:20.235
Ich denke also, wie ich[br]schon sagte [unhörbar],
0:31:20.235,0:31:22.694
dass wir noch nicht[br]die kritische Masse erreicht haben,
0:31:22.694,0:31:25.529
in der man viele der wirklich[br]interessanten Werkzeuge bauen kann.
0:31:25.529,0:31:27.707
Aber es gibt bereits einige Werkzeuge.
0:31:28.267,0:31:31.732
Erst neulich hat Esther [Pandelia][br]zum Beispiel
0:31:31.732,0:31:34.017
ein Werkzeug veröffentlicht,[br]mit dem man sehen kann,
0:31:35.837,0:31:38.889
ich glaube, es waren die Worte[br]auf einem Globus,
0:31:38.889,0:31:41.724
wo sie gesprochen werden,[br]woher sie kommen.
0:31:42.481,0:31:44.090
Wahrscheinlich irre ich mich da,
0:31:44.090,0:31:46.786
aber sie hatte auf dem Projekt-Chat[br]auf Wikidata geantwortet--
0:31:46.786,0:31:48.798
Sie können es dort nachschlagen.
0:31:49.574,0:31:51.805
Wir haben also[br]diese ersten Werkzeuge gesehen,
0:31:51.805,0:31:55.391
genau wie damals, als Wikidata begann.
0:31:56.846,0:31:59.602
Zuerst etwas - wie ein Netzwerk,
0:31:59.602,0:32:01.754
und wie: "Schau, da ist dieses Ding,
0:32:01.754,0:32:03.764
das sich mit diesem[br]anderen Ding verbindet".
0:32:04.824,0:32:07.059
Und je mehr Daten wir haben
0:32:07.059,0:32:10.352
und je mehr wir[br]eine kritische Masse erreicht haben,
0:32:11.852,0:32:14.559
desto leistungsfähigere Anwendungen[br]werden möglich,
0:32:15.677,0:32:17.516
Dinge wie Histropedia,
0:32:19.126,0:32:21.988
Dinge wie Fragen und Antworten
0:32:21.988,0:32:26.483
in Ihrem digitalen persönlichen[br]Assistenten, Platypus und so weiter.
0:32:26.483,0:32:29.849
Ähnliches sehen wir bei den Lexemen.
0:32:31.198,0:32:34.650
Wir befinden uns in einem Stadium,[br]in dem man so etwas wie diese kleinen,
0:32:34.650,0:32:37.464
hey, schau, es gibt eine Verbindung[br]zwischen den beiden Dingen,
0:32:37.864,0:32:42.528
und es gibt eine Übersetzung[br]dieses Wortes in dieses Sprachstadium,
0:32:42.528,0:32:47.587
und wenn wir es erweitern[br]und mehr Wörter beschreiben,
0:32:47.587,0:32:49.223
wird mehr möglich.
0:32:49.223,0:32:51.525
Was wird nun möglich?
0:32:53.482,0:32:59.303
Wie Ben, unser Hauptredner vorhin,[br]sprach über Übersetzungen,
0:33:00.103,0:33:03.265
über die Möglichkeit, von einer Sprache[br]in eine andere zu übersetzen.
0:33:03.265,0:33:07.769
Und Jens, mein Kollege,[br]er spricht immer davon,
0:33:07.769,0:33:11.452
dass die Europäische Union[br]einen Übersetzer sucht,
0:33:11.452,0:33:17.439
der aus dem Maltesischen ins Schwedische[br]übersetzen kann, war es Maltesisch?
0:33:17.439,0:33:19.436
- (Person 8) Estnisch.[br]- (Lydia) Estnisch.
0:33:22.016,0:33:26.211
Und das ist keine übliche Kombination.
0:33:27.211,0:33:31.535
Aber wenn man all diese Sprachen[br]an einem maschinenlesbaren Ort hat,
0:33:31.535,0:33:33.023
kann man das tun,
0:33:33.023,0:33:36.757
man kann ein Wörterbuch
0:33:36.757,0:33:41.735
von Estnisch nach Maltesisch[br]und zurück bekommen.
0:33:42.935,0:33:45.607
Also Sprachkombinationen[br]in Wörterbüchern abzudecken,
0:33:45.607,0:33:47.911
die vorher einfach nicht abgedeckt wurden,
0:33:47.911,0:33:51.050
weil es nicht genug Nachfrage[br]dafür gab, zum Beispiel,
0:33:51.050,0:33:55.540
um die Arbeit finanziell tragbar zu machen[br]und zu rechtfertigen.
0:33:55.540,0:33:57.067
Jetzt können wir das tun.
0:33:59.797,0:34:02.048
Dann die Texterstellung.
0:34:02.048,0:34:04.253
Lucie hat vorhin davon gesprochen,
0:34:04.253,0:34:10.136
wie sie mit Hattie[br]an der Textgenerierung arbeitet,
0:34:10.136,0:34:14.523
um Wikipedia-Artikel[br]in Minderheitensprachen zu erstellen,
0:34:15.423,0:34:19.512
und dazu braucht man Daten über Wörter,
0:34:19.512,0:34:22.529
und dazu muss man die Sprache verstehen.
0:34:23.769,0:34:27.773
Ja, und das sind nur einige,[br]die mir gerade in den Sinn kommen.
0:34:28.693,0:34:30.494
Vielleicht hat unser Publikum mehr Ideen,
0:34:30.494,0:34:34.253
was es tun möchte, wenn wir[br]all die herrlichen Daten haben.
0:34:37.693,0:34:40.892
(Person 9) Okay, ich werde vom Thema[br]Lexeme abweichen.
0:34:40.892,0:34:42.666
Ich werde die Frage stellen,
0:34:42.666,0:34:45.634
wie kann ich als Mitglied der Community
0:34:45.634,0:34:50.135
darauf Einfluss nehmen, dass die Priorität[br]auf die Aufgabe gelegt wird,
0:34:50.135,0:34:53.724
dass ein neuer Benutzer angeben kann,
0:34:53.724,0:34:56.644
welche Sprachen er sehen[br]und bearbeiten möchte,
0:34:56.644,0:35:01.135
ohne dass er geheime[br]verbale Vorlagenkenntnisse hat.
0:35:02.145,0:35:05.053
Vielleicht wird es dieses Jahr[br]diese technische Wunschliste
0:35:05.053,0:35:07.040
ohne Wikipedia-Themen geben.
0:35:07.040,0:35:10.969
Vielleicht gibt es eine Hoffnung, dass wir[br]alle über diese Sache abstimmen können,
0:35:10.969,0:35:14.018
die wir sieben Jahre lang[br]nicht geregelt haben.
0:35:14.018,0:35:17.607
Haben Sie also irgendwelche[br]Ideen und Kommentare dazu?
0:35:18.217,0:35:20.328
Sie sprechen also davon,
0:35:20.328,0:35:23.248
dass jemand, der nicht[br]in Wikidata eingeloggt ist,
0:35:23.248,0:35:25.631
seine Sprache nicht einfach ändern kann?
0:35:25.631,0:35:27.839
(Person 9) Nein, für [unhörbare] Benutzer.
0:35:28.309,0:35:30.689
(Lydia) Wenn sie also eingeloggt sind,
0:35:30.689,0:35:34.871
können sie ihre Sprache einfach[br]oben auf der Seite ändern,
0:35:35.891,0:35:38.099
und dann erscheint,
0:35:39.769,0:35:42.013
wo die Beschreibung [unhörbar] steht
0:35:42.013,0:35:43.553
und sie können sie bearbeiten.
0:35:45.657,0:35:49.009
(Person 9) Nun, eigentlich[br]ist der Arbeitsablauf oft so,
0:35:49.009,0:35:52.447
dass, wenn Sie mehrere Sprachen[br]haben wollen, diese angeboten werden,
0:35:52.447,0:35:55.298
das nicht immer der Fall ist.
0:35:55.298,0:35:58.287
(Lydia) Okay, vielleicht sollten wir uns[br]nach diesem Vortrag zusammensetzen
0:35:58.287,0:35:59.507
und Sie zeigen es mir.
0:36:01.562,0:36:04.009
Cool. Noch mehr Fragen?
0:36:05.444,0:36:06.446
Ja.
0:36:11.595,0:36:13.196
(Person 10) Danke für die Präsentation.
0:36:14.106,0:36:15.517
Können Sie den Stand
0:36:15.517,0:36:19.307
der Korrelation mit der[br]Wiktionary-Community kommentieren?
0:36:19.307,0:36:22.296
Soweit ich gesehen habe,[br]gab es einige Diskussionen
0:36:22.296,0:36:26.051
über den Import[br]einiger Elemente der Arbeit,
0:36:26.051,0:36:30.843
aber es scheint, Lizenzprobleme und einige[br]Meinungsverschiedenheiten usw. zu geben.
0:36:30.843,0:36:32.008
(Lydia) Das stimmt.
0:36:32.008,0:36:36.330
Die Wiktionary-Community[br]hat also viel Zeit
0:36:37.320,0:36:39.473
mit dem Aufbau[br]von Wiktionary verbracht.
0:36:39.473,0:36:42.643
Sie haben erstaunlich komplizierte
0:36:43.193,0:36:47.554
und komplexe Vorlagen gebaut,
0:36:47.554,0:36:53.614
um hübsche Tabellen zu erstellen,[br]die automatisch Formen für Sie
0:36:53.614,0:36:56.392
und alle möglichen[br]wirklich beeindruckenden
0:36:56.392,0:37:00.523
und verrückten Dinge erzeugen,[br]wenn Sie darüber nachdenken.
0:37:02.311,0:37:07.994
Und natürlich haben sie eine Menge Zeit[br]und Mühe in diese Arbeit investiert.
0:37:09.364,0:37:12.801
Und verständlicherweise wollen die nicht,
0:37:12.801,0:37:17.016
dass man sich das einfach grabscht.
0:37:18.046,0:37:19.102
einfach so.
0:37:19.102,0:37:21.567
Einiges davon kommt also von dort.
0:37:22.761,0:37:24.987
Und das ist gut so, das ist okay.
0:37:25.737,0:37:32.012
Die ersten Wiktionary-Communities[br]sprechen nun davon,
0:37:32.012,0:37:34.329
einige ihrer Daten[br]in Wikidata zu importieren.
0:37:34.329,0:37:39.095
Russisch, das Sie gesehen haben,[br]ist zum Beispiel einer dieser Fälle,
0:37:40.375,0:37:42.545
und ich erwarte, dass noch mehr[br]davon realisiert wird.
0:37:43.635,0:37:46.704
Aber es wird ein langsamer Prozess sein,
0:37:46.704,0:37:49.383
so wie die Übernahme der Daten[br]von Wikidata in Wikipedia
0:37:49.383,0:37:51.909
ein ziemlich langsamer Prozess war.
0:37:52.849,0:37:56.183
Auf der anderen Seite ist es einfacher,
0:37:56.183,0:37:59.512
die Daten, die in Lexemen[br]auf Wiktionary stehen,
0:37:59.512,0:38:02.209
tatsächlich zu nutzen,[br]so dass sie diese nutzen
0:38:02.209,0:38:05.531
und Daten zwischen den Wiktionaries[br]austauschen können,
0:38:05.531,0:38:08.853
was im Moment super schwer[br]bis unmöglich ist,
0:38:08.853,0:38:11.560
was verrückt ist, genau wie bei Wikipedia.
0:38:13.860,0:38:16.325
Warten Sie auf das Geburtstagsgeschenk.[br](lacht)
0:38:19.928,0:38:21.072
Ja.
0:38:22.599,0:38:24.827
(Person 11) Als ich andersherum dachte,
0:38:24.827,0:38:28.168
wollte ich es eigentlich nicht sagen,[br]weil ich denke, es wird super albern sein,
0:38:28.168,0:38:32.003
aber ich denke, dass Wiktionary[br]bereits einige Inhalte hat,
0:38:32.003,0:38:34.978
und ich weiß, dass wir diese nicht[br]auf Wikidata übertragen können,
0:38:34.978,0:38:37.048
weil es einen Unterschied[br]in den Lizenzen gibt.
0:38:37.048,0:38:39.631
Aber ich dachte, dass wir vielleicht[br]etwas deswegen tun können.
0:38:40.321,0:38:45.513
Vielleicht, ich weiß nicht, können wir[br]die Erlaubnis der Communities einholen,
0:38:45.513,0:38:51.205
nachdem wir eine öffentliche[br]Abstimmung durchgeführt haben
0:38:51.705,0:38:56.042
und die aktiven Mitglieder[br]der Gemeinschaft abstimmen
0:38:56.042,0:38:57.482
und sagen können,
0:38:57.482,0:39:02.523
ob sie die Inhalte, für die sie[br]die Wikidata-Lexeme machen dürfen,
0:39:02.523,0:39:05.528
annehmen oder übertragen möchten.
0:39:06.238,0:39:08.647
Weil ich es einfach[br]für eine solche Verschwendung halte.
0:39:09.568,0:39:14.443
Also, das ist definitiv im Gespräch,[br]dass die Leute,
0:39:14.443,0:39:18.249
die in Wiktionary-Communities sind,[br]das dort zur Sprache bringen.
0:39:18.249,0:39:24.487
Ich denke, es wäre ein bisschen anmaßend,[br]wenn wir das erzwingen würden.
0:39:25.917,0:39:31.142
Aber, ja, ich denke, es ist[br]auf jeden Fall ein Gespräch wert.
0:39:31.142,0:39:33.898
Aber ich denke, es ist[br]auch wichtig, zu verstehen,
0:39:33.898,0:39:39.082
dass es einen Unterschied gibt[br]zwischen dem, was gesetzlich erlaubt ist
0:39:39.082,0:39:43.007
und was wir tun sollten,
0:39:43.007,0:39:45.426
und dem, was diese Leute[br]wollen oder nicht wollen.
0:39:45.736,0:39:47.429
Selbst wenn es also rechtlich erlaubt ist,
0:39:47.429,0:39:50.640
wenn einige Wiktionary-Communities[br]das nicht wollen,
0:39:50.640,0:39:53.243
wäre ich zumindest vorsichtig.
0:39:58.886,0:40:02.259
Ich denke, Sie brauchen das Mikro[br]für den Stream.
0:40:04.540,0:40:07.299
(Person 12) Also, offensichtlich[br]ist das alles sehr aufregend,
0:40:07.979,0:40:12.197
und ich denke sofort, wie kann ich[br]das meinen Studenten vermitteln
0:40:12.197,0:40:15.248
und wie kann ich es in die Kurse,
0:40:15.248,0:40:18.531
die Arbeit, die wir machen,[br]und die Bildungseinrichtungen integrieren.
0:40:18.531,0:40:22.271
Und mir fehlt im Moment
0:40:22.511,0:40:24.116
noch das Wissen,
0:40:24.116,0:40:27.023
aber ich denke,[br]die Dokumentation, die wir haben,
0:40:27.808,0:40:29.992
vielleicht verbessert werden könnte.
0:40:29.992,0:40:33.437
Das ist also eine Art Aufforderung,[br]coole Videos zu machen,
0:40:33.437,0:40:35.898
die erklären, wie es funktioniert,
0:40:35.898,0:40:39.948
denn wenn wir das haben,[br]können wir es nutzen,
0:40:39.948,0:40:41.985
und wir können Studenten an Bord ziehen,
0:40:41.985,0:40:47.012
und wir können den Leuten verständlich[br]machen, wie fantastisch das alles ist.
0:40:47.012,0:40:52.001
Und ja, denken Sie an die Dokumentation[br]und denken Sie an die Ausbildung, bitte.
0:40:52.001,0:40:54.480
Denn ich denke, es könnte[br]eine Menge getan werden.
0:40:54.480,0:40:58.585
Dies sind schon viele Aufgaben,[br]die auch mit...
0:41:00.125,0:41:02.033
na ja, ich würde nicht sagen[br]Grundschulen,
0:41:02.033,0:41:05.495
aber sicherlich auch mit jüngeren[br]Studenten durchgeführt werden könnten.
0:41:05.915,0:41:10.793
Und deshalb würde ich es gerne sehen,[br]dass dieses Potenzial genutzt wird,
0:41:10.793,0:41:15.062
und ich persönlich verstehe[br]noch nicht genug,
0:41:15.062,0:41:19.020
um Aufgaben zu erstellen[br]oder so etwas wie...
0:41:20.300,0:41:22.275
etwas Praktisches daraus zu machen.
0:41:22.275,0:41:25.772
Wenn also jemand hier Hilfe[br]oder Gedanken dazu hat,
0:41:25.772,0:41:29.648
würde ich mich sehr freuen,[br]Ihre Ideen zu hören, und Ihre auch.
0:41:30.508,0:41:32.199
(Lydia) Ja, lassen Sie uns darüber reden.
0:41:35.453,0:41:36.949
Noch Fragen?
0:41:37.709,0:41:39.285
Jemand anderes hat die Hand gehoben.
0:41:39.285,0:41:40.715
Ich habe vergessen, wer das war.
0:41:45.739,0:41:49.779
(Person 13) Wenn wir also nicht[br]aus Wiktionary importieren können,
0:41:49.779,0:41:52.055
gibt es eine konzertierte Anstrengung,
0:41:52.055,0:41:55.772
um andere öffentlich[br]zugängliche Quellen zu finden,
0:41:55.772,0:41:57.459
vielleicht alle Daten,
0:41:58.769,0:42:03.167
und eine Art Vorfilter,[br]um sie so zu organisieren,
0:42:03.167,0:42:08.470
dass sie von Leuten beim Import[br]einfach überprüft werden können?
0:42:09.093,0:42:11.181
Es gibt also erste Bemühungen.
0:42:11.181,0:42:14.769
Nach meinem Verständnis[br]ist das Baskische eine dieser Bemühungen.
0:42:14.769,0:42:17.474
Vielleicht möchten Sie[br]etwas mehr darüber sagen?
0:42:18.426,0:42:20.130
(Person 14) [unhörbar]
0:42:23.166,0:42:27.148
Okay, die eigentliche Antwort ist,[br]dafür zu bezahlen...
0:42:28.374,0:42:31.914
Ich meine, wir haben eine Vereinbarung[br]mit einem Auftragnehmer,
0:42:31.914,0:42:33.760
mit dem wir normalerweise[br]zusammenarbeiten.
0:42:34.801,0:42:38.321
Sie machen Wörterbücher--
0:42:40.315,0:42:42.458
viele Dinge, aber sie machen Wörterbücher.
0:42:42.458,0:42:44.734
Also haben wir mit ihnen vereinbart,
0:42:44.734,0:42:47.473
das Studenten-Wörterbuch[br]kostenlos zu machen,
0:42:47.473,0:42:52.782
wir würden die häufigsten Wörter[br]auswählen und damit beginnen,
0:42:52.782,0:42:55.590
es mit einer externen Kennung[br]und dem Schema der Dinge hochzuladen.
0:42:56.420,0:43:00.464
Aber es gab einige Diskussionen darüber,
0:43:00.464,0:43:02.722
es auf CC0 zu belassen,
0:43:03.212,0:43:05.522
weil sie das Wörterbuch[br]bei CC dabei haben,
0:43:06.537,0:43:10.065
und sie verstanden,[br]was der Unterschied war.
0:43:10.065,0:43:13.704
Es gab also einige Diskussionen.
0:43:13.704,0:43:19.246
Aber ich denke, dass wir in Zukunft[br]einige Werkzeuge oder Beispiele
0:43:19.246,0:43:20.761
zur Verfügung stellen können,
0:43:20.761,0:43:22.891
und ich denke, dass es[br]andere Wörterbücher geben wird,
0:43:22.891,0:43:24.206
mit denen wir umgehen können,
0:43:24.206,0:43:29.049
und ich denke auch, dass Wiktionary[br]in diese Richtung gehen sollte,
0:43:29.049,0:43:32.069
aber das ist eine weitere[br]umfangreiche Diskussion.
0:43:33.285,0:43:34.487
Und darüber hinaus
0:43:34.487,0:43:38.619
steht Lea auch in Kontakt[br]mit Leuten aus Okzitan,
0:43:38.619,0:43:41.827
die an okzitanischen[br]Wörterbüchern arbeiten,
0:43:41.827,0:43:45.058
und sie arbeiten derzeit an einer[br]sumerischen Zusammenarbeit.
0:43:51.504,0:43:53.253
Noch weitere Fragen?
0:44:01.487,0:44:05.349
(Person 15) Hallo! Wir sind die Leute,[br]die okzitanische Daten importieren wollen.
0:44:05.349,0:44:06.646
(Lydia) Aha! Perfekt!
0:44:06.646,0:44:08.518
(Person 15) Und wir haben[br]ein kleines Problem.
0:44:09.188,0:44:14.215
Wir wissen nicht, wie wir die Vielfalt[br]aller Lexeme darstellen können.
0:44:14.215,0:44:17.503
Wir haben sechs Dialekte,
0:44:17.503,0:44:23.754
und wir wollen für Lexeme angeben,[br]in welchem Dialekt es verwendet wird,
0:44:23.754,0:44:27.285
und wir haben keine richtige[br]C0-Anweisung, um das zu tun.
0:44:27.285,0:44:31.105
Solange das Segment also nicht existiert,
0:44:31.635,0:44:34.465
verhindert es, dass wir es[br][unhörbar] machen,
0:44:34.465,0:44:37.603
weil wir es noch einmal machen müssen,
0:44:37.603,0:44:41.956
wenn wir die Anweisung exportieren können.
0:44:41.956,0:44:44.551
Und es ist kompliziert,[br]weil es eine Aussage ist,
0:44:44.551,0:44:47.802
die nicht von vielen Leuten gefragt wird,
0:44:47.802,0:44:53.024
weil es eine Aussage ist, die vor allem[br]Minderheitensprachen betrifft.
0:44:53.254,0:44:56.933
Sie werden also eine Person haben,[br]die das fragen kann.
0:44:56.933,0:45:00.022
Aber wie unsere baskischen Kollegen
0:45:00.022,0:45:05.844
kann es eine Person sein,[br]die Tausende von anderen antreibt,
0:45:05.844,0:45:10.884
also es ist vielleicht[br]nicht sehr viel verlangt,
0:45:10.884,0:45:13.796
aber es wird für uns sehr wichtig sein.
0:45:14.874,0:45:17.410
(Lydia) Haben Sie bereits einen neuen[br]Eigenschaftenvorschlag
0:45:17.410,0:45:19.470
oder brauchen Sie Hilfe[br]bei dessen Erstellung?
0:45:21.524,0:45:24.300
(Person 15) Wir haben[br]vor vier Monaten danach gefragt.
0:45:24.720,0:45:26.689
(Lydia) Na gut, dann holen wir uns[br]ein paar Leute,
0:45:26.689,0:45:28.832
die uns bei diesem[br]Eigenschaftenvorschlag helfen.
0:45:30.159,0:45:33.152
Ich bin sicher, es sind genug Leute[br]in diesem Raum, um dies zu ermöglichen.
0:45:33.360,0:45:36.283
(Person 15) Eigenschaftenvorschlag[br][spricht Französisch].
0:45:36.510,0:45:38.619
Wir bekamen keine Antwort[br]und wissen nicht,
0:45:38.619,0:45:40.189
wie wir das machen sollen,
0:45:40.189,0:45:42.843
weil wir nicht in der[br]Wikidata-Community sind.
0:45:44.694,0:45:48.307
(Lydia) Ja, also gibt es hier Leute,[br]die Ihnen helfen können.
0:45:48.307,0:45:51.247
Vielleicht hebt jemand die Hand, um--
0:45:52.424,0:45:53.644
(Person 14) Nicht dafür.
0:45:53.644,0:45:55.512
Aber ich denke,[br]das ist ziemlich interessant,
0:45:55.512,0:45:58.559
dass nur die Variante der Form
0:45:58.559,0:46:02.607
auch geographisch, mit Koordinaten
0:46:02.607,0:46:04.995
oder einer Art von Kartierung,[br]damit umgehen kann.
0:46:05.595,0:46:07.815
Auch unterschiedliche[br]Aussprachen zu haben,
0:46:07.815,0:46:11.837
und ich denke, das ist etwas,[br]das in vielen Sprachen geschieht.
0:46:12.607,0:46:16.262
Wir sollten damit anfangen.
0:46:16.262,0:46:18.865
Und ich werde nach der Eigenschaft suchen.
0:46:19.782,0:46:20.933
(Lydia) Cool.
0:46:20.933,0:46:24.256
Sie erhalten also Unterstützung[br]für Ihren Eigenschaftenvorschlag.
0:46:25.936,0:46:27.297
Ich danke Ihnen.
0:46:28.153,0:46:30.261
In Ordnung, noch Fragen?
0:46:32.280,0:46:33.344
Finn.
0:46:33.774,0:46:35.095
Finn ist einer dieser Leute,
0:46:35.095,0:46:37.765
die auf lexikografischen Daten aufbauen.
0:46:37.765,0:46:40.085
(Finn) Es ist nur eine kleine Frage,
0:46:40.405,0:46:44.226
und es geht um Variationen[br]in der Rechtschreibung.
0:46:44.896,0:46:48.002
Es scheint, schwierig zu sein, sie in...
0:46:48.532,0:46:53.368
Man könnte natürlich mehrere Formen[br]für dasselbe Wort haben.
0:46:56.327,0:46:58.448
Ich weiß nicht, es scheint...
0:46:59.558,0:47:03.535
Wenn man es nicht so macht, scheint es,[br]schwierig zu sein, es zu spezifizieren...
0:47:04.611,0:47:05.888
oder ich weiß nicht,
0:47:05.888,0:47:09.591
ob es sich nur um eine kleine[br]technische Frage handelt oder ob...
0:47:09.591,0:47:11.252
(Lydia) Betrachten wir es gemeinsam.
0:47:11.642,0:47:14.990
Ich würde gerne ein Beispiel sehen.
0:47:17.478,0:47:18.478
Asaf.
0:47:26.616,0:47:28.126
(Asaf) Vielen Dank.
0:47:29.386,0:47:33.685
Ich kann ein sehr konkretes Beispiel aus[br]meiner Muttersprache, Hebräisch, nennen.
0:47:34.205,0:47:38.374
Im Hebräischen gibt es[br]zwei Hauptvarianten,
0:47:38.374,0:47:42.362
um fast jedes Wort auszudrücken,
0:47:42.506,0:47:47.270
weil die traditionelle Schreibweise
0:47:47.270,0:47:49.755
viele Vokale auslässt.
0:47:50.934,0:47:55.064
Und deshalb werden in modernen Ausgaben[br]der Bibel und der Poesie
0:47:55.064,0:47:57.251
diakritische Zeichen verwendet.
0:47:57.251,0:48:02.670
Diese diakritischen Zeichen werden[br]jedoch nie für moderne Prosa,
0:48:02.670,0:48:05.604
Zeitungstexte[br]oder Straßenschilder verwendet.
0:48:05.604,0:48:11.209
Der durchschnittliche tägliche Gebrauch[br]legt also zusätzliche Vokale hinein
0:48:12.169,0:48:13.968
und verwendet[br]die diakritischen Zeichen nicht,
0:48:13.968,0:48:15.607
weil sie natürlich umständlicher sind
0:48:15.607,0:48:18.044
und alle möglichen Regeln haben[br]und niemand die Regeln kennt.
0:48:18.633,0:48:20.531
Es gibt also grundsätzlich zwei Varianten.
0:48:20.531,0:48:25.042
Es gibt die alltägliche,[br]beiläufige Prosa-Variante,
0:48:25.042,0:48:27.827
und es gibt die Bibel oder die Poesie,
0:48:27.827,0:48:31.970
die immer in diesem traditionellen[br]diakritischierten Text vorkommen.
0:48:31.970,0:48:33.302
Um nützlich zu sein,
0:48:33.302,0:48:37.208
müsste Lexeme sowohl Varianten[br]jedes einzelnen Wortes
0:48:37.208,0:48:39.867
als auch jede einzelne Form[br]jedes einzelnen Wortes erkennen.
0:48:40.677,0:48:43.391
Das ist also ein sehr[br]umfassender Anwendungsfall
0:48:43.391,0:48:46.340
für offizielle stabile Varianten.
0:48:46.340,0:48:48.942
Es ist kein Dialekt,[br]es sind keine Regionen,
0:48:49.332,0:48:53.627
es sind im Grunde zwei nebeneinander[br]existierende morphologische Systeme.
0:48:54.537,0:48:56.656
Und auch ich weiß nicht genau,
0:48:56.656,0:48:58.926
wie ich das momentan[br]in Lexeme ausdrücken soll.
0:48:58.926,0:49:02.790
Das ist eine Sache, die mich--[br]als Teilantwort auf Magnus' Frage--
0:49:02.790,0:49:05.238
davon abhält, die Teile hochzuladen,
0:49:05.238,0:49:09.394
die aus dem größten hebräischen[br]Wörterbuch, das öffentlich zugänglich ist
0:49:09.394,0:49:13.141
und das ich seit einigen Jahren[br]digitalisiere, stammen.
0:49:13.141,0:49:14.803
Ein guter Teil davon ist fertig,
0:49:14.803,0:49:16.549
aber ich stelle es jetzt nicht auf Lexeme,
0:49:16.549,0:49:20.018
weil ich nicht genau weiß,[br]wie ich dieses Problem lösen soll.
0:49:20.018,0:49:23.387
(Lydia) In Ordnung,[br]lösen wir das Problem hier. (lacht)
0:49:24.393,0:49:25.911
Das muss doch möglich sein.
0:49:30.045,0:49:32.047
In Ordnung, noch Fragen?
0:49:37.173,0:49:39.735
Wenn nicht,[br]dann danke ich Ihnen vielmals.
0:49:40.605,0:49:42.675
(Beifall)