0:00:01.201,0:00:04.486 WikiData und Sprachen 0:00:06.303,0:00:07.362 (Lydia) Vielen Dank. 0:00:07.362,0:00:11.244 Also, in dieser Konferenz sind[br]einige der großen Themen die Sprachen. 0:00:14.220,0:00:18.088 Ich möchte Ihnen einen Überblick[br]darüber geben, wo wir derzeit 0:00:18.088,0:00:19.812 beim Thema Sprachen stehen 0:00:20.264,0:00:22.167 und wie wir von hier aus[br]weitermachen können. 0:00:26.491,0:00:28.851 [Mehr Leuten mehr Zugang[br]zu mehr Wissen geben] 0:00:29.036,0:00:32.580 Bei Wikidata geht es darum, mehr Menschen[br]mehr Zugang zu mehr Wissen zu geben, 0:00:32.580,0:00:37.168 und Sprache ist ein wichtiger Teil davon,[br]dies Wirklichkeit werden zu lassen, 0:00:38.205,0:00:43.291 zumal immer mehr unseres Lebens[br]von der Technologie abhängt. 0:00:44.114,0:00:48.873 Und wie unser Hauptredner vorhin sagte, 0:00:49.723,0:00:52.488 fallen durch einen Teil der Technologie[br]die Menschen einfach zurück, 0:00:52.488,0:00:55.020 weil sie eine bestimmte Sprache[br]einfach nicht sprechen können, 0:00:55.320,0:00:57.303 und das ist nicht in Ordnung. 0:00:58.633,0:01:02.097 Deshalb wollen wir etwas[br]dagegen unternehmen. 0:01:02.927,0:01:05.841 Und um das zu ändern,[br]braucht man mindestens zwei Dinge. 0:01:06.411,0:01:11.010 Erstens muss man den Leuten Inhalte[br]in ihrer Sprache zur Verfügung stellen, 0:01:11.010,0:01:12.955 und zweitens muss man ihnen 0:01:12.955,0:01:15.910 in diesen Anwendungen[br]oder was immer man hat, 0:01:15.910,0:01:19.189 Interaktion in ihrer Sprache ermöglichen. 0:01:20.367,0:01:24.980 Und Wikidata hilft bei beiden davon. 0:01:24.980,0:01:28.268 Und die erste Sache,[br]der Inhalt in Ihrer Sprache, 0:01:28.268,0:01:31.089 das ist im Grunde das, was wir[br]an Objekten und Eigenschaften haben, 0:01:31.319,0:01:33.082 wie wir die Welt beschreiben. 0:01:33.082,0:01:35.175 Nun, das ist sicherlich nicht alles,[br]was man braucht, 0:01:35.175,0:01:39.294 aber es bringt einen ziemlich weit voran. 0:01:39.764,0:01:41.927 Die andere Sache ist[br]die Interaktion in Ihrer Sprache, 0:01:41.927,0:01:46.281 und hier kommen Lexeme ins Spiel. 0:01:46.281,0:01:49.382 Wenn Sie mit Ihrem digitalen[br]persönlichen Assistenten sprechen wollen 0:01:49.382,0:01:54.918 oder wenn Sie Ihr Gerät einen Text[br]und solche Dinge übersetzen lassen wollen. 0:01:56.404,0:01:59.254 Na gut, sehen wir uns[br]den Inhalt in Ihrer Sprache an. 0:01:59.254,0:02:03.396 Also, was wir an Objekten[br]und Eigenschaften haben. 0:02:05.406,0:02:09.696 Dafür sind Bezeichnungen in den Objekten[br]und Eigenschaften entscheidend. 0:02:10.236,0:02:14.866 Wir müssen wissen, wie diese Entität[br]genannt wird, über die wir sprechen. 0:02:15.656,0:02:19.767 Und anstatt über Q5 zu sprechen, 0:02:19.767,0:02:22.310 jemand, der Englisch spricht, weiß,[br]dass das ein "human" ist, 0:02:22.310,0:02:24.706 jemand, der Deutsch spricht, weiß,[br]dass das ein "Mensch" ist, 0:02:24.706,0:02:26.254 und ähnliche Dinge. 0:02:26.254,0:02:29.742 Also überbrücken diese Bezeichnungen[br]auf Objekten und Eigenschaften 0:02:29.742,0:02:33.499 die Kluft zwischen Mensch und Maschine. 0:02:33.499,0:02:35.439 Und Menschen und Menschen 0:02:35.439,0:02:40.115 machen mehr vorhandenes Wissen[br]für sie zugänglich. 0:02:43.270,0:02:45.963 Das ist ein schönes Ziel zum Anstreben. 0:02:45.963,0:02:48.092 Wie sieht es eigentlich aus? 0:02:48.092,0:02:49.507 Es sieht so aus. 0:02:50.947,0:02:52.786 Was Sie hier sehen, ist, 0:02:52.786,0:02:58.496 dass die meisten Objekte auf Wikidata[br]zwei Bezeichnungen haben, 0:02:58.496,0:03:00.767 also Bezeichnungen in zwei Sprachen. 0:03:01.697,0:03:03.851 Und danach nur eines und dann drei, 0:03:03.851,0:03:05.948 und dann wird es sehr düster. 0:03:06.781,0:03:08.581 (leises Lachen) 0:03:10.047,0:03:12.713 Ich denke, wir müssen es besser machen. 0:03:14.185,0:03:16.079 Aber andererseits[br]habe ich eigentlich erwartet, 0:03:16.079,0:03:17.578 dass es schlimmer sein würde. 0:03:17.578,0:03:19.860 Ich habe erwartet,[br]dass der Durchschnitt eines sein würde. 0:03:19.860,0:03:22.503 Deshalb war ich ziemlich froh,[br]zwei zu sehen. (lacht) 0:03:24.661,0:03:25.926 In Ordnung. 0:03:27.156,0:03:29.527 Aber es ist nicht nur interessant[br]zu wissen, 0:03:29.527,0:03:33.742 wie viele Bezeichnungen unsere[br]Objekte und Eigenschaften haben. 0:03:33.742,0:03:36.565 Es ist auch interessant zu sehen,[br]in welchen Sprachen. 0:03:38.045,0:03:43.764 Hier sehen Sie eine Grafik der Sprachen, 0:03:43.764,0:03:46.838 für die wir Bezeichnungen[br]auf den Objekten haben. 0:03:46.838,0:03:50.669 Der größte Teil davon ist also Sonstiges. 0:03:51.229,0:03:53.863 Ich habe also nur[br]die 100 wichtigsten Sprachen ausgewählt 0:03:54.533,0:03:58.902 und alles andere ist Sonstiges,[br]um diese Grafik lesbar zu machen. 0:03:59.542,0:04:02.142 Und dann gibt es noch[br]Englisch und Niederländisch, 0:04:03.002,0:04:04.254 Französisch 0:04:05.924,0:04:09.129 und, nicht zu vergessen, Asturisch. 0:04:09.659,0:04:11.889 - (Person 1) Juhu! [br]- (Lydia) Juhuu, jawohl! 0:04:13.899,0:04:16.954 Was Sie hier sehen,[br]ist also ein ziemliches Ungleichgewicht 0:04:16.954,0:04:20.114 und immer noch eine starke Konzentration[br]auf Englisch. 0:04:21.236,0:04:24.367 Eine andere Sache ist, wenn Sie sich[br]das Gleiche für Eigenschaften ansehen, 0:04:24.367,0:04:25.999 sieht es eigentlich besser aus. 0:04:27.399,0:04:32.620 Und teilweise kommt das davon, dass es[br]einfach viel weniger Eigenschaften waren. 0:04:32.620,0:04:36.650 Also haben auch kleinere Communites[br]eine Chance, damit Schritt zu halten. 0:04:36.650,0:04:39.173 Aber es ist auch ein ziemlich[br]wichtiger Teil von Wikidata, 0:04:39.173,0:04:41.159 dass man in seine Sprache[br]lokalisieren kann. 0:04:41.159,0:04:42.384 Das ist also gut. 0:04:45.752,0:04:48.268 Was ich hier mit Asturisch[br]hervorheben möchte, ist, 0:04:48.268,0:04:53.698 dass eine kleine Gemeinschaft[br]mit etwas Hingabe und Arbeit 0:04:54.448,0:04:57.085 wirklich einen großen Unterschied[br]machen kann, 0:04:57.085,0:04:58.420 und das ist wirklich cool. 0:05:01.846,0:05:03.380 Ein kleines Quiz für Sie. 0:05:03.380,0:05:05.493 Wenn Sie alle Eigenschaften[br]auf Wikidata nehmen, 0:05:05.493,0:05:07.687 die keine externen Identifikatoren sind, 0:05:07.687,0:05:10.498 welche hat dann die meisten Bezeichnungen,[br]also die meisten Sprachen? 0:05:10.977,0:05:13.847 (Publikum) [Gemurmel] 0:05:13.847,0:05:16.786 Ich höre eine gewisse Übereinstimmung[br]über die Instanz von? 0:05:17.506,0:05:19.363 Sie würden sich irren. 0:05:19.983,0:05:22.210 Es ist Bild. (lacht) 0:05:23.230,0:05:26.366 Also, ja, das sagt Ihnen,[br]wenn Sie eine der Sprachen sprechen, 0:05:26.366,0:05:28.621 in denen Instanz von[br]noch keine Bezeichnung hat, 0:05:28.621,0:05:30.350 sollten Sie sie vielleicht hinzufügen. 0:05:32.102,0:05:35.532 Es hat also derzeit 148 Bezeichnungen. 0:05:37.688,0:05:41.249 Aber das ist eine andere Folie. 0:05:42.631,0:05:44.520 Diese Grafik sagt uns etwas darüber, 0:05:44.520,0:05:49.026 wie viel Inhalt wir in einer bestimmten[br]Sprache zur Verfügung stellen 0:05:49.026,0:05:51.922 und wie viel von diesem Inhalt[br]tatsächlich genutzt wird. 0:05:51.922,0:05:55.332 Was Sie also sehen,[br]ist im Grunde eine Kurve, 0:05:55.332,0:05:59.487 bei der die meisten Inhalte[br]englische Beschriftungen haben, 0:05:59.487,0:06:04.005 in Englisch verfügbar sind[br]und viel genutzt werden. 0:06:04.005,0:06:06.449 Und dann geht sie abwärts. 0:06:06.449,0:06:09.294 Aber was Sie wiederum sehen,[br]sind Ausreißer, 0:06:09.294,0:06:14.971 die viel mehr Inhalte haben,[br]als Sie unbedingt erwarten würden, 0:06:16.903,0:06:19.539 und das ist wirklich, wirklich gut. 0:06:20.839,0:06:24.775 Das Problem ist immer noch,[br]dass es nicht oft verwendet wird. 0:06:25.565,0:06:28.522 Asturisch und Niederländisch[br]sollten höher stehen, 0:06:28.522,0:06:31.994 und ich denke, dass es echt nützlich ist, 0:06:33.266,0:06:35.563 diesen Gemeinden dabei zu helfen, 0:06:35.563,0:06:37.532 die Nutzung der gesammelten Daten[br]zu erhöhen. 0:06:42.910,0:06:48.110 Was diese und andere Analysen[br]uns gezeigt haben, ist eine gute Sache, 0:06:48.300,0:06:51.378 denn wir sehen,[br]dass stark genutzte Artikel 0:06:51.378,0:06:55.295 auch dazu neigen,[br]mehr Bezeichnungen zu haben 0:06:55.295,0:06:58.188 oder umgekehrt - das ist nicht ganz klar. 0:07:02.513,0:07:04.376 Und dann stellt sich die Frage, 0:07:04.806,0:07:07.009 ob wir nur die mächtigen Sprachen[br]bedienen. 0:07:07.899,0:07:10.997 Oder dienen wir allen? 0:07:12.757,0:07:17.533 Und was Sie hier sehen,[br]ist eine Gruppierung der Sprachen. 0:07:17.533,0:07:21.832 Die Sprachen, die in einer Gruppe sind,[br]haben oft gemeinsame Bezeichnungen. 0:07:26.042,0:07:28.599 Und Sie sehen, dass diese sich gruppieren. 0:07:28.599,0:07:34.775 Hier ist eine ähnliche Gruppierung,[br]in Farbe, basierend darauf, 0:07:34.775,0:07:39.395 wie lebendig, wie oft verwendet 0:07:40.455,0:07:43.026 und wie gefährdet die Sprache ist. 0:07:43.026,0:07:44.772 Und eine gute Sache, die Sie hier sehen, 0:07:44.772,0:07:49.039 ist, dass sichere Sprachen[br]und gefährdete Sprachen 0:07:49.239,0:07:53.653 nicht zwei verschiedene Cluster bilden, 0:07:53.653,0:07:58.872 sondern sie sind alle[br]miteinander vermischt, 0:08:00.262,0:08:04.625 was viel besser ist als umgekehrt, 0:08:04.625,0:08:09.377 wenn die sicheren Sprachen,[br]die mächtigen Sprachen, 0:08:10.197,0:08:12.164 sich nur gegenseitig aushelfen würden. 0:08:12.744,0:08:14.356 Nein, das ist nicht der Fall. 0:08:14.356,0:08:17.417 Und das ist wirklich eine gute Sache. 0:08:17.417,0:08:20.042 Als ich das sah, fand ich das sehr gut. 0:08:23.474,0:08:25.169 Hier ist eine ähnliche Sache, 0:08:26.239,0:08:28.800 bei der wir uns 0:08:30.230,0:08:33.982 den Status der Sprachen 0:08:33.982,0:08:36.225 und die Anzahl der Bezeichnungen[br]angesehen haben. 0:08:39.367,0:08:42.937 Was Sie sehen, ist ein klarer Sieg[br]für ungefährdete Sprachen, 0:08:42.937,0:08:44.248 wie zu erwarten ist. 0:08:45.508,0:08:47.093 Aber was Sie auch sehen, ist, 0:08:47.093,0:08:53.967 dass die Sprachen in Kategorie 2[br]und 3 und vielleicht sogar 4 0:08:53.967,0:08:58.960 eigentlich gar nicht so schlecht sind, 0:08:58.960,0:09:02.367 was ihre Darstellung in Wikidata[br]und anderen angeht. 0:09:03.287,0:09:05.978 Das festzustellen, ist wirklich gut. 0:09:07.646,0:09:09.609 Wenn man sich nun[br]die gleiche Sache anschaut, 0:09:09.609,0:09:12.418 wie viel von dem Inhalt[br]dieser Bezeichnungen 0:09:12.418,0:09:15.265 beispielsweise auf Wikipedia[br]tatsächlich verwendet wird, 0:09:17.455,0:09:22.563 dann sehen wir ein ähnliches Bild,[br]das wieder auftaucht. 0:09:23.603,0:09:29.633 Es zeigt uns, dass diese Communities[br]ihre Zeit tatsächlich gut nutzen, 0:09:29.633,0:09:34.504 indem sie beispielsweise Bezeichnungen[br]für stärker verwendete Artikel eintragen. 0:09:36.410,0:09:40.493 Es gibt Ausreißer, bei denen wir[br]meiner Meinung nach helfen können, 0:09:41.683,0:09:44.251 um diesen Communities zu helfen, 0:09:44.251,0:09:48.141 die Orte zu finden,[br]wo ihre Arbeit am wertvollsten wäre. 0:09:49.312,0:09:52.663 Aber insgesamt bin ich[br]mit diesem Bild zufrieden. 0:09:54.823,0:09:59.734 Nun, das war der Teil der Objekte[br]und Eigenschaften von Wikidata. 0:10:00.714,0:10:03.033 Betrachten wir nun die Interaktion[br]in Ihren Sprachen. 0:10:03.033,0:10:05.203 Also die Lexeme-Teile von Wikidata, 0:10:05.203,0:10:09.394 in denen wir Wörter und ihre Formen[br]und ihre Bedeutungen beschreiben. 0:10:10.167,0:10:13.301 Wir machen das jetzt[br]seit Mai letzten Jahres, 0:10:16.461,0:10:19.127 und der Inhalt ist gewachsen. 0:10:20.114,0:10:22.149 Sie können hier in Blau die Lexeme sehen 0:10:22.149,0:10:25.938 und dann in rot die Formen[br]auf diesen Lexemen 0:10:25.938,0:10:29.910 und in gelb die Bedeutung[br]auf diesen Lexemen. 0:10:30.991,0:10:34.251 Einige Communities--[br]dazu kommen wir später -- 0:10:34.251,0:10:39.793 haben also viel Zeit damit verbracht,[br]Formen und Bedeutungen für ihre Lexeme 0:10:39.793,0:10:42.753 zu erstellen, was wirklich nützlich ist, 0:10:42.753,0:10:47.993 denn das bildet den Kern[br]des Datensatzes, den Sie benötigen. 0:10:50.562,0:10:55.133 Nun haben wir uns alle Sprachen angesehen, 0:10:55.133,0:10:57.906 die Lexeme auf Wikidata haben. 0:10:57.906,0:11:01.003 Die Wörter, die wir haben, 0:11:01.713,0:11:04.404 das sind im Moment 310 Sprachen. 0:11:04.884,0:11:08.290 Was ist Ihrer Meinung nach[br]die wichtigste Sprache, 0:11:08.290,0:11:11.949 wenn es um die Anzahl der Lexeme geht,[br]die derzeit in Wikidata enthalten sind? 0:11:12.933,0:11:14.700 (Publikum) [mehrere Zwischenrufe] 0:11:19.183,0:11:20.216 (Lydia) Hm? 0:11:20.216,0:11:21.741 (Person 2) Deutsch. 0:11:21.741,0:11:24.022 (Lydia) Entschuldigung,[br]ich habe es schon mal gehört. 0:11:24.022,0:11:25.411 Es ist Russisch. 0:11:28.011,0:11:29.754 Russisch hat einen großen Vorsprung. 0:11:31.897,0:11:33.832 Und nur um Ihnen[br]einen Eindruck zu geben, 0:11:35.482,0:11:37.036 es gibt verschiedene Meinungen, 0:11:37.036,0:11:41.705 aber ich habe zum Beispiel gelesen,[br]dass 1.000 bis 3.000 Wörter 0:11:41.705,0:11:45.450 Sie ungefähr auf Konversationsniveau[br]in einer anderen Sprache bringen 0:11:45.450,0:11:49.461 und 4.000 bis 10.000 Wörter[br]auf ein fortgeschrittenes Niveau. 0:11:51.591,0:11:55.022 Wir müssen also noch ein wenig aufholen. 0:11:58.483,0:12:02.792 Eine Sache, die Sie beachten sollten,[br]ist Baskisch hier 0:12:03.272,0:12:07.524 mit ungefähr 10.000 Lexemen. 0:12:09.244,0:12:13.003 Wenn man sich die Anzahl der Formen[br]für diese Lexeme ansieht, 0:12:14.163,0:12:16.277 ist Baskisch weit oben, 0:12:18.257,0:12:20.006 was wirklich cool ist, 0:12:20.006,0:12:24.930 und Sie sollten zu einem Vortrag gehen,[br]der Ihnen erklärt, warum das der Fall ist. 0:12:27.341,0:12:29.576 Wenn man sich nun die Anzahl[br]der Bedeutungen anschaut, 0:12:29.576,0:12:31.078 also was bedeuten die Wörter, 0:12:31.728,0:12:34.721 steht Baskisch sogar[br]ganz oben auf der Liste. 0:12:34.721,0:12:36.820 Ich denke, das verdient einen Applaus. 0:12:36.820,0:12:38.921 (Beifall) 0:12:45.678,0:12:47.118 Noch ein kurzes Quiz. 0:12:47.118,0:12:50.181 Welches ist das Lexem[br]mit den meisten Übersetzungen derzeit? 0:12:50.651,0:12:55.414 (Publikum) Katzen, Katzen, [unhörbar],[br]Douglas Adams, [unhörbar] 0:12:56.766,0:13:00.014 (Lydia) Alles gute Ratschläge, aber nein. 0:13:01.012,0:13:04.027 Es ist dies,[br]das russische Wort für "Wasser". 0:13:09.571,0:13:12.753 Also gut, wir haben jetzt[br]viel darüber gesprochen, 0:13:12.753,0:13:16.412 wie viele Lexeme, Formen[br]und Bedeutungen wir haben, 0:13:16.412,0:13:20.493 aber das ist nur eine Sache,[br]die man braucht. 0:13:20.493,0:13:21.705 Die andere Sache ist, 0:13:21.705,0:13:25.161 diese Lexeme, Formen und Bedeutungen 0:13:25.161,0:13:27.364 in maschinenlesbarer Form zu beschreiben. 0:13:27.364,0:13:30.039 Und dazu hat man Aussagen,[br]wie zum Beispiel zu Objekten. 0:13:31.479,0:13:34.752 Und eine der Eigenschaften,[br]die man verwendet, 0:13:34.752,0:13:36.362 ist ein Anwendungsbeispiel. 0:13:36.362,0:13:38.582 Wer also diese Daten verwendet, 0:13:38.582,0:13:42.089 kann verstehen, wie dieses Wort[br]im Kontext zu verwenden ist, 0:13:42.089,0:13:44.158 so dass es zum Beispiel[br]ein Zitat sein könnte. 0:13:45.396,0:13:47.113 Und hier liegt Polnisch ganz vorne. 0:13:47.900,0:13:49.764 Gute Arbeit, Polnisch-Sprecher. 0:13:54.219,0:13:57.680 Eine weitere Eigenschaft,[br]die wirklich nützlich ist, ist IPA, 0:13:57.680,0:13:59.968 also wie spricht man dieses Wort aus. 0:14:00.876,0:14:07.497 Russisch braucht offenbar[br]viele IPA-Erklärungen. 0:14:10.419,0:14:13.314 Aber noch einmal kommt Polnisch[br]gleich hinterher. 0:14:17.148,0:14:20.753 Und zu guter Letzt haben wir[br]auch noch eine Audioaussprache. 0:14:20.753,0:14:23.372 Das sind also Links[br]zu Dateien auf Commons, 0:14:23.372,0:14:25.959 in denen jemand das Wort ausspricht, 0:14:25.959,0:14:27.703 so dass Sie hören können, 0:14:27.703,0:14:29.913 wie ein Muttersprachler[br]das Wort ausspricht, 0:14:29.913,0:14:32.741 falls Sie zum Beispiel[br]IPA nicht lesen können. 0:14:34.959,0:14:39.015 Und es gibt ein wirklich nettes,[br]auf Wiki basierendes Projekt 0:14:39.015,0:14:40.474 namens Lingua Libre, 0:14:40.884,0:14:45.173 bei dem Sie mithelfen können,[br]Wörter in Ihrer Sprache aufzunehmen, 0:14:45.173,0:14:47.836 die dann zu den Lexemen auf Wikidata[br]hinzugefügt werden können, 0:14:48.446,0:14:51.923 damit andere Leute verstehen können,[br]wie Ihre Wörter ausgesprochen werden. 0:14:53.663,0:14:55.694 (Person 2) [undeutlich] 0:14:55.694,0:14:57.665 (Lydia) Wenn Sie[br]nach "Lingua Libre" suchen, 0:14:57.665,0:15:00.981 und ich bin sicher, dass es jemand[br]im Telegrammkanal posten kann. 0:15:03.138,0:15:04.621 Die Leute sind der Hammer. 0:15:04.621,0:15:06.726 Sie haben wirklich coole Sachen[br]mit Wikibase gemacht. 0:15:09.416,0:15:10.617 In Ordnung. 0:15:12.706,0:15:16.980 Dann ist die Frage, wie geht es weiter? 0:15:19.165,0:15:22.010 Basierend auf den Zahlen,[br]die ich Ihnen gerade gezeigt habe, 0:15:23.030,0:15:25.172 haben wir einen langen Weg zurückgelegt, 0:15:25.172,0:15:28.430 um mehr Menschen mehr Zugang[br]zu mehr Wissen zu geben, 0:15:28.430,0:15:31.040 was Sprachen auf Wikidata betrifft. 0:15:32.530,0:15:36.392 Aber es liegt auch noch[br]eine Menge Arbeit vor uns. 0:15:38.992,0:15:42.341 Einige der Dinge, die Sie[br]tun können, um zu helfen, 0:15:42.341,0:15:44.921 sind zum Beispiel Label-a-Thons, 0:15:44.921,0:15:50.124 wie Leute zusammenzubringen,[br]um Objekte in Wikidata zu bezeichnen, 0:15:50.914,0:15:55.121 oder einen Edit-a-Thon, um Lexeme[br]in Ihrer Sprache zu vervollständigen, 0:15:55.121,0:15:59.002 um die am häufigsten verwendeten Wörter[br]in Ihrer Sprache in Wikidata zu bestimmen. 0:16:00.773,0:16:03.285 Oder Sie können ein Werkzeug[br]wie Terminator verwenden, 0:16:03.285,0:16:08.273 das Ihnen hilft, die wichtigsten Elemente[br]in Ihrer Sprache zu finden, 0:16:08.273,0:16:11.549 bei denen noch keine Bezeichnung[br]vorhanden ist. 0:16:13.274,0:16:17.509 Am wichtigsten ist es, zu messen, 0:16:17.509,0:16:22.253 wie oft es in anderen Wikidata-Elementen[br]als Links in Aussagen verwendet wird. 0:16:25.768,0:16:30.022 Und beim Lexeme-Teil 0:16:31.342,0:16:35.169 geht es natürlich auch darum,[br]diese Lexeme zu erweitern 0:16:35.169,0:16:41.013 und weitere Aussagen hinzuzufügen, 0:16:41.013,0:16:44.031 so dass sie tatsächlich die Basis 0:16:44.031,0:16:47.281 für sinnvolle Anwendungen bilden können,[br]die darauf aufbauen. 0:16:48.141,0:16:50.795 Denn wir nähern uns[br]dieser kritischen Masse, 0:16:50.795,0:16:53.366 aber wir sind noch weit davon entfernt, 0:16:53.366,0:16:56.624 dass man darauf ernsthafte[br]Anwendungen aufbauen könnte. 0:16:58.277,0:17:01.680 Und ich hoffe, dass Sie alle [br]sich uns dabei anschließen werden. 0:17:02.583,0:17:06.813 Und damit komme ich schon 0:17:06.813,0:17:09.387 zu einer kleinen Hilfe[br]von unseren Freunden, 0:17:09.597,0:17:12.542 und Bruno, wollen Sie zu uns kommen 0:17:13.882,0:17:16.854 und mit uns über[br]lexikalische Masken sprechen? 0:17:17.231,0:17:18.567 (Bruno) Danke, Lydia. 0:17:18.567,0:17:21.519 Danke, dass Sie mir[br]die Zeit gegeben haben, 0:17:21.519,0:17:24.550 um diese Arbeit vorzustellen,[br]die wir bei Google Denny machen 0:17:24.550,0:17:29.319 und von der viele von Ihnen schon[br]gehört haben oder wissen. 0:17:30.126,0:17:32.030 Denn bei Google bin ich Linguist. 0:17:32.030,0:17:35.780 Ich freue mich also sehr, hier unter[br]anderen Sprachbegeisterten zu sein. 0:17:36.620,0:17:39.278 Wir bauen auch einige Lexika auf, 0:17:39.278,0:17:41.766 und wir haben diese Technologie 0:17:41.766,0:17:45.589 oder diesen Ansatz aufgebaut, von dem[br]wir glauben, dass er nützlich sein kann. 0:17:46.369,0:17:48.455 Nur um ein wenig[br]Hintergrundinformationen zu geben, 0:17:48.455,0:17:52.068 hier ist mein lexikografischer[br]Hintergrund, über den ich hier spreche. 0:17:52.558,0:17:54.637 Wenn wir eine Lexikon-Datenbank aufbauen, 0:17:54.637,0:17:58.623 ist es sehr schwierig, sie zu pflegen,[br]konsistent zu halten 0:17:58.623,0:18:00.125 und Daten auszutauschen, 0:18:00.125,0:18:01.847 wie Sie wahrscheinlich wissen. 0:18:02.517,0:18:05.927 Es gibt mehrere Versuche, die Funktionen[br]und die Eigenschaften zu vereinheitlichen, 0:18:05.927,0:18:08.964 die diese Lexeme[br]und diese Formen beschreiben, 0:18:08.964,0:18:10.936 und es ist kein gelöstes Problem. 0:18:10.936,0:18:13.728 Es gibt einige Vereinheitlichungsversuche[br]auf dieser Seite. 0:18:13.728,0:18:15.209 Aber was wirklich fehlt-- 0:18:15.209,0:18:18.732 und dieses Problem hatten wir[br]zu Beginn unseres Projekts bei Google-- 0:18:18.732,0:18:21.607 ist der Versuch,[br]eine interne Struktur zu schaffen, 0:18:22.197,0:18:25.910 die beschreibt, wie ein[br]lexikalischer Eintrag aussehen sollte, 0:18:25.910,0:18:28.581 welche Art von Daten oder welche Art[br]von Informationen wir haben 0:18:28.581,0:18:31.987 und welche Spezifikationen[br]erwartet werden. 0:18:32.247,0:18:38.447 Das ist es also, was wir mit dieser Sache[br]namens Lexikon-Maske herausgefunden haben. 0:18:38.897,0:18:44.261 Eine Lexikonmaske beschreibt,[br]was für einen Eintrag, 0:18:44.261,0:18:47.355 einen lexikografischen Eintrag,[br]erwartet wird, um vollständig zu sein, 0:18:47.355,0:18:51.436 sowohl in Bezug auf die Anzahl der Formen,[br]die Sie für ein Lexem erwarten, 0:18:51.436,0:18:55.472 als auch auf die Anzahl der Merkmale,[br]die Sie für jede dieser Formen erwarten. 0:18:56.257,0:18:58.329 Hier ist ein Beispiel[br]für italienische Adjektive. 0:18:58.329,0:19:02.002 Sie erwarten, dass Ihre Adjektive[br]auf Italienisch vier Formen haben, 0:19:02.002,0:19:05.383 und jede dieser Formen[br]hat eine spezifische Kombination 0:19:05.383,0:19:07.776 von Geschlechts- und Numerusmerkmalen. 0:19:08.606,0:19:12.392 Das erwarten wir[br]für die italienischen Adjektive. 0:19:12.392,0:19:15.996 Natürlich können Sie[br]sehr komplexe Masken haben, 0:19:15.996,0:19:18.508 wie die Konjugation[br]der französischen Verben, 0:19:18.508,0:19:20.366 die sehr umfangreich ist, 0:19:20.366,0:19:23.357 und ich zeige Ihnen nicht[br]weitere russische Masken, 0:19:23.357,0:19:25.378 weil diese nicht[br]auf den Bildschirm passen. 0:19:26.308,0:19:29.531 Und wir haben auch[br]einige detaillierte Spezifikationen, 0:19:29.531,0:19:33.421 weil wir unterscheiden auf der Formebene. 0:19:33.421,0:19:37.384 Hier haben Sie also russische Substantive,[br]die drei Numeri 0:19:37.384,0:19:40.048 und eine Reihe von Fällen[br]mit unterschiedlichen Formen haben, 0:19:40.048,0:19:43.086 aber sie haben auch eine Spezifikation[br]auf der Einstiegsebene, 0:19:43.086,0:19:45.590 die besagt, dass ein Substantiv vor allem 0:19:45.590,0:19:50.133 ein inhärentes Geschlecht[br]und ein inhärentes Belebtheitsmerkmal hat, 0:19:50.133,0:19:52.488 das ebenfalls in der Maske angegeben ist. 0:19:54.518,0:19:57.729 Wir wollen auch unterscheiden,[br]dass eine Maske 0:19:57.729,0:20:01.724 eine Spezifikation dafür gibt,[br]wie ein Eintrag aussehen sollte. 0:20:01.724,0:20:07.048 Aber Sie können kleinere Masken[br]für fehlerhafte Aspekte der Form 0:20:07.048,0:20:11.282 oder fehlerhafte Aspekte des Lexems haben,[br]die in der Sprache vorkommen. 0:20:11.282,0:20:14.537 Hier ist also die einfachste Version[br]der französischen Verben, 0:20:14.537,0:20:19.729 die nur die dritte Person Singular[br]für alle Wetterverben haben, 0:20:19.729,0:20:23.804 wie "es regnet" oder "es schneit",[br]wie im Englischen. 0:20:24.537,0:20:26.493 Wir unterscheiden also[br]diese beiden Stufen. 0:20:26.923,0:20:29.962 Und wie wir das bei Google verwenden, 0:20:29.962,0:20:32.643 ist, dass wir, wenn wir ein Lexikon haben,[br]das wir verwenden wollen, 0:20:33.063,0:20:37.469 die Maske benutzen, um die Lexika,[br]also alle Einträge, 0:20:37.469,0:20:40.163 wirklich buchstäblich[br]durch die Maske zu werfen 0:20:40.163,0:20:44.303 und zu sehen, welcher Eintrag[br]ein Problem in Bezug auf die Struktur hat. 0:20:44.303,0:20:46.523 Fehlt uns eine Form?[br]Fehlt uns ein Merkmal? 0:20:46.523,0:20:51.247 Und wenn es ein Problem gibt, führen wir[br]eine menschliche Validierung durch 0:20:51.247,0:20:53.751 oder einfach nur, um zu sehen,[br]ob es die Maske passiert. 0:20:53.751,0:20:55.940 Es ist also ein extrem[br]leistungsfähiges Werkzeug, 0:20:55.940,0:20:58.132 um die Qualität der Struktur[br]zu überprüfen. 0:20:59.427,0:21:01.964 Wir freuen uns also,[br]heute bekannt geben zu können, 0:21:01.964,0:21:05.408 dass wir grünes Licht erhalten haben,[br]unsere Maske freizugeben. 0:21:05.948,0:21:07.573 Dies ist also ein Schema. 0:21:07.573,0:21:09.547 Wenn Sie das wollen,[br]können wir es veröffentlichen 0:21:09.547,0:21:13.483 und wir werden es Wikidata[br]als ShEx-Dateien zur Verfügung stellen. 0:21:13.483,0:21:16.688 Dies ist eine ShEx-Datei[br]für deutsche Substantive, 0:21:16.688,0:21:20.428 und Denny arbeitet an der Konvertierung[br]von unserer internen Spezifikation 0:21:20.428,0:21:23.516 in eine Open-Source-Spezifikation. 0:21:23.516,0:21:27.242 Derzeit decken wir[br]mehr als 25 Sprachen ab. 0:21:27.242,0:21:29.315 Wir erwarten also Wachstum[br]auf unserer Seite, 0:21:29.315,0:21:34.033 aber wir suchen auch nach der Möglichkeit,[br]für andere Sprachen zusammenzuarbeiten. 0:21:34.033,0:21:39.993 Und eine der laufenden Kooperationen,[br]die zwischen Denny und Lukas stattfindet, 0:21:40.503,0:21:45.052 Lukas hat diese großartigen Werkzeuge,[br]um eine Benutzeroberfläche zu haben, 0:21:45.052,0:21:48.524 die dem Benutzer[br]oder dem Beitragenden hilft, 0:21:48.524,0:21:50.811 weitere Formen hinzuzufügen. 0:21:50.811,0:21:54.151 Wenn Sie also ein Adjektiv[br]auf Französisch hinzufügen möchten, 0:21:54.151,0:21:58.897 sagt Ihnen die Benutzeroberfläche,[br]wie viele Formen erwartet werden 0:21:58.897,0:22:01.562 und welche Art von Funktionen[br]diese Form haben sollte. 0:22:01.562,0:22:06.047 Unsere Maske hilft Ihnen, das Werkzeug[br]zu definieren und zu erweitern. 0:22:07.238,0:22:08.385 Das ist alles. 0:22:08.791,0:22:10.358 (Lydia) Ich danke Ihnen vielmals. 0:22:10.358,0:22:11.993 (Beifall) 0:22:14.249,0:22:16.741 In Ordnung. Gibt es Fragen? 0:22:16.741,0:22:19.035 Wollen Sie mehr über Lexeme sprechen? 0:22:19.817,0:22:21.475 - (Person 3) Ja. [br]- (Lydia) Ja. (lacht) 0:22:33.485,0:22:35.520 (Person 3) Meine Frage,[br]weil Sie davon sprachen, 0:22:35.520,0:22:38.916 mehr Menschen in mehr Sprachen[br]Zugang zu gewähren. 0:22:38.916,0:22:41.112 Aber es gibt eine Menge Sprachen,[br]die in Wikidata 0:22:41.112,0:22:42.524 nicht verwendet werden können. 0:22:42.524,0:22:44.528 Welche Lösung haben Sie also dafür? 0:22:45.789,0:22:48.416 (Lydia) Wenn Sie sagen, dass Wikidata[br]nicht verwendet werden kann, 0:22:48.416,0:22:50.308 sprechen Sie von der Eingabe[br]von Bezeichnungen? 0:22:50.308,0:22:51.938 (Person 3) Bezeichnungen,[br]Beschreibungen. 0:22:51.938,0:22:55.498 (Lydia) Richtig.[br]Bei Lexemes ist es also etwas anders, 0:22:55.498,0:22:57.793 weil wir dort diese Einschränkung[br]nicht haben. 0:22:58.923,0:23:02.812 Für Bezeichnungen[br]von Objekten und Eigenschaften 0:23:02.812,0:23:05.072 gibt es eine gewisse Einschränkung, 0:23:05.252,0:23:11.772 weil wir sicherstellen wollten,[br]dass nicht jeder 0:23:12.411,0:23:14.229 etwas völlig anderes macht 0:23:14.229,0:23:17.243 und es unüberschaubar wird. 0:23:19.349,0:23:21.197 Sogar eine kleine Communties, 0:23:21.197,0:23:23.758 die eine einzige Sprache wollen[br]und daran arbeiten möchten, 0:23:23.758,0:23:26.757 kommt zu uns und sprecht mit uns,[br]wir werden das einrichten. 0:23:26.757,0:23:29.222 (Person 3) Wir haben das[br]beim Prager Hackathon im Mai getan, 0:23:29.222,0:23:32.459 und wir haben bis fast August gebraucht,[br]um unsere Sprache verwenden zu können. 0:23:32.459,0:23:35.036 - (Lydia) Ja. [br]- (Person 3) Also, es ist sehr langsam. 0:23:35.036,0:23:37.383 (Lydia) Ja, es ist leider sehr langsam. 0:23:37.623,0:23:39.883 Wir arbeiten derzeit[br]mit dem Sprachausschuss 0:23:39.883,0:23:45.746 an der Lösung einiger grundlegender... 0:23:49.537,0:23:52.125 Zum Beispiel, eine Einigung[br]darüber zu erzielen, 0:23:52.125,0:23:55.272 welche Arten von Sprachen[br]tatsächlich "erlaubt" sind, 0:23:55.742,0:23:59.055 und das hat zu lange gedauert, 0:23:59.988,0:24:02.768 weshalb Ihre Anfrage wahrscheinlich[br]länger gedauert hat, 0:24:02.768,0:24:04.398 als sie hätte sein sollen. 0:24:04.778,0:24:05.963 (Person 3) Danke. 0:24:06.815,0:24:07.950 (Person 4) Vielen Dank. 0:24:07.950,0:24:10.938 Lydia, wenn Sie sich an die Statistiken[br]erinnern, die Sie gezeigt haben, 0:24:10.938,0:24:12.886 die Anzahl der Lexeme pro Sprache. 0:24:12.886,0:24:17.599 Haben Sie also alle Formen[br]als Datenpunkt gezählt 0:24:17.599,0:24:19.757 oder nur Lexeme? 0:24:21.289,0:24:22.931 (Lydia) Meinen Sie das? 0:24:22.931,0:24:24.053 Welches meinen Sie? 0:24:24.053,0:24:25.529 (Person 4) Ja, genau. 0:24:25.797,0:24:28.341 Wenn Sie sich erinnern,[br]zählt diese Zahl [unhörbar] 0:24:28.341,0:24:31.654 alle Formen für alle Lexeme[br]oder nur, wie viele Lexeme es gibt? 0:24:31.654,0:24:33.795 (Lydia) Nein, dies ist nur[br]die Anzahl von Lexemen. 0:24:33.795,0:24:35.515 (Person 4) Nur eine Anzahl[br]von Lexemen, okay. 0:24:35.515,0:24:37.083 Dann ist es also nur eine Statistik, 0:24:37.083,0:24:39.390 denn wenn es dann die Formen[br]zusammensetzen würde-- 0:24:39.390,0:24:40.614 deshalb frage ich-- 0:24:40.614,0:24:42.817 dann haben alle Sprachen[br]mit der Flexionsmorphologie, 0:24:42.817,0:24:45.027 wie Russisch, Serbisch,[br]Slowenisch und so weiter, 0:24:45.027,0:24:47.616 einen natürlichen Vorteil,[br]weil sie so viele haben. 0:24:47.616,0:24:51.860 (Lydia) Das wirkt sich also[br]auf diese Anzahl von Formen aus. 0:24:51.860,0:24:53.851 (Person 4) Ja, das war diese hier. Danke. 0:24:56.546,0:25:00.224 (Person 5) Also, ich hatte[br]eine kurze Frage über die... 0:25:00.644,0:25:06.824 Wenn wir über die eigentlichen[br]Objekte und Eigenschaften sprechen, 0:25:07.124,0:25:08.901 soweit ich weiß, 0:25:08.901,0:25:11.955 gibt es derzeit keine Möglichkeit,[br]eine tatsächliche Quelle 0:25:11.955,0:25:14.726 für die angegebenen Bezeichnungen[br]und Beschreibungen anzugeben. 0:25:14.726,0:25:17.542 Zum Beispiel, weil man, 0:25:17.542,0:25:20.741 wenn es sich um eine Eigenschaft[br]eines Objekts handelt, 0:25:20.741,0:25:24.389 kann man zum Beispiel[br]widersprüchliche Bezeichnungen erhalten. 0:25:24.389,0:25:25.539 (Lydia) Ja. 0:25:25.539,0:25:27.662 (Person 5) Diese Person ist also wie... 0:25:28.332,0:25:31.021 Wir haben zum Beispiel schon einmal[br]über indigene Dinge gesprochen. 0:25:31.021,0:25:35.775 Diese Person ist also nach dieser Quelle[br]ein norwegischer Künstler, 0:25:35.775,0:25:38.750 und nach dieser Quelle[br]ein samischer Künstler. 0:25:39.550,0:25:42.883 Oder, zum Beispiel, in der[br]estnischen Sprache hatten wir ein Problem, 0:25:42.883,0:25:47.556 bei dem wir die Terminologie[br]auf die offizielle Terminologie 0:25:47.556,0:25:49.482 in den offiziellen Lexika[br]umstellen mussten, 0:25:49.482,0:25:52.072 aber wir haben keine Möglichkeit,[br]wirklich anzugeben, warum, 0:25:52.072,0:25:53.596 was die Ursache dafür war 0:25:53.596,0:25:55.561 und warum das besser war[br]und was vorher da war. 0:25:55.561,0:25:57.150 Es war nur ich als zufällige Person, 0:25:57.150,0:25:59.615 die die Sache umgestellt hat[br]für jeden, der das sieht. 0:25:59.615,0:26:02.520 Gibt es also einen Plan, um dies[br]in irgendeiner Weise zu ermöglichen, 0:26:02.520,0:26:06.224 damit wir tatsächlich die richtigen[br]Quellen für die Sprachdaten haben? 0:26:07.045,0:26:11.498 (Lydia) Also, es ist teilweise möglich. 0:26:11.498,0:26:15.743 Wenn Sie zum Beispiel ein Objekt[br]für eine Person haben, 0:26:16.968,0:26:21.032 dann haben Sie eine Aussage,[br]den Vornamen, den Nachnamen 0:26:21.032,0:26:22.720 und so weiter, dieser Person, 0:26:22.720,0:26:26.019 und dann können Sie dort[br]die Referenz dafür angeben. 0:26:28.211,0:26:32.004 Ich zögere noch, mehr Komplexität 0:26:32.004,0:26:35.397 für Referenzen auf Bezeichnungen[br]und Beschreibungen hinzuzufügen, 0:26:35.397,0:26:38.624 aber wenn die Leute wirklich,[br]wirklich denken, 0:26:38.624,0:26:43.021 dass dies etwas ist,[br]das nicht durch eine Referenz 0:26:43.021,0:26:44.952 zu der Aussage abgedeckt ist, 0:26:44.952,0:26:46.753 dann lassen Sie uns darüber reden. 0:26:49.079,0:26:52.983 Aber ich fürchte, es wird[br]eine Menge Komplexität 0:26:52.983,0:26:56.363 für hoffentlich wenige Fälle hinzufügen, 0:26:57.393,0:27:00.188 aber ich bin bereit, mich vom Gegenteil[br]überzeugen zu lassen, 0:27:00.188,0:27:03.977 wenn die Leute wirklich[br]sehr stark davon überzeugt sind. 0:27:03.977,0:27:07.997 (Person 5) Wenn es hinzugefügt wird,[br]sollte es nicht Standardeinstellung sein, 0:27:07.997,0:27:12.272 das allen Anfängern der Benutzer [br]zu zeigen, auf jeden Fall. 0:27:12.272,0:27:16.010 Eher so: "Klicken Sie hier, wenn Sie[br]etwas Bestimmtes dazu sagen müssen". 0:27:17.632,0:27:23.228 (Lydia) Haben wir ein Gefühl dafür,[br]wie oft das eine Rolle spielen würde? 0:27:24.520,0:27:26.423 (Person 5) Auf Estnisch, zum Beispiel-- 0:27:26.423,0:27:28.844 ich nehme an, das gilt auch[br]für andere Sprachen-- 0:27:29.274,0:27:34.023 gibt es einen offiziellen Namen,[br]die tatsächlich legitime Übersetzung, 0:27:34.023,0:27:36.036 zum Beispiel ins Englische, 0:27:36.036,0:27:40.314 einer bestimmten Art[br]von Stadtgemeinde ist. 0:27:40.614,0:27:42.402 Das war zum Beispiel mein Anwendungsfall, 0:27:42.402,0:27:44.409 wo wir das Wort "Gemeinde"[br]verwendet haben, 0:27:45.159,0:27:50.715 das im estnischen Original[br]wie eine Kirchengemeinde gemeint war, 0:27:50.715,0:27:51.899 und das war der Ursprung, 0:27:51.899,0:27:54.809 aber das ist nicht die offizielle[br]Übersetzung, die Estland jetzt hat. 0:27:55.189,0:27:58.993 (Lydia) In diesem Fall würde ich es[br]als offizielle Namensangabe hinzufügen 0:27:58.993,0:28:00.817 und dort den Verweis hinzufügen. 0:28:02.032,0:28:03.158 (Person 5) Okay. 0:28:05.186,0:28:06.572 (Lydia) Weitere Fragen, ja? 0:28:07.682,0:28:10.044 (Person 6) Ich habe zwei kurze Kommentare. 0:28:10.044,0:28:13.934 Sie haben ausdrücklich Asturisch als eine[br]Sprache genannt, die gut funktioniert, 0:28:13.934,0:28:16.285 und ich denke,[br]das ist ein falsches Artefakt. 0:28:16.285,0:28:17.724 (Lydia) Erzählen Sie mir davon. 0:28:17.724,0:28:19.748 (Person 6) Ich glaube, es ist nur ein Bot, 0:28:19.748,0:28:23.784 der Personennamen wie Eigennamen einfügt 0:28:23.784,0:28:26.902 und sagt: "Nun, das ist genau[br]wie im Französischen oder Spanischen", 0:28:26.902,0:28:28.558 und es einfach massiv kopiert. 0:28:28.558,0:28:33.316 Ein Beweis dafür ist, dass man[br]diese Energie im Asturischen 0:28:33.316,0:28:37.205 nicht in Dingen sieht, die eigentlich[br]übersetzt werden müssen, wie Eigennamen 0:28:37.205,0:28:39.648 oder Namen von Objekten,[br]die keine Eigennamen sind. 0:28:39.648,0:28:41.219 (Lydia) Asaf, du brichst mir das Herz. 0:28:41.219,0:28:43.198 (Person 6) Ich weiß,[br]ich vermassle immer die Show, 0:28:43.198,0:28:48.458 aber ich habe auch gute Neuigkeiten,[br]was die Zahlen zur Aussprache betrifft. 0:28:49.408,0:28:53.515 Wie Sie wahrscheinlich wissen,[br]ist Commons voll von Aussprachedateien, 0:28:53.515,0:28:54.668 und zum Beispiel 0:28:54.668,0:28:59.632 gibt es im Niederländischen nicht weniger[br]als 300.000 Aussprachedateien 0:28:59.632,0:29:01.272 schon unter Commons 0:29:01.912,0:29:05.051 die nur irgendwie[br]aufgenommen werden müssen. 0:29:05.051,0:29:07.517 Wenn also jemand[br]nach einem Nebenprojekt sucht, 0:29:07.517,0:29:08.997 gibt es tonnenweise 0:29:08.997,0:29:13.280 klassifizierte, kategorisierte[br]Aussprachedateien unter Commons 0:29:13.280,0:29:16.893 unter der Kategorie "Aussprache"[br]nach Sprache. 0:29:16.893,0:29:20.402 Das wartet nur darauf,[br]mit Lexemen abgeglichen 0:29:20.402,0:29:23.180 und auf Lexeme gesetzt zu werden. 0:29:23.180,0:29:26.585 Und ich habe mich gefragt, ob Sie etwas[br]über den Fahrplan sagen können, 0:29:26.585,0:29:28.757 etwas darüber, wie viel Investitionen 0:29:28.757,0:29:31.995 oder was wir im kommenden Jahr[br]von Lexeme erwarten können, 0:29:31.995,0:29:33.830 denn ich kann es kaum erwarten. 0:29:34.949,0:29:37.044 (Lydia) Sie können nicht warten? (lacht) 0:29:37.044,0:29:39.118 - (Person 6) Auf mehr. [br]- (Lydia) Ja. 0:29:44.541,0:29:49.293 Im Moment konzentrieren wir uns[br]auf mehr über Wikibase und Datenqualität, 0:29:51.493,0:29:55.087 um zu sehen, wie viel Fahrt das bekommt, 0:29:55.087,0:30:01.496 und dann mehr Information darüber,[br]wo die Schwachpunkte als Nächstes liegen, 0:30:01.496,0:30:06.003 und dann wieder zur weiteren Verbesserung[br]der lexikografischen Daten zurückzukehren. 0:30:06.903,0:30:09.790 Und eines der Dinge, die ich[br]gerne von Ihnen hören würde, 0:30:09.790,0:30:14.136 ist, wo genau Sie[br]die nächsten Schritte sehen, 0:30:14.136,0:30:15.966 wo Sie Verbesserungen sehen wollen, 0:30:15.966,0:30:20.340 damit wir dann herausfinden können,[br]wie wir das erreichen können. 0:30:21.125,0:30:22.810 Aber natürlich haben Sie Recht, 0:30:22.810,0:30:25.712 es gibt noch so viel zu tun,[br]auch von der technischen Seite her. 0:30:30.573,0:30:33.797 (Person 7) Okay, als wir[br]die baskischen Wörter 0:30:33.797,0:30:35.848 mit Formen hochgeladen haben, 0:30:35.848,0:30:37.768 und Sie werden einige dieser Dinge sehen, 0:30:37.768,0:30:41.329 sagten wir beide letzte Woche:[br]"Oh, wir sind die Ersten bei etwas. 0:30:42.919,0:30:44.928 Es erscheint in der Presse,[br]und es ist wie: 0:30:44.928,0:30:49.218 "Oh, Baskisch, es ist das erste Mal,[br]das sie bei etwas die ersten sind". 0:30:49.218,0:30:50.606 (Lachen) 0:30:50.606,0:30:53.002 Und dann fragen die Leute:[br]"Okay, aber wofür ist das?" 0:30:54.678,0:30:56.849 Wir haben keine wirklich gute Antwort. 0:30:56.849,0:30:58.008 Ich meine, "Okay, 0:30:58.008,0:31:01.761 das wird Computern helfen,[br]unsere Sprache besser zu verstehen, ja, 0:31:01.761,0:31:05.279 aber was für Werkzeuge können wir[br]in der Zukunft herstellen?" 0:31:05.279,0:31:07.467 Und darauf haben wir keine gute Antwort. 0:31:07.467,0:31:10.452 Ich weiß also nicht, ob Sie[br]eine gute Antwort darauf haben. 0:31:10.452,0:31:13.102 (Lydia) (lacht) Ich weiß nicht,[br]ob ich eine gute Antwort habe, 0:31:13.102,0:31:14.746 aber ich habe eine Antwort. 0:31:15.480,0:31:20.235 Ich denke also, wie ich[br]schon sagte [unhörbar], 0:31:20.235,0:31:22.694 dass wir noch nicht[br]die kritische Masse erreicht haben, 0:31:22.694,0:31:25.529 in der man viele der wirklich[br]interessanten Werkzeuge bauen kann. 0:31:25.529,0:31:27.707 Aber es gibt bereits einige Werkzeuge. 0:31:28.267,0:31:31.732 Erst neulich hat Esther [Pandelia][br]zum Beispiel 0:31:31.732,0:31:34.017 ein Werkzeug veröffentlicht,[br]mit dem man sehen kann, 0:31:35.837,0:31:38.889 ich glaube, es waren die Worte[br]auf einem Globus, 0:31:38.889,0:31:41.724 wo sie gesprochen werden,[br]woher sie kommen. 0:31:42.481,0:31:44.090 Wahrscheinlich irre ich mich da, 0:31:44.090,0:31:46.786 aber sie hatte auf dem Projekt-Chat[br]auf Wikidata geantwortet-- 0:31:46.786,0:31:48.798 Sie können es dort nachschlagen. 0:31:49.574,0:31:51.805 Wir haben also[br]diese ersten Werkzeuge gesehen, 0:31:51.805,0:31:55.391 genau wie damals, als Wikidata begann. 0:31:56.846,0:31:59.602 Zuerst etwas - wie ein Netzwerk, 0:31:59.602,0:32:01.754 und wie: "Schau, da ist dieses Ding, 0:32:01.754,0:32:03.764 das sich mit diesem[br]anderen Ding verbindet". 0:32:04.824,0:32:07.059 Und je mehr Daten wir haben 0:32:07.059,0:32:10.352 und je mehr wir[br]eine kritische Masse erreicht haben, 0:32:11.852,0:32:14.559 desto leistungsfähigere Anwendungen[br]werden möglich, 0:32:15.677,0:32:17.516 Dinge wie Histropedia, 0:32:19.126,0:32:21.988 Dinge wie Fragen und Antworten 0:32:21.988,0:32:26.483 in Ihrem digitalen persönlichen[br]Assistenten, Platypus und so weiter. 0:32:26.483,0:32:29.849 Ähnliches sehen wir bei den Lexemen. 0:32:31.198,0:32:34.650 Wir befinden uns in einem Stadium,[br]in dem man so etwas wie diese kleinen, 0:32:34.650,0:32:37.464 hey, schau, es gibt eine Verbindung[br]zwischen den beiden Dingen, 0:32:37.864,0:32:42.528 und es gibt eine Übersetzung[br]dieses Wortes in dieses Sprachstadium, 0:32:42.528,0:32:47.587 und wenn wir es erweitern[br]und mehr Wörter beschreiben, 0:32:47.587,0:32:49.223 wird mehr möglich. 0:32:49.223,0:32:51.525 Was wird nun möglich? 0:32:53.482,0:32:59.303 Wie Ben, unser Hauptredner vorhin,[br]sprach über Übersetzungen, 0:33:00.103,0:33:03.265 über die Möglichkeit, von einer Sprache[br]in eine andere zu übersetzen. 0:33:03.265,0:33:07.769 Und Jens, mein Kollege,[br]er spricht immer davon, 0:33:07.769,0:33:11.452 dass die Europäische Union[br]einen Übersetzer sucht, 0:33:11.452,0:33:17.439 der aus dem Maltesischen ins Schwedische[br]übersetzen kann, war es Maltesisch? 0:33:17.439,0:33:19.436 - (Person 8) Estnisch.[br]- (Lydia) Estnisch. 0:33:22.016,0:33:26.211 Und das ist keine übliche Kombination. 0:33:27.211,0:33:31.535 Aber wenn man all diese Sprachen[br]an einem maschinenlesbaren Ort hat, 0:33:31.535,0:33:33.023 kann man das tun, 0:33:33.023,0:33:36.757 man kann ein Wörterbuch 0:33:36.757,0:33:41.735 von Estnisch nach Maltesisch[br]und zurück bekommen. 0:33:42.935,0:33:45.607 Also Sprachkombinationen[br]in Wörterbüchern abzudecken, 0:33:45.607,0:33:47.911 die vorher einfach nicht abgedeckt wurden, 0:33:47.911,0:33:51.050 weil es nicht genug Nachfrage[br]dafür gab, zum Beispiel, 0:33:51.050,0:33:55.540 um die Arbeit finanziell tragbar zu machen[br]und zu rechtfertigen. 0:33:55.540,0:33:57.067 Jetzt können wir das tun. 0:33:59.797,0:34:02.048 Dann die Texterstellung. 0:34:02.048,0:34:04.253 Lucie hat vorhin davon gesprochen, 0:34:04.253,0:34:10.136 wie sie mit Hattie[br]an der Textgenerierung arbeitet, 0:34:10.136,0:34:14.523 um Wikipedia-Artikel[br]in Minderheitensprachen zu erstellen, 0:34:15.423,0:34:19.512 und dazu braucht man Daten über Wörter, 0:34:19.512,0:34:22.529 und dazu muss man die Sprache verstehen. 0:34:23.769,0:34:27.773 Ja, und das sind nur einige,[br]die mir gerade in den Sinn kommen. 0:34:28.693,0:34:30.494 Vielleicht hat unser Publikum mehr Ideen, 0:34:30.494,0:34:34.253 was es tun möchte, wenn wir[br]all die herrlichen Daten haben. 0:34:37.693,0:34:40.892 (Person 9) Okay, ich werde vom Thema[br]Lexeme abweichen. 0:34:40.892,0:34:42.666 Ich werde die Frage stellen, 0:34:42.666,0:34:45.634 wie kann ich als Mitglied der Community 0:34:45.634,0:34:50.135 darauf Einfluss nehmen, dass die Priorität[br]auf die Aufgabe gelegt wird, 0:34:50.135,0:34:53.724 dass ein neuer Benutzer angeben kann, 0:34:53.724,0:34:56.644 welche Sprachen er sehen[br]und bearbeiten möchte, 0:34:56.644,0:35:01.135 ohne dass er geheime[br]verbale Vorlagenkenntnisse hat. 0:35:02.145,0:35:05.053 Vielleicht wird es dieses Jahr[br]diese technische Wunschliste 0:35:05.053,0:35:07.040 ohne Wikipedia-Themen geben. 0:35:07.040,0:35:10.969 Vielleicht gibt es eine Hoffnung, dass wir[br]alle über diese Sache abstimmen können, 0:35:10.969,0:35:14.018 die wir sieben Jahre lang[br]nicht geregelt haben. 0:35:14.018,0:35:17.607 Haben Sie also irgendwelche[br]Ideen und Kommentare dazu? 0:35:18.217,0:35:20.328 Sie sprechen also davon, 0:35:20.328,0:35:23.248 dass jemand, der nicht[br]in Wikidata eingeloggt ist, 0:35:23.248,0:35:25.631 seine Sprache nicht einfach ändern kann? 0:35:25.631,0:35:27.839 (Person 9) Nein, für [unhörbare] Benutzer. 0:35:28.309,0:35:30.689 (Lydia) Wenn sie also eingeloggt sind, 0:35:30.689,0:35:34.871 können sie ihre Sprache einfach[br]oben auf der Seite ändern, 0:35:35.891,0:35:38.099 und dann erscheint, 0:35:39.769,0:35:42.013 wo die Beschreibung [unhörbar] steht 0:35:42.013,0:35:43.553 und sie können sie bearbeiten. 0:35:45.657,0:35:49.009 (Person 9) Nun, eigentlich[br]ist der Arbeitsablauf oft so, 0:35:49.009,0:35:52.447 dass, wenn Sie mehrere Sprachen[br]haben wollen, diese angeboten werden, 0:35:52.447,0:35:55.298 das nicht immer der Fall ist. 0:35:55.298,0:35:58.287 (Lydia) Okay, vielleicht sollten wir uns[br]nach diesem Vortrag zusammensetzen 0:35:58.287,0:35:59.507 und Sie zeigen es mir. 0:36:01.562,0:36:04.009 Cool. Noch mehr Fragen? 0:36:05.444,0:36:06.446 Ja. 0:36:11.595,0:36:13.196 (Person 10) Danke für die Präsentation. 0:36:14.106,0:36:15.517 Können Sie den Stand 0:36:15.517,0:36:19.307 der Korrelation mit der[br]Wiktionary-Community kommentieren? 0:36:19.307,0:36:22.296 Soweit ich gesehen habe,[br]gab es einige Diskussionen 0:36:22.296,0:36:26.051 über den Import[br]einiger Elemente der Arbeit, 0:36:26.051,0:36:30.843 aber es scheint, Lizenzprobleme und einige[br]Meinungsverschiedenheiten usw. zu geben. 0:36:30.843,0:36:32.008 (Lydia) Das stimmt. 0:36:32.008,0:36:36.330 Die Wiktionary-Community[br]hat also viel Zeit 0:36:37.320,0:36:39.473 mit dem Aufbau[br]von Wiktionary verbracht. 0:36:39.473,0:36:42.643 Sie haben erstaunlich komplizierte 0:36:43.193,0:36:47.554 und komplexe Vorlagen gebaut, 0:36:47.554,0:36:53.614 um hübsche Tabellen zu erstellen,[br]die automatisch Formen für Sie 0:36:53.614,0:36:56.392 und alle möglichen[br]wirklich beeindruckenden 0:36:56.392,0:37:00.523 und verrückten Dinge erzeugen,[br]wenn Sie darüber nachdenken. 0:37:02.311,0:37:07.994 Und natürlich haben sie eine Menge Zeit[br]und Mühe in diese Arbeit investiert. 0:37:09.364,0:37:12.801 Und verständlicherweise wollen die nicht, 0:37:12.801,0:37:17.016 dass man sich das einfach grabscht. 0:37:18.046,0:37:19.102 einfach so. 0:37:19.102,0:37:21.567 Einiges davon kommt also von dort. 0:37:22.761,0:37:24.987 Und das ist gut so, das ist okay. 0:37:25.737,0:37:32.012 Die ersten Wiktionary-Communities[br]sprechen nun davon, 0:37:32.012,0:37:34.329 einige ihrer Daten[br]in Wikidata zu importieren. 0:37:34.329,0:37:39.095 Russisch, das Sie gesehen haben,[br]ist zum Beispiel einer dieser Fälle, 0:37:40.375,0:37:42.545 und ich erwarte, dass noch mehr[br]davon realisiert wird. 0:37:43.635,0:37:46.704 Aber es wird ein langsamer Prozess sein, 0:37:46.704,0:37:49.383 so wie die Übernahme der Daten[br]von Wikidata in Wikipedia 0:37:49.383,0:37:51.909 ein ziemlich langsamer Prozess war. 0:37:52.849,0:37:56.183 Auf der anderen Seite ist es einfacher, 0:37:56.183,0:37:59.512 die Daten, die in Lexemen[br]auf Wiktionary stehen, 0:37:59.512,0:38:02.209 tatsächlich zu nutzen,[br]so dass sie diese nutzen 0:38:02.209,0:38:05.531 und Daten zwischen den Wiktionaries[br]austauschen können, 0:38:05.531,0:38:08.853 was im Moment super schwer[br]bis unmöglich ist, 0:38:08.853,0:38:11.560 was verrückt ist, genau wie bei Wikipedia. 0:38:13.860,0:38:16.325 Warten Sie auf das Geburtstagsgeschenk.[br](lacht) 0:38:19.928,0:38:21.072 Ja. 0:38:22.599,0:38:24.827 (Person 11) Als ich andersherum dachte, 0:38:24.827,0:38:28.168 wollte ich es eigentlich nicht sagen,[br]weil ich denke, es wird super albern sein, 0:38:28.168,0:38:32.003 aber ich denke, dass Wiktionary[br]bereits einige Inhalte hat, 0:38:32.003,0:38:34.978 und ich weiß, dass wir diese nicht[br]auf Wikidata übertragen können, 0:38:34.978,0:38:37.048 weil es einen Unterschied[br]in den Lizenzen gibt. 0:38:37.048,0:38:39.631 Aber ich dachte, dass wir vielleicht[br]etwas deswegen tun können. 0:38:40.321,0:38:45.513 Vielleicht, ich weiß nicht, können wir[br]die Erlaubnis der Communities einholen, 0:38:45.513,0:38:51.205 nachdem wir eine öffentliche[br]Abstimmung durchgeführt haben 0:38:51.705,0:38:56.042 und die aktiven Mitglieder[br]der Gemeinschaft abstimmen 0:38:56.042,0:38:57.482 und sagen können, 0:38:57.482,0:39:02.523 ob sie die Inhalte, für die sie[br]die Wikidata-Lexeme machen dürfen, 0:39:02.523,0:39:05.528 annehmen oder übertragen möchten. 0:39:06.238,0:39:08.647 Weil ich es einfach[br]für eine solche Verschwendung halte. 0:39:09.568,0:39:14.443 Also, das ist definitiv im Gespräch,[br]dass die Leute, 0:39:14.443,0:39:18.249 die in Wiktionary-Communities sind,[br]das dort zur Sprache bringen. 0:39:18.249,0:39:24.487 Ich denke, es wäre ein bisschen anmaßend,[br]wenn wir das erzwingen würden. 0:39:25.917,0:39:31.142 Aber, ja, ich denke, es ist[br]auf jeden Fall ein Gespräch wert. 0:39:31.142,0:39:33.898 Aber ich denke, es ist[br]auch wichtig, zu verstehen, 0:39:33.898,0:39:39.082 dass es einen Unterschied gibt[br]zwischen dem, was gesetzlich erlaubt ist 0:39:39.082,0:39:43.007 und was wir tun sollten, 0:39:43.007,0:39:45.426 und dem, was diese Leute[br]wollen oder nicht wollen. 0:39:45.736,0:39:47.429 Selbst wenn es also rechtlich erlaubt ist, 0:39:47.429,0:39:50.640 wenn einige Wiktionary-Communities[br]das nicht wollen, 0:39:50.640,0:39:53.243 wäre ich zumindest vorsichtig. 0:39:58.886,0:40:02.259 Ich denke, Sie brauchen das Mikro[br]für den Stream. 0:40:04.540,0:40:07.299 (Person 12) Also, offensichtlich[br]ist das alles sehr aufregend, 0:40:07.979,0:40:12.197 und ich denke sofort, wie kann ich[br]das meinen Studenten vermitteln 0:40:12.197,0:40:15.248 und wie kann ich es in die Kurse, 0:40:15.248,0:40:18.531 die Arbeit, die wir machen,[br]und die Bildungseinrichtungen integrieren. 0:40:18.531,0:40:22.271 Und mir fehlt im Moment 0:40:22.511,0:40:24.116 noch das Wissen, 0:40:24.116,0:40:27.023 aber ich denke,[br]die Dokumentation, die wir haben, 0:40:27.808,0:40:29.992 vielleicht verbessert werden könnte. 0:40:29.992,0:40:33.437 Das ist also eine Art Aufforderung,[br]coole Videos zu machen, 0:40:33.437,0:40:35.898 die erklären, wie es funktioniert, 0:40:35.898,0:40:39.948 denn wenn wir das haben,[br]können wir es nutzen, 0:40:39.948,0:40:41.985 und wir können Studenten an Bord ziehen, 0:40:41.985,0:40:47.012 und wir können den Leuten verständlich[br]machen, wie fantastisch das alles ist. 0:40:47.012,0:40:52.001 Und ja, denken Sie an die Dokumentation[br]und denken Sie an die Ausbildung, bitte. 0:40:52.001,0:40:54.480 Denn ich denke, es könnte[br]eine Menge getan werden. 0:40:54.480,0:40:58.585 Dies sind schon viele Aufgaben,[br]die auch mit... 0:41:00.125,0:41:02.033 na ja, ich würde nicht sagen[br]Grundschulen, 0:41:02.033,0:41:05.495 aber sicherlich auch mit jüngeren[br]Studenten durchgeführt werden könnten. 0:41:05.915,0:41:10.793 Und deshalb würde ich es gerne sehen,[br]dass dieses Potenzial genutzt wird, 0:41:10.793,0:41:15.062 und ich persönlich verstehe[br]noch nicht genug, 0:41:15.062,0:41:19.020 um Aufgaben zu erstellen[br]oder so etwas wie... 0:41:20.300,0:41:22.275 etwas Praktisches daraus zu machen. 0:41:22.275,0:41:25.772 Wenn also jemand hier Hilfe[br]oder Gedanken dazu hat, 0:41:25.772,0:41:29.648 würde ich mich sehr freuen,[br]Ihre Ideen zu hören, und Ihre auch. 0:41:30.508,0:41:32.199 (Lydia) Ja, lassen Sie uns darüber reden. 0:41:35.453,0:41:36.949 Noch Fragen? 0:41:37.709,0:41:39.285 Jemand anderes hat die Hand gehoben. 0:41:39.285,0:41:40.715 Ich habe vergessen, wer das war. 0:41:45.739,0:41:49.779 (Person 13) Wenn wir also nicht[br]aus Wiktionary importieren können, 0:41:49.779,0:41:52.055 gibt es eine konzertierte Anstrengung, 0:41:52.055,0:41:55.772 um andere öffentlich[br]zugängliche Quellen zu finden, 0:41:55.772,0:41:57.459 vielleicht alle Daten, 0:41:58.769,0:42:03.167 und eine Art Vorfilter,[br]um sie so zu organisieren, 0:42:03.167,0:42:08.470 dass sie von Leuten beim Import[br]einfach überprüft werden können? 0:42:09.093,0:42:11.181 Es gibt also erste Bemühungen. 0:42:11.181,0:42:14.769 Nach meinem Verständnis[br]ist das Baskische eine dieser Bemühungen. 0:42:14.769,0:42:17.474 Vielleicht möchten Sie[br]etwas mehr darüber sagen? 0:42:18.426,0:42:20.130 (Person 14) [unhörbar] 0:42:23.166,0:42:27.148 Okay, die eigentliche Antwort ist,[br]dafür zu bezahlen... 0:42:28.374,0:42:31.914 Ich meine, wir haben eine Vereinbarung[br]mit einem Auftragnehmer, 0:42:31.914,0:42:33.760 mit dem wir normalerweise[br]zusammenarbeiten. 0:42:34.801,0:42:38.321 Sie machen Wörterbücher-- 0:42:40.315,0:42:42.458 viele Dinge, aber sie machen Wörterbücher. 0:42:42.458,0:42:44.734 Also haben wir mit ihnen vereinbart, 0:42:44.734,0:42:47.473 das Studenten-Wörterbuch[br]kostenlos zu machen, 0:42:47.473,0:42:52.782 wir würden die häufigsten Wörter[br]auswählen und damit beginnen, 0:42:52.782,0:42:55.590 es mit einer externen Kennung[br]und dem Schema der Dinge hochzuladen. 0:42:56.420,0:43:00.464 Aber es gab einige Diskussionen darüber, 0:43:00.464,0:43:02.722 es auf CC0 zu belassen, 0:43:03.212,0:43:05.522 weil sie das Wörterbuch[br]bei CC dabei haben, 0:43:06.537,0:43:10.065 und sie verstanden,[br]was der Unterschied war. 0:43:10.065,0:43:13.704 Es gab also einige Diskussionen. 0:43:13.704,0:43:19.246 Aber ich denke, dass wir in Zukunft[br]einige Werkzeuge oder Beispiele 0:43:19.246,0:43:20.761 zur Verfügung stellen können, 0:43:20.761,0:43:22.891 und ich denke, dass es[br]andere Wörterbücher geben wird, 0:43:22.891,0:43:24.206 mit denen wir umgehen können, 0:43:24.206,0:43:29.049 und ich denke auch, dass Wiktionary[br]in diese Richtung gehen sollte, 0:43:29.049,0:43:32.069 aber das ist eine weitere[br]umfangreiche Diskussion. 0:43:33.285,0:43:34.487 Und darüber hinaus 0:43:34.487,0:43:38.619 steht Lea auch in Kontakt[br]mit Leuten aus Okzitan, 0:43:38.619,0:43:41.827 die an okzitanischen[br]Wörterbüchern arbeiten, 0:43:41.827,0:43:45.058 und sie arbeiten derzeit an einer[br]sumerischen Zusammenarbeit. 0:43:51.504,0:43:53.253 Noch weitere Fragen? 0:44:01.487,0:44:05.349 (Person 15) Hallo! Wir sind die Leute,[br]die okzitanische Daten importieren wollen. 0:44:05.349,0:44:06.646 (Lydia) Aha! Perfekt! 0:44:06.646,0:44:08.518 (Person 15) Und wir haben[br]ein kleines Problem. 0:44:09.188,0:44:14.215 Wir wissen nicht, wie wir die Vielfalt[br]aller Lexeme darstellen können. 0:44:14.215,0:44:17.503 Wir haben sechs Dialekte, 0:44:17.503,0:44:23.754 und wir wollen für Lexeme angeben,[br]in welchem Dialekt es verwendet wird, 0:44:23.754,0:44:27.285 und wir haben keine richtige[br]C0-Anweisung, um das zu tun. 0:44:27.285,0:44:31.105 Solange das Segment also nicht existiert, 0:44:31.635,0:44:34.465 verhindert es, dass wir es[br][unhörbar] machen, 0:44:34.465,0:44:37.603 weil wir es noch einmal machen müssen, 0:44:37.603,0:44:41.956 wenn wir die Anweisung exportieren können. 0:44:41.956,0:44:44.551 Und es ist kompliziert,[br]weil es eine Aussage ist, 0:44:44.551,0:44:47.802 die nicht von vielen Leuten gefragt wird, 0:44:47.802,0:44:53.024 weil es eine Aussage ist, die vor allem[br]Minderheitensprachen betrifft. 0:44:53.254,0:44:56.933 Sie werden also eine Person haben,[br]die das fragen kann. 0:44:56.933,0:45:00.022 Aber wie unsere baskischen Kollegen 0:45:00.022,0:45:05.844 kann es eine Person sein,[br]die Tausende von anderen antreibt, 0:45:05.844,0:45:10.884 also es ist vielleicht[br]nicht sehr viel verlangt, 0:45:10.884,0:45:13.796 aber es wird für uns sehr wichtig sein. 0:45:14.874,0:45:17.410 (Lydia) Haben Sie bereits einen neuen[br]Eigenschaftenvorschlag 0:45:17.410,0:45:19.470 oder brauchen Sie Hilfe[br]bei dessen Erstellung? 0:45:21.524,0:45:24.300 (Person 15) Wir haben[br]vor vier Monaten danach gefragt. 0:45:24.720,0:45:26.689 (Lydia) Na gut, dann holen wir uns[br]ein paar Leute, 0:45:26.689,0:45:28.832 die uns bei diesem[br]Eigenschaftenvorschlag helfen. 0:45:30.159,0:45:33.152 Ich bin sicher, es sind genug Leute[br]in diesem Raum, um dies zu ermöglichen. 0:45:33.360,0:45:36.283 (Person 15) Eigenschaftenvorschlag[br][spricht Französisch]. 0:45:36.510,0:45:38.619 Wir bekamen keine Antwort[br]und wissen nicht, 0:45:38.619,0:45:40.189 wie wir das machen sollen, 0:45:40.189,0:45:42.843 weil wir nicht in der[br]Wikidata-Community sind. 0:45:44.694,0:45:48.307 (Lydia) Ja, also gibt es hier Leute,[br]die Ihnen helfen können. 0:45:48.307,0:45:51.247 Vielleicht hebt jemand die Hand, um-- 0:45:52.424,0:45:53.644 (Person 14) Nicht dafür. 0:45:53.644,0:45:55.512 Aber ich denke,[br]das ist ziemlich interessant, 0:45:55.512,0:45:58.559 dass nur die Variante der Form 0:45:58.559,0:46:02.607 auch geographisch, mit Koordinaten 0:46:02.607,0:46:04.995 oder einer Art von Kartierung,[br]damit umgehen kann. 0:46:05.595,0:46:07.815 Auch unterschiedliche[br]Aussprachen zu haben, 0:46:07.815,0:46:11.837 und ich denke, das ist etwas,[br]das in vielen Sprachen geschieht. 0:46:12.607,0:46:16.262 Wir sollten damit anfangen. 0:46:16.262,0:46:18.865 Und ich werde nach der Eigenschaft suchen. 0:46:19.782,0:46:20.933 (Lydia) Cool. 0:46:20.933,0:46:24.256 Sie erhalten also Unterstützung[br]für Ihren Eigenschaftenvorschlag. 0:46:25.936,0:46:27.297 Ich danke Ihnen. 0:46:28.153,0:46:30.261 In Ordnung, noch Fragen? 0:46:32.280,0:46:33.344 Finn. 0:46:33.774,0:46:35.095 Finn ist einer dieser Leute, 0:46:35.095,0:46:37.765 die auf lexikografischen Daten aufbauen. 0:46:37.765,0:46:40.085 (Finn) Es ist nur eine kleine Frage, 0:46:40.405,0:46:44.226 und es geht um Variationen[br]in der Rechtschreibung. 0:46:44.896,0:46:48.002 Es scheint, schwierig zu sein, sie in... 0:46:48.532,0:46:53.368 Man könnte natürlich mehrere Formen[br]für dasselbe Wort haben. 0:46:56.327,0:46:58.448 Ich weiß nicht, es scheint... 0:46:59.558,0:47:03.535 Wenn man es nicht so macht, scheint es,[br]schwierig zu sein, es zu spezifizieren... 0:47:04.611,0:47:05.888 oder ich weiß nicht, 0:47:05.888,0:47:09.591 ob es sich nur um eine kleine[br]technische Frage handelt oder ob... 0:47:09.591,0:47:11.252 (Lydia) Betrachten wir es gemeinsam. 0:47:11.642,0:47:14.990 Ich würde gerne ein Beispiel sehen. 0:47:17.478,0:47:18.478 Asaf. 0:47:26.616,0:47:28.126 (Asaf) Vielen Dank. 0:47:29.386,0:47:33.685 Ich kann ein sehr konkretes Beispiel aus[br]meiner Muttersprache, Hebräisch, nennen. 0:47:34.205,0:47:38.374 Im Hebräischen gibt es[br]zwei Hauptvarianten, 0:47:38.374,0:47:42.362 um fast jedes Wort auszudrücken, 0:47:42.506,0:47:47.270 weil die traditionelle Schreibweise 0:47:47.270,0:47:49.755 viele Vokale auslässt. 0:47:50.934,0:47:55.064 Und deshalb werden in modernen Ausgaben[br]der Bibel und der Poesie 0:47:55.064,0:47:57.251 diakritische Zeichen verwendet. 0:47:57.251,0:48:02.670 Diese diakritischen Zeichen werden[br]jedoch nie für moderne Prosa, 0:48:02.670,0:48:05.604 Zeitungstexte[br]oder Straßenschilder verwendet. 0:48:05.604,0:48:11.209 Der durchschnittliche tägliche Gebrauch[br]legt also zusätzliche Vokale hinein 0:48:12.169,0:48:13.968 und verwendet[br]die diakritischen Zeichen nicht, 0:48:13.968,0:48:15.607 weil sie natürlich umständlicher sind 0:48:15.607,0:48:18.044 und alle möglichen Regeln haben[br]und niemand die Regeln kennt. 0:48:18.633,0:48:20.531 Es gibt also grundsätzlich zwei Varianten. 0:48:20.531,0:48:25.042 Es gibt die alltägliche,[br]beiläufige Prosa-Variante, 0:48:25.042,0:48:27.827 und es gibt die Bibel oder die Poesie, 0:48:27.827,0:48:31.970 die immer in diesem traditionellen[br]diakritischierten Text vorkommen. 0:48:31.970,0:48:33.302 Um nützlich zu sein, 0:48:33.302,0:48:37.208 müsste Lexeme sowohl Varianten[br]jedes einzelnen Wortes 0:48:37.208,0:48:39.867 als auch jede einzelne Form[br]jedes einzelnen Wortes erkennen. 0:48:40.677,0:48:43.391 Das ist also ein sehr[br]umfassender Anwendungsfall 0:48:43.391,0:48:46.340 für offizielle stabile Varianten. 0:48:46.340,0:48:48.942 Es ist kein Dialekt,[br]es sind keine Regionen, 0:48:49.332,0:48:53.627 es sind im Grunde zwei nebeneinander[br]existierende morphologische Systeme. 0:48:54.537,0:48:56.656 Und auch ich weiß nicht genau, 0:48:56.656,0:48:58.926 wie ich das momentan[br]in Lexeme ausdrücken soll. 0:48:58.926,0:49:02.790 Das ist eine Sache, die mich--[br]als Teilantwort auf Magnus' Frage-- 0:49:02.790,0:49:05.238 davon abhält, die Teile hochzuladen, 0:49:05.238,0:49:09.394 die aus dem größten hebräischen[br]Wörterbuch, das öffentlich zugänglich ist 0:49:09.394,0:49:13.141 und das ich seit einigen Jahren[br]digitalisiere, stammen. 0:49:13.141,0:49:14.803 Ein guter Teil davon ist fertig, 0:49:14.803,0:49:16.549 aber ich stelle es jetzt nicht auf Lexeme, 0:49:16.549,0:49:20.018 weil ich nicht genau weiß,[br]wie ich dieses Problem lösen soll. 0:49:20.018,0:49:23.387 (Lydia) In Ordnung,[br]lösen wir das Problem hier. (lacht) 0:49:24.393,0:49:25.911 Das muss doch möglich sein. 0:49:30.045,0:49:32.047 In Ordnung, noch Fragen? 0:49:37.173,0:49:39.735 Wenn nicht,[br]dann danke ich Ihnen vielmals. 0:49:40.605,0:49:42.675 (Beifall)