0:00:02.651,0:00:05.000
Wikidata et les langues
0:00:05.000,0:00:06.303
Où en sommes-nous ?[br]Et après ?
0:00:06.303,0:00:07.362
(Lydia) Merci beaucoup.
0:00:07.362,0:00:11.417
L'un des sujets majeurs[br]de cette conférence concerne les langues.
0:00:14.220,0:00:18.508
Je voudrais vous donner un aperçu[br]du point où nous en sommes à ce jour
0:00:18.508,0:00:20.500
en ce qui concerne les langues
0:00:20.500,0:00:22.403
et quelles sont les prochaines étapes.
0:00:28.976,0:00:30.409
Le but de Wikidata est de donner
0:00:30.409,0:00:32.580
plus d'accès à plus de savoir[br]à davantage de monde
0:00:32.580,0:00:37.220
et la langue est un aspect essentiel[br]dans la réalisation de cet objectif,
0:00:38.205,0:00:43.291
d'autant plus que nos vies dépendent[br]de plus en plus de la technologie.
0:00:44.114,0:00:48.873
Et comme le disait notre conférencier[br]sur Keynote tout à l'heure,
0:00:49.603,0:00:52.440
une partie de cette technologie[br]reste inaccessible à certains
0:00:52.440,0:00:55.020
du simple fait qu'ils ne parlent pas[br]telle ou telle langue,
0:00:55.320,0:00:57.573
et ce n'est pas acceptable.
0:00:58.633,0:01:02.097
Donc nous voulons[br]remédier à cette situation.
0:01:02.927,0:01:05.841
Et afin de changer cela,[br]il faut au moins deux choses.
0:01:06.411,0:01:11.270
D'abord, on doit fournir des contenus[br]aux gens dans leur propre langue,
0:01:11.270,0:01:12.955
et la deuxième chose,
0:01:12.955,0:01:15.910
c'est de leur fournir la possibilité[br]d'interagir dans leur propre langue
0:01:15.910,0:01:19.189
avec des applications[br]ou quoi que ce soit d'autre.
0:01:20.367,0:01:25.277
Wikidata contribue à satisfaire[br]ces deux conditions.
0:01:25.277,0:01:28.408
La première d'entre elles,[br]du contenu dans votre langue,
0:01:28.408,0:01:31.317
c'est globalement ce que nous avons[br]dans les éléments et les propriétés,
0:01:31.319,0:01:33.082
la façon dont nous décrivons le monde.
0:01:33.082,0:01:35.205
Tout ce dont vous avez besoin[br]n'y est certainement pas
0:01:35.205,0:01:39.294
mais il y a déjà de quoi bien avancer.
0:01:39.764,0:01:41.847
L'autre point, c'est l'interaction[br]dans votre langue
0:01:41.847,0:01:46.389
et c'est là que les lexèmes[br]entrent en jeu :
0:01:46.389,0:01:49.382
si vous voulez parler[br]à votre assistant personnel numérique
0:01:49.382,0:01:54.918
ou que votre appareil[br]vous traduise un texte ou autre.
0:01:56.404,0:01:59.254
Très bien, intéressons-nous[br]aux contenus dans votre langue,
0:01:59.254,0:02:03.676
donc, à ce que nous avons[br]sous la rubrique Éléments et Propriétés.
0:02:05.406,0:02:10.236
Les libellés sont essentiels[br]pour ces éléments et propriétés.
0:02:10.236,0:02:14.916
Nous devons savoir comment s'appelle[br]l'entité dont il est question.
0:02:15.656,0:02:19.987
Et plutôt que de parler de Q5,
0:02:19.987,0:02:22.180
un anglophone saura[br]qu'il s'agit d'un « humain »,
0:02:22.180,0:02:24.706
un germanophone saura[br]qu'il s'agit d'un « Mensch »,
0:02:24.706,0:02:26.374
ce genre de choses.
0:02:26.374,0:02:29.872
Donc, les libellés[br]dans les éléments et les propriétés
0:02:29.872,0:02:33.619
font la liaison entre les humains[br]et les machines
0:02:33.619,0:02:35.439
mais relient aussi les humains entre eux
0:02:35.439,0:02:40.115
en leur rendant davantage[br]de savoir accessible.
0:02:41.192,0:02:43.270
À quoi ressemble notre couverture ?
0:02:43.270,0:02:46.290
L'intention est louable.
0:02:46.290,0:02:48.342
Mais voyons ce que cela donne[br]dans les faits.
0:02:48.342,0:02:49.882
Cela ressemble à ça.
0:02:50.947,0:02:52.416
Ce que vous voyez ici,
0:02:52.416,0:02:58.496
c'est que la plupart des éléments[br]dans Wikidata ont deux libellés,
0:02:58.496,0:03:00.767
donc des libellés dans deux langues.
0:03:01.697,0:03:03.851
Ensuite on passe à un, puis trois,
0:03:03.851,0:03:06.265
et au-delà, cela devient vraiment navrant.
0:03:06.781,0:03:08.581
(rires légers)
0:03:10.047,0:03:12.813
Je crois que nous devons[br]faire mieux que ça.
0:03:14.185,0:03:15.319
Mais, d'un autre côté,
0:03:15.319,0:03:17.478
je m'attendais à pire, en fait.
0:03:17.478,0:03:19.810
Je m'attendais à ce que la moyenne[br]soit d'une seule langue.
0:03:19.810,0:03:22.503
Donc, j'ai été agréablement surprise[br]de voir que c'était deux.
0:03:23.655,0:03:24.921
Quelles langues couvrons-nous ?
0:03:24.921,0:03:26.186
Très bien.
0:03:27.156,0:03:29.527
Mais au-delà de l'intérêt de savoir
0:03:29.527,0:03:33.742
de combien de libellés disposent[br]nos éléments et propriétés,
0:03:33.742,0:03:36.705
il est aussi intéressant de voir[br]quelles sont les langues de ces libellés.
0:03:38.045,0:03:43.764
Voici un graphique présentant les langues
0:03:43.764,0:03:46.838
dans lesquelles nous avons des libellés[br]pour les éléments.
0:03:46.838,0:03:50.849
La portion la plus grosse ici[br]correspond à la catégorie Autres.
0:03:51.229,0:03:53.863
Alors, je n'ai détaillé[br]que les 100 premières langues
0:03:54.533,0:03:59.122
donc tout le reste entre dans la catégorie[br]Autres pour que le graphique soit lisible.
0:03:59.542,0:04:02.142
Ensuite viennent l'anglais[br]et le néerlandais,
0:04:03.002,0:04:04.254
le français,
0:04:05.924,0:04:09.129
et n'oublions pas l'asturien.
0:04:09.659,0:04:12.069
- (un auditeur) Waouh ![br]- (Lydia) Waouh, effectivement !
0:04:13.899,0:04:16.954
Donc ce qui apparaît ici[br]est un déséquilibre considérable
0:04:16.954,0:04:20.114
avec toujours une nette[br]prédominance de l'anglais.
0:04:21.236,0:04:24.367
Par ailleurs, si l'on regarde[br]la même chose pour les propriétés,
0:04:24.367,0:04:26.099
le tableau est déjà mieux.
0:04:27.399,0:04:32.750
Je crois que cela tient en partie au fait[br]qu'il y a beaucoup moins de propriétés,
0:04:32.750,0:04:36.670
ce qui fait que même des communautés[br]plus petites peuvent assurer cette partie.
0:04:36.770,0:04:39.173
Mais cela constitue aussi[br]une partie importante de Wikidata
0:04:39.173,0:04:41.159
de pouvoir les adapter dans votre langue.
0:04:41.159,0:04:42.494
Donc c'est un point positif.
0:04:45.752,0:04:47.962
Ce que je voulais souligner ici[br]à propos de l'asturien,
0:04:47.962,0:04:53.698
c'est qu'une petite communauté[br]peut vraiment se démarquer
0:04:54.448,0:04:57.085
par son investissement et son travail,
0:04:57.085,0:04:58.420
et c'est vraiment chouette.
0:05:01.846,0:05:03.530
Une petite devinette pour vous.
0:05:03.530,0:05:05.493
Si vous prenez toutes[br]les propriétés de Wikidata
0:05:05.493,0:05:07.687
qui n'ont pas d'identifiants externes,
0:05:07.687,0:05:10.778
laquelle compte selon vous le plus grand[br]nombre de libellés, donc de langues ?
0:05:10.977,0:05:13.847
(réponses inaudibles de l'auditoire)
0:05:13.847,0:05:16.886
Il semble se dégager une majorité[br]pour « nature de l'élément ».
0:05:17.506,0:05:19.603
Ce serait une mauvaise réponse.
0:05:19.983,0:05:22.210
La réponse est « image ».
0:05:23.230,0:05:26.006
Donc, effectivement,[br]si vous parlez l'une des langues
0:05:26.006,0:05:28.621
pour lesquelles « nature de l'élément »[br]n'a pas encore de libellé,
0:05:28.621,0:05:30.190
vous savez ce qu'il vous reste à faire.
0:05:32.102,0:05:35.676
Donc, « image » dispose[br]de 148 libellés actuellement.
0:05:37.688,0:05:41.249
Mais c'est une autre diapositive.
0:05:42.521,0:05:44.162
Ce graphique nous donne une idée
0:05:44.162,0:05:49.321
du volume de contenu que nous rendons[br]accessible dans une langue donnée
0:05:49.321,0:05:52.042
et dans quelle proportion ce contenu[br]est effectivement utilisé.
0:05:52.042,0:05:55.448
Donc en gros, on peut voir[br]se dessiner une courbe
0:05:55.448,0:05:59.057
où la majorité des contenus[br]disposant de libellés en anglais,
0:05:59.307,0:06:04.105
étant disponibles en anglais[br]sont aussi largement utilisés.
0:06:04.295,0:06:06.449
Puis ça a tendance à diminuer.
0:06:06.449,0:06:09.436
Mais à nouveau,[br]on peut noter des exceptions
0:06:09.436,0:06:15.333
qui ont beaucoup plus de contenus[br]qu'on aurait pu s'y attendre,
0:06:16.903,0:06:19.539
et c'est une très bonne chose.
0:06:20.839,0:06:24.945
Le problème demeure que ces contenus[br]ne sont pas très utilisés.
0:06:25.565,0:06:28.742
L'asturien et le néerlandais devraient[br]être en meilleure position
0:06:28.742,0:06:31.994
et je crois qu'aider ces communautés
0:06:33.266,0:06:35.716
à accroître l'utilisation des données[br]qu'elles ont rassemblées
0:06:35.716,0:06:37.792
est quelque chose de très utile.
0:06:42.910,0:06:48.110
Ce que cette analyse ainsi que d'autres[br]nous ont révélé de positif,
0:06:48.300,0:06:51.378
c'est que les éléments les plus utilisés
0:06:51.378,0:06:55.295
ont aussi tendance[br]à avoir plus de libellés
0:06:55.295,0:06:58.538
à moins que ça ne marche en sens inverse ;[br]ce n'est pas tout à fait clair.
0:07:02.513,0:07:04.596
Et la question qui se pose alors, c'est :
0:07:04.596,0:07:07.269
Sommes-nous seulement au service[br]des langues les plus puissantes ?
0:07:07.899,0:07:11.197
Ou sommes-nous[br]au service de tout le monde ?
0:07:12.757,0:07:17.743
Et ce que vous voyez ici,[br]ce sont des regroupements de langues.
0:07:17.743,0:07:19.642
Les langues que nous avons[br]regroupées ensemble
0:07:19.642,0:07:21.987
ont tendance à avoir[br]des libellés en commun.
0:07:26.042,0:07:28.219
Et vous voyez se former des faisceaux.
0:07:28.599,0:07:34.065
À présent, voici un même type[br]de regroupement avec différentes couleurs,
0:07:34.065,0:07:39.475
selon que la langue est plus ou moins[br]vivante, plus ou moins largement utilisée
0:07:40.455,0:07:43.156
ou menacée de disparition.
0:07:43.156,0:07:44.642
Et la bonne chose qui apparaît ici,
0:07:44.642,0:07:49.566
c'est que les langues dominantes[br]et les langues menacées de disparition
0:07:49.566,0:07:53.773
ne constituent pas[br]deux groupes différents,
0:07:53.773,0:07:58.872
mais qu'elles sont toutes[br]mélangées ensemble,
0:08:00.262,0:08:04.625
ce qui est bien plus réjouissant[br]que si la situation avait été inverse
0:08:04.625,0:08:09.377
et que les langues les plus assurées,[br]les langues dominantes
0:08:10.197,0:08:12.164
s'étaient mutuellement soutenues.
0:08:12.744,0:08:14.356
Ce n'est pas le cas.
0:08:14.356,0:08:17.417
Et c'est une très bonne chose.
0:08:17.417,0:08:20.042
J'ai trouvé que c'était[br]un très bon signe quand j'ai vu ça.
0:08:23.474,0:08:25.229
Voici un autre exemple similaire
0:08:26.239,0:08:28.800
où nous avons regardé
0:08:30.230,0:08:34.222
le statut des langues
0:08:34.222,0:08:36.225
et le nombre de libellés[br]dont elles disposent.
0:08:39.367,0:08:42.937
Ce qui apparaît, c'est que les langues[br]fortes dominent clairement,
0:08:42.937,0:08:44.438
comme on pouvait s'y attendre.
0:08:45.508,0:08:46.693
Mais ce que l'on voit aussi,
0:08:46.693,0:08:54.407
c'est que les langues des catégories 2,[br]3 et peut-être même 4
0:08:54.407,0:08:59.280
ne s'en tirent pas si mal en fait,
0:08:59.280,0:09:02.367
au niveau de leur représentation[br]sur Wikidata,
0:09:03.287,0:09:06.408
ce qui est vraiment[br]un résultat réjouissant.
0:09:07.556,0:09:09.129
Maintenant, si on regarde[br]la même chose
0:09:09.129,0:09:12.418
sous l'angle de la proportion[br]de contenu de ces libellés
0:09:12.418,0:09:15.495
qui est effectivement utilisée[br]dans Wikipédia, par exemple,
0:09:17.455,0:09:22.563
on voit à nouveau se dessiner[br]la même tendance.
0:09:23.603,0:09:29.813
Et cela nous révèle que ces communautés[br]font vraiment bon usage de leur temps
0:09:29.813,0:09:34.504
en créant des libellés pour les éléments[br]les plus utilisés, par exemple.
0:09:36.410,0:09:40.493
Il y a des exceptions[br]que nous devons pouvoir soutenir
0:09:41.683,0:09:48.202
en aidant ces communautés à mieux[br]valoriser leur investissement.
0:09:49.312,0:09:52.663
Mais de façon générale,[br]cette image me paraît réjouissante.
0:09:54.823,0:09:59.844
Voilà pour ce qui était de la partie[br]éléments et propriétés de Wikidata.
0:10:00.714,0:10:03.033
Regardons à présent les interactions[br]dans vos langues.
0:10:03.033,0:10:05.203
Donc le volet lexème de Wikidata,
0:10:05.203,0:10:09.394
où il s'agit de décrire les mots,[br]leur forme et leur signification.
0:10:10.167,0:10:13.301
C'est un travail que nous avons[br]démarré en mai de l'année dernière
0:10:16.461,0:10:19.127
et le contenu[br]n'a cessé de se développer.
0:10:20.114,0:10:22.149
Ici, on voit les lexèmes en bleu,
0:10:22.149,0:10:25.938
en rouge, les formes de ces lexèmes
0:10:25.938,0:10:29.910
et en jaune, les significations[br]de ces lexèmes.
0:10:30.991,0:10:34.451
Donc certaines communautés,[br]nous y reviendrons plus tard,
0:10:34.451,0:10:38.523
ont consacré beaucoup de temps[br]à créer des formes et des significations
0:10:38.523,0:10:42.753
pour leurs lexèmes, ce qui est très utile
0:10:42.753,0:10:48.243
car cela constitue l'essence[br]des données dont vous avez besoin.
0:10:50.562,0:10:55.133
Maintenant, nous avons regardé[br]toutes les langues
0:10:55.133,0:10:57.906
qui ont des lexèmes sur Wikidata,
0:10:57.906,0:11:01.003
donc les mots que nous avons.
0:11:01.603,0:11:04.524
Ces derniers sont[br]actuellement en 310 langues.
0:11:04.884,0:11:08.290
Maintenant, quelle est,[br]à votre avis, la première langue
0:11:08.290,0:11:11.949
en termes de nombre de lexèmes[br]actuellement sur Wikidata ?
0:11:11.949,0:11:14.677
(réponses fusant de l'auditoire)[br]Le suédois, le russe,
0:11:14.677,0:11:16.350
l'asturien, l'allemand
0:11:16.350,0:11:20.216
- (un intervenant parle hors micro)[br]- Hein ?
0:11:20.216,0:11:21.741
(un autre intervenant) L'allemand.
0:11:21.741,0:11:24.252
Désolée, la bonne réponse a été donnée.
0:11:24.252,0:11:25.651
C'est le russe.
0:11:28.011,0:11:29.924
Le russe est loin devant.
0:11:31.897,0:11:33.832
Et pour vous donner une perspective,
0:11:35.412,0:11:36.816
les opinions divergent à ce sujet,
0:11:36.816,0:11:42.231
mais j'ai lu, par exemple,[br]que connaître 1 000 à 3 000 mots
0:11:42.231,0:11:45.450
vous permet d'accéder au niveau[br]courant dans une autre langue.
0:11:45.450,0:11:49.721
et qu'en connaître 4 000 à 10 000[br]vous situe à un niveau avancé.
0:11:51.591,0:11:55.372
Donc nous avons encore[br]du chemin à faire pour en arriver là.
0:11:58.483,0:12:03.279
J'aimerais attirer votre attention[br]sur la langue basque
0:12:03.279,0:12:07.744
qui a environ 10 000 lexèmes.
0:12:09.244,0:12:13.003
Or, si vous regardez le nombre[br]de formes pour ces lexèmes,
0:12:14.163,0:12:16.497
le basque est très bien placé,
0:12:18.257,0:12:20.006
ce qui est vraiment bien
0:12:20.006,0:12:22.434
et il serait intéressant[br]d'assister à l'exposé
0:12:22.434,0:12:25.315
qui vous expliquera cet état de fait.
0:12:27.341,0:12:31.175
Maintenant, si on regarde le nombre[br]de sens, ce que les mots signifient,
0:12:32.015,0:12:35.081
le basque arrive en tête de la liste.
0:12:35.081,0:12:37.102
Il me semble que cela mérite[br]nos applaudissements.
0:12:37.102,0:12:38.921
(applaudissements)
0:12:45.678,0:12:47.118
Une autre devinette.
0:12:47.118,0:12:50.511
Quel est le lexème le plus traduit[br]à l'heure actuelle, selon vous ?
0:12:50.511,0:12:54.304
(public) Les chats, les chats,[br]Douglas Adams
0:12:54.304,0:12:55.914
(rires)
0:12:56.766,0:13:00.014
Ce sont toutes de bonnes idées, mais non.
0:13:01.012,0:13:04.137
Voici la bonne réponse :[br]c'est le mot russe qui désigne l'eau.
0:13:09.301,0:13:12.253
Très bien, nous avons beaucoup parlé
0:13:12.253,0:13:16.412
du nombre de formes et de sens[br]des lexèmes que nous avons,
0:13:16.412,0:13:20.453
mais ce n'est qu'une partie[br]de ce dont vous avez besoin.
0:13:20.453,0:13:21.872
L'autre chose dont vous avez besoin
0:13:21.872,0:13:25.161
c'est une description[br]des formes et des sens de ces lexèmes,
0:13:25.161,0:13:27.647
dans un format qui soit lisible[br]par des machines.
0:13:27.647,0:13:30.679
Et pour cela, vous avez des déclarations,[br]comme dans les éléments.
0:13:31.479,0:13:36.362
Et l'une des propriétés utilisées ici[br]est l'exemple d'utilisation.
0:13:36.362,0:13:38.582
De sorte que quiconque utilisera[br]cette donnée
0:13:38.582,0:13:42.089
pourra comprendre comment[br]utiliser ce mot dans un contexte,
0:13:42.089,0:13:44.648
il peut s'agir[br]d'une citation, par exemple.
0:13:45.396,0:13:47.343
Et dans ce domaine, le polonais assure !
0:13:47.820,0:13:50.109
Bien joué, à vous qui parlez polonais.
0:13:54.219,0:13:57.680
Une autre propriété qui est[br]vraiment utile, c'est l'API,
0:13:57.680,0:14:00.186
donc la manière de prononcer le mot.
0:14:00.876,0:14:07.577
Il semble que le russe exige[br]de nombreuses déclarations API.
0:14:10.419,0:14:13.314
Mais revoici le polonais[br]en deuxième position.
0:14:17.148,0:14:20.753
Et enfin, nous avons[br]la prononciation audio.
0:14:20.753,0:14:23.472
Il s'agit là de liens vers des fichiers[br]hébergés sur les Commons
0:14:23.472,0:14:25.959
où un individu prononce le mot,
0:14:25.959,0:14:28.500
ce qui vous permet d'entendre[br]le mot prononcé par quelqu'un
0:14:28.500,0:14:29.913
dont c'est la langue natale,
0:14:29.913,0:14:32.871
pour le cas où vous ne sauriez pas[br]déchiffrer l'API, par exemple.
0:14:34.959,0:14:39.205
Et il existe un projet vraiment sympa[br]sous l'impulsion de Wiki
0:14:39.205,0:14:40.884
qui s'appelle « Lingua Libre »
0:14:40.884,0:14:45.173
auquel vous pouvez contribuer[br]en enregistrant des mots dans votre langue
0:14:45.173,0:14:47.966
qui pourront ensuite être ajoutés[br]aux lexèmes sur Wikidata
0:14:48.446,0:14:52.103
afin que d'autres puissent[br]apprendre à prononcer vos mots.
0:14:53.663,0:14:55.694
(propos inaudibles d'un intervenant)
0:14:55.694,0:14:57.665
Si vous recherchez « Lingua Libre »
0:14:57.665,0:15:00.981
et je suis sûre que quelqu'un[br]pourra poster le lien sur Telegram.
0:15:03.138,0:15:04.621
Ces gars-là sont super.
0:15:04.621,0:15:06.726
Ils ont fait un travail formidable[br]avec Wikibase.
0:15:09.416,0:15:10.617
Très bien.
0:15:12.706,0:15:17.285
La question qui se pose à présent est :[br]quelles sont les prochaines étapes ?
0:15:19.165,0:15:22.010
Si l'on en croit les chiffres[br]que je viens de vous montrer,
0:15:23.030,0:15:25.172
nous avons bien avancé
0:15:25.172,0:15:28.430
vers notre objectif de donner plus d'accès[br]à plus de savoir à davantage de gens
0:15:28.430,0:15:31.240
dans le domaine des langues sur Wikidata.
0:15:32.530,0:15:36.392
Mais nous avons encore beaucoup[br]de travail à accomplir.
0:15:38.992,0:15:42.341
Une des choses que vous pouvez faire[br]pour contribuer au projet,
0:15:42.341,0:15:44.921
c'est par exemple de lancer[br]une opération « libelléthon »,
0:15:44.921,0:15:50.124
consistant à inciter des gens[br]à créer des libellés sur Wikidata
0:15:50.914,0:15:55.121
ou une campagne de révision[br]des lexèmes dans votre langue
0:15:55.121,0:15:57.372
pour assurer la présence sur Wikidata
0:15:57.372,0:15:59.792
des mots les plus usités[br]dans votre langue.
0:16:00.773,0:16:03.285
Vous pouvez aussi utiliser[br]un outil comme Terminator
0:16:03.285,0:16:07.211
qui vous aide à identifier[br]les éléments les plus importants
0:16:07.211,0:16:11.699
mais ne disposant pas encore[br]d'un libellé dans votre langue.
0:16:13.274,0:16:18.359
Nous qualifions ici de « plus importants »[br]les éléments les plus fréquemment utilisés
0:16:18.359,0:16:22.553
dans d'autres éléments Wikidata[br]en tant que liens dans les déclarations.
0:16:25.768,0:16:30.022
Et bien entendu, pour la partie lexèmes,
0:16:31.342,0:16:35.169
à présent que nous avons couvert[br]l'essentiel des lexèmes,
0:16:35.169,0:16:41.163
il s'agit de les élaborer[br]en y ajoutant des déclarations
0:16:41.163,0:16:44.401
afin qu'ils puissent réellement[br]construire les bases
0:16:44.401,0:16:47.421
sur lesquelles des applications[br]significatives pourront se développer.
0:16:48.141,0:16:50.795
Parce que nous nous rapprochons[br]de la masse critique
0:16:50.795,0:16:53.616
mais nous sommes encore loin
0:16:53.616,0:16:56.624
de la situation permettant de bâtir[br]de sérieuses applications sur ces bases.
0:16:58.277,0:17:01.680
Et j'espère que vous allez tous[br]joindre vos efforts pour atteindre ce but.
0:17:02.583,0:17:07.103
Ce qui m'amène tout droit
0:17:07.103,0:17:09.843
à solliciter les amis qui nous soutiennent
0:17:09.843,0:17:12.812
et Bruno, veux-tu bien me rejoindre
0:17:13.882,0:17:16.854
pour nous parler des masques lexicaux ?
0:17:17.541,0:17:18.567
(Bruno) Merci, Lydia.
0:17:18.567,0:17:21.519
Merci de m'accorder un petit moment
0:17:21.519,0:17:24.150
pour présenter ce travail[br]que nous effectuons à Google
0:17:24.150,0:17:29.635
avec Denny et dont la plupart d'entre vous[br]ont probablement entendu parler.
0:17:30.136,0:17:31.878
Parce que je suis linguiste[br]chez Google,
0:17:31.878,0:17:33.760
et je suis aussi très heureux[br]de me trouver ici
0:17:33.760,0:17:36.620
en compagnie d'autres[br]passionnés des langues,
0:17:36.620,0:17:39.278
et chez Google, nous construisons[br]aussi des lexiques
0:17:39.278,0:17:41.766
et nous avons développé cette technologie
0:17:41.766,0:17:45.589
ou cette approche dont nous pensons[br]qu'elle peut vous être utile.
0:17:46.369,0:17:48.455
Pour vous expliquer un peu le contexte,
0:17:48.455,0:17:52.068
vous pouvez voir ici mes références[br]en matière de lexicographie.
0:17:52.668,0:17:54.667
Pour créer une base[br]de données lexicographiques,
0:17:54.667,0:17:58.623
nous consacrons beaucoup de temps[br]et d'efforts à maintenir une cohérence
0:17:58.623,0:18:00.125
et à échanger des données,
0:18:00.125,0:18:02.027
comme vous le savez probablement.
0:18:02.417,0:18:03.809
Il existe plusieurs tentatives
0:18:03.809,0:18:06.081
visant à unifier les caractéristiques[br]et les propriétés
0:18:06.081,0:18:09.184
qui décrivent ces lexèmes et ces formes
0:18:09.184,0:18:10.936
et la question n'est pas encore réglée
0:18:10.936,0:18:13.958
mais des tentatives sont en cours[br]pour aller dans le sens d'une unification.
0:18:13.958,0:18:15.209
Mais ce qui manque réellement,
0:18:15.209,0:18:17.312
et c'est un problème auquel[br]nous avons été confrontés
0:18:17.312,0:18:18.732
chez Google au début du projet,
0:18:18.732,0:18:21.757
c'est de tenter de construire[br]une structure interne
0:18:22.197,0:18:25.910
décrivant à quoi devrait ressembler[br]une entrée lexicale,
0:18:25.910,0:18:28.581
le type de données ou d'informations[br]dont nous disposons
0:18:28.581,0:18:32.237
et le degré de spécification attendu.
0:18:32.237,0:18:38.187
Et voici ce à quoi nous avons abouti[br]et qui s'appelle le « masque lexical ».
0:18:38.897,0:18:43.639
Un masque lexical décrit[br]les données attendues
0:18:43.639,0:18:47.369
pour qu'une entrée lexicographique [br]puisse être considérée comme complète
0:18:47.369,0:18:51.436
à la fois quant au nombre de formes[br]qu'un lexème devrait avoir
0:18:51.436,0:18:55.607
et quant au nombre de caractéristiques[br]attendues pour chacune de ces formes.
0:18:56.307,0:18:58.409
Voici un exemple portant[br]sur les adjectifs italiens.
0:18:58.409,0:19:02.002
En italien, on devrait trouver[br]quatre formes pour les adjectifs
0:19:02.002,0:19:05.383
et chacune de ces formes[br]reflète une combinaison spécifique
0:19:05.383,0:19:07.946
de caractéristiques de genre et de nombre.
0:19:08.606,0:19:12.672
C'est ce qui est attendu[br]en matière d'adjectifs italiens.
0:19:12.672,0:19:16.176
Bien sûr, on peut avoir des masques[br]extrêmement complexes,
0:19:16.176,0:19:20.783
comme pour les conjugaisons françaises[br]qui sont très fournies
0:19:20.783,0:19:23.487
et je ne vous présente pas[br]un masque russe quel qu'il soit,
0:19:23.487,0:19:25.378
parce qu'il déborderait de l'écran.
0:19:26.308,0:19:29.531
Et nous avons aussi[br]des spécifications détaillées
0:19:29.531,0:19:33.421
parce que nous distinguons[br]ce qui se situe au niveau de la forme.
0:19:33.421,0:19:37.544
Donc ici vous voyez les noms russes[br]qui comportent trois nombres
0:19:37.544,0:19:40.048
ainsi qu'un nombre de cas[br]avec différentes formes
0:19:40.048,0:19:43.086
mais ils ont également[br]une spécification au niveau de l'entrée
0:19:43.086,0:19:45.590
qui indique qu'un nom
0:19:45.590,0:19:47.073
a un genre inhérent
0:19:47.073,0:19:50.133
ainsi qu'une caractéristique[br]d'animéité inhérente
0:19:50.133,0:19:52.688
qui est également précisée dans le masque.
0:19:54.518,0:19:58.779
Nous voulons aussi préciser[br]qu'un masque indique une spécification
0:19:58.779,0:20:01.874
de ce à quoi devrait ressembler[br]une entrée, de manière générale.
0:20:01.874,0:20:07.158
Mais vous pouvez avoir des masques[br]plus petits en cas de formes réduites
0:20:07.158,0:20:11.282
ou d'aspects limités de l'utilisation[br]du lexème dans la langue.
0:20:11.282,0:20:14.537
Voici par exemple la version[br]la plus simple de verbes en français
0:20:14.537,0:20:17.584
qui ne se conjuguent qu'à la troisième[br]personne du singulier,
0:20:17.584,0:20:19.930
les verbes désignant[br]les phénomènes météorologiques
0:20:19.930,0:20:23.969
comme « il pleut » ou « il neige »,[br]comme c'est aussi le cas en anglais.
0:20:24.537,0:20:26.923
Donc, nous faisons la distinction[br]entre ces deux niveaux.
0:20:26.923,0:20:29.962
Et la façon dont nous utilisons[br]cela chez Google,
0:20:29.962,0:20:32.643
quand nous avons un lexique[br]que nous voulons utiliser,
0:20:33.063,0:20:38.219
nous utilisons le masque[br]pour carrément y déverser le lexique
0:20:38.219,0:20:40.283
et toutes ses entrées,[br]qui vont traverser le masque
0:20:40.283,0:20:44.303
et nous voyons quelles entrées posent[br]un problème en termes de structure.
0:20:44.303,0:20:46.673
Manque-t-il une forme ?[br]Manque-t-il une caractéristique ?
0:20:46.673,0:20:48.563
Et quand un problème se présente,
0:20:48.563,0:20:51.497
nous avons recours[br]à une validation humaine
0:20:51.497,0:20:53.751
pour vérifier si l'entrée passe[br]l'épreuve du masque.
0:20:53.751,0:20:57.924
C'est donc un outil extrêmement puissant[br]pour vérifier la qualité de la structure.
0:20:59.427,0:21:01.964
Et nous sommes heureux[br]de vous annoncer aujourd'hui
0:21:01.964,0:21:05.408
que nous avons eu le feu vert[br]pour ouvrir notre masque à l'open source.
0:21:05.948,0:21:07.469
Donc voici le schéma.
0:21:07.469,0:21:09.697
Si vous le voulez, nous pouvons[br]le mettre à disposition
0:21:09.697,0:21:13.483
et le fournir à Wikidata[br]sous forme de fichiers Shex.
0:21:13.483,0:21:16.688
Voici un fichier Shex[br]pour les noms allemands
0:21:16.688,0:21:20.428
et Denny travaille à le convertir[br]pour passer de nos spécifications internes
0:21:20.428,0:21:23.666
à une spécification[br]plus appropriée à l'open source
0:21:23.666,0:21:27.522
Nous couvrons actuellement[br]plus de 25 langues.
0:21:27.522,0:21:29.495
Nous espérons développer[br]cette offre de notre côté
0:21:29.495,0:21:34.350
mais nous y voyons aussi une opportunité[br]de collaboration pour ajouter des langues.
0:21:34.350,0:21:40.728
Et l'une de ces collaborations est celle[br]que Denny entretient avec Lukas.
0:21:40.728,0:21:45.052
Lukas dispose d'outils fantastiques[br]permettant une interface utilisateur
0:21:45.052,0:21:48.525
pour permettre à l'utilisateur[br]ou au contributeur
0:21:48.525,0:21:51.061
d'ajouter davantage de formes.
0:21:51.061,0:21:54.151
Donc si vous voulez ajouter[br]un adjectif en français,
0:21:54.151,0:21:59.057
l'IU vous indiquera le nombre[br]de formes à fournir
0:21:59.057,0:22:01.562
et les caractéristiques[br]que ces formes devraient avoir.
0:22:01.562,0:22:06.268
Ainsi notre masque permettra à cet outil[br]de s'affiner et de se développer.
0:22:07.238,0:22:08.385
Et voilà.
0:22:08.791,0:22:10.358
(Lydia) Merci infiniment.
0:22:10.358,0:22:11.993
(applaudissements)
0:22:14.249,0:22:16.891
(Lydia) Très bien.[br]Avez-vous des questions ?
0:22:16.891,0:22:19.381
Souhaitez-vous que nous parlions[br]davantage des lexèmes ?
0:22:19.774,0:22:21.885
- (intervenant 1) Oui.[br]- (Lydia) Oui. (petit rire)
0:22:33.485,0:22:35.380
- (intervenant 1) Vous parliez
0:22:35.380,0:22:39.106
de donner plus d'accès[br]à plus de gens dans plus de langues,
0:22:39.106,0:22:42.444
mais beaucoup de langues ne peuvent pas[br]être utilisées dans Wikidata.
0:22:42.444,0:22:44.838
Quelle solution avez-vous[br]pour résoudre cela ?
0:22:45.079,0:22:47.686
Quand vous dites qu'elles[br]ne peuvent pas utiliser Wikidata,
0:22:47.686,0:22:50.208
est-ce que vous parlez[br]d'intégrer des libellés ?
0:22:50.208,0:22:52.581
- (i.1) Des libellés, des descriptions.[br]- D'accord.
0:22:52.581,0:22:55.498
Donc, en ce qui concerne[br]les lexèmes, c'est un peu différent,
0:22:55.498,0:22:58.003
parce que cette restriction[br]ne s'applique pas ici.
0:22:58.923,0:23:05.003
Pour les libellés des éléments[br]et propriétés, des restrictions existent
0:23:05.433,0:23:10.551
parce que nous voulions nous assurer
0:23:10.551,0:23:14.229
que n'importe qui ne puisse pas[br]faire n'importe quoi
0:23:14.229,0:23:17.769
et que cela devienne ingérable.
0:23:19.349,0:23:23.328
Si une communauté, même petite,[br]veut ajouter une langue et y travailler,
0:23:23.898,0:23:26.787
venez en discuter avec nous[br]et nous pourrons rendre cela possible.
0:23:26.787,0:23:29.470
(i.1) Nous l'avons fait à l'occasion[br]du Hackathon de Prague en mai
0:23:29.470,0:23:32.576
et il nous a fallu attendre le mois d'août[br]pour pouvoir utiliser notre langue.
0:23:32.576,0:23:35.135
- Oui.[br]- (i.1) Donc, c'est très lent.
0:23:35.135,0:23:37.854
Oui, c'est malheureusement très lent.
0:23:37.854,0:23:40.093
Nous travaillons actuellement[br]avec le Comité des langues
0:23:40.093,0:23:46.048
à la résolution[br]de certains points fondamentaux...
0:23:49.537,0:23:55.447
Comme par exemple parvenir à un accord[br]sur les langues qui sont « autorisées »
0:23:56.047,0:23:59.468
et cela nous a pris trop de temps,
0:23:59.988,0:24:02.258
ce qui explique pourquoi votre demande
0:24:02.258,0:24:04.868
a probablement mis plus de temps[br]à aboutir qu'elle ne l'aurait dû.
0:24:04.868,0:24:05.963
(i.1) Merci.
0:24:06.705,0:24:07.800
(intervenant 2) Merci.
0:24:07.800,0:24:10.938
Lydia, vous vous souvenez des statistiques[br]que vous nous avez montrées,
0:24:10.938,0:24:12.886
sur le nombre de lexèmes par langue ?
0:24:12.886,0:24:17.599
Avez-vous pris chaque forme[br]comme unité de calcul
0:24:17.599,0:24:20.034
ou seulement les lexèmes ?
0:24:21.159,0:24:22.941
Vous faites référence à ceci ?
0:24:22.941,0:24:25.797
- De quelle diapo parlez-vous ?[br]- (i.2) Oui, c'est exactement cela.
0:24:25.797,0:24:28.341
Si vous vous rappelez,[br]ce nombre représente-t-il
0:24:28.341,0:24:31.954
toutes les formes de tous les lexèmes[br]où seulement les lexèmes existants ?
0:24:31.954,0:24:35.395
- Non, ce sont seulement des lexèmes.[br]- (i.2) Uniquement les lexèmes, d'accord.
0:24:35.395,0:24:36.897
Alors la statistique est correcte.
0:24:36.897,0:24:39.390
Parce que si vous aviez pris[br]les formes en compte,
0:24:39.390,0:24:40.748
et c'est la raison de ma question,
0:24:40.748,0:24:43.074
alors toutes les langues ayant[br]une morphologie flexionnelle
0:24:43.074,0:24:45.027
comme le russe, le serbe, le slovène, etc.
0:24:45.027,0:24:47.616
seraient naturellement avantagées[br]tant elles ont de formes.
0:24:47.616,0:24:51.990
C'est ici que c'est manifeste,[br]sur le nombre de formes.
0:24:51.990,0:24:54.141
(intervenant 2) Oui,[br]c'était bien celle-ci. Merci.
0:24:56.546,0:25:00.224
(intervenant 3) Une petite question[br]concernant...
0:25:00.644,0:25:06.824
Quand nous parlons des éléments[br]et propriétés à proprement parler,
0:25:07.124,0:25:08.901
Pour autant que je sache,
0:25:08.901,0:25:11.955
il n'y a à l'heure actuelle aucun moyen[br]d'identifier une source
0:25:11.955,0:25:14.726
pour n'importe lequel des libellés[br]et descriptions qui sont fournis.
0:25:14.726,0:25:18.047
Donc, par exemple, [br]quand vous parlez
0:25:18.047,0:25:20.920
d'une propriété d'un élément,
0:25:20.920,0:25:24.509
vous pouvez être confronté[br]à des libellés contradictoires.
0:25:24.509,0:25:25.739
Oui.
0:25:25.739,0:25:27.862
(i.3) Donc, disons[br]que telle personne est...
0:25:28.302,0:25:30.920
Nous parlions tout à l'heure[br]des questions indigènes, par exemple.
0:25:30.920,0:25:35.965
Donc telle personne est un artiste[br]norvégien selon telle source
0:25:35.965,0:25:38.750
et un artiste sami[br]selon telle autre source.
0:25:39.550,0:25:42.883
Ou par exemple, la question[br]s'est posée pour l'estonien
0:25:42.883,0:25:47.729
et nous avons dû revoir la terminologie[br]en fonction de la terminologie officielle
0:25:47.729,0:25:49.667
telle qu'elle figure[br]dans les lexiques officiels,
0:25:49.667,0:25:52.262
mais nous n'avons aucun moyen[br]d'indiquer quelle en est la raison,
0:25:52.262,0:25:54.426
quelle en est la source[br]et pourquoi c'est plus juste
0:25:54.426,0:25:55.658
que ce qu'il y avait avant.
0:25:55.658,0:25:57.150
C'est un simple quidam comme moi
0:25:57.150,0:25:59.615
qui a remplacé la donnée[br]pour qui la verra.
0:25:59.615,0:26:02.520
Donc est-il prévu de rendre cela possible[br]d'une manière ou d'une autre
0:26:02.520,0:26:06.605
afin que nous puissions avoir de vraies[br]sources pour les données linguistiques ?
0:26:07.045,0:26:11.568
Alors, c'est en partie possible.
0:26:11.568,0:26:16.088
Donc, par exemple, quand vous avez[br]un élément portant sur une personne,
0:26:16.898,0:26:22.720
vous avez dans les déclarations :[br]prénom, nom, etc., de cette personne
0:26:22.720,0:26:26.406
et vous pouvez fournir la référence[br]correspondante à ce niveau-là.
0:26:28.101,0:26:32.544
J'ai beaucoup de réserves[br]quant à rendre les choses plus complexes
0:26:32.544,0:26:35.557
avec des références[br]sur les libellés et les descriptions,
0:26:35.557,0:26:38.624
mais si les gens pensent vraiment
0:26:38.624,0:26:44.939
que c'est quelque chose qui n'est couvert[br]par aucune référence sur la déclaration,
0:26:44.939,0:26:46.803
alors parlons-en.
0:26:49.079,0:26:53.303
Mais je crains que cela n'entraîne[br]beaucoup de complexité
0:26:53.303,0:26:56.523
pour des occurrences dont j'espère[br]qu'elles sont peu nombreuses,
0:26:57.393,0:27:00.188
mais je veux bien être[br]convaincue du contraire,
0:27:00.188,0:27:04.087
si les gens y tiennent beaucoup.
0:27:04.087,0:27:08.177
(i.3) Je veux dire, si c'est ajouté[br]ce ne devrait pas être impératif
0:27:08.177,0:27:12.452
et apparaître à tous les utilisateurs[br]débutant dans l'interface en tout cas.
0:27:12.452,0:27:13.580
Plutôt quelque chose comme :
0:27:13.580,0:27:16.761
« Cliquez ici si vous avez[br]des commentaires à faire à ce sujet ».
0:27:17.632,0:27:23.368
A-t-on une idée du nombre[br]de cas où cela aurait de l'importance ?
0:27:24.520,0:27:26.423
(i.3) En estonien, par exemple,
0:27:26.423,0:27:29.164
et je suppose que c'est aussi le cas[br]dans d'autres langues,
0:27:29.164,0:27:34.203
il existe un mot officiel,[br]qui est la traduction légitime
0:27:34.203,0:27:36.206
par exemple, en anglais,
0:27:36.206,0:27:40.314
disons d'un type particulier[br]de municipalité.
0:27:40.314,0:27:41.746
C'était mon cas pratique,
0:27:41.746,0:27:44.409
par exemple, où nous utilisions[br]le mot « paroisse »
0:27:45.159,0:27:50.775
où effectivement le mot estonien original[br]avait le sens de paroisse d'église
0:27:50.775,0:27:51.999
et c'était là l'origine du mot
0:27:51.999,0:27:53.699
mais ce n'est plus[br]la traduction officielle
0:27:53.699,0:27:55.189
qu'en donne l'Estonie aujourd'hui.
0:27:55.189,0:27:57.531
Dans ce cas, je l'ajouterais [br]dans les déclarations
0:27:57.531,0:28:00.817
en tant que nom officiel[br]et c'est là que j'ajouterais la référence.
0:28:02.032,0:28:03.158
(intervenant 3) D'accord.
0:28:05.186,0:28:06.952
D'autres questions, oui ?
0:28:07.682,0:28:10.044
(intervenant 4) J'aimerais faire[br]deux courtes remarques.
0:28:10.044,0:28:13.934
Vous avez mis l'asturien en avant[br]comme une langue réussissant bien
0:28:13.934,0:28:16.455
et je pense qu'il s'agit[br]d'un effet artificiel.
0:28:16.455,0:28:17.724
Dites-m'en plus.
0:28:17.724,0:28:19.748
(intervenant 4) Je pense[br]que c'est juste un robot
0:28:19.748,0:28:21.854
- (i.4) qui a collé...[br]- Oh non !
0:28:21.854,0:28:24.068
(i.4) des noms de personnes,[br]des noms propres
0:28:24.068,0:28:27.172
et a dit : « C'est exactement[br]comme en français ou en espagnol »,
0:28:27.172,0:28:28.558
et a tout copié en bloc.
0:28:28.558,0:28:33.316
Ce qui tend à prouver ça, c'est qu'on ne[br]retrouve pas cette énergie en asturien
0:28:33.316,0:28:35.785
pour les choses qui exigent[br]réellement un effort de traduction
0:28:35.785,0:28:37.336
comme les noms de propriétés
0:28:37.336,0:28:39.648
ou les noms des éléments[br]qui ne sont pas des noms propres.
0:28:39.648,0:28:41.219
Asaf, vous me brisez le cœur.
0:28:41.219,0:28:43.198
(i.4) Je sais.[br]J'aime bien gâcher la fête,
0:28:43.198,0:28:48.558
mais j'ai aussi de bonnes nouvelles[br]au sujet des scores en prononciation.
0:28:49.408,0:28:50.765
Comme vous le savez probablement,
0:28:50.765,0:28:53.515
les Commons sont pleins[br]de fichiers de prononciation
0:28:53.515,0:28:54.668
et par exemple
0:28:54.668,0:28:59.464
le néerlandais compte pas moins[br]de 300 000 fichiers de prononciation
0:28:59.464,0:29:01.912
qui sont déjà dans les Commons
0:29:01.912,0:29:05.051
et qui ne demandent qu'à être ingérés.
0:29:05.051,0:29:07.697
Donc si quelqu'un est en recherche[br]d'un projet connexe,
0:29:07.697,0:29:09.118
il existe des tonnes et des tonnes
0:29:09.118,0:29:13.280
de fichiers de prononciation, classés[br]et catégorisés dans les Commons
0:29:13.280,0:29:16.893
sous la catégorie[br]« Prononciation » par langue.
0:29:16.893,0:29:22.840
Il n'y a plus qu'à les faire correspondre[br]aux lexèmes et les intégrer dans Lexèmes.
0:29:23.000,0:29:25.484
Et d'autre part, je me demandais[br]si vous pourriez parler un peu
0:29:25.484,0:29:26.585
de la feuille de route,
0:29:26.585,0:29:28.757
nous dire un peu[br]quel degré d'investissement
0:29:28.757,0:29:31.995
ou ce que nous pouvons attendre[br]de Lexème pour l'année qui vient,
0:29:31.995,0:29:34.560
parce qu'en tout cas[br]pour ma part, je brûle d'impatience.
0:29:34.949,0:29:37.044
Vous brûlez d'impatience ?[br](petit rire)
0:29:37.044,0:29:39.588
- (i.3) de voir la suite.[br]- Oui (petit rire)
0:29:44.541,0:29:48.073
Actuellement, nous nous concentrons[br]plutôt sur Wikibase
0:29:48.073,0:29:50.138
et la qualité des données
0:29:51.493,0:29:55.087
pour voir quel est l'attrait suscité,
0:29:55.087,0:30:01.676
puis l'augmenter davantage[br]au niveau des points faibles
0:30:01.676,0:30:06.003
et ensuite revenir pour continuer[br]à développer les données lexicographiques.
0:30:06.903,0:30:09.790
Et une des choses que j'aimerais[br]entendre de votre part,
0:30:09.790,0:30:14.136
c'est quelles devraient précisément[br]être les prochaines étapes selon vous.
0:30:14.136,0:30:15.966
où voulez-vous voir des améliorations
0:30:15.966,0:30:20.340
pour que nous puissions définir[br]comment parvenir à les produire.
0:30:21.125,0:30:22.810
Mais bien sûr, vous avez raison,
0:30:22.810,0:30:25.832
il reste encore tant à faire,[br]au niveau technique aussi.
0:30:30.573,0:30:35.848
(intervenant 5) Tandis que nous intégrions[br]les mots basques avec leurs formes,
0:30:35.848,0:30:37.768
et ce genre de situations[br]est assez fréquent,
0:30:37.768,0:30:41.399
nous nous disions, la semaine dernière :[br]« Oh, nous sommes premiers quelque part »
0:30:42.739,0:30:44.928
ça sort dans la presse, c'est comme :
0:30:44.928,0:30:49.488
« Oh, c'est une première, les Basques sont[br]premiers dans un domaine, chouette ! »
0:30:49.488,0:30:50.606
(rire)
0:30:50.606,0:30:53.708
Et alors les gens nous demandent :[br]« C'est bien, mais à quoi ça sert ? »
0:30:54.678,0:30:56.849
Nous n'avons pas vraiment[br]de bonne réponse à ça.
0:30:56.849,0:30:57.980
je veux dire, c'est pas mal,
0:30:57.980,0:31:01.841
cela permettra aux ordinateurs[br]de comprendre davantage notre langue, oui,
0:31:01.841,0:31:05.279
mais quel genre d'outils[br]pourrons-nous développer à l'avenir ?
0:31:05.279,0:31:07.467
Nous n'avons pas[br]de bonne réponse à cette question.
0:31:07.467,0:31:10.625
Donc, je me demande si vous avez[br]une bonne réponse à ça.
0:31:10.625,0:31:12.982
(petit rire) Je ne sais pas[br]si c'est une bonne réponse,
0:31:12.982,0:31:14.846
mais j'ai une réponse.
0:31:15.480,0:31:20.425
Alors, je crois qu'à l'heure actuelle,[br]comme je l'indiquais,
0:31:20.425,0:31:22.194
nous n'avons pas atteint[br]cette masse critique
0:31:22.194,0:31:25.529
qui permet de construire bon nombre[br]des outils vraiment intéressants.
0:31:25.529,0:31:27.707
Mais il existe déjà quelques outils.
0:31:28.267,0:31:31.912
Pas plus tard que l'autre jour,[br]par exemple, Esther [Pandelia]
0:31:31.912,0:31:34.217
a mis à disposition un outil[br]permettant de visualiser
0:31:35.837,0:31:38.889
je crois qu'il s'agissait[br]des mots sur un globe,
0:31:38.889,0:31:41.901
l'endroit où ils sont le plus parlés,[br]l'endroit dont ils sont originaires.
0:31:42.631,0:31:44.090
Je me trompe peut-être là-dessus,
0:31:44.090,0:31:46.526
mais elle a répondu sur la page[br]Discussion Projet de Wikidata,
0:31:46.526,0:31:48.984
vous pouvez allez voir.
0:31:49.574,0:31:51.805
Donc, nous voyons apparaître[br]ces premiers outils,
0:31:51.805,0:31:55.806
tout comme nous l'avons vu[br]au démarrage de Wikidata,
0:31:56.846,0:31:59.602
d'abord comme une sorte de réseau,
0:31:59.602,0:32:03.424
puis : « Hé, mais il y a cette chose[br]qui se connecte à cette autre chose ».
0:32:04.824,0:32:07.059
Et une fois que l'on a plus de données
0:32:07.059,0:32:10.612
et que l'on a atteint[br]une sorte de masse critique,
0:32:11.852,0:32:14.747
de nouvelles applications[br]plus puissantes deviennent possibles
0:32:15.677,0:32:17.676
des choses comme Histropedia,
0:32:19.126,0:32:21.988
des choses comme les questions-réponses
0:32:21.988,0:32:26.663
avec votre assistant personnel numérique,[br]Platypus et ainsi de suite.
0:32:26.663,0:32:30.038
Et nous voyons le même phénomène[br]se produire avec les lexèmes.
0:32:31.198,0:32:34.650
Nous en sommes au stade[br]où vous pouvez construire ces petits
0:32:34.650,0:32:37.464
« Hé, il y a une connexion possible[br]entre ces deux choses,
0:32:37.864,0:32:42.738
et il existe une traduction[br]de ce mot dans cette langue ».
0:32:42.738,0:32:47.747
Et plus nous l'élaborons,[br]plus nous décrivons de mots,
0:32:47.747,0:32:49.533
plus ces choses deviennent possibles.
0:32:49.533,0:32:51.795
Alors, qu'est-ce qui devient possible ?
0:32:53.482,0:32:59.483
Comme Ben, notre conférencier sur Keynote,[br]le disait plus tôt : les traductions,
0:33:00.103,0:33:03.455
être capable de traduire[br]d'une langue à une autre.
0:33:03.455,0:33:07.929
Et Jens, mon collègue, ne cesse de parler
0:33:07.929,0:33:11.452
de l'Union Européenne[br]qui cherche un traducteur
0:33:11.452,0:33:17.439
capable de traduire[br]du maltais au suédois, je crois.
0:33:17.439,0:33:19.716
- (intervenant 6) de l'estonien.[br]- De l'estonien.
0:33:22.016,0:33:26.211
Et ce n'est pas là[br]une combinaison habituelle,
0:33:27.211,0:33:29.375
mais une fois que toutes ces langues[br]sont disponibles
0:33:29.375,0:33:31.735
dans un espace[br]lisible par des machines,
0:33:31.735,0:33:33.143
c'est faisable,
0:33:33.143,0:33:36.857
on peut avoir un dictionnaire
0:33:36.857,0:33:41.735
estonien-maltais et vice-versa.
0:33:42.865,0:33:45.607
Donc assurer des combinaisons[br]de langues dans des dictionnaires
0:33:45.607,0:33:47.911
qui n'ont jamais été réalisés auparavant
0:33:47.911,0:33:51.050
parce que la demande était insuffisante
0:33:51.050,0:33:55.540
pour en faire un projet financièrement[br]viable qui justifie un tel travail.
0:33:55.540,0:33:57.147
Maintenant nous pouvons le faire.
0:33:59.797,0:34:02.318
Ensuite, la création de texte.
0:34:02.318,0:34:03.653
Lucie parlait tout à l'heure
0:34:03.653,0:34:10.136
de la manière dont elle travaille[br]avec Hattie à générer du texte
0:34:10.136,0:34:12.153
pour commencer à diffuser[br]des articles de Wikipédia
0:34:12.153,0:34:15.021
dans des langues minoritaires
0:34:15.423,0:34:19.512
et cela exige d'avoir[br]des données sur les mots
0:34:19.512,0:34:22.589
et il faut comprendre la langue[br]pour y parvenir.
0:34:23.669,0:34:28.133
Et oui, ce ne sont que quelques[br]exemples qui me viennent à l'esprit.
0:34:28.513,0:34:30.604
Peut-être que notre auditoire[br]a d'autres idées
0:34:30.604,0:34:32.364
quant à ce qu'ils voudraient faire
0:34:32.364,0:34:34.914
une fois que nous aurons[br]toutes ces précieuses données.
0:34:37.693,0:34:40.892
(intervenant 7) Je vais un peu[br]m'écarter du sujet des lexèmes.
0:34:40.892,0:34:42.666
Je voudrais poser cette question.
0:34:42.666,0:34:45.634
Quel impact puis-je avoir en tant[br]que membre d'une communauté
0:34:45.634,0:34:50.135
pour faire d'une tâche une priorité,
0:34:50.135,0:34:54.493
afin qu'un nouvel utilisateur[br]puisse indiquer les langues
0:34:54.493,0:34:56.644
qu'il souhaite voir et éditer
0:34:56.644,0:35:01.135
sans disposer d'une bulle secrète[br]de connaissances formatées ?
0:35:02.145,0:35:05.193
Peut-être verrons-nous cette année[br]cette liste de souhaits techniques exaucée
0:35:05.193,0:35:07.040
en dehors des thèmes de Wikipédia.
0:35:07.040,0:35:10.119
Peut-être pouvons-nous espérer[br]un vote général sur ce point
0:35:10.119,0:35:14.218
que nous n'avons pas réussi[br]à résoudre depuis sept ans.
0:35:14.218,0:35:17.607
Avez-vous des idées[br]ou des commentaires à ce sujet ?
0:35:18.217,0:35:20.328
Vous faites référence au fait
0:35:20.328,0:35:23.518
qu'un utilisateur qui n'est pas[br]connecté sur Wikidata
0:35:23.518,0:35:25.971
ne peut pas apporter facilement[br]de changements sur sa langue ?
0:35:25.971,0:35:28.039
(intervenant 7) Non,[br]je parle des utilisateurs.
0:35:28.309,0:35:30.689
Alors, s'ils sont connectés,
0:35:30.689,0:35:34.871
ils peuvent modifier leur langue[br]en haut de la page
0:35:35.891,0:35:38.489
et là ils verront apparaître,
0:35:39.659,0:35:42.271
l'endroit où se trouvent[br]les descriptions des libellés
0:35:42.271,0:35:43.773
et ils peuvent les modifier.
0:35:45.657,0:35:49.009
(intervenant 7) Eh bien, en fait,[br]bien souvent, le processus est tel
0:35:49.009,0:35:52.447
que si vous voulez avoir plusieurs[br]langues disponibles, elles le sont,
0:35:52.447,0:35:55.419
mais ce n'est pas toujours le cas.
0:35:55.419,0:35:57.364
D'accord, peut-être[br]pouvons-nous en discuter
0:35:57.364,0:35:59.543
après cette conférence[br]et vous me montrerez ?
0:36:01.562,0:36:04.089
Bien. D'autres questions ?
0:36:05.534,0:36:06.536
Oui.
0:36:11.595,0:36:13.196
(intervenant 8) Merci pour votre exposé.
0:36:14.106,0:36:15.127
Pouvez-vous nous parler
0:36:15.127,0:36:19.307
de l'état de la corrélation[br]avec la communauté Wiktionary ?
0:36:19.307,0:36:22.296
D'après ce que j'en ai vu,[br]il a été question lors de discussions
0:36:22.296,0:36:26.051
d'importer certains éléments[br]qui sont le fruit de leur travail
0:36:26.051,0:36:30.843
mais il semble qu'il y ait des problèmes[br]de licences et des désaccords, etc.
0:36:30.843,0:36:31.848
C'est exact.
0:36:31.848,0:36:36.330
Les communautés Wiktionary[br]ont consacré énormément de temps
0:36:37.320,0:36:39.473
à la construction de Wiktionary.
0:36:39.473,0:36:42.643
Ils ont élaboré
0:36:43.193,0:36:47.554
des modèles incroyablement complexes
0:36:47.554,0:36:50.525
pour créer de beaux tableaux
0:36:50.525,0:36:53.614
qui vous génèrent[br]automatiquement des formulaires
0:36:53.614,0:36:56.392
et toutes sortes de trucs impressionnants
0:36:56.392,0:37:00.683
et parfois vraiment dingues,[br]quand on y pense.
0:37:02.311,0:37:07.994
Et bien sûr, ils y ont consacré[br]énormément de temps et d'efforts.
0:37:09.364,0:37:11.801
On peut comprendre
0:37:11.801,0:37:17.116
qu'ils ne souhaitent pas[br]qu'on puisse s'approprier tout ça
0:37:18.046,0:37:19.102
aussi facilement.
0:37:19.102,0:37:21.791
Donc c'est un peu ce qui se dit[br]de ce côté-là.
0:37:22.761,0:37:25.137
Et c'est OK.
0:37:25.737,0:37:32.092
Maintenant, les premières communautés[br]Wiktionary parlent de participer
0:37:32.092,0:37:34.329
et d'importer certaines[br]de leurs données sur Wikidata.
0:37:34.329,0:37:39.095
Le russe, comme vous avez pu le voir[br]par exemple fait partie de ces cas.
0:37:40.375,0:37:42.355
Et je m'attends à ce que d'autres suivent.
0:37:43.635,0:37:46.800
Mais ce sera un processus lent,
0:37:46.800,0:37:49.383
de même que l'adoption[br]de données Wikidata sur Wikipedia
0:37:49.383,0:37:51.909
a également fait l'objet[br]d'un processus assez lent.
0:37:52.849,0:37:56.183
Outre le fait que cela rend plus facile
0:37:56.183,0:37:59.132
l'utilisation des données[br]comprises dans les lexèmes
0:37:59.132,0:38:02.209
sur Wiktionary, pour qu'ils puissent[br]s'en servir et partager des données
0:38:02.209,0:38:05.531
entre les Wiktionnaires[br]de différentes langues,
0:38:05.531,0:38:08.853
chose hyper difficile voire impossible[br]à faire à l'heure actuelle,
0:38:08.853,0:38:11.560
ce qui est fou,[br]comme ce fut le cas sur Wikipédia.
0:38:13.860,0:38:16.595
Attendons les cadeaux[br]d'anniversaire ! (petit rire)
0:38:20.038,0:38:21.182
Oui.
0:38:22.849,0:38:24.827
(Intervenant 9) Je pensais[br]à la situation inverse,
0:38:24.827,0:38:28.168
je ne voulais pas en parler[br]parce que ça me semblait idiot,
0:38:28.168,0:38:32.003
mais je crois que Wiktionnary[br]dispose déjà de certains contenus
0:38:32.003,0:38:34.978
et je sais qu'on ne peut pas[br]les transférer sur Wikidata
0:38:34.978,0:38:37.048
en raison des différences de licences.
0:38:37.048,0:38:39.891
Mais je me disais que nous pourrions[br]peut-être remédier à cela.
0:38:40.321,0:38:45.913
Peut-être peut-on obtenir[br]la permission des communautés
0:38:45.913,0:38:51.205
après un vote général
0:38:52.075,0:38:55.642
au cours duquel la communauté,[br]les membres actifs de la communauté
0:38:55.642,0:39:02.523
voteraient et diraient s'ils veulent[br]ou acceptent de transférer les contenus
0:39:02.523,0:39:05.528
permettant de faire les lexèmes Wikidata.
0:39:06.238,0:39:08.637
Parce que ça me paraît[br]être un vrai gâchis.
0:39:09.568,0:39:13.443
Donc, c'est certainement une conversation
0:39:13.443,0:39:16.146
que ceux qui sont membres[br]de communautés Wiktionary
0:39:16.146,0:39:18.319
peuvent susciter entre eux[br]et nous en serions heureux.
0:39:18.319,0:39:24.647
Je crois que ce serait un peu présomptueux[br]de notre part de chercher à forcer cela.
0:39:25.917,0:39:31.142
Mais oui, cela mérite largement[br]qu'on en discute.
0:39:31.142,0:39:33.898
Mais il me semble important de comprendre
0:39:33.898,0:39:36.117
qu'il faut faire la distinction
0:39:36.117,0:39:39.082
entre ce qui est faisable[br]d'un point de vue légal,
0:39:39.082,0:39:43.147
ce que nous devrions faire
0:39:43.147,0:39:45.426
et ce que ces gens veulent faire ou pas.
0:39:45.626,0:39:47.510
Donc, même si c'est autorisé légalement,
0:39:47.510,0:39:50.640
si certaines communautés[br]Wiktionary s'y opposent,
0:39:50.640,0:39:53.637
je crois que nous devrions être[br]pour le moins prudents là-dessus.
0:39:58.886,0:40:02.489
Je crois qu'il vous faut un micro[br]pour la retransmission.
0:40:04.540,0:40:07.549
(intervenant 10) Tout cela[br]est bien sûr très enthousiasmant
0:40:07.979,0:40:12.319
et je me demande tout de suite comment[br]je peux en faire profiter mes élèves
0:40:12.319,0:40:15.558
et intégrer cela à mes cours,
0:40:15.558,0:40:18.531
au travail que nous faisons,[br]dans le cadre de l'éducation.
0:40:18.531,0:40:22.271
Et je ne dispose pas à ce jour
0:40:22.621,0:40:24.241
des connaissances suffisantes, d'abord,
0:40:24.241,0:40:27.278
mais je crois que la documentation[br]dont nous disposons
0:40:27.808,0:40:30.082
pourrait peut-être être améliorée.
0:40:30.082,0:40:33.437
Donc, j'aimerais exprimer le souhait[br]de voir réaliser des vidéos sympa
0:40:33.437,0:40:35.898
pour expliquer comment ça marche
0:40:35.898,0:40:39.948
parce que si nous avons cela,[br]nous pourrons nous en servir
0:40:39.948,0:40:41.985
et impliquer les élèves
0:40:41.985,0:40:47.072
et nous pourrons faire savoir aux gens[br]à quel point c'est fantastique.
0:40:47.072,0:40:52.001
Et oui, donc, s'il vous plaît, pensez[br]à la documentation et à l'éducation.
0:40:52.001,0:40:54.480
Parce que je crois qu'on pourrait[br]faire beaucoup de choses.
0:40:54.480,0:40:58.585
Il y a de nombreuses tâches[br]qui pourraient être effectuées avec...
0:41:00.125,0:41:02.033
je ne dirais pas des élèves de primaire
0:41:02.033,0:41:05.495
mais certainement[br]avec des élèves plus jeunes.
0:41:05.915,0:41:10.866
Et donc j'aimerais vraiment[br]que ce potentiel soit mis à contribution
0:41:10.866,0:41:15.272
et personnellement,[br]je ne m'y connais pas assez à ce stade
0:41:15.272,0:41:19.500
pour pouvoir créer[br]des tâches ou créer...
0:41:20.430,0:41:22.155
faire quelque chose de pratique avec ça.
0:41:22.155,0:41:25.772
Donc, si quelqu'un peut apporter[br]de l'aide, des idées à ce sujet,
0:41:25.772,0:41:29.648
ce serait une joie pour moi[br]d'entendre vos idées et les vôtres aussi.
0:41:30.508,0:41:32.329
D'accord ! Discutons-en.
0:41:35.473,0:41:37.139
D'autres questions ?
0:41:37.719,0:41:39.195
Quelqu'un d'autre avait levé la main
0:41:39.195,0:41:40.625
mais je ne sais plus qui.
0:41:45.739,0:41:49.996
(intervenant 11) Donc, si nous ne pouvons[br]pas importer des contenus de Wiktionary,
0:41:49.996,0:41:52.092
y a-t-il des efforts concertés
0:41:52.092,0:41:55.772
pour trouver d'autres ressources[br]dans le domaine public
0:41:55.772,0:41:57.459
peut-être des données
0:41:58.769,0:42:03.167
que nous pourrions pré-filtrer, organiser
0:42:03.167,0:42:08.470
afin de les rendre facilement vérifiables[br]pour que les gens puissent les importer ?
0:42:09.033,0:42:11.291
Alors, il y a[br]des premiers efforts de faits.
0:42:11.291,0:42:14.769
J'ai cru comprendre que le basque[br]était l'un de ces exemples.
0:42:14.769,0:42:17.474
Peut-être voudriez-vous[br]nous en dire plus à ce sujet ?
0:42:18.306,0:42:20.130
(l'intervenant 12 parle hors micro)
0:42:23.166,0:42:27.098
OK, la réponse aujourd'hui[br]c'est de payer pour cela,
0:42:28.374,0:42:33.381
je veux dire, nous avons passé un accord[br]avec un de nos prestataires habituels,
0:42:34.801,0:42:38.725
Ils font des dictionnaires...
0:42:40.125,0:42:42.508
plein d'autres trucs aussi,[br]mais ils font des dictionnaires.
0:42:42.508,0:42:45.070
Donc, nous nous sommes entendus
0:42:45.070,0:42:47.473
pour mettre en libre accès[br]le dictionnaire des étudiants
0:42:47.473,0:42:52.782
qui comprend les mots les plus communs[br]et nous avons commencé à le téléverser
0:42:52.782,0:42:55.590
avec un identifiant externe[br]et ce genre de choses.
0:42:56.230,0:43:02.902
Mais il y a eu quelques discussions[br]sur le fait de le laisser en CC0
0:43:03.212,0:43:05.702
parce que leur dictionnaire[br]est sous licence Attribution
0:43:06.307,0:43:10.326
et ils ont compris sur quoi[br]reposait la différence.
0:43:10.326,0:43:13.866
Donc, cela a donné lieu[br]à quelques discussions.
0:43:13.866,0:43:19.519
Mais je crois que si nous pouvons[br]fournir des outils ou des exemples,
0:43:19.519,0:43:21.761
je pense qu'il y aura à l'avenir[br]d'autres dictionnaires
0:43:21.761,0:43:24.016
que nous pourrons traiter
0:43:24.016,0:43:29.274
et je crois que Wiktionary devrait[br]aussi aller dans ce sens,
0:43:29.274,0:43:32.260
mais c'est une autre discussion de taille.
0:43:33.285,0:43:34.487
Et de plus,
0:43:34.487,0:43:38.839
Lea est aussi en contact[br]avec des Occitans
0:43:38.839,0:43:41.827
qui travaillent[br]sur des dictionnaires en occitan
0:43:41.827,0:43:45.238
et participent en ce moment[br]à une collaboration autour du sumérien.
0:43:51.644,0:43:53.483
D'autres questions ?
0:44:01.377,0:44:03.519
(intervenant 13) Bonjour.[br]Nous sommes justement ceux
0:44:03.519,0:44:05.399
qui souhaitent importer[br]les données en occitan.
0:44:05.399,0:44:06.585
Ah, parfait !
0:44:06.585,0:44:08.478
(i.13) Et nous rencontrons[br]un petit problème.
0:44:09.188,0:44:14.215
C'est que nous ignorons comment refléter[br]les variantes de tous les lexèmes.
0:44:14.215,0:44:17.893
Nous avons six dialectes
0:44:17.893,0:44:24.014
et nous voudrions indiquer[br]dans quel dialecte le lexème s'utilise,
0:44:24.014,0:44:27.285
mais nous n'avons pas[br]de déclaration C0 pour faire cela
0:44:27.285,0:44:31.105
Donc, tant que cette section n'existe pas
0:44:31.635,0:44:34.465
cela nous empêche de l'intégrer
0:44:34.465,0:44:37.603
parce que nous devrions[br]tout reprendre
0:44:37.603,0:44:42.076
le jour où nous pourrons[br]exprimer cette déclaration.
0:44:42.076,0:44:44.551
Et c'est compliqué[br]parce que c'est une déclaration
0:44:44.551,0:44:47.802
qui aura peu de demandeurs
0:44:47.802,0:44:53.444
étant donnée qu'elle concerne[br]principalement des langues minoritaires.
0:44:53.444,0:44:56.933
Donc, il n'y aura[br]qu'un demandeur pour cela.
0:44:56.933,0:45:00.022
Mais comme nos collègues basques
0:45:00.022,0:45:02.322
ce sera peut-être une personne
0:45:02.322,0:45:06.082
qui ouvrira une possibilité[br]à des milliers d'autres,
0:45:06.082,0:45:10.884
donc ce n'est peut-être pas trop demander,
0:45:10.884,0:45:14.136
mais ce sera très important pour nous.
0:45:14.874,0:45:17.600
Avez-vous une proposition[br]de nouvelle propriété déjà prête
0:45:17.600,0:45:19.550
ou avez-vous besoin d'aide[br]pour la créer ?
0:45:21.524,0:45:24.356
(intervenant 13) Nous en avons fait[br]la demande il y a quatre mois.
0:45:24.720,0:45:28.755
D'accord, alors voyons qui peut aider[br]à sortir cette proposition de propriété.
0:45:30.159,0:45:33.360
Je suis sûre qu'il y a assez de gens[br]dans cette salle pour que ça se fasse.
0:45:33.360,0:45:35.564
(i.13) Proposition de propriété[br]« Variété de la forme ».
0:45:35.564,0:45:36.965
(l'intervenant 14 parle hors micro)
0:45:36.965,0:45:39.699
(i.13) Nous n'avons pas eu de réponse[br]et nous ne savons pas le faire
0:45:39.699,0:45:43.153
parce que nous ne sommes pas[br]dans la communauté Wikidata.
0:45:44.694,0:45:48.817
OK. Il y a des gens ici[br]qui peuvent vous aider.
0:45:48.817,0:45:52.134
Peut-être que vous pouvez lever la main...
0:45:52.574,0:45:53.644
(i.15) Je suis d'accord.
0:45:53.644,0:45:55.512
Je crois que c'est très intéressant
0:45:55.512,0:45:59.059
que la variété de forme
0:45:59.059,0:46:02.607
peut aussi être corrélée[br]d'un point de vue géographique
0:46:02.607,0:46:04.995
avec des coordonnées[br]ou une forme de cartographie.
0:46:05.595,0:46:07.815
Et cela vaut aussi[br]pour les variétés de prononciations
0:46:07.815,0:46:11.837
et je crois que c'est quelque chose[br]qui se produit dans beaucoup de langues.
0:46:12.607,0:46:16.262
Nous devrions pouvoir[br]mettre cela en place.
0:46:16.262,0:46:18.865
je vais faire des recherches[br]pour cette propriété.
0:46:19.782,0:46:20.933
Chouette.
0:46:20.933,0:46:24.446
Donc vous allez avoir du soutien[br]pour votre proposition de propriété.
0:46:26.136,0:46:27.297
Merci.
0:46:28.153,0:46:30.261
Très bien. D'autres questions ?
0:46:32.410,0:46:33.474
Finn.
0:46:33.974,0:46:35.055
Finn fait partie de ceux
0:46:35.055,0:46:38.031
qui construisent des choses[br]à partir des données lexicographiques.
0:46:38.031,0:46:40.085
(Finn) C'est juste une petite question.
0:46:40.405,0:46:44.226
et elle concerne les variantes[br]orthographiques.
0:46:44.896,0:46:48.002
Il semble qu'il soit difficile[br]de les faire apparaître...
0:46:48.532,0:46:53.368
Bien sûr, il serait possible d'avoir[br]de multiples formes pour un même mot.
0:46:56.327,0:46:58.448
Je ne sais pas. Ça me semble...
0:46:59.558,0:47:03.535
Si on ne le fait pas de cette manière,[br]il semble difficile de préciser...
0:47:04.771,0:47:05.888
je ne sais pas si...
0:47:05.888,0:47:09.731
s'il s'agit d'un souci technique mineur[br]ou si au contraire...
0:47:09.731,0:47:11.252
Voyons cela ensemble.
0:47:11.642,0:47:15.230
Je serais ravie de voir un exemple.
0:47:17.478,0:47:18.478
Asaf.
0:47:26.886,0:47:28.396
(Asaf) Merci.
0:47:29.386,0:47:33.685
Je peux vous donner un exemple concret[br]dans ma langue maternelle, l'hébreu.
0:47:34.205,0:47:38.845
L'hébreu a deux variantes principales
0:47:38.845,0:47:42.786
pour exprimer quasiment chaque mot
0:47:42.786,0:47:47.640
parce que l'orthographe traditionnelle
0:47:47.640,0:47:50.274
se dispense d'un grand nombre de voyelles.
0:47:50.934,0:47:55.207
Et par conséquent, dans les éditions[br]modernes de la Bible ou des poèmes,
0:47:55.207,0:47:57.461
des signes diacritiques sont utilisés.
0:47:57.461,0:47:59.200
Cependant, ces signes diacritiques
0:47:59.200,0:48:02.670
ne sont jamais utilisés[br]dans la prose moderne,
0:48:02.670,0:48:05.974
dans la presse[br]ou les panneaux indicateurs.
0:48:05.974,0:48:11.209
Donc, l'usage courant ajoute[br]des voyelles supplémentaires
0:48:12.019,0:48:13.679
et n'utilise pas de signes diacritiques
0:48:13.679,0:48:15.607
par qu'ils sont évidemment[br]plus encombrants,
0:48:15.607,0:48:18.623
qu'ils sont soumis à toutes sortes[br]de règles que plus personne ne connaît.
0:48:18.633,0:48:20.531
Donc en gros, il y a deux variantes.
0:48:20.531,0:48:25.322
Il y a la variante propre à la prose[br]usuelle de tous les jours
0:48:25.322,0:48:27.827
et celle de la Bible ou de la poésie
0:48:27.827,0:48:30.136
qui se présente toujours[br]sous la forme traditionnelle
0:48:30.136,0:48:32.200
avec ses signes diacritiques.
0:48:32.200,0:48:33.302
Pour être utile,
0:48:33.302,0:48:37.428
le lexème devrait reconnaître les deux[br]variétés pour chaque mot sans exception
0:48:37.428,0:48:39.747
et pour chaque forme de chaque mot.
0:48:40.677,0:48:43.391
Donc il s'agit là d'un cas[br]pratique très complet
0:48:43.391,0:48:46.340
pour ce qui est des variantes[br]officielles stables.
0:48:46.340,0:48:49.332
Il ne s'agit pas de dialectes,[br]il ne s'agit pas de variantes régionales,
0:48:49.332,0:48:53.627
mais bien de deux systèmes[br]morphologiques qui coexistent.
0:48:54.537,0:48:58.926
Et je ne sais pas bien non plus[br]comment exprimer cela dans les lexèmes
0:48:58.926,0:49:02.800
et en réponse à la question de Magnus,[br]c'est l'une des choses qui m'empêchent
0:49:02.800,0:49:05.238
de téléverser les parties déjà prêtes
0:49:05.238,0:49:09.394
du plus grand dictionnaire d'hébreu[br]qui fait partie du domaine public
0:49:09.394,0:49:13.141
et que j'ai entrepris de numériser[br]depuis maintenant plusieurs années.
0:49:13.141,0:49:14.673
Une portion conséquente est déjà prête
0:49:14.673,0:49:16.689
mais je ne l'intègre pas au lexème[br]pour le moment
0:49:16.689,0:49:20.245
parce que je ne sais pas exactement[br]comment résoudre ce problème.
0:49:20.245,0:49:23.387
Très bien, trouvons[br]la solution ici même (petit rire)
0:49:24.503,0:49:26.021
Ce doit être possible.
0:49:30.045,0:49:32.047
Très bien, d'autres questions ?
0:49:37.173,0:49:39.735
Si vous n'avez plus de questions,[br]merci à tous.
0:49:40.605,0:49:42.675
(applaudissements)
0:49:45.983,0:49:48.263
WIKI DATA 2019[br]Wikidata et les langues