0:00:02.651,0:00:05.000 Wikidata et les langues 0:00:05.000,0:00:06.303 Où en sommes-nous ?[br]Et après ? 0:00:06.303,0:00:07.362 (Lydia) Merci beaucoup. 0:00:07.362,0:00:11.417 L'un des sujets majeurs[br]de cette conférence concerne les langues. 0:00:14.220,0:00:18.508 Je voudrais vous donner un aperçu[br]du point où nous en sommes à ce jour 0:00:18.508,0:00:20.500 en ce qui concerne les langues 0:00:20.500,0:00:22.403 et quelles sont les prochaines étapes. 0:00:28.976,0:00:30.409 Le but de Wikidata est de donner 0:00:30.409,0:00:32.580 plus d'accès à plus de savoir[br]à davantage de monde 0:00:32.580,0:00:37.220 et la langue est un aspect essentiel[br]dans la réalisation de cet objectif, 0:00:38.205,0:00:43.291 d'autant plus que nos vies dépendent[br]de plus en plus de la technologie. 0:00:44.114,0:00:48.873 Et comme le disait notre conférencier[br]sur Keynote tout à l'heure, 0:00:49.603,0:00:52.440 une partie de cette technologie[br]reste inaccessible à certains 0:00:52.440,0:00:55.020 du simple fait qu'ils ne parlent pas[br]telle ou telle langue, 0:00:55.320,0:00:57.573 et ce n'est pas acceptable. 0:00:58.633,0:01:02.097 Donc nous voulons[br]remédier à cette situation. 0:01:02.927,0:01:05.841 Et afin de changer cela,[br]il faut au moins deux choses. 0:01:06.411,0:01:11.270 D'abord, on doit fournir des contenus[br]aux gens dans leur propre langue, 0:01:11.270,0:01:12.955 et la deuxième chose, 0:01:12.955,0:01:15.910 c'est de leur fournir la possibilité[br]d'interagir dans leur propre langue 0:01:15.910,0:01:19.189 avec des applications[br]ou quoi que ce soit d'autre. 0:01:20.367,0:01:25.277 Wikidata contribue à satisfaire[br]ces deux conditions. 0:01:25.277,0:01:28.408 La première d'entre elles,[br]du contenu dans votre langue, 0:01:28.408,0:01:31.317 c'est globalement ce que nous avons[br]dans les éléments et les propriétés, 0:01:31.319,0:01:33.082 la façon dont nous décrivons le monde. 0:01:33.082,0:01:35.205 Tout ce dont vous avez besoin[br]n'y est certainement pas 0:01:35.205,0:01:39.294 mais il y a déjà de quoi bien avancer. 0:01:39.764,0:01:41.847 L'autre point, c'est l'interaction[br]dans votre langue 0:01:41.847,0:01:46.389 et c'est là que les lexèmes[br]entrent en jeu : 0:01:46.389,0:01:49.382 si vous voulez parler[br]à votre assistant personnel numérique 0:01:49.382,0:01:54.918 ou que votre appareil[br]vous traduise un texte ou autre. 0:01:56.404,0:01:59.254 Très bien, intéressons-nous[br]aux contenus dans votre langue, 0:01:59.254,0:02:03.676 donc, à ce que nous avons[br]sous la rubrique Éléments et Propriétés. 0:02:05.406,0:02:10.236 Les libellés sont essentiels[br]pour ces éléments et propriétés. 0:02:10.236,0:02:14.916 Nous devons savoir comment s'appelle[br]l'entité dont il est question. 0:02:15.656,0:02:19.987 Et plutôt que de parler de Q5, 0:02:19.987,0:02:22.180 un anglophone saura[br]qu'il s'agit d'un « humain », 0:02:22.180,0:02:24.706 un germanophone saura[br]qu'il s'agit d'un « Mensch », 0:02:24.706,0:02:26.374 ce genre de choses. 0:02:26.374,0:02:29.872 Donc, les libellés[br]dans les éléments et les propriétés 0:02:29.872,0:02:33.619 font la liaison entre les humains[br]et les machines 0:02:33.619,0:02:35.439 mais relient aussi les humains entre eux 0:02:35.439,0:02:40.115 en leur rendant davantage[br]de savoir accessible. 0:02:41.192,0:02:43.270 À quoi ressemble notre couverture ? 0:02:43.270,0:02:46.290 L'intention est louable. 0:02:46.290,0:02:48.342 Mais voyons ce que cela donne[br]dans les faits. 0:02:48.342,0:02:49.882 Cela ressemble à ça. 0:02:50.947,0:02:52.416 Ce que vous voyez ici, 0:02:52.416,0:02:58.496 c'est que la plupart des éléments[br]dans Wikidata ont deux libellés, 0:02:58.496,0:03:00.767 donc des libellés dans deux langues. 0:03:01.697,0:03:03.851 Ensuite on passe à un, puis trois, 0:03:03.851,0:03:06.265 et au-delà, cela devient vraiment navrant. 0:03:06.781,0:03:08.581 (rires légers) 0:03:10.047,0:03:12.813 Je crois que nous devons[br]faire mieux que ça. 0:03:14.185,0:03:15.319 Mais, d'un autre côté, 0:03:15.319,0:03:17.478 je m'attendais à pire, en fait. 0:03:17.478,0:03:19.810 Je m'attendais à ce que la moyenne[br]soit d'une seule langue. 0:03:19.810,0:03:22.503 Donc, j'ai été agréablement surprise[br]de voir que c'était deux. 0:03:23.655,0:03:24.921 Quelles langues couvrons-nous ? 0:03:24.921,0:03:26.186 Très bien. 0:03:27.156,0:03:29.527 Mais au-delà de l'intérêt de savoir 0:03:29.527,0:03:33.742 de combien de libellés disposent[br]nos éléments et propriétés, 0:03:33.742,0:03:36.705 il est aussi intéressant de voir[br]quelles sont les langues de ces libellés. 0:03:38.045,0:03:43.764 Voici un graphique présentant les langues 0:03:43.764,0:03:46.838 dans lesquelles nous avons des libellés[br]pour les éléments. 0:03:46.838,0:03:50.849 La portion la plus grosse ici[br]correspond à la catégorie Autres. 0:03:51.229,0:03:53.863 Alors, je n'ai détaillé[br]que les 100 premières langues 0:03:54.533,0:03:59.122 donc tout le reste entre dans la catégorie[br]Autres pour que le graphique soit lisible. 0:03:59.542,0:04:02.142 Ensuite viennent l'anglais[br]et le néerlandais, 0:04:03.002,0:04:04.254 le français, 0:04:05.924,0:04:09.129 et n'oublions pas l'asturien. 0:04:09.659,0:04:12.069 - (un auditeur) Waouh ![br]- (Lydia) Waouh, effectivement ! 0:04:13.899,0:04:16.954 Donc ce qui apparaît ici[br]est un déséquilibre considérable 0:04:16.954,0:04:20.114 avec toujours une nette[br]prédominance de l'anglais. 0:04:21.236,0:04:24.367 Par ailleurs, si l'on regarde[br]la même chose pour les propriétés, 0:04:24.367,0:04:26.099 le tableau est déjà mieux. 0:04:27.399,0:04:32.750 Je crois que cela tient en partie au fait[br]qu'il y a beaucoup moins de propriétés, 0:04:32.750,0:04:36.670 ce qui fait que même des communautés[br]plus petites peuvent assurer cette partie. 0:04:36.770,0:04:39.173 Mais cela constitue aussi[br]une partie importante de Wikidata 0:04:39.173,0:04:41.159 de pouvoir les adapter dans votre langue. 0:04:41.159,0:04:42.494 Donc c'est un point positif. 0:04:45.752,0:04:47.962 Ce que je voulais souligner ici[br]à propos de l'asturien, 0:04:47.962,0:04:53.698 c'est qu'une petite communauté[br]peut vraiment se démarquer 0:04:54.448,0:04:57.085 par son investissement et son travail, 0:04:57.085,0:04:58.420 et c'est vraiment chouette. 0:05:01.846,0:05:03.530 Une petite devinette pour vous. 0:05:03.530,0:05:05.493 Si vous prenez toutes[br]les propriétés de Wikidata 0:05:05.493,0:05:07.687 qui n'ont pas d'identifiants externes, 0:05:07.687,0:05:10.778 laquelle compte selon vous le plus grand[br]nombre de libellés, donc de langues ? 0:05:10.977,0:05:13.847 (réponses inaudibles de l'auditoire) 0:05:13.847,0:05:16.886 Il semble se dégager une majorité[br]pour « nature de l'élément ». 0:05:17.506,0:05:19.603 Ce serait une mauvaise réponse. 0:05:19.983,0:05:22.210 La réponse est « image ». 0:05:23.230,0:05:26.006 Donc, effectivement,[br]si vous parlez l'une des langues 0:05:26.006,0:05:28.621 pour lesquelles « nature de l'élément »[br]n'a pas encore de libellé, 0:05:28.621,0:05:30.190 vous savez ce qu'il vous reste à faire. 0:05:32.102,0:05:35.676 Donc, « image » dispose[br]de 148 libellés actuellement. 0:05:37.688,0:05:41.249 Mais c'est une autre diapositive. 0:05:42.521,0:05:44.162 Ce graphique nous donne une idée 0:05:44.162,0:05:49.321 du volume de contenu que nous rendons[br]accessible dans une langue donnée 0:05:49.321,0:05:52.042 et dans quelle proportion ce contenu[br]est effectivement utilisé. 0:05:52.042,0:05:55.448 Donc en gros, on peut voir[br]se dessiner une courbe 0:05:55.448,0:05:59.057 où la majorité des contenus[br]disposant de libellés en anglais, 0:05:59.307,0:06:04.105 étant disponibles en anglais[br]sont aussi largement utilisés. 0:06:04.295,0:06:06.449 Puis ça a tendance à diminuer. 0:06:06.449,0:06:09.436 Mais à nouveau,[br]on peut noter des exceptions 0:06:09.436,0:06:15.333 qui ont beaucoup plus de contenus[br]qu'on aurait pu s'y attendre, 0:06:16.903,0:06:19.539 et c'est une très bonne chose. 0:06:20.839,0:06:24.945 Le problème demeure que ces contenus[br]ne sont pas très utilisés. 0:06:25.565,0:06:28.742 L'asturien et le néerlandais devraient[br]être en meilleure position 0:06:28.742,0:06:31.994 et je crois qu'aider ces communautés 0:06:33.266,0:06:35.716 à accroître l'utilisation des données[br]qu'elles ont rassemblées 0:06:35.716,0:06:37.792 est quelque chose de très utile. 0:06:42.910,0:06:48.110 Ce que cette analyse ainsi que d'autres[br]nous ont révélé de positif, 0:06:48.300,0:06:51.378 c'est que les éléments les plus utilisés 0:06:51.378,0:06:55.295 ont aussi tendance[br]à avoir plus de libellés 0:06:55.295,0:06:58.538 à moins que ça ne marche en sens inverse ;[br]ce n'est pas tout à fait clair. 0:07:02.513,0:07:04.596 Et la question qui se pose alors, c'est : 0:07:04.596,0:07:07.269 Sommes-nous seulement au service[br]des langues les plus puissantes ? 0:07:07.899,0:07:11.197 Ou sommes-nous[br]au service de tout le monde ? 0:07:12.757,0:07:17.743 Et ce que vous voyez ici,[br]ce sont des regroupements de langues. 0:07:17.743,0:07:19.642 Les langues que nous avons[br]regroupées ensemble 0:07:19.642,0:07:21.987 ont tendance à avoir[br]des libellés en commun. 0:07:26.042,0:07:28.219 Et vous voyez se former des faisceaux. 0:07:28.599,0:07:34.065 À présent, voici un même type[br]de regroupement avec différentes couleurs, 0:07:34.065,0:07:39.475 selon que la langue est plus ou moins[br]vivante, plus ou moins largement utilisée 0:07:40.455,0:07:43.156 ou menacée de disparition. 0:07:43.156,0:07:44.642 Et la bonne chose qui apparaît ici, 0:07:44.642,0:07:49.566 c'est que les langues dominantes[br]et les langues menacées de disparition 0:07:49.566,0:07:53.773 ne constituent pas[br]deux groupes différents, 0:07:53.773,0:07:58.872 mais qu'elles sont toutes[br]mélangées ensemble, 0:08:00.262,0:08:04.625 ce qui est bien plus réjouissant[br]que si la situation avait été inverse 0:08:04.625,0:08:09.377 et que les langues les plus assurées,[br]les langues dominantes 0:08:10.197,0:08:12.164 s'étaient mutuellement soutenues. 0:08:12.744,0:08:14.356 Ce n'est pas le cas. 0:08:14.356,0:08:17.417 Et c'est une très bonne chose. 0:08:17.417,0:08:20.042 J'ai trouvé que c'était[br]un très bon signe quand j'ai vu ça. 0:08:23.474,0:08:25.229 Voici un autre exemple similaire 0:08:26.239,0:08:28.800 où nous avons regardé 0:08:30.230,0:08:34.222 le statut des langues 0:08:34.222,0:08:36.225 et le nombre de libellés[br]dont elles disposent. 0:08:39.367,0:08:42.937 Ce qui apparaît, c'est que les langues[br]fortes dominent clairement, 0:08:42.937,0:08:44.438 comme on pouvait s'y attendre. 0:08:45.508,0:08:46.693 Mais ce que l'on voit aussi, 0:08:46.693,0:08:54.407 c'est que les langues des catégories 2,[br]3 et peut-être même 4 0:08:54.407,0:08:59.280 ne s'en tirent pas si mal en fait, 0:08:59.280,0:09:02.367 au niveau de leur représentation[br]sur Wikidata, 0:09:03.287,0:09:06.408 ce qui est vraiment[br]un résultat réjouissant. 0:09:07.556,0:09:09.129 Maintenant, si on regarde[br]la même chose 0:09:09.129,0:09:12.418 sous l'angle de la proportion[br]de contenu de ces libellés 0:09:12.418,0:09:15.495 qui est effectivement utilisée[br]dans Wikipédia, par exemple, 0:09:17.455,0:09:22.563 on voit à nouveau se dessiner[br]la même tendance. 0:09:23.603,0:09:29.813 Et cela nous révèle que ces communautés[br]font vraiment bon usage de leur temps 0:09:29.813,0:09:34.504 en créant des libellés pour les éléments[br]les plus utilisés, par exemple. 0:09:36.410,0:09:40.493 Il y a des exceptions[br]que nous devons pouvoir soutenir 0:09:41.683,0:09:48.202 en aidant ces communautés à mieux[br]valoriser leur investissement. 0:09:49.312,0:09:52.663 Mais de façon générale,[br]cette image me paraît réjouissante. 0:09:54.823,0:09:59.844 Voilà pour ce qui était de la partie[br]éléments et propriétés de Wikidata. 0:10:00.714,0:10:03.033 Regardons à présent les interactions[br]dans vos langues. 0:10:03.033,0:10:05.203 Donc le volet lexème de Wikidata, 0:10:05.203,0:10:09.394 où il s'agit de décrire les mots,[br]leur forme et leur signification. 0:10:10.167,0:10:13.301 C'est un travail que nous avons[br]démarré en mai de l'année dernière 0:10:16.461,0:10:19.127 et le contenu[br]n'a cessé de se développer. 0:10:20.114,0:10:22.149 Ici, on voit les lexèmes en bleu, 0:10:22.149,0:10:25.938 en rouge, les formes de ces lexèmes 0:10:25.938,0:10:29.910 et en jaune, les significations[br]de ces lexèmes. 0:10:30.991,0:10:34.451 Donc certaines communautés,[br]nous y reviendrons plus tard, 0:10:34.451,0:10:38.523 ont consacré beaucoup de temps[br]à créer des formes et des significations 0:10:38.523,0:10:42.753 pour leurs lexèmes, ce qui est très utile 0:10:42.753,0:10:48.243 car cela constitue l'essence[br]des données dont vous avez besoin. 0:10:50.562,0:10:55.133 Maintenant, nous avons regardé[br]toutes les langues 0:10:55.133,0:10:57.906 qui ont des lexèmes sur Wikidata, 0:10:57.906,0:11:01.003 donc les mots que nous avons. 0:11:01.603,0:11:04.524 Ces derniers sont[br]actuellement en 310 langues. 0:11:04.884,0:11:08.290 Maintenant, quelle est,[br]à votre avis, la première langue 0:11:08.290,0:11:11.949 en termes de nombre de lexèmes[br]actuellement sur Wikidata ? 0:11:11.949,0:11:14.677 (réponses fusant de l'auditoire)[br]Le suédois, le russe, 0:11:14.677,0:11:16.350 l'asturien, l'allemand 0:11:16.350,0:11:20.216 - (un intervenant parle hors micro)[br]- Hein ? 0:11:20.216,0:11:21.741 (un autre intervenant) L'allemand. 0:11:21.741,0:11:24.252 Désolée, la bonne réponse a été donnée. 0:11:24.252,0:11:25.651 C'est le russe. 0:11:28.011,0:11:29.924 Le russe est loin devant. 0:11:31.897,0:11:33.832 Et pour vous donner une perspective, 0:11:35.412,0:11:36.816 les opinions divergent à ce sujet, 0:11:36.816,0:11:42.231 mais j'ai lu, par exemple,[br]que connaître 1 000 à 3 000 mots 0:11:42.231,0:11:45.450 vous permet d'accéder au niveau[br]courant dans une autre langue. 0:11:45.450,0:11:49.721 et qu'en connaître 4 000 à 10 000[br]vous situe à un niveau avancé. 0:11:51.591,0:11:55.372 Donc nous avons encore[br]du chemin à faire pour en arriver là. 0:11:58.483,0:12:03.279 J'aimerais attirer votre attention[br]sur la langue basque 0:12:03.279,0:12:07.744 qui a environ 10 000 lexèmes. 0:12:09.244,0:12:13.003 Or, si vous regardez le nombre[br]de formes pour ces lexèmes, 0:12:14.163,0:12:16.497 le basque est très bien placé, 0:12:18.257,0:12:20.006 ce qui est vraiment bien 0:12:20.006,0:12:22.434 et il serait intéressant[br]d'assister à l'exposé 0:12:22.434,0:12:25.315 qui vous expliquera cet état de fait. 0:12:27.341,0:12:31.175 Maintenant, si on regarde le nombre[br]de sens, ce que les mots signifient, 0:12:32.015,0:12:35.081 le basque arrive en tête de la liste. 0:12:35.081,0:12:37.102 Il me semble que cela mérite[br]nos applaudissements. 0:12:37.102,0:12:38.921 (applaudissements) 0:12:45.678,0:12:47.118 Une autre devinette. 0:12:47.118,0:12:50.511 Quel est le lexème le plus traduit[br]à l'heure actuelle, selon vous ? 0:12:50.511,0:12:54.304 (public) Les chats, les chats,[br]Douglas Adams 0:12:54.304,0:12:55.914 (rires) 0:12:56.766,0:13:00.014 Ce sont toutes de bonnes idées, mais non. 0:13:01.012,0:13:04.137 Voici la bonne réponse :[br]c'est le mot russe qui désigne l'eau. 0:13:09.301,0:13:12.253 Très bien, nous avons beaucoup parlé 0:13:12.253,0:13:16.412 du nombre de formes et de sens[br]des lexèmes que nous avons, 0:13:16.412,0:13:20.453 mais ce n'est qu'une partie[br]de ce dont vous avez besoin. 0:13:20.453,0:13:21.872 L'autre chose dont vous avez besoin 0:13:21.872,0:13:25.161 c'est une description[br]des formes et des sens de ces lexèmes, 0:13:25.161,0:13:27.647 dans un format qui soit lisible[br]par des machines. 0:13:27.647,0:13:30.679 Et pour cela, vous avez des déclarations,[br]comme dans les éléments. 0:13:31.479,0:13:36.362 Et l'une des propriétés utilisées ici[br]est l'exemple d'utilisation. 0:13:36.362,0:13:38.582 De sorte que quiconque utilisera[br]cette donnée 0:13:38.582,0:13:42.089 pourra comprendre comment[br]utiliser ce mot dans un contexte, 0:13:42.089,0:13:44.648 il peut s'agir[br]d'une citation, par exemple. 0:13:45.396,0:13:47.343 Et dans ce domaine, le polonais assure ! 0:13:47.820,0:13:50.109 Bien joué, à vous qui parlez polonais. 0:13:54.219,0:13:57.680 Une autre propriété qui est[br]vraiment utile, c'est l'API, 0:13:57.680,0:14:00.186 donc la manière de prononcer le mot. 0:14:00.876,0:14:07.577 Il semble que le russe exige[br]de nombreuses déclarations API. 0:14:10.419,0:14:13.314 Mais revoici le polonais[br]en deuxième position. 0:14:17.148,0:14:20.753 Et enfin, nous avons[br]la prononciation audio. 0:14:20.753,0:14:23.472 Il s'agit là de liens vers des fichiers[br]hébergés sur les Commons 0:14:23.472,0:14:25.959 où un individu prononce le mot, 0:14:25.959,0:14:28.500 ce qui vous permet d'entendre[br]le mot prononcé par quelqu'un 0:14:28.500,0:14:29.913 dont c'est la langue natale, 0:14:29.913,0:14:32.871 pour le cas où vous ne sauriez pas[br]déchiffrer l'API, par exemple. 0:14:34.959,0:14:39.205 Et il existe un projet vraiment sympa[br]sous l'impulsion de Wiki 0:14:39.205,0:14:40.884 qui s'appelle « Lingua Libre » 0:14:40.884,0:14:45.173 auquel vous pouvez contribuer[br]en enregistrant des mots dans votre langue 0:14:45.173,0:14:47.966 qui pourront ensuite être ajoutés[br]aux lexèmes sur Wikidata 0:14:48.446,0:14:52.103 afin que d'autres puissent[br]apprendre à prononcer vos mots. 0:14:53.663,0:14:55.694 (propos inaudibles d'un intervenant) 0:14:55.694,0:14:57.665 Si vous recherchez « Lingua Libre » 0:14:57.665,0:15:00.981 et je suis sûre que quelqu'un[br]pourra poster le lien sur Telegram. 0:15:03.138,0:15:04.621 Ces gars-là sont super. 0:15:04.621,0:15:06.726 Ils ont fait un travail formidable[br]avec Wikibase. 0:15:09.416,0:15:10.617 Très bien. 0:15:12.706,0:15:17.285 La question qui se pose à présent est :[br]quelles sont les prochaines étapes ? 0:15:19.165,0:15:22.010 Si l'on en croit les chiffres[br]que je viens de vous montrer, 0:15:23.030,0:15:25.172 nous avons bien avancé 0:15:25.172,0:15:28.430 vers notre objectif de donner plus d'accès[br]à plus de savoir à davantage de gens 0:15:28.430,0:15:31.240 dans le domaine des langues sur Wikidata. 0:15:32.530,0:15:36.392 Mais nous avons encore beaucoup[br]de travail à accomplir. 0:15:38.992,0:15:42.341 Une des choses que vous pouvez faire[br]pour contribuer au projet, 0:15:42.341,0:15:44.921 c'est par exemple de lancer[br]une opération « libelléthon », 0:15:44.921,0:15:50.124 consistant à inciter des gens[br]à créer des libellés sur Wikidata 0:15:50.914,0:15:55.121 ou une campagne de révision[br]des lexèmes dans votre langue 0:15:55.121,0:15:57.372 pour assurer la présence sur Wikidata 0:15:57.372,0:15:59.792 des mots les plus usités[br]dans votre langue. 0:16:00.773,0:16:03.285 Vous pouvez aussi utiliser[br]un outil comme Terminator 0:16:03.285,0:16:07.211 qui vous aide à identifier[br]les éléments les plus importants 0:16:07.211,0:16:11.699 mais ne disposant pas encore[br]d'un libellé dans votre langue. 0:16:13.274,0:16:18.359 Nous qualifions ici de « plus importants »[br]les éléments les plus fréquemment utilisés 0:16:18.359,0:16:22.553 dans d'autres éléments Wikidata[br]en tant que liens dans les déclarations. 0:16:25.768,0:16:30.022 Et bien entendu, pour la partie lexèmes, 0:16:31.342,0:16:35.169 à présent que nous avons couvert[br]l'essentiel des lexèmes, 0:16:35.169,0:16:41.163 il s'agit de les élaborer[br]en y ajoutant des déclarations 0:16:41.163,0:16:44.401 afin qu'ils puissent réellement[br]construire les bases 0:16:44.401,0:16:47.421 sur lesquelles des applications[br]significatives pourront se développer. 0:16:48.141,0:16:50.795 Parce que nous nous rapprochons[br]de la masse critique 0:16:50.795,0:16:53.616 mais nous sommes encore loin 0:16:53.616,0:16:56.624 de la situation permettant de bâtir[br]de sérieuses applications sur ces bases. 0:16:58.277,0:17:01.680 Et j'espère que vous allez tous[br]joindre vos efforts pour atteindre ce but. 0:17:02.583,0:17:07.103 Ce qui m'amène tout droit 0:17:07.103,0:17:09.843 à solliciter les amis qui nous soutiennent 0:17:09.843,0:17:12.812 et Bruno, veux-tu bien me rejoindre 0:17:13.882,0:17:16.854 pour nous parler des masques lexicaux ? 0:17:17.541,0:17:18.567 (Bruno) Merci, Lydia. 0:17:18.567,0:17:21.519 Merci de m'accorder un petit moment 0:17:21.519,0:17:24.150 pour présenter ce travail[br]que nous effectuons à Google 0:17:24.150,0:17:29.635 avec Denny et dont la plupart d'entre vous[br]ont probablement entendu parler. 0:17:30.136,0:17:31.878 Parce que je suis linguiste[br]chez Google, 0:17:31.878,0:17:33.760 et je suis aussi très heureux[br]de me trouver ici 0:17:33.760,0:17:36.620 en compagnie d'autres[br]passionnés des langues, 0:17:36.620,0:17:39.278 et chez Google, nous construisons[br]aussi des lexiques 0:17:39.278,0:17:41.766 et nous avons développé cette technologie 0:17:41.766,0:17:45.589 ou cette approche dont nous pensons[br]qu'elle peut vous être utile. 0:17:46.369,0:17:48.455 Pour vous expliquer un peu le contexte, 0:17:48.455,0:17:52.068 vous pouvez voir ici mes références[br]en matière de lexicographie. 0:17:52.668,0:17:54.667 Pour créer une base[br]de données lexicographiques, 0:17:54.667,0:17:58.623 nous consacrons beaucoup de temps[br]et d'efforts à maintenir une cohérence 0:17:58.623,0:18:00.125 et à échanger des données, 0:18:00.125,0:18:02.027 comme vous le savez probablement. 0:18:02.417,0:18:03.809 Il existe plusieurs tentatives 0:18:03.809,0:18:06.081 visant à unifier les caractéristiques[br]et les propriétés 0:18:06.081,0:18:09.184 qui décrivent ces lexèmes et ces formes 0:18:09.184,0:18:10.936 et la question n'est pas encore réglée 0:18:10.936,0:18:13.958 mais des tentatives sont en cours[br]pour aller dans le sens d'une unification. 0:18:13.958,0:18:15.209 Mais ce qui manque réellement, 0:18:15.209,0:18:17.312 et c'est un problème auquel[br]nous avons été confrontés 0:18:17.312,0:18:18.732 chez Google au début du projet, 0:18:18.732,0:18:21.757 c'est de tenter de construire[br]une structure interne 0:18:22.197,0:18:25.910 décrivant à quoi devrait ressembler[br]une entrée lexicale, 0:18:25.910,0:18:28.581 le type de données ou d'informations[br]dont nous disposons 0:18:28.581,0:18:32.237 et le degré de spécification attendu. 0:18:32.237,0:18:38.187 Et voici ce à quoi nous avons abouti[br]et qui s'appelle le « masque lexical ». 0:18:38.897,0:18:43.639 Un masque lexical décrit[br]les données attendues 0:18:43.639,0:18:47.369 pour qu'une entrée lexicographique [br]puisse être considérée comme complète 0:18:47.369,0:18:51.436 à la fois quant au nombre de formes[br]qu'un lexème devrait avoir 0:18:51.436,0:18:55.607 et quant au nombre de caractéristiques[br]attendues pour chacune de ces formes. 0:18:56.307,0:18:58.409 Voici un exemple portant[br]sur les adjectifs italiens. 0:18:58.409,0:19:02.002 En italien, on devrait trouver[br]quatre formes pour les adjectifs 0:19:02.002,0:19:05.383 et chacune de ces formes[br]reflète une combinaison spécifique 0:19:05.383,0:19:07.946 de caractéristiques de genre et de nombre. 0:19:08.606,0:19:12.672 C'est ce qui est attendu[br]en matière d'adjectifs italiens. 0:19:12.672,0:19:16.176 Bien sûr, on peut avoir des masques[br]extrêmement complexes, 0:19:16.176,0:19:20.783 comme pour les conjugaisons françaises[br]qui sont très fournies 0:19:20.783,0:19:23.487 et je ne vous présente pas[br]un masque russe quel qu'il soit, 0:19:23.487,0:19:25.378 parce qu'il déborderait de l'écran. 0:19:26.308,0:19:29.531 Et nous avons aussi[br]des spécifications détaillées 0:19:29.531,0:19:33.421 parce que nous distinguons[br]ce qui se situe au niveau de la forme. 0:19:33.421,0:19:37.544 Donc ici vous voyez les noms russes[br]qui comportent trois nombres 0:19:37.544,0:19:40.048 ainsi qu'un nombre de cas[br]avec différentes formes 0:19:40.048,0:19:43.086 mais ils ont également[br]une spécification au niveau de l'entrée 0:19:43.086,0:19:45.590 qui indique qu'un nom 0:19:45.590,0:19:47.073 a un genre inhérent 0:19:47.073,0:19:50.133 ainsi qu'une caractéristique[br]d'animéité inhérente 0:19:50.133,0:19:52.688 qui est également précisée dans le masque. 0:19:54.518,0:19:58.779 Nous voulons aussi préciser[br]qu'un masque indique une spécification 0:19:58.779,0:20:01.874 de ce à quoi devrait ressembler[br]une entrée, de manière générale. 0:20:01.874,0:20:07.158 Mais vous pouvez avoir des masques[br]plus petits en cas de formes réduites 0:20:07.158,0:20:11.282 ou d'aspects limités de l'utilisation[br]du lexème dans la langue. 0:20:11.282,0:20:14.537 Voici par exemple la version[br]la plus simple de verbes en français 0:20:14.537,0:20:17.584 qui ne se conjuguent qu'à la troisième[br]personne du singulier, 0:20:17.584,0:20:19.930 les verbes désignant[br]les phénomènes météorologiques 0:20:19.930,0:20:23.969 comme « il pleut » ou « il neige »,[br]comme c'est aussi le cas en anglais. 0:20:24.537,0:20:26.923 Donc, nous faisons la distinction[br]entre ces deux niveaux. 0:20:26.923,0:20:29.962 Et la façon dont nous utilisons[br]cela chez Google, 0:20:29.962,0:20:32.643 quand nous avons un lexique[br]que nous voulons utiliser, 0:20:33.063,0:20:38.219 nous utilisons le masque[br]pour carrément y déverser le lexique 0:20:38.219,0:20:40.283 et toutes ses entrées,[br]qui vont traverser le masque 0:20:40.283,0:20:44.303 et nous voyons quelles entrées posent[br]un problème en termes de structure. 0:20:44.303,0:20:46.673 Manque-t-il une forme ?[br]Manque-t-il une caractéristique ? 0:20:46.673,0:20:48.563 Et quand un problème se présente, 0:20:48.563,0:20:51.497 nous avons recours[br]à une validation humaine 0:20:51.497,0:20:53.751 pour vérifier si l'entrée passe[br]l'épreuve du masque. 0:20:53.751,0:20:57.924 C'est donc un outil extrêmement puissant[br]pour vérifier la qualité de la structure. 0:20:59.427,0:21:01.964 Et nous sommes heureux[br]de vous annoncer aujourd'hui 0:21:01.964,0:21:05.408 que nous avons eu le feu vert[br]pour ouvrir notre masque à l'open source. 0:21:05.948,0:21:07.469 Donc voici le schéma. 0:21:07.469,0:21:09.697 Si vous le voulez, nous pouvons[br]le mettre à disposition 0:21:09.697,0:21:13.483 et le fournir à Wikidata[br]sous forme de fichiers Shex. 0:21:13.483,0:21:16.688 Voici un fichier Shex[br]pour les noms allemands 0:21:16.688,0:21:20.428 et Denny travaille à le convertir[br]pour passer de nos spécifications internes 0:21:20.428,0:21:23.666 à une spécification[br]plus appropriée à l'open source 0:21:23.666,0:21:27.522 Nous couvrons actuellement[br]plus de 25 langues. 0:21:27.522,0:21:29.495 Nous espérons développer[br]cette offre de notre côté 0:21:29.495,0:21:34.350 mais nous y voyons aussi une opportunité[br]de collaboration pour ajouter des langues. 0:21:34.350,0:21:40.728 Et l'une de ces collaborations est celle[br]que Denny entretient avec Lukas. 0:21:40.728,0:21:45.052 Lukas dispose d'outils fantastiques[br]permettant une interface utilisateur 0:21:45.052,0:21:48.525 pour permettre à l'utilisateur[br]ou au contributeur 0:21:48.525,0:21:51.061 d'ajouter davantage de formes. 0:21:51.061,0:21:54.151 Donc si vous voulez ajouter[br]un adjectif en français, 0:21:54.151,0:21:59.057 l'IU vous indiquera le nombre[br]de formes à fournir 0:21:59.057,0:22:01.562 et les caractéristiques[br]que ces formes devraient avoir. 0:22:01.562,0:22:06.268 Ainsi notre masque permettra à cet outil[br]de s'affiner et de se développer. 0:22:07.238,0:22:08.385 Et voilà. 0:22:08.791,0:22:10.358 (Lydia) Merci infiniment. 0:22:10.358,0:22:11.993 (applaudissements) 0:22:14.249,0:22:16.891 (Lydia) Très bien.[br]Avez-vous des questions ? 0:22:16.891,0:22:19.381 Souhaitez-vous que nous parlions[br]davantage des lexèmes ? 0:22:19.774,0:22:21.885 - (intervenant 1) Oui.[br]- (Lydia) Oui. (petit rire) 0:22:33.485,0:22:35.380 - (intervenant 1) Vous parliez 0:22:35.380,0:22:39.106 de donner plus d'accès[br]à plus de gens dans plus de langues, 0:22:39.106,0:22:42.444 mais beaucoup de langues ne peuvent pas[br]être utilisées dans Wikidata. 0:22:42.444,0:22:44.838 Quelle solution avez-vous[br]pour résoudre cela ? 0:22:45.079,0:22:47.686 Quand vous dites qu'elles[br]ne peuvent pas utiliser Wikidata, 0:22:47.686,0:22:50.208 est-ce que vous parlez[br]d'intégrer des libellés ? 0:22:50.208,0:22:52.581 - (i.1) Des libellés, des descriptions.[br]- D'accord. 0:22:52.581,0:22:55.498 Donc, en ce qui concerne[br]les lexèmes, c'est un peu différent, 0:22:55.498,0:22:58.003 parce que cette restriction[br]ne s'applique pas ici. 0:22:58.923,0:23:05.003 Pour les libellés des éléments[br]et propriétés, des restrictions existent 0:23:05.433,0:23:10.551 parce que nous voulions nous assurer 0:23:10.551,0:23:14.229 que n'importe qui ne puisse pas[br]faire n'importe quoi 0:23:14.229,0:23:17.769 et que cela devienne ingérable. 0:23:19.349,0:23:23.328 Si une communauté, même petite,[br]veut ajouter une langue et y travailler, 0:23:23.898,0:23:26.787 venez en discuter avec nous[br]et nous pourrons rendre cela possible. 0:23:26.787,0:23:29.470 (i.1) Nous l'avons fait à l'occasion[br]du Hackathon de Prague en mai 0:23:29.470,0:23:32.576 et il nous a fallu attendre le mois d'août[br]pour pouvoir utiliser notre langue. 0:23:32.576,0:23:35.135 - Oui.[br]- (i.1) Donc, c'est très lent. 0:23:35.135,0:23:37.854 Oui, c'est malheureusement très lent. 0:23:37.854,0:23:40.093 Nous travaillons actuellement[br]avec le Comité des langues 0:23:40.093,0:23:46.048 à la résolution[br]de certains points fondamentaux... 0:23:49.537,0:23:55.447 Comme par exemple parvenir à un accord[br]sur les langues qui sont « autorisées » 0:23:56.047,0:23:59.468 et cela nous a pris trop de temps, 0:23:59.988,0:24:02.258 ce qui explique pourquoi votre demande 0:24:02.258,0:24:04.868 a probablement mis plus de temps[br]à aboutir qu'elle ne l'aurait dû. 0:24:04.868,0:24:05.963 (i.1) Merci. 0:24:06.705,0:24:07.800 (intervenant 2) Merci. 0:24:07.800,0:24:10.938 Lydia, vous vous souvenez des statistiques[br]que vous nous avez montrées, 0:24:10.938,0:24:12.886 sur le nombre de lexèmes par langue ? 0:24:12.886,0:24:17.599 Avez-vous pris chaque forme[br]comme unité de calcul 0:24:17.599,0:24:20.034 ou seulement les lexèmes ? 0:24:21.159,0:24:22.941 Vous faites référence à ceci ? 0:24:22.941,0:24:25.797 - De quelle diapo parlez-vous ?[br]- (i.2) Oui, c'est exactement cela. 0:24:25.797,0:24:28.341 Si vous vous rappelez,[br]ce nombre représente-t-il 0:24:28.341,0:24:31.954 toutes les formes de tous les lexèmes[br]où seulement les lexèmes existants ? 0:24:31.954,0:24:35.395 - Non, ce sont seulement des lexèmes.[br]- (i.2) Uniquement les lexèmes, d'accord. 0:24:35.395,0:24:36.897 Alors la statistique est correcte. 0:24:36.897,0:24:39.390 Parce que si vous aviez pris[br]les formes en compte, 0:24:39.390,0:24:40.748 et c'est la raison de ma question, 0:24:40.748,0:24:43.074 alors toutes les langues ayant[br]une morphologie flexionnelle 0:24:43.074,0:24:45.027 comme le russe, le serbe, le slovène, etc. 0:24:45.027,0:24:47.616 seraient naturellement avantagées[br]tant elles ont de formes. 0:24:47.616,0:24:51.990 C'est ici que c'est manifeste,[br]sur le nombre de formes. 0:24:51.990,0:24:54.141 (intervenant 2) Oui,[br]c'était bien celle-ci. Merci. 0:24:56.546,0:25:00.224 (intervenant 3) Une petite question[br]concernant... 0:25:00.644,0:25:06.824 Quand nous parlons des éléments[br]et propriétés à proprement parler, 0:25:07.124,0:25:08.901 Pour autant que je sache, 0:25:08.901,0:25:11.955 il n'y a à l'heure actuelle aucun moyen[br]d'identifier une source 0:25:11.955,0:25:14.726 pour n'importe lequel des libellés[br]et descriptions qui sont fournis. 0:25:14.726,0:25:18.047 Donc, par exemple, [br]quand vous parlez 0:25:18.047,0:25:20.920 d'une propriété d'un élément, 0:25:20.920,0:25:24.509 vous pouvez être confronté[br]à des libellés contradictoires. 0:25:24.509,0:25:25.739 Oui. 0:25:25.739,0:25:27.862 (i.3) Donc, disons[br]que telle personne est... 0:25:28.302,0:25:30.920 Nous parlions tout à l'heure[br]des questions indigènes, par exemple. 0:25:30.920,0:25:35.965 Donc telle personne est un artiste[br]norvégien selon telle source 0:25:35.965,0:25:38.750 et un artiste sami[br]selon telle autre source. 0:25:39.550,0:25:42.883 Ou par exemple, la question[br]s'est posée pour l'estonien 0:25:42.883,0:25:47.729 et nous avons dû revoir la terminologie[br]en fonction de la terminologie officielle 0:25:47.729,0:25:49.667 telle qu'elle figure[br]dans les lexiques officiels, 0:25:49.667,0:25:52.262 mais nous n'avons aucun moyen[br]d'indiquer quelle en est la raison, 0:25:52.262,0:25:54.426 quelle en est la source[br]et pourquoi c'est plus juste 0:25:54.426,0:25:55.658 que ce qu'il y avait avant. 0:25:55.658,0:25:57.150 C'est un simple quidam comme moi 0:25:57.150,0:25:59.615 qui a remplacé la donnée[br]pour qui la verra. 0:25:59.615,0:26:02.520 Donc est-il prévu de rendre cela possible[br]d'une manière ou d'une autre 0:26:02.520,0:26:06.605 afin que nous puissions avoir de vraies[br]sources pour les données linguistiques ? 0:26:07.045,0:26:11.568 Alors, c'est en partie possible. 0:26:11.568,0:26:16.088 Donc, par exemple, quand vous avez[br]un élément portant sur une personne, 0:26:16.898,0:26:22.720 vous avez dans les déclarations :[br]prénom, nom, etc., de cette personne 0:26:22.720,0:26:26.406 et vous pouvez fournir la référence[br]correspondante à ce niveau-là. 0:26:28.101,0:26:32.544 J'ai beaucoup de réserves[br]quant à rendre les choses plus complexes 0:26:32.544,0:26:35.557 avec des références[br]sur les libellés et les descriptions, 0:26:35.557,0:26:38.624 mais si les gens pensent vraiment 0:26:38.624,0:26:44.939 que c'est quelque chose qui n'est couvert[br]par aucune référence sur la déclaration, 0:26:44.939,0:26:46.803 alors parlons-en. 0:26:49.079,0:26:53.303 Mais je crains que cela n'entraîne[br]beaucoup de complexité 0:26:53.303,0:26:56.523 pour des occurrences dont j'espère[br]qu'elles sont peu nombreuses, 0:26:57.393,0:27:00.188 mais je veux bien être[br]convaincue du contraire, 0:27:00.188,0:27:04.087 si les gens y tiennent beaucoup. 0:27:04.087,0:27:08.177 (i.3) Je veux dire, si c'est ajouté[br]ce ne devrait pas être impératif 0:27:08.177,0:27:12.452 et apparaître à tous les utilisateurs[br]débutant dans l'interface en tout cas. 0:27:12.452,0:27:13.580 Plutôt quelque chose comme : 0:27:13.580,0:27:16.761 « Cliquez ici si vous avez[br]des commentaires à faire à ce sujet ». 0:27:17.632,0:27:23.368 A-t-on une idée du nombre[br]de cas où cela aurait de l'importance ? 0:27:24.520,0:27:26.423 (i.3) En estonien, par exemple, 0:27:26.423,0:27:29.164 et je suppose que c'est aussi le cas[br]dans d'autres langues, 0:27:29.164,0:27:34.203 il existe un mot officiel,[br]qui est la traduction légitime 0:27:34.203,0:27:36.206 par exemple, en anglais, 0:27:36.206,0:27:40.314 disons d'un type particulier[br]de municipalité. 0:27:40.314,0:27:41.746 C'était mon cas pratique, 0:27:41.746,0:27:44.409 par exemple, où nous utilisions[br]le mot « paroisse » 0:27:45.159,0:27:50.775 où effectivement le mot estonien original[br]avait le sens de paroisse d'église 0:27:50.775,0:27:51.999 et c'était là l'origine du mot 0:27:51.999,0:27:53.699 mais ce n'est plus[br]la traduction officielle 0:27:53.699,0:27:55.189 qu'en donne l'Estonie aujourd'hui. 0:27:55.189,0:27:57.531 Dans ce cas, je l'ajouterais [br]dans les déclarations 0:27:57.531,0:28:00.817 en tant que nom officiel[br]et c'est là que j'ajouterais la référence. 0:28:02.032,0:28:03.158 (intervenant 3) D'accord. 0:28:05.186,0:28:06.952 D'autres questions, oui ? 0:28:07.682,0:28:10.044 (intervenant 4) J'aimerais faire[br]deux courtes remarques. 0:28:10.044,0:28:13.934 Vous avez mis l'asturien en avant[br]comme une langue réussissant bien 0:28:13.934,0:28:16.455 et je pense qu'il s'agit[br]d'un effet artificiel. 0:28:16.455,0:28:17.724 Dites-m'en plus. 0:28:17.724,0:28:19.748 (intervenant 4) Je pense[br]que c'est juste un robot 0:28:19.748,0:28:21.854 - (i.4) qui a collé...[br]- Oh non ! 0:28:21.854,0:28:24.068 (i.4) des noms de personnes,[br]des noms propres 0:28:24.068,0:28:27.172 et a dit : « C'est exactement[br]comme en français ou en espagnol », 0:28:27.172,0:28:28.558 et a tout copié en bloc. 0:28:28.558,0:28:33.316 Ce qui tend à prouver ça, c'est qu'on ne[br]retrouve pas cette énergie en asturien 0:28:33.316,0:28:35.785 pour les choses qui exigent[br]réellement un effort de traduction 0:28:35.785,0:28:37.336 comme les noms de propriétés 0:28:37.336,0:28:39.648 ou les noms des éléments[br]qui ne sont pas des noms propres. 0:28:39.648,0:28:41.219 Asaf, vous me brisez le cœur. 0:28:41.219,0:28:43.198 (i.4) Je sais.[br]J'aime bien gâcher la fête, 0:28:43.198,0:28:48.558 mais j'ai aussi de bonnes nouvelles[br]au sujet des scores en prononciation. 0:28:49.408,0:28:50.765 Comme vous le savez probablement, 0:28:50.765,0:28:53.515 les Commons sont pleins[br]de fichiers de prononciation 0:28:53.515,0:28:54.668 et par exemple 0:28:54.668,0:28:59.464 le néerlandais compte pas moins[br]de 300 000 fichiers de prononciation 0:28:59.464,0:29:01.912 qui sont déjà dans les Commons 0:29:01.912,0:29:05.051 et qui ne demandent qu'à être ingérés. 0:29:05.051,0:29:07.697 Donc si quelqu'un est en recherche[br]d'un projet connexe, 0:29:07.697,0:29:09.118 il existe des tonnes et des tonnes 0:29:09.118,0:29:13.280 de fichiers de prononciation, classés[br]et catégorisés dans les Commons 0:29:13.280,0:29:16.893 sous la catégorie[br]« Prononciation » par langue. 0:29:16.893,0:29:22.840 Il n'y a plus qu'à les faire correspondre[br]aux lexèmes et les intégrer dans Lexèmes. 0:29:23.000,0:29:25.484 Et d'autre part, je me demandais[br]si vous pourriez parler un peu 0:29:25.484,0:29:26.585 de la feuille de route, 0:29:26.585,0:29:28.757 nous dire un peu[br]quel degré d'investissement 0:29:28.757,0:29:31.995 ou ce que nous pouvons attendre[br]de Lexème pour l'année qui vient, 0:29:31.995,0:29:34.560 parce qu'en tout cas[br]pour ma part, je brûle d'impatience. 0:29:34.949,0:29:37.044 Vous brûlez d'impatience ?[br](petit rire) 0:29:37.044,0:29:39.588 - (i.3) de voir la suite.[br]- Oui (petit rire) 0:29:44.541,0:29:48.073 Actuellement, nous nous concentrons[br]plutôt sur Wikibase 0:29:48.073,0:29:50.138 et la qualité des données 0:29:51.493,0:29:55.087 pour voir quel est l'attrait suscité, 0:29:55.087,0:30:01.676 puis l'augmenter davantage[br]au niveau des points faibles 0:30:01.676,0:30:06.003 et ensuite revenir pour continuer[br]à développer les données lexicographiques. 0:30:06.903,0:30:09.790 Et une des choses que j'aimerais[br]entendre de votre part, 0:30:09.790,0:30:14.136 c'est quelles devraient précisément[br]être les prochaines étapes selon vous. 0:30:14.136,0:30:15.966 où voulez-vous voir des améliorations 0:30:15.966,0:30:20.340 pour que nous puissions définir[br]comment parvenir à les produire. 0:30:21.125,0:30:22.810 Mais bien sûr, vous avez raison, 0:30:22.810,0:30:25.832 il reste encore tant à faire,[br]au niveau technique aussi. 0:30:30.573,0:30:35.848 (intervenant 5) Tandis que nous intégrions[br]les mots basques avec leurs formes, 0:30:35.848,0:30:37.768 et ce genre de situations[br]est assez fréquent, 0:30:37.768,0:30:41.399 nous nous disions, la semaine dernière :[br]« Oh, nous sommes premiers quelque part » 0:30:42.739,0:30:44.928 ça sort dans la presse, c'est comme : 0:30:44.928,0:30:49.488 « Oh, c'est une première, les Basques sont[br]premiers dans un domaine, chouette ! » 0:30:49.488,0:30:50.606 (rire) 0:30:50.606,0:30:53.708 Et alors les gens nous demandent :[br]« C'est bien, mais à quoi ça sert ? » 0:30:54.678,0:30:56.849 Nous n'avons pas vraiment[br]de bonne réponse à ça. 0:30:56.849,0:30:57.980 je veux dire, c'est pas mal, 0:30:57.980,0:31:01.841 cela permettra aux ordinateurs[br]de comprendre davantage notre langue, oui, 0:31:01.841,0:31:05.279 mais quel genre d'outils[br]pourrons-nous développer à l'avenir ? 0:31:05.279,0:31:07.467 Nous n'avons pas[br]de bonne réponse à cette question. 0:31:07.467,0:31:10.625 Donc, je me demande si vous avez[br]une bonne réponse à ça. 0:31:10.625,0:31:12.982 (petit rire) Je ne sais pas[br]si c'est une bonne réponse, 0:31:12.982,0:31:14.846 mais j'ai une réponse. 0:31:15.480,0:31:20.425 Alors, je crois qu'à l'heure actuelle,[br]comme je l'indiquais, 0:31:20.425,0:31:22.194 nous n'avons pas atteint[br]cette masse critique 0:31:22.194,0:31:25.529 qui permet de construire bon nombre[br]des outils vraiment intéressants. 0:31:25.529,0:31:27.707 Mais il existe déjà quelques outils. 0:31:28.267,0:31:31.912 Pas plus tard que l'autre jour,[br]par exemple, Esther [Pandelia] 0:31:31.912,0:31:34.217 a mis à disposition un outil[br]permettant de visualiser 0:31:35.837,0:31:38.889 je crois qu'il s'agissait[br]des mots sur un globe, 0:31:38.889,0:31:41.901 l'endroit où ils sont le plus parlés,[br]l'endroit dont ils sont originaires. 0:31:42.631,0:31:44.090 Je me trompe peut-être là-dessus, 0:31:44.090,0:31:46.526 mais elle a répondu sur la page[br]Discussion Projet de Wikidata, 0:31:46.526,0:31:48.984 vous pouvez allez voir. 0:31:49.574,0:31:51.805 Donc, nous voyons apparaître[br]ces premiers outils, 0:31:51.805,0:31:55.806 tout comme nous l'avons vu[br]au démarrage de Wikidata, 0:31:56.846,0:31:59.602 d'abord comme une sorte de réseau, 0:31:59.602,0:32:03.424 puis : « Hé, mais il y a cette chose[br]qui se connecte à cette autre chose ». 0:32:04.824,0:32:07.059 Et une fois que l'on a plus de données 0:32:07.059,0:32:10.612 et que l'on a atteint[br]une sorte de masse critique, 0:32:11.852,0:32:14.747 de nouvelles applications[br]plus puissantes deviennent possibles 0:32:15.677,0:32:17.676 des choses comme Histropedia, 0:32:19.126,0:32:21.988 des choses comme les questions-réponses 0:32:21.988,0:32:26.663 avec votre assistant personnel numérique,[br]Platypus et ainsi de suite. 0:32:26.663,0:32:30.038 Et nous voyons le même phénomène[br]se produire avec les lexèmes. 0:32:31.198,0:32:34.650 Nous en sommes au stade[br]où vous pouvez construire ces petits 0:32:34.650,0:32:37.464 « Hé, il y a une connexion possible[br]entre ces deux choses, 0:32:37.864,0:32:42.738 et il existe une traduction[br]de ce mot dans cette langue ». 0:32:42.738,0:32:47.747 Et plus nous l'élaborons,[br]plus nous décrivons de mots, 0:32:47.747,0:32:49.533 plus ces choses deviennent possibles. 0:32:49.533,0:32:51.795 Alors, qu'est-ce qui devient possible ? 0:32:53.482,0:32:59.483 Comme Ben, notre conférencier sur Keynote,[br]le disait plus tôt : les traductions, 0:33:00.103,0:33:03.455 être capable de traduire[br]d'une langue à une autre. 0:33:03.455,0:33:07.929 Et Jens, mon collègue, ne cesse de parler 0:33:07.929,0:33:11.452 de l'Union Européenne[br]qui cherche un traducteur 0:33:11.452,0:33:17.439 capable de traduire[br]du maltais au suédois, je crois. 0:33:17.439,0:33:19.716 - (intervenant 6) de l'estonien.[br]- De l'estonien. 0:33:22.016,0:33:26.211 Et ce n'est pas là[br]une combinaison habituelle, 0:33:27.211,0:33:29.375 mais une fois que toutes ces langues[br]sont disponibles 0:33:29.375,0:33:31.735 dans un espace[br]lisible par des machines, 0:33:31.735,0:33:33.143 c'est faisable, 0:33:33.143,0:33:36.857 on peut avoir un dictionnaire 0:33:36.857,0:33:41.735 estonien-maltais et vice-versa. 0:33:42.865,0:33:45.607 Donc assurer des combinaisons[br]de langues dans des dictionnaires 0:33:45.607,0:33:47.911 qui n'ont jamais été réalisés auparavant 0:33:47.911,0:33:51.050 parce que la demande était insuffisante 0:33:51.050,0:33:55.540 pour en faire un projet financièrement[br]viable qui justifie un tel travail. 0:33:55.540,0:33:57.147 Maintenant nous pouvons le faire. 0:33:59.797,0:34:02.318 Ensuite, la création de texte. 0:34:02.318,0:34:03.653 Lucie parlait tout à l'heure 0:34:03.653,0:34:10.136 de la manière dont elle travaille[br]avec Hattie à générer du texte 0:34:10.136,0:34:12.153 pour commencer à diffuser[br]des articles de Wikipédia 0:34:12.153,0:34:15.021 dans des langues minoritaires 0:34:15.423,0:34:19.512 et cela exige d'avoir[br]des données sur les mots 0:34:19.512,0:34:22.589 et il faut comprendre la langue[br]pour y parvenir. 0:34:23.669,0:34:28.133 Et oui, ce ne sont que quelques[br]exemples qui me viennent à l'esprit. 0:34:28.513,0:34:30.604 Peut-être que notre auditoire[br]a d'autres idées 0:34:30.604,0:34:32.364 quant à ce qu'ils voudraient faire 0:34:32.364,0:34:34.914 une fois que nous aurons[br]toutes ces précieuses données. 0:34:37.693,0:34:40.892 (intervenant 7) Je vais un peu[br]m'écarter du sujet des lexèmes. 0:34:40.892,0:34:42.666 Je voudrais poser cette question. 0:34:42.666,0:34:45.634 Quel impact puis-je avoir en tant[br]que membre d'une communauté 0:34:45.634,0:34:50.135 pour faire d'une tâche une priorité, 0:34:50.135,0:34:54.493 afin qu'un nouvel utilisateur[br]puisse indiquer les langues 0:34:54.493,0:34:56.644 qu'il souhaite voir et éditer 0:34:56.644,0:35:01.135 sans disposer d'une bulle secrète[br]de connaissances formatées ? 0:35:02.145,0:35:05.193 Peut-être verrons-nous cette année[br]cette liste de souhaits techniques exaucée 0:35:05.193,0:35:07.040 en dehors des thèmes de Wikipédia. 0:35:07.040,0:35:10.119 Peut-être pouvons-nous espérer[br]un vote général sur ce point 0:35:10.119,0:35:14.218 que nous n'avons pas réussi[br]à résoudre depuis sept ans. 0:35:14.218,0:35:17.607 Avez-vous des idées[br]ou des commentaires à ce sujet ? 0:35:18.217,0:35:20.328 Vous faites référence au fait 0:35:20.328,0:35:23.518 qu'un utilisateur qui n'est pas[br]connecté sur Wikidata 0:35:23.518,0:35:25.971 ne peut pas apporter facilement[br]de changements sur sa langue ? 0:35:25.971,0:35:28.039 (intervenant 7) Non,[br]je parle des utilisateurs. 0:35:28.309,0:35:30.689 Alors, s'ils sont connectés, 0:35:30.689,0:35:34.871 ils peuvent modifier leur langue[br]en haut de la page 0:35:35.891,0:35:38.489 et là ils verront apparaître, 0:35:39.659,0:35:42.271 l'endroit où se trouvent[br]les descriptions des libellés 0:35:42.271,0:35:43.773 et ils peuvent les modifier. 0:35:45.657,0:35:49.009 (intervenant 7) Eh bien, en fait,[br]bien souvent, le processus est tel 0:35:49.009,0:35:52.447 que si vous voulez avoir plusieurs[br]langues disponibles, elles le sont, 0:35:52.447,0:35:55.419 mais ce n'est pas toujours le cas. 0:35:55.419,0:35:57.364 D'accord, peut-être[br]pouvons-nous en discuter 0:35:57.364,0:35:59.543 après cette conférence[br]et vous me montrerez ? 0:36:01.562,0:36:04.089 Bien. D'autres questions ? 0:36:05.534,0:36:06.536 Oui. 0:36:11.595,0:36:13.196 (intervenant 8) Merci pour votre exposé. 0:36:14.106,0:36:15.127 Pouvez-vous nous parler 0:36:15.127,0:36:19.307 de l'état de la corrélation[br]avec la communauté Wiktionary ? 0:36:19.307,0:36:22.296 D'après ce que j'en ai vu,[br]il a été question lors de discussions 0:36:22.296,0:36:26.051 d'importer certains éléments[br]qui sont le fruit de leur travail 0:36:26.051,0:36:30.843 mais il semble qu'il y ait des problèmes[br]de licences et des désaccords, etc. 0:36:30.843,0:36:31.848 C'est exact. 0:36:31.848,0:36:36.330 Les communautés Wiktionary[br]ont consacré énormément de temps 0:36:37.320,0:36:39.473 à la construction de Wiktionary. 0:36:39.473,0:36:42.643 Ils ont élaboré 0:36:43.193,0:36:47.554 des modèles incroyablement complexes 0:36:47.554,0:36:50.525 pour créer de beaux tableaux 0:36:50.525,0:36:53.614 qui vous génèrent[br]automatiquement des formulaires 0:36:53.614,0:36:56.392 et toutes sortes de trucs impressionnants 0:36:56.392,0:37:00.683 et parfois vraiment dingues,[br]quand on y pense. 0:37:02.311,0:37:07.994 Et bien sûr, ils y ont consacré[br]énormément de temps et d'efforts. 0:37:09.364,0:37:11.801 On peut comprendre 0:37:11.801,0:37:17.116 qu'ils ne souhaitent pas[br]qu'on puisse s'approprier tout ça 0:37:18.046,0:37:19.102 aussi facilement. 0:37:19.102,0:37:21.791 Donc c'est un peu ce qui se dit[br]de ce côté-là. 0:37:22.761,0:37:25.137 Et c'est OK. 0:37:25.737,0:37:32.092 Maintenant, les premières communautés[br]Wiktionary parlent de participer 0:37:32.092,0:37:34.329 et d'importer certaines[br]de leurs données sur Wikidata. 0:37:34.329,0:37:39.095 Le russe, comme vous avez pu le voir[br]par exemple fait partie de ces cas. 0:37:40.375,0:37:42.355 Et je m'attends à ce que d'autres suivent. 0:37:43.635,0:37:46.800 Mais ce sera un processus lent, 0:37:46.800,0:37:49.383 de même que l'adoption[br]de données Wikidata sur Wikipedia 0:37:49.383,0:37:51.909 a également fait l'objet[br]d'un processus assez lent. 0:37:52.849,0:37:56.183 Outre le fait que cela rend plus facile 0:37:56.183,0:37:59.132 l'utilisation des données[br]comprises dans les lexèmes 0:37:59.132,0:38:02.209 sur Wiktionary, pour qu'ils puissent[br]s'en servir et partager des données 0:38:02.209,0:38:05.531 entre les Wiktionnaires[br]de différentes langues, 0:38:05.531,0:38:08.853 chose hyper difficile voire impossible[br]à faire à l'heure actuelle, 0:38:08.853,0:38:11.560 ce qui est fou,[br]comme ce fut le cas sur Wikipédia. 0:38:13.860,0:38:16.595 Attendons les cadeaux[br]d'anniversaire ! (petit rire) 0:38:20.038,0:38:21.182 Oui. 0:38:22.849,0:38:24.827 (Intervenant 9) Je pensais[br]à la situation inverse, 0:38:24.827,0:38:28.168 je ne voulais pas en parler[br]parce que ça me semblait idiot, 0:38:28.168,0:38:32.003 mais je crois que Wiktionnary[br]dispose déjà de certains contenus 0:38:32.003,0:38:34.978 et je sais qu'on ne peut pas[br]les transférer sur Wikidata 0:38:34.978,0:38:37.048 en raison des différences de licences. 0:38:37.048,0:38:39.891 Mais je me disais que nous pourrions[br]peut-être remédier à cela. 0:38:40.321,0:38:45.913 Peut-être peut-on obtenir[br]la permission des communautés 0:38:45.913,0:38:51.205 après un vote général 0:38:52.075,0:38:55.642 au cours duquel la communauté,[br]les membres actifs de la communauté 0:38:55.642,0:39:02.523 voteraient et diraient s'ils veulent[br]ou acceptent de transférer les contenus 0:39:02.523,0:39:05.528 permettant de faire les lexèmes Wikidata. 0:39:06.238,0:39:08.637 Parce que ça me paraît[br]être un vrai gâchis. 0:39:09.568,0:39:13.443 Donc, c'est certainement une conversation 0:39:13.443,0:39:16.146 que ceux qui sont membres[br]de communautés Wiktionary 0:39:16.146,0:39:18.319 peuvent susciter entre eux[br]et nous en serions heureux. 0:39:18.319,0:39:24.647 Je crois que ce serait un peu présomptueux[br]de notre part de chercher à forcer cela. 0:39:25.917,0:39:31.142 Mais oui, cela mérite largement[br]qu'on en discute. 0:39:31.142,0:39:33.898 Mais il me semble important de comprendre 0:39:33.898,0:39:36.117 qu'il faut faire la distinction 0:39:36.117,0:39:39.082 entre ce qui est faisable[br]d'un point de vue légal, 0:39:39.082,0:39:43.147 ce que nous devrions faire 0:39:43.147,0:39:45.426 et ce que ces gens veulent faire ou pas. 0:39:45.626,0:39:47.510 Donc, même si c'est autorisé légalement, 0:39:47.510,0:39:50.640 si certaines communautés[br]Wiktionary s'y opposent, 0:39:50.640,0:39:53.637 je crois que nous devrions être[br]pour le moins prudents là-dessus. 0:39:58.886,0:40:02.489 Je crois qu'il vous faut un micro[br]pour la retransmission. 0:40:04.540,0:40:07.549 (intervenant 10) Tout cela[br]est bien sûr très enthousiasmant 0:40:07.979,0:40:12.319 et je me demande tout de suite comment[br]je peux en faire profiter mes élèves 0:40:12.319,0:40:15.558 et intégrer cela à mes cours, 0:40:15.558,0:40:18.531 au travail que nous faisons,[br]dans le cadre de l'éducation. 0:40:18.531,0:40:22.271 Et je ne dispose pas à ce jour 0:40:22.621,0:40:24.241 des connaissances suffisantes, d'abord, 0:40:24.241,0:40:27.278 mais je crois que la documentation[br]dont nous disposons 0:40:27.808,0:40:30.082 pourrait peut-être être améliorée. 0:40:30.082,0:40:33.437 Donc, j'aimerais exprimer le souhait[br]de voir réaliser des vidéos sympa 0:40:33.437,0:40:35.898 pour expliquer comment ça marche 0:40:35.898,0:40:39.948 parce que si nous avons cela,[br]nous pourrons nous en servir 0:40:39.948,0:40:41.985 et impliquer les élèves 0:40:41.985,0:40:47.072 et nous pourrons faire savoir aux gens[br]à quel point c'est fantastique. 0:40:47.072,0:40:52.001 Et oui, donc, s'il vous plaît, pensez[br]à la documentation et à l'éducation. 0:40:52.001,0:40:54.480 Parce que je crois qu'on pourrait[br]faire beaucoup de choses. 0:40:54.480,0:40:58.585 Il y a de nombreuses tâches[br]qui pourraient être effectuées avec... 0:41:00.125,0:41:02.033 je ne dirais pas des élèves de primaire 0:41:02.033,0:41:05.495 mais certainement[br]avec des élèves plus jeunes. 0:41:05.915,0:41:10.866 Et donc j'aimerais vraiment[br]que ce potentiel soit mis à contribution 0:41:10.866,0:41:15.272 et personnellement,[br]je ne m'y connais pas assez à ce stade 0:41:15.272,0:41:19.500 pour pouvoir créer[br]des tâches ou créer... 0:41:20.430,0:41:22.155 faire quelque chose de pratique avec ça. 0:41:22.155,0:41:25.772 Donc, si quelqu'un peut apporter[br]de l'aide, des idées à ce sujet, 0:41:25.772,0:41:29.648 ce serait une joie pour moi[br]d'entendre vos idées et les vôtres aussi. 0:41:30.508,0:41:32.329 D'accord ! Discutons-en. 0:41:35.473,0:41:37.139 D'autres questions ? 0:41:37.719,0:41:39.195 Quelqu'un d'autre avait levé la main 0:41:39.195,0:41:40.625 mais je ne sais plus qui. 0:41:45.739,0:41:49.996 (intervenant 11) Donc, si nous ne pouvons[br]pas importer des contenus de Wiktionary, 0:41:49.996,0:41:52.092 y a-t-il des efforts concertés 0:41:52.092,0:41:55.772 pour trouver d'autres ressources[br]dans le domaine public 0:41:55.772,0:41:57.459 peut-être des données 0:41:58.769,0:42:03.167 que nous pourrions pré-filtrer, organiser 0:42:03.167,0:42:08.470 afin de les rendre facilement vérifiables[br]pour que les gens puissent les importer ? 0:42:09.033,0:42:11.291 Alors, il y a[br]des premiers efforts de faits. 0:42:11.291,0:42:14.769 J'ai cru comprendre que le basque[br]était l'un de ces exemples. 0:42:14.769,0:42:17.474 Peut-être voudriez-vous[br]nous en dire plus à ce sujet ? 0:42:18.306,0:42:20.130 (l'intervenant 12 parle hors micro) 0:42:23.166,0:42:27.098 OK, la réponse aujourd'hui[br]c'est de payer pour cela, 0:42:28.374,0:42:33.381 je veux dire, nous avons passé un accord[br]avec un de nos prestataires habituels, 0:42:34.801,0:42:38.725 Ils font des dictionnaires... 0:42:40.125,0:42:42.508 plein d'autres trucs aussi,[br]mais ils font des dictionnaires. 0:42:42.508,0:42:45.070 Donc, nous nous sommes entendus 0:42:45.070,0:42:47.473 pour mettre en libre accès[br]le dictionnaire des étudiants 0:42:47.473,0:42:52.782 qui comprend les mots les plus communs[br]et nous avons commencé à le téléverser 0:42:52.782,0:42:55.590 avec un identifiant externe[br]et ce genre de choses. 0:42:56.230,0:43:02.902 Mais il y a eu quelques discussions[br]sur le fait de le laisser en CC0 0:43:03.212,0:43:05.702 parce que leur dictionnaire[br]est sous licence Attribution 0:43:06.307,0:43:10.326 et ils ont compris sur quoi[br]reposait la différence. 0:43:10.326,0:43:13.866 Donc, cela a donné lieu[br]à quelques discussions. 0:43:13.866,0:43:19.519 Mais je crois que si nous pouvons[br]fournir des outils ou des exemples, 0:43:19.519,0:43:21.761 je pense qu'il y aura à l'avenir[br]d'autres dictionnaires 0:43:21.761,0:43:24.016 que nous pourrons traiter 0:43:24.016,0:43:29.274 et je crois que Wiktionary devrait[br]aussi aller dans ce sens, 0:43:29.274,0:43:32.260 mais c'est une autre discussion de taille. 0:43:33.285,0:43:34.487 Et de plus, 0:43:34.487,0:43:38.839 Lea est aussi en contact[br]avec des Occitans 0:43:38.839,0:43:41.827 qui travaillent[br]sur des dictionnaires en occitan 0:43:41.827,0:43:45.238 et participent en ce moment[br]à une collaboration autour du sumérien. 0:43:51.644,0:43:53.483 D'autres questions ? 0:44:01.377,0:44:03.519 (intervenant 13) Bonjour.[br]Nous sommes justement ceux 0:44:03.519,0:44:05.399 qui souhaitent importer[br]les données en occitan. 0:44:05.399,0:44:06.585 Ah, parfait ! 0:44:06.585,0:44:08.478 (i.13) Et nous rencontrons[br]un petit problème. 0:44:09.188,0:44:14.215 C'est que nous ignorons comment refléter[br]les variantes de tous les lexèmes. 0:44:14.215,0:44:17.893 Nous avons six dialectes 0:44:17.893,0:44:24.014 et nous voudrions indiquer[br]dans quel dialecte le lexème s'utilise, 0:44:24.014,0:44:27.285 mais nous n'avons pas[br]de déclaration C0 pour faire cela 0:44:27.285,0:44:31.105 Donc, tant que cette section n'existe pas 0:44:31.635,0:44:34.465 cela nous empêche de l'intégrer 0:44:34.465,0:44:37.603 parce que nous devrions[br]tout reprendre 0:44:37.603,0:44:42.076 le jour où nous pourrons[br]exprimer cette déclaration. 0:44:42.076,0:44:44.551 Et c'est compliqué[br]parce que c'est une déclaration 0:44:44.551,0:44:47.802 qui aura peu de demandeurs 0:44:47.802,0:44:53.444 étant donnée qu'elle concerne[br]principalement des langues minoritaires. 0:44:53.444,0:44:56.933 Donc, il n'y aura[br]qu'un demandeur pour cela. 0:44:56.933,0:45:00.022 Mais comme nos collègues basques 0:45:00.022,0:45:02.322 ce sera peut-être une personne 0:45:02.322,0:45:06.082 qui ouvrira une possibilité[br]à des milliers d'autres, 0:45:06.082,0:45:10.884 donc ce n'est peut-être pas trop demander, 0:45:10.884,0:45:14.136 mais ce sera très important pour nous. 0:45:14.874,0:45:17.600 Avez-vous une proposition[br]de nouvelle propriété déjà prête 0:45:17.600,0:45:19.550 ou avez-vous besoin d'aide[br]pour la créer ? 0:45:21.524,0:45:24.356 (intervenant 13) Nous en avons fait[br]la demande il y a quatre mois. 0:45:24.720,0:45:28.755 D'accord, alors voyons qui peut aider[br]à sortir cette proposition de propriété. 0:45:30.159,0:45:33.360 Je suis sûre qu'il y a assez de gens[br]dans cette salle pour que ça se fasse. 0:45:33.360,0:45:35.564 (i.13) Proposition de propriété[br]« Variété de la forme ». 0:45:35.564,0:45:36.965 (l'intervenant 14 parle hors micro) 0:45:36.965,0:45:39.699 (i.13) Nous n'avons pas eu de réponse[br]et nous ne savons pas le faire 0:45:39.699,0:45:43.153 parce que nous ne sommes pas[br]dans la communauté Wikidata. 0:45:44.694,0:45:48.817 OK. Il y a des gens ici[br]qui peuvent vous aider. 0:45:48.817,0:45:52.134 Peut-être que vous pouvez lever la main... 0:45:52.574,0:45:53.644 (i.15) Je suis d'accord. 0:45:53.644,0:45:55.512 Je crois que c'est très intéressant 0:45:55.512,0:45:59.059 que la variété de forme 0:45:59.059,0:46:02.607 peut aussi être corrélée[br]d'un point de vue géographique 0:46:02.607,0:46:04.995 avec des coordonnées[br]ou une forme de cartographie. 0:46:05.595,0:46:07.815 Et cela vaut aussi[br]pour les variétés de prononciations 0:46:07.815,0:46:11.837 et je crois que c'est quelque chose[br]qui se produit dans beaucoup de langues. 0:46:12.607,0:46:16.262 Nous devrions pouvoir[br]mettre cela en place. 0:46:16.262,0:46:18.865 je vais faire des recherches[br]pour cette propriété. 0:46:19.782,0:46:20.933 Chouette. 0:46:20.933,0:46:24.446 Donc vous allez avoir du soutien[br]pour votre proposition de propriété. 0:46:26.136,0:46:27.297 Merci. 0:46:28.153,0:46:30.261 Très bien. D'autres questions ? 0:46:32.410,0:46:33.474 Finn. 0:46:33.974,0:46:35.055 Finn fait partie de ceux 0:46:35.055,0:46:38.031 qui construisent des choses[br]à partir des données lexicographiques. 0:46:38.031,0:46:40.085 (Finn) C'est juste une petite question. 0:46:40.405,0:46:44.226 et elle concerne les variantes[br]orthographiques. 0:46:44.896,0:46:48.002 Il semble qu'il soit difficile[br]de les faire apparaître... 0:46:48.532,0:46:53.368 Bien sûr, il serait possible d'avoir[br]de multiples formes pour un même mot. 0:46:56.327,0:46:58.448 Je ne sais pas. Ça me semble... 0:46:59.558,0:47:03.535 Si on ne le fait pas de cette manière,[br]il semble difficile de préciser... 0:47:04.771,0:47:05.888 je ne sais pas si... 0:47:05.888,0:47:09.731 s'il s'agit d'un souci technique mineur[br]ou si au contraire... 0:47:09.731,0:47:11.252 Voyons cela ensemble. 0:47:11.642,0:47:15.230 Je serais ravie de voir un exemple. 0:47:17.478,0:47:18.478 Asaf. 0:47:26.886,0:47:28.396 (Asaf) Merci. 0:47:29.386,0:47:33.685 Je peux vous donner un exemple concret[br]dans ma langue maternelle, l'hébreu. 0:47:34.205,0:47:38.845 L'hébreu a deux variantes principales 0:47:38.845,0:47:42.786 pour exprimer quasiment chaque mot 0:47:42.786,0:47:47.640 parce que l'orthographe traditionnelle 0:47:47.640,0:47:50.274 se dispense d'un grand nombre de voyelles. 0:47:50.934,0:47:55.207 Et par conséquent, dans les éditions[br]modernes de la Bible ou des poèmes, 0:47:55.207,0:47:57.461 des signes diacritiques sont utilisés. 0:47:57.461,0:47:59.200 Cependant, ces signes diacritiques 0:47:59.200,0:48:02.670 ne sont jamais utilisés[br]dans la prose moderne, 0:48:02.670,0:48:05.974 dans la presse[br]ou les panneaux indicateurs. 0:48:05.974,0:48:11.209 Donc, l'usage courant ajoute[br]des voyelles supplémentaires 0:48:12.019,0:48:13.679 et n'utilise pas de signes diacritiques 0:48:13.679,0:48:15.607 par qu'ils sont évidemment[br]plus encombrants, 0:48:15.607,0:48:18.623 qu'ils sont soumis à toutes sortes[br]de règles que plus personne ne connaît. 0:48:18.633,0:48:20.531 Donc en gros, il y a deux variantes. 0:48:20.531,0:48:25.322 Il y a la variante propre à la prose[br]usuelle de tous les jours 0:48:25.322,0:48:27.827 et celle de la Bible ou de la poésie 0:48:27.827,0:48:30.136 qui se présente toujours[br]sous la forme traditionnelle 0:48:30.136,0:48:32.200 avec ses signes diacritiques. 0:48:32.200,0:48:33.302 Pour être utile, 0:48:33.302,0:48:37.428 le lexème devrait reconnaître les deux[br]variétés pour chaque mot sans exception 0:48:37.428,0:48:39.747 et pour chaque forme de chaque mot. 0:48:40.677,0:48:43.391 Donc il s'agit là d'un cas[br]pratique très complet 0:48:43.391,0:48:46.340 pour ce qui est des variantes[br]officielles stables. 0:48:46.340,0:48:49.332 Il ne s'agit pas de dialectes,[br]il ne s'agit pas de variantes régionales, 0:48:49.332,0:48:53.627 mais bien de deux systèmes[br]morphologiques qui coexistent. 0:48:54.537,0:48:58.926 Et je ne sais pas bien non plus[br]comment exprimer cela dans les lexèmes 0:48:58.926,0:49:02.800 et en réponse à la question de Magnus,[br]c'est l'une des choses qui m'empêchent 0:49:02.800,0:49:05.238 de téléverser les parties déjà prêtes 0:49:05.238,0:49:09.394 du plus grand dictionnaire d'hébreu[br]qui fait partie du domaine public 0:49:09.394,0:49:13.141 et que j'ai entrepris de numériser[br]depuis maintenant plusieurs années. 0:49:13.141,0:49:14.673 Une portion conséquente est déjà prête 0:49:14.673,0:49:16.689 mais je ne l'intègre pas au lexème[br]pour le moment 0:49:16.689,0:49:20.245 parce que je ne sais pas exactement[br]comment résoudre ce problème. 0:49:20.245,0:49:23.387 Très bien, trouvons[br]la solution ici même (petit rire) 0:49:24.503,0:49:26.021 Ce doit être possible. 0:49:30.045,0:49:32.047 Très bien, d'autres questions ? 0:49:37.173,0:49:39.735 Si vous n'avez plus de questions,[br]merci à tous. 0:49:40.605,0:49:42.675 (applaudissements) 0:49:45.983,0:49:48.263 WIKI DATA 2019[br]Wikidata et les langues