WEBVTT 00:00:00.987 --> 00:00:03.588 Panel GLAM 00:00:03.588 --> 00:00:06.048 GLAM : galeries d'art, bibliothèques, archives et musées 00:00:06.254 --> 00:00:08.249 Bonjour à tous. 00:00:08.929 --> 00:00:12.068 Bienvenue à notre panel GLAM. 00:00:13.124 --> 00:00:17.009 Avant de commencer, j'ai deux annonces à vous faire. 00:00:17.329 --> 00:00:23.049 La première : n'hésitez pas à utiliser notre Etherpad pour prendre des notes. 00:00:23.781 --> 00:00:27.998 La deuxième annonce s'adresse à ceux qui nous regardent de chez eux, 00:00:27.998 --> 00:00:29.819 ou bien où qu'ils se trouvent : 00:00:29.819 --> 00:00:30.958 si vous avez des questions, 00:00:30.958 --> 00:00:34.028 vous pouvez également les noter sur l'Etherpad, 00:00:34.028 --> 00:00:37.828 et nos bonnes âmes de la salle pourront suivre vos interrogations. 00:00:39.328 --> 00:00:44.348 Nous avons donc décidé pour le panel de cette année, 00:00:45.388 --> 00:00:48.868 après avoir vu toutes les contributions, 00:00:49.128 --> 00:00:52.046 que nous nous concentrerions sur le rôle de Wikidata 00:00:52.046 --> 00:00:53.551 dans les écosystèmes de données 00:00:53.551 --> 00:00:57.199 qui vont au-delà des projets Wikimedia en cours, 00:00:57.199 --> 00:00:59.747 ce qui est également en phase 00:00:59.747 --> 00:01:03.677 avec la nouvelle statégie de la fondation Wikimedia. 00:01:04.652 --> 00:01:07.947 Et nous sommes accompagnés, aujourd'hui, de quatre membres du panel. 00:01:08.387 --> 00:01:09.876 Trois plus un. 00:01:09.876 --> 00:01:13.636 Je vais donc vous demander de monter sur scène 00:01:13.636 --> 00:01:15.875 afin que je puisse vous présenter à l'assemblée. 00:01:16.536 --> 00:01:20.500 (bruits de pas) 00:01:22.205 --> 00:01:24.706 Nous avons donc Susanna Ånäs. 00:01:25.385 --> 00:01:29.296 Susanna milite depuis très longtemps pour la liberté du savoir, 00:01:29.296 --> 00:01:31.276 est engagée dans de nombreux WikiProjects, 00:01:31.776 --> 00:01:33.596 et aujourd'hui, elle nous fera le compte-rendu 00:01:33.596 --> 00:01:35.526 d'un projet en coopération 00:01:35.526 --> 00:01:38.396 avec la Bibliothèque nationale finlandaise. 00:01:38.856 --> 00:01:43.435 Ensuite, j'ai à côté de moi Mike Dickison, 00:01:43.435 --> 00:01:46.325 qui interviendra en deuxième. 00:01:46.995 --> 00:01:50.283 Il est conservateur de musée et est originaire de Nouvelle-Zélande. 00:01:50.283 --> 00:01:53.815 Il est également zoologue et rédacteur en chef de Wikipédia. 00:01:53.815 --> 00:01:58.788 Il a été le premier Wikipédien néo-zélandais en résidence 00:01:58.788 --> 00:02:02.565 en 2018 et 2019, 00:02:02.565 --> 00:02:06.634 et il nous parlera de son expérience dans ce rôle, 00:02:06.634 --> 00:02:13.105 et ce que cela a fait de travailler pour Wikidata dans ce contexte. 00:02:15.784 --> 00:02:18.135 Nous avons ensuite Joachim Neubert 00:02:18.135 --> 00:02:23.461 du centre d'information de Leibniz pour l'économie à Kiel et Hambourg. 00:02:24.011 --> 00:02:25.601 Il travaille à rendre 00:02:25.601 --> 00:02:29.131 les plus grandes archives publiques de la presse au monde 00:02:29.131 --> 00:02:31.435 plus accessible au public, 00:02:31.435 --> 00:02:34.745 et il utilise Wikidata à cette fin. 00:02:35.890 --> 00:02:37.661 J'interviendrai en dernier. 00:02:37.661 --> 00:02:39.091 Je m'appelle Beat Estermann. 00:02:39.091 --> 00:02:43.080 Je travaille pour l'Université de Berne des sciences appliquées, en Suisse. 00:02:43.640 --> 00:02:49.950 Je promeus depuis très longtemps l'OpenGLAM en Suisse et en Autriche, 00:02:50.335 --> 00:02:54.280 et je ferai aujourd'hui un compte-rendu de mes activités 00:02:54.280 --> 00:02:55.960 en relation avec le mandat 00:02:55.960 --> 00:02:59.460 de l'Association canadienne des organismes artistiques, 00:02:59.460 --> 00:03:01.270 à savoir les arts du spectacle, 00:03:02.121 --> 00:03:04.440 pas nécessairement par le biais de Wikidata, 00:03:04.440 --> 00:03:08.421 mais vous verrez qu'il commence à jouer un rôle dans ce domaine. 00:03:08.970 --> 00:03:13.250 À présent, la plupart d'entre nous allons prendre place ici, 00:03:13.250 --> 00:03:16.980 et je vais donner la parole à Susanna. 00:03:17.760 --> 00:03:19.149 (Susanna) Bien. 00:03:20.469 --> 00:03:22.769 Bonjour, je m'appelle Susana Ånäs, 00:03:22.769 --> 00:03:25.579 et je travaille à temps partiel pour Wikimedia Finlande 00:03:25.579 --> 00:03:27.079 en tant que coordinatrice du GLAM, 00:03:27.079 --> 00:03:32.655 et je suis également consultante dans le domaine des savoirs libres, 00:03:32.655 --> 00:03:36.049 Alors, ça peut être un discours [inaudible], 00:03:36.049 --> 00:03:38.719 j'ai donc participé à la réalisation 00:03:38.719 --> 00:03:41.940 d'un groupe... 00:03:43.132 --> 00:03:46.650 d'un groupe de données géographiques du... 00:03:48.439 --> 00:03:51.147 je n'ai pas vérifié le terme en anglais, 00:03:51.147 --> 00:03:53.617 mais, c'était à l'initiative du gouvernement royal finlandais 00:03:53.617 --> 00:03:54.917 au nom du patrimoine culturel. 00:03:54.917 --> 00:03:59.775 Il s'agit donc de noms de lieux 00:03:59.775 --> 00:04:03.300 et de la manière dont ils sont représentés 00:04:03.300 --> 00:04:07.466 dans différents référentiels du secteur des GLAM en Finlande, 00:04:07.466 --> 00:04:11.755 comment les GLAM essaient de rassembler ces différentes sources, 00:04:11.755 --> 00:04:15.899 et comment les lieux sont décrits par le biais de la modélisation 00:04:15.899 --> 00:04:17.906 dans Wikidata et ailleurs. 00:04:17.906 --> 00:04:23.315 On retrouve ici les trois sources principales du projet YSO Places 00:04:23.315 --> 00:04:27.944 faisant partie de l'ontologie générale. 00:04:27.944 --> 00:04:29.665 AHAA désigne les archives finlandaises, 00:04:29.665 --> 00:04:31.645 Melinda, les bibliothèques finlandaises, 00:04:31.645 --> 00:04:33.750 et KOOKOS, les musées finlandais. 00:04:33.750 --> 00:04:37.585 Il existe donc trois systèmes de gestion de contenu 00:04:37.585 --> 00:04:40.290 réunis dans le projet YSO Places. 00:04:40.745 --> 00:04:47.365 Des échanges entre Wikidata sont déjà en cours, 00:04:47.965 --> 00:04:53.065 ainsi qu'un projet de toponymie pour le Service National Cartographique. 00:04:53.065 --> 00:04:56.285 Et puis, il existe un troisième projet, les archives de toponymie finlandaise, 00:04:56.285 --> 00:05:00.391 qui n'y contribue pas encore, 00:05:00.391 --> 00:05:02.715 mais c'est en prévision. 00:05:02.715 --> 00:05:09.175 L'un des points clés de la modélisation dans cette problématique 00:05:09.175 --> 00:05:15.226 est que trois types d'éléments de la toponymie des lieux 00:05:16.116 --> 00:05:18.195 sont représentés dans ce projet, 00:05:18.195 --> 00:05:21.236 l'un d'eux étant le lieu, son emplacement géographique, 00:05:21.236 --> 00:05:24.766 un autre étant le nom du lieu, 00:05:25.006 --> 00:05:27.696 le dernier étant les sources, c'est-à-dire les documents 00:05:27.696 --> 00:05:30.756 d'où ces deux premiers éléments sont tirés, 00:05:30.756 --> 00:05:32.565 ou encore, étayés. 00:05:32.565 --> 00:05:34.115 Le projet YSO Places, 00:05:34.115 --> 00:05:38.799 ici, en haut à droite, on retrouve les mêmes diagrammes 00:05:38.799 --> 00:05:41.189 ce projet YSO se concentre principalement sur les lieux. 00:05:42.619 --> 00:05:46.279 Ce projet est sous la houlette de la Bibliothèque nationale de Finlande, 00:05:46.279 --> 00:05:49.329 et du projet Finto. 00:05:50.199 --> 00:05:55.608 Il compte à présent plus de 7 000 lieux en finnois et en suédois, 00:05:55.608 --> 00:06:02.318 et plus de 3 000 en anglais, sous licence CC0. 00:06:02.772 --> 00:06:06.008 On retrouve ici le service Finto. 00:06:06.008 --> 00:06:09.883 Et j'ai choisi pour lieu Sevettijärvi, 00:06:09.883 --> 00:06:13.908 qui fait désormais partie de notre projet linguistique 00:06:13.908 --> 00:06:15.268 aux côtés des Skolt Sámi.. 00:06:15.268 --> 00:06:18.877 Sevettijärvi est un lieu situé dans l'extrême nord de la Finlande, 00:06:18.877 --> 00:06:21.765 habité par les Skolt Sámi. 00:06:21.765 --> 00:06:27.264 On peut donc voir ici le lieu qui appartient à... 00:06:27.264 --> 00:06:32.724 enfin... voilà les données concernant cet endroit. 00:06:32.724 --> 00:06:37.952 On peut voir qu'il est relié à un Wikidata, 00:06:37.952 --> 00:06:42.344 et retrouver les données du Service National Cartopgraphique. 00:06:43.192 --> 00:06:47.406 On voit ici plus en détail ces éléments. 00:06:48.582 --> 00:06:52.360 Les données sont également hiérarchisées 00:06:52.360 --> 00:06:56.310 dans ce référentiel. 00:06:57.670 --> 00:07:00.460 En réalité, ce lieu n'est pas affiché ici, 00:07:00.460 --> 00:07:05.880 mais on le retrouve sous cette municipalité, 00:07:05.880 --> 00:07:07.880 ainsi que sa région, 00:07:07.880 --> 00:07:10.154 et la Finlande en tant que pays, et les pays nordiques, 00:07:10.154 --> 00:07:12.650 comme région frontalière. 00:07:12.650 --> 00:07:14.400 On peut voir ici que beaucoup de ces données 00:07:14.400 --> 00:07:17.891 ont été associées avec Wikidata auparavant, 00:07:18.730 --> 00:07:22.230 par le biais d'un Mix'n'Match, et il en reste encore à associer. 00:07:22.230 --> 00:07:27.900 Cependant, la quantité d'entrées n'est pas si élevée : 00:07:28.411 --> 00:07:30.844 il y a un peu moins de 5 000. 00:07:31.570 --> 00:07:33.860 Il existe également cet autre référentiel 00:07:33.860 --> 00:07:38.040 du projet de plateforme géospatial finlandaise, 00:07:38.040 --> 00:07:39.199 les Place Names Cards. 00:07:39.199 --> 00:07:42.130 Ce sont tous les noms de lieux qui figurent sur les cartes finlandaises. 00:07:42.130 --> 00:07:48.308 Les données qui y sont reliées, sont sous licence CC BY 4.0. 00:07:48.518 --> 00:07:52.628 Ce sont 800 000 étiquettes de cartes en finnois, suédois, 00:07:52.628 --> 00:07:55.778 et dans les trois langues sámi que l'on parle en Finlande. 00:07:55.997 --> 00:07:58.877 Et il existe deux types d'entités : 00:07:58.877 --> 00:08:02.651 certaines sont des lieux, et les autres des noms de lieux. 00:08:02.651 --> 00:08:05.271 Et elles ont toutes deux leur adresse PURL. 00:08:06.001 --> 00:08:09.721 Par exemple, ici, ce même Sevettijärvi, apparaît en finnois, à la première ligne, 00:08:09.721 --> 00:08:12.141 puis dans les trois langues sámi, 00:08:12.141 --> 00:08:17.301 ainsi que ses données géographiques, et davantage d'informations 00:08:17.301 --> 00:08:20.841 comme le type de lieu, et ainsi de suite. 00:08:21.640 --> 00:08:28.815 Voici le tableau pour cette toponymie ayant son propre URI. 00:08:29.943 --> 00:08:33.738 Désolé, apparemment, ça n'est pas traduit en anglais... 00:08:34.432 --> 00:08:39.151 Il semblerait que le multilinguisme ne couvre pas l'ensemble du projet. 00:08:40.057 --> 00:08:42.523 Nous arrivons ensuite à l'archivage des toponymes finlandais. 00:08:42.523 --> 00:08:46.234 Il s'agit d'un projet mené par l'Institut de langues de Finlande, 00:08:46.234 --> 00:08:50.456 qui ne traite ni des lieux, ni de leur toponymes, 00:08:50.456 --> 00:08:52.603 mais des sources de ces derniers. 00:08:52.603 --> 00:08:57.123 Il s'agit donc de trois millions de notes sur le terrain des noms de lieux, 00:08:57.723 --> 00:08:59.529 et il s'agit d'un projet Wikibase. 00:08:59.529 --> 00:09:01.139 Ces données sont dans une Wikibase, 00:09:01.139 --> 00:09:03.325 principalement en finnois, certaines en suédois, 00:09:03.325 --> 00:09:08.111 dans quantité de langues sámi d'intérêt, 00:09:08.111 --> 00:09:10.141 et elles sont sous licence CC BY 4.0, 00:09:10.380 --> 00:09:14.850 ce qui représente également un défi du point de vue Wikidata, 00:09:14.850 --> 00:09:17.640 mais s'il existait une Wikibase locale finlandaise, 00:09:17.640 --> 00:09:22.632 nous serions peut-être en mesure de les travailler en premier. 00:09:23.034 --> 00:09:25.343 Voici donc une capture d'écran 00:09:26.443 --> 00:09:31.323 montrant qu'il y a des informations concernant le lieu, les cartes... 00:09:31.323 --> 00:09:35.227 et des anciennes cartes que les collectionneurs utilisaient, 00:09:35.227 --> 00:09:40.713 ainsi que des cartes générées sur la base des données récoltées. 00:09:41.455 --> 00:09:46.416 Voici donc une de ces cartes 00:09:46.416 --> 00:09:50.186 générée sur base des données. 00:09:51.166 --> 00:09:53.301 Nous avons également ce projet 00:09:53.301 --> 00:09:56.336 mené par le Laboratoire des humanités numériques d'Helsinki 00:09:56.336 --> 00:10:01.446 et le groupe de recherche en sémantique informatique de l'université d'Aalto, 00:10:01.446 --> 00:10:06.525 en partenariat avec l'Institut de langues de Finlande, 00:10:06.525 --> 00:10:07.994 le projet Names Sampo. 00:10:07.994 --> 00:10:11.024 Et il s'agit d'une interface de recherche agrégée 00:10:11.024 --> 00:10:13.503 selon plusieurs sources de toponymie. 00:10:13.503 --> 00:10:17.704 Ici, on peut voir nombre de sources à gauche de l'écran, 00:10:17.704 --> 00:10:20.763 et on peut générer différentes représentations 00:10:20.763 --> 00:10:22.653 sur la base de ces données. 00:10:22.653 --> 00:10:24.438 Et... oui, c'est ça. 00:10:25.289 --> 00:10:30.603 J'ai donc évoqué cette idée de modélisation d'une Wikibase locale 00:10:30.603 --> 00:10:32.693 que nous pourrions réaliser avec ces données. 00:10:32.693 --> 00:10:36.280 Mais lorsque nous évoquons ces questions de modélisation, 00:10:36.280 --> 00:10:37.770 ou comment modéliser, 00:10:37.770 --> 00:10:41.589 il y existe différentes manières de procéder. 00:10:42.105 --> 00:10:43.693 Et donc... 00:10:44.662 --> 00:10:45.682 Oui. 00:10:45.682 --> 00:10:48.160 Ce qu'il y a de bien, 00:10:48.160 --> 00:10:50.569 c'est que cela pourrait servir les langues minoritaires 00:10:50.569 --> 00:10:52.593 avec très peu d'efforts. 00:10:53.243 --> 00:10:57.179 Très bien, nous avons donc ici deux options : 00:10:57.179 --> 00:11:01.660 le modèle SAPO, c'est-à-dire l'ontologie spatio-temporelle finlandaise, 00:11:02.841 --> 00:11:04.421 et le modèle Wikidata. 00:11:04.421 --> 00:11:06.909 On peut voir ici que les éléments Wikidata ont tendance à... 00:11:06.909 --> 00:11:12.871 eh bien, dans l'idéal, rester identiques avec des propriétés changeantes, 00:11:12.871 --> 00:11:16.909 alors que, dans le modèle SAPO, ces éléments deviennent nouveaux 00:11:16.909 --> 00:11:20.399 lorsqu'il y a un changement, comme un changement de zone ou de nom. 00:11:21.179 --> 00:11:26.219 Revenons à ce schéma divisé 00:11:26.219 --> 00:11:31.719 entre ces trois différentes dimensions. 00:11:32.099 --> 00:11:35.869 Ainsi, devrions-nous faire de ces toponymes 00:11:35.869 --> 00:11:37.659 des entités ou des propriétés ? 00:11:37.659 --> 00:11:39.248 Wikidata utilise des propriétés, 00:11:39.248 --> 00:11:43.098 tandis que le Service National Cartopgraphique parle d'entités. 00:11:43.838 --> 00:11:46.177 Ou devrions-nous en faire des lexèmes ? 00:11:46.177 --> 00:11:52.106 Wikidata a choisi de travailler avec des propriétés textuelles 00:11:52.106 --> 00:11:54.956 pour les toponymes plutôt que des lexèmes. 00:11:55.567 --> 00:11:57.818 Je suis désolée, c'est l'inverse. 00:11:57.818 --> 00:11:59.631 Donc, les noms sont... 00:12:03.056 --> 00:12:04.941 des propriétés, pas des lexèmes. 00:12:05.874 --> 00:12:06.877 Bien. 00:12:07.165 --> 00:12:11.132 Je dirais que la faiblesse de la Wikibase 00:12:11.132 --> 00:12:16.340 est peut-être l'absence de données topographiques 00:12:16.340 --> 00:12:20.958 comme dans la configuration de base, 00:12:20.958 --> 00:12:24.748 il faudrait donc rendre le système plus performant 00:12:24.748 --> 00:12:29.688 pour pouvoir utiliser les topographies locales. 00:12:29.688 --> 00:12:31.823 Et une fédération serait vraiment la bienvenue 00:12:31.823 --> 00:12:38.048 pour pouvoir profiter du corpus Wikidata. 00:12:38.648 --> 00:12:41.926 Donc, je crois bien être arrivée à la fin de la présentation ! 00:12:41.926 --> 00:12:43.058 Merci ! 00:12:43.616 --> 00:12:45.827 (applaudissements) 00:12:49.381 --> 00:12:52.071 (bruits de pas) 00:13:01.255 --> 00:13:02.514 Bien. 00:13:03.274 --> 00:13:05.011 (s'exprimant en maori) 00:13:05.011 --> 00:13:06.165 (Mike) Bienvenue à tous. 00:13:06.165 --> 00:13:08.375 Je m'appelle Mike Dickison. 00:13:08.375 --> 00:13:10.149 Et durant un an, 00:13:10.149 --> 00:13:13.075 j'ai été un wikipédien néo-zélandais en résidence. 00:13:13.935 --> 00:13:16.935 Vous vous demandez peut-être ce qu'est un wikipédien en résidence, 00:13:17.856 --> 00:13:20.825 parce que si vous cherchez, vous ne trouverez rien à ce sujet, 00:13:20.825 --> 00:13:22.275 comme on peut le voir ici. 00:13:22.735 --> 00:13:25.855 C'est un terme que j'ai inventé dans la proposition de subvention, 00:13:26.153 --> 00:13:29.003 ce que la fondation a semblé beaucoup apprécier. 00:13:29.983 --> 00:13:31.533 Et donc, nous avons gardé ce terme. 00:13:32.303 --> 00:13:36.633 Durant un an, je suis passé par 35 institutions différentes, 00:13:37.053 --> 00:13:41.053 les résidences qui, pour la plupart, organisaient des sessions de formation, 00:13:41.493 --> 00:13:44.363 des événements publics, et essayaient de développer 00:13:44.363 --> 00:13:47.230 une stratégie Wikimedia, chacune de leur côté. 00:13:47.808 --> 00:13:49.498 Ça a été une expérience très intéressante, 00:13:49.498 --> 00:13:53.267 où j'ai découvert un large éventail de projets et de personnes, 00:13:53.267 --> 00:13:58.211 et j'aimerais passer en revue quelques-uns des différents projets 00:13:58.211 --> 00:14:00.345 qui portaient sur Wikidata, 00:14:00.872 --> 00:14:05.171 d'une manière intéressante, ou tout au moins éclairante, 00:14:05.171 --> 00:14:07.181 dont les gens pourront débattre. 00:14:07.181 --> 00:14:08.621 Le projet était axé sur Wikipedia... 00:14:08.621 --> 00:14:11.961 Le projet était initialement estampillé Wikipédia 00:14:11.961 --> 00:14:14.651 simplement parce que les gens étaient familiers de Wikipedia, 00:14:15.281 --> 00:14:18.360 et nous avons donc organisé de multiples événements différents 00:14:18.360 --> 00:14:23.135 lors d'edit-a-thons traditionnels sur les écarts entre les sexes... 00:14:24.607 --> 00:14:26.752 [dont beaucoup ont été très fructueux], 00:14:27.105 --> 00:14:30.812 ainsi qu'une série recrutement de rédacteurs en chef tout aussi réussie. 00:14:31.754 --> 00:14:34.454 Nous avons effectué des téléchargements en masse vers les Commons. 00:14:35.454 --> 00:14:41.246 En l'occurrence ici, une collection de plus de 1 000 œuvres d'art originales 00:14:41.246 --> 00:14:46.047 de l'illustrateur entomologiste, Des Helmore, 00:14:46.047 --> 00:14:47.927 qui se trouvait sur un disque dur, 00:14:47.927 --> 00:14:50.167 qui correspondait à une décennie de recherche, 00:14:50.167 --> 00:14:52.322 et nous avons pu obtenir l'autorisation de les publier 00:14:52.322 --> 00:14:54.245 le tout sous licence CC BY. 00:14:54.245 --> 00:14:57.963 Donc, de petites victoires que nous avons pu montrer aux gens de là-bas. 00:14:57.963 --> 00:15:01.095 Tout le monde peut comprendre des images de coléoptères. 00:15:01.095 --> 00:15:02.850 Tout le monde peut comprendre 00:15:02.850 --> 00:15:07.250 les ateliers consacrés à la réduction de l'écart entre les sexes. 00:15:07.250 --> 00:15:10.251 Mais Wikidata est beaucoup plus difficile à vendre 00:15:10.251 --> 00:15:12.280 aux personnes du secteur GLAM, 00:15:12.280 --> 00:15:15.005 ou toute personne extérieure de notre mouvement. 00:15:16.107 --> 00:15:19.717 J'ai donc commencé à réaliser que Wikidata 00:15:19.717 --> 00:15:22.634 allait devenir une voie de plus en plus importante 00:15:22.634 --> 00:15:25.883 dans ces projets de wikipédiens en résidence. 00:15:25.883 --> 00:15:28.232 Ainsi, au fur et à mesure que nous avancions, 00:15:28.232 --> 00:15:31.849 cette composante a pris de plus en plus d'importance dans mon travail, 00:15:31.849 --> 00:15:36.350 et j'ai commencé à essayer d'en apprendre plus sur Wikidata moi-même, 00:15:36.800 --> 00:15:39.515 parce que je commençais à en comprendre l'importance. 00:15:40.287 --> 00:15:41.989 Donc, voici un projet... 00:15:41.989 --> 00:15:46.325 le kakapo est un perroquet grimpeur endémique de Nouvelle-Zélande. 00:15:48.096 --> 00:15:51.335 Nous avons travaillé en partenariat avec le Ministère de la conservation, 00:15:51.335 --> 00:15:54.299 dont le travail est de sauver cette espèce de l'extinction, 00:15:54.299 --> 00:15:55.643 et l'idée était : 00:15:55.643 --> 00:15:59.253 « Et si nous référencions chaque kakapo dans Wikidata ? » 00:16:01.221 --> 00:16:02.701 Cela peut sembler risible, 00:16:02.701 --> 00:16:05.580 mais c'est en fait un projet parfaitement réalisable. 00:16:05.981 --> 00:16:08.427 Quelques-uns d'entre eux y sont déjà. 00:16:09.100 --> 00:16:11.601 Un élément clé à noter ici est qu'il n'y a très peu de kakapos. 00:16:11.615 --> 00:16:13.245 C'est donc une tâche gérable. 00:16:13.245 --> 00:16:16.656 Il y en existait 148 quand j'ai commencé, un est mort depuis, 00:16:16.935 --> 00:16:19.001 et la dernière saison de reproduction a été bonne 00:16:19.001 --> 00:16:21.765 puisqu'on en dénombre 213 à présent. 00:16:21.765 --> 00:16:25.045 C'est formidable car on n'avait pas atteint ce nombre depuis plus de 50 ans. 00:16:25.505 --> 00:16:28.260 Ça a été une grosse affaire, 00:16:28.260 --> 00:16:30.725 ça faisait les manchettes tous les jours en Nouvelle-Zélande. 00:16:31.285 --> 00:16:32.694 Et... oui ? 00:16:32.694 --> 00:16:34.414 (intervenant·e 1) Même le New York Times ! 00:16:34.414 --> 00:16:35.673 (Mike) Vraiment ? Merveilleux. 00:16:35.673 --> 00:16:38.522 Oui, ça a eu une ampleur nationale, tout le monde aime ces oiseaux. 00:16:39.002 --> 00:16:40.663 Mais ce qui les rend intéressants, 00:16:40.663 --> 00:16:43.932 c'est que, contrairement aux espèces qui sont plus peuplées, 00:16:43.932 --> 00:16:49.817 chaque kakapo a un nom et un numéro d'identification propre, 00:16:49.817 --> 00:16:52.442 et on dispose souvent de données biographiques complètes 00:16:52.442 --> 00:16:54.672 sur le lieu et la date de leur naissance, 00:16:54.672 --> 00:16:56.972 où ils ont été couvés, qui étaient le père et la mère, 00:16:56.972 --> 00:16:58.713 quand ils sont morts, s'ils sont morts. 00:16:58.713 --> 00:17:01.312 Il existe donc une base de données au Ministère de la conservation 00:17:01.312 --> 00:17:02.882 qui répertorie toutes ces informations. 00:17:02.882 --> 00:17:06.723 Et l'un des plus célèbres kakapos, bien entendu, est Sirocco, 00:17:06.723 --> 00:17:09.726 qui, comme vous pouvez le voir, est nommé d'après le vent. 00:17:09.726 --> 00:17:13.225 Sirocco a un compte Twitter, 00:17:13.705 --> 00:17:15.927 avec lequel Wikidata rencontrait quelques problèmes, 00:17:15.927 --> 00:17:17.162 parce que, apparemment, 00:17:17.162 --> 00:17:20.342 ils ne peuvent tout simplement pas avoir de compte Twitter, bref. 00:17:21.121 --> 00:17:23.456 Il a même fait la couverture d'un album, et cetera. 00:17:23.456 --> 00:17:25.716 Il y a donc eu de multiples propriétés à cela, 00:17:25.716 --> 00:17:28.258 à probablement l'un des plus célèbres kakapo. 00:17:28.258 --> 00:17:30.337 J'ai donc proposé au Ministère de la conservation : 00:17:30.337 --> 00:17:33.245 « Pourquoi n'essayons-nous pas de faire cela avec chacun d'entre eux ? » 00:17:33.245 --> 00:17:37.665 Alors, il leur a fallu réfléchir à combien des données biographiques 00:17:37.665 --> 00:17:39.365 pourraient être rendues publiques, 00:17:39.365 --> 00:17:41.225 et ils ont présenté une liste. 00:17:41.225 --> 00:17:45.094 Et maintenant nous en avons, je crois, 212 ou 210... 00:17:45.094 --> 00:17:46.644 je crois qu'un couple est mort... 00:17:46.644 --> 00:17:50.333 kakapo vivants qui sont à présent tous candidats. 00:17:50.333 --> 00:17:52.933 Et ils ne reçoivent un nom que lorsqu'ils se couvrent de plumes, 00:17:52.933 --> 00:17:56.172 un code leur donné tant qu'il sont bébés. 00:17:56.172 --> 00:17:58.227 Donc, une fois la récolte de données complète, 00:17:58.227 --> 00:18:01.806 nous allons créer un Wikidata complet... 00:18:01.806 --> 00:18:04.225 l'espèce entière sera référencée dans Wikidata. 00:18:04.426 --> 00:18:06.605 Mais on doit arriver à une propriété pour DOC ID... 00:18:06.605 --> 00:18:08.875 En fait, j'aimerais évoquer ce sujet avec vous : 00:18:08.875 --> 00:18:11.266 devrions-nous utiliser une identification très spécifique 00:18:11.266 --> 00:18:14.216 ou devrions-nous trouver une identité qui fonctionnerait 00:18:14.216 --> 00:18:21.375 pour tous les oiseaux, plantes ou animaux sujets de projets scientifique ? 00:18:21.965 --> 00:18:23.795 C'est une bonne question. 00:18:25.105 --> 00:18:27.695 Le deuxième projet concernait la galerie d'art de Christchurch. 00:18:28.225 --> 00:18:31.523 Il y existe très peu de peintures de Colin MacCahon, 00:18:31.523 --> 00:18:33.963 c'est l'un des plus célèbres artistes de l'existence. 00:18:33.963 --> 00:18:36.704 Voici un dessin qu'il a fait pour le New Zealand School Journal, 00:18:36.704 --> 00:18:38.424 financé par le gouvernement de l'époque. 00:18:38.424 --> 00:18:40.704 Il fait donc partie des archives de Nouvelle-Zélande 00:18:40.704 --> 00:18:42.294 qui en détiennent les droits d'auteur. 00:18:42.294 --> 00:18:44.333 C'est une situation très inhabituelle. 00:18:44.774 --> 00:18:47.073 J'ai donc travaillé avec la galerie d'art de Christchurch, 00:18:47.073 --> 00:18:48.993 qui, avec la galerie d'art d'Auckland, 00:18:48.993 --> 00:18:52.954 posséde un site appelé « Trouvez des artistes néo-zélandais », 00:18:52.954 --> 00:18:55.478 dont la tâche est de garder une trace des exploitations... 00:18:55.478 --> 00:18:58.403 de chaque institution possédant des propriétés d'artistes néo-zélandais, 00:18:58.403 --> 00:19:03.163 soit une base données d'environ 18 000 artistes, 00:19:03.163 --> 00:19:05.517 dont la majorité est très peu documentée. 00:19:06.233 --> 00:19:08.992 Nous avons donc procédé à une sorte de Mix'n'Match standard. 00:19:08.992 --> 00:19:12.133 Nous avons exporté les données ayant au moins 00:19:12.133 --> 00:19:17.545 une date de naissance ou de décès, ou un lieu de naissance ou de mort. 00:19:17.545 --> 00:19:20.614 Donc, le champs était large. 00:19:20.614 --> 00:19:23.484 Or, même là, on en a extrait peu, 00:19:23.484 --> 00:19:25.954 mais aujourd'hui, nous en avons environ 1 500 00:19:25.954 --> 00:19:28.603 reliés à des artistes connus dans Wikidata, 00:19:28.603 --> 00:19:30.123 ce qui est bien. 00:19:30.123 --> 00:19:31.783 Mais ce qui les intéressait... 00:19:31.783 --> 00:19:33.523 Voici leur site web, 00:19:33.523 --> 00:19:39.213 qui ne fait que répertorier les liens d'exploitation, 00:19:39.213 --> 00:19:44.523 sachant qu'il créent manuellement ces données biographiques 00:19:44.523 --> 00:19:46.063 pour chaque artiste, 00:19:46.063 --> 00:19:48.803 eh bien, l'acte d'exporter et la mise en place d'un Mix'n'Match 00:19:48.803 --> 00:19:52.363 a mis en lumière de nombreuses coquilles et toute sorte d'erreurs, 00:19:52.363 --> 00:19:53.723 qu'ils n'avaient pas remarquées. 00:19:53.723 --> 00:19:56.123 Et ce n'est que qu'en traitant les données dans un Excel 00:19:56.123 --> 00:19:57.272 que les erreurs ressortent. 00:19:57.272 --> 00:20:01.520 Et ils ont tout à coup réalisé la valeur de Wikidata 00:20:01.520 --> 00:20:02.547 quand je leur ai dit : 00:20:02.547 --> 00:20:06.537 « Il vous suffit de pomper ces informations de Wikidata ». 00:20:06.548 --> 00:20:09.507 Ça leur a ouvert les yeux. 00:20:09.507 --> 00:20:11.748 Je pense donc que c'est un des arguments vendeurs. 00:20:11.748 --> 00:20:14.907 Lorsque vous avez un site web soigneusement créé à la main, 00:20:14.907 --> 00:20:17.154 avec 18 000 entrées pleines d'erreurs, 00:20:17.154 --> 00:20:19.344 et qu'on vous dit qu'il existe un autre moyen, 00:20:19.344 --> 00:20:23.192 que d'autres personnes peuvent vérifier et corriger pour vous les informations, 00:20:23.192 --> 00:20:24.813 c'est là que l'idée fait son chemin. 00:20:25.143 --> 00:20:30.083 Et puis, je leur ai lancé l'idée de « Wikidatafier » l'intégralité ce livre 00:20:30.083 --> 00:20:33.333 sur l'histoire des artistes néo-zélandais à Christchurch dans les années 30, 00:20:33.333 --> 00:20:39.453 et de passer en revue chaque personne, lien, lieu, exposition, et cetera. 00:20:39.453 --> 00:20:43.103 C'est un projet de taille raisonnable, et ils sont très enthousiastes. 00:20:43.943 --> 00:20:46.843 Et troisièmement, je voulais vous montrer le projet des rubriques Maori. 00:20:46.843 --> 00:20:50.811 Waka est le nom maori qui désigne un certain type de canoë, 00:20:50.811 --> 00:20:52.732 un canoë de guerre. 00:20:52.732 --> 00:20:55.812 Ainsi, à la Bibliothèque nationale de la Nouvelle-Zélande, 00:20:55.812 --> 00:20:57.090 il existe une entrée pour waka, 00:20:57.090 --> 00:21:00.925 parce que la Bibliothèque nationale a en réalité son propre dictionnaire 00:21:00.925 --> 00:21:04.234 des rubriques Maori, en langue maori. 00:21:04.234 --> 00:21:09.755 Donc, ici, il définit le waka en maori et en anglais. 00:21:10.182 --> 00:21:12.372 Mais il comporte également beaucoup de termes maoris... 00:21:12.372 --> 00:21:16.237 on peut voir ici, sur le côté, une taurapa maorie typique. 00:21:16.237 --> 00:21:19.774 La définition apparaît d'abord en maori, puis en anglais. 00:21:19.774 --> 00:21:22.475 Ce qu'on voit ici, c'est un étambot sculpté. 00:21:22.475 --> 00:21:24.252 En français, on appellerait cela « étambot », 00:21:24.252 --> 00:21:26.989 mais on ne peut pas utiliser le mot « étambot » pour une taurapa, 00:21:26.989 --> 00:21:28.750 car on ne voit la taurapa 00:21:28.750 --> 00:21:31.420 que sur certains types de canoës de guerre. 00:21:31.420 --> 00:21:34.460 Donc, il n'existe pas d'équivalent en français. 00:21:35.108 --> 00:21:36.909 Et j'ai soudain réalisé qu'il y avait ici 00:21:36.909 --> 00:21:39.929 toute une ontologie de termes spécifiques à la culture 00:21:39.929 --> 00:21:42.867 qui ont été soigneusement répertoriés et vérifiés 00:21:42.867 --> 00:21:45.043 par la Bibliothèque nationale avec les Maoris, 00:21:45.043 --> 00:21:49.733 régulièrement mis à jour et suppléés par des définitions et des descriptions, 00:21:49.733 --> 00:21:51.803 en anglais et en maori. 00:21:51.803 --> 00:21:52.956 Vraiment passionnant ! 00:21:52.956 --> 00:21:56.228 J'ai soudain pensé que nous pourrions injecter tout cela dans Wikidata, 00:21:56.228 --> 00:21:57.993 en maori d'abord, 00:21:57.993 --> 00:22:00.596 puis traduits en anglais, selon les besoins, 00:22:00.596 --> 00:22:02.291 ça change un peu, n'est-ce pas ? 00:22:03.081 --> 00:22:05.046 Voici la licence de droit d'auteur. 00:22:05.046 --> 00:22:08.726 Et malheureusement, elle en empêche l'exploitation commerciale. 00:22:10.346 --> 00:22:14.626 Je dois reprendre les échanges avec eux : pourquoi ont-ils choisi cette license ? 00:22:15.675 --> 00:22:19.970 Peut-être parce qu'ils ont [négocié] avec les Maoris, 00:22:19.970 --> 00:22:22.679 qui ont accepté la diffusion de ces informations 00:22:22.679 --> 00:22:27.149 à condition qu'aucune de ces informations ne soit utilisée à des fins commerciales. 00:22:27.920 --> 00:22:31.999 C'est donc l'un des aspects les plus frustrants de cette tâche : 00:22:31.999 --> 00:22:34.238 se heurter à ce genre de restrictions. 00:22:34.238 --> 00:22:36.869 Voici donc les trois projets que je voulais mettre en avant 00:22:36.869 --> 00:22:38.379 et ouvrir à la discussion. 00:22:38.379 --> 00:22:40.878 Répertorier une espèce entière dans Wikidata, 00:22:40.878 --> 00:22:44.107 ce qu'il faut pour changer la vision d'un conservateur de galerie d'art 00:22:44.107 --> 00:22:46.078 sur la valeur des Wikidatas, 00:22:46.078 --> 00:22:49.838 et que faire lorsque nous voyons une ontologie entière 00:22:49.838 --> 00:22:51.277 dans une autre langue qui, 00:22:51.277 --> 00:22:55.697 malheureusement, est freinée par une licence Creative Commons. 00:22:55.697 --> 00:22:56.997 Je vous remercie. 00:22:56.997 --> 00:22:58.737 (applaudissements) 00:23:04.574 --> 00:23:07.024 Faire don de données à Wikidata : 00:23:07.024 --> 00:23:09.664 première expérience avec les archives de presse du 20e siècle. 00:23:11.412 --> 00:23:14.077 (Joachim) Bonjour ! Je m'appelle Joachim Neubert. 00:23:14.077 --> 00:23:16.472 Je travaille pour la ZBW, 00:23:17.522 --> 00:23:20.947 c'est-à-dire le centre d'information pour l'économie à Hambourg, 00:23:21.407 --> 00:23:24.306 en tant que développeur de logiciels scientifiques. 00:23:24.726 --> 00:23:27.248 Et une de mes tâches l'année dernière 00:23:27.248 --> 00:23:31.408 a été de préparer un don de données à Wikidata. 00:23:31.878 --> 00:23:37.193 Je voudrais donc faire un compte-rendu de cette première expérience 00:23:37.613 --> 00:23:43.259 de don de métadonnées des archives de presse du 20e siècle. 00:23:46.463 --> 00:23:48.299 À notre connaissance, 00:23:48.299 --> 00:23:52.678 il s'agit des plus grandes archives de presse publiques dans le monde. 00:23:54.018 --> 00:23:59.158 Elles ont été collectées entre 1908 et 2005, 00:24:01.008 --> 00:24:04.244 et ont été obtenues de... 00:24:05.174 --> 00:24:10.312 de plus de 1 500 journaux et périodiques d'Allemagne, 00:24:10.312 --> 00:24:13.333 mais aussi à l'échelle internationale. 00:24:14.651 --> 00:24:18.841 Et elles couvrent tout ce qui pourrait présenter un intérêt 00:24:18.841 --> 00:24:22.820 pour Hambourg... 00:24:25.870 --> 00:24:28.030 pour les hommes d'affaires de Hambourg 00:24:28.030 --> 00:24:32.410 qui voudraient développer leur commerce à travers le monde. 00:24:34.611 --> 00:24:36.550 Comme vous pouvez le constater, 00:24:36.550 --> 00:24:41.790 les contenus ont été découpés des journaux et fixés sur des feuilles, 00:24:41.790 --> 00:24:44.731 puis rassemblés dans des dossiers, 00:24:45.211 --> 00:24:50.451 comme ici, on aperçoit une partie d'une pièce d'archive, 00:24:51.255 --> 00:24:56.182 et, de même, l'information qui a été collectée des entreprises, 00:24:56.182 --> 00:24:59.762 sur des sujets généraux, sur... 00:24:59.762 --> 00:25:01.533 (bafouillements) 00:25:01.533 --> 00:25:05.557 sur tout ce qui pourrait être intéressant. 00:25:06.978 --> 00:25:11.074 Ces dossiers ont été scannés 00:25:12.652 --> 00:25:15.868 jusqu'à l'année 1949 environ, 00:25:17.076 --> 00:25:23.123 dans le cadre d'un projet financé par la DFG de 2004 à 2007. 00:25:24.268 --> 00:25:30.591 Par conséquent, jusqu'à présent, ce sont 25 000 dossiers thématiques 00:25:31.727 --> 00:25:33.759 de cette époque qui ont été scannés. 00:25:33.771 --> 00:25:37.913 Les archives contiennent un peu plus de 2 millions de pages, 00:25:38.845 --> 00:25:41.522 et on peut les retrouver sur Internet 00:25:43.633 --> 00:25:48.461 grâce à l'application développée à l'époque par ZBW, 00:25:50.006 --> 00:25:55.931 qui semble aujourd'hui un peu dépassée, n'est pas très agréable à regarder, 00:25:55.931 --> 00:25:58.597 mais plus qu'un programme, NOTE Paragraph 00:25:58.597 --> 00:26:04.350 c'est une application qui a été construite avec une architecture Oracle, 00:26:04.350 --> 00:26:08.662 elle a été construite sur ColdFusion, elle fonctionne sur des serveurs Windows, 00:26:09.227 --> 00:26:14.992 elle n'est donc pas très viable à long terme. 00:26:16.008 --> 00:26:19.384 Nous nous sommes demandés si nous devions la migrer 00:26:19.384 --> 00:26:22.755 vers une application de données ouvertes liées plus sophistiquée, 00:26:23.931 --> 00:26:27.964 ou si nous devions prendre des mesures radicales 00:26:27.964 --> 00:26:31.749 et mettre toutes ces données en consultation libre. 00:26:32.843 --> 00:26:37.416 Nous avons attribué une licence CC0 à ces données 00:26:37.416 --> 00:26:40.938 et nous déplaçons actuellement certaines... 00:26:42.036 --> 00:26:46.463 certaines couches -- principale et primaire -- de découvertes... 00:26:47.233 --> 00:26:50.587 vers des données ouvertes liées 00:26:51.315 --> 00:26:53.801 là où... 00:26:53.801 --> 00:27:00.580 cela a le plus de sens d'intégrer des métadonnées dans Wikidata, 00:27:02.367 --> 00:27:06.781 et afin de s'assurer que tous les dossiers 00:27:07.594 --> 00:27:10.633 des collections sont reliés à Wikidata 00:27:11.485 --> 00:27:13.308 pour qu'ils soient trouvables, 00:27:14.240 --> 00:27:17.795 et que toutes les métadonnées concernant ces dossiers 00:27:18.444 --> 00:27:22.977 soient également transférées sur Wikidata. 00:27:23.344 --> 00:27:27.886 Elles pourront donc y être utilisées, et éventuellement enrichies, 00:27:28.780 --> 00:27:32.237 des corrections pourront être apportées à ces données. 00:27:32.645 --> 00:27:36.224 Mais ZBW continuera de gérer l'application 00:27:36.224 --> 00:27:39.274 et prendre en charge le coût de stockage des images 00:27:39.947 --> 00:27:43.882 auxquelles nous ne pouvons pas, de quelque manière que ce soit, 00:27:45.548 --> 00:27:47.326 attribuer de licence, 00:27:47.326 --> 00:27:51.179 parce qu'elles restent la propriété de leurs créateurs d'origine. 00:27:52.271 --> 00:27:54.954 Mais nous veillerons à ce qu'elles soient accessibles 00:27:56.500 --> 00:28:02.138 à certains fichiers de métadonnées via DFG Viewer 00:28:03.108 --> 00:28:06.108 à l'avenir par les manifestes de l'IIIF. 00:28:06.849 --> 00:28:11.050 Et nous allons mettre en place quelques pages d'atterrissage statiques 00:28:11.707 --> 00:28:18.333 qui serviront de point de données de référence pour Wikidata, 00:28:18.333 --> 00:28:22.596 tout en continuant à mettre à disposition des données 00:28:22.600 --> 00:28:26.174 qui ne s'intègrent pas bien dans Wikidata. 00:28:31.253 --> 00:28:36.815 Pour nous, il s'agit de la migration et du don de données à Wikidata 00:28:37.165 --> 00:28:42.873 grâce notre infrastructure sur mesure de points de terminaison SPARQL 00:28:42.873 --> 00:28:44.837 de ces données, 00:28:45.887 --> 00:28:49.100 et nous avons essentiellement utilisé des requêtes fédérées 00:28:49.990 --> 00:28:53.834 entre les points de terminaison et le service de recherche Wikidata 00:28:53.834 --> 00:28:57.633 pour créer des déclarations concordantes 00:28:59.207 --> 00:29:02.107 au travers de [résultats] concaténés 00:29:02.107 --> 00:29:06.937 dans les requêtes SPARQL elles-mêmes, ou transformés par un script, 00:29:07.907 --> 00:29:12.254 ce qui a également généré des références pour ces déclarations 00:29:12.742 --> 00:29:17.496 et on a ensuite intégré cela aux QuickStatements du code 00:29:17.496 --> 00:29:20.446 pour les utiliser en ligne. 00:29:20.785 --> 00:29:22.544 Enrichissement Wikidata en metadonnées PM20. 00:29:22.544 --> 00:29:24.073 Voilà donc ce que nous obtenons. 00:29:24.073 --> 00:29:25.886 Il ne s'agit pas uniquement de données simples 00:29:25.886 --> 00:29:27.955 comme les dates de naissance, mais... 00:29:27.955 --> 00:29:29.835 oups, pardonnez-moi... 00:29:29.835 --> 00:29:34.998 mais aussi de déclarations complexes 00:29:34.998 --> 00:29:39.787 sur des éléments déjà existants, 00:29:39.787 --> 00:29:42.700 comme par exemple, si cette personne est un superviseur 00:29:42.700 --> 00:29:45.790 membre du conseil d'administration de ladite société 00:29:46.682 --> 00:29:48.905 durant cette période, 00:29:49.663 --> 00:29:54.196 et est référencé dans... 00:29:54.409 --> 00:29:56.149 (hésitation) 00:29:56.149 --> 00:30:01.864 utilisé dans un contexte scientifique. 00:30:04.926 --> 00:30:06.488 Première étape du don de données ZBW : 00:30:06.488 --> 00:30:07.763 L'archive personnelle - achevé 00:30:07.763 --> 00:30:10.939 La première étape de ce don de données a été achevée. 00:30:12.736 --> 00:30:17.201 Les archives personnelles sont entièrement reliées à Wikidata. 00:30:18.333 --> 00:30:23.652 C'est aussi devenu un outil d'informations. 00:30:23.652 --> 00:30:27.360 Beaucoup d'éléments qui ont déjà été... 00:30:27.360 --> 00:30:30.422 n'avaient pas de références externes. 00:30:31.278 --> 00:30:35.674 Et nous avons généré un peu plus de 6 000 déclarations, 00:30:36.201 --> 00:30:41.924 maintenant sourcées dans les métadonnées de cette archive. 00:30:43.737 --> 00:30:45.288 Le prochain grand défi. 00:30:45.288 --> 00:30:49.951 Eh bien, c'était la partie la plus facile, 00:30:50.880 --> 00:30:54.785 parce que les personnes sont facilement identifiables dans Wikidata. 00:30:56.494 --> 00:31:00.443 Plus de 90 % d'entre-elles y existaient déjà, 00:31:00.443 --> 00:31:02.412 donc nous pouvions relier les informations. 00:31:02.412 --> 00:31:06.486 Nous avons créé une centaine d'articles pour ces derniers, 00:31:06.486 --> 00:31:08.807 et pour ceux qui manquaient. 00:31:09.296 --> 00:31:10.996 Mais à présent, 00:31:12.666 --> 00:31:18.165 nous travaillons sur le reste des archives, 00:31:18.165 --> 00:31:20.432 notamment sur les sujets des archives, 00:31:21.243 --> 00:31:24.787 ce qui signifie cartographier un système historique 00:31:24.787 --> 00:31:29.884 pour l'organisation du savoir sur le monde entier, 00:31:29.884 --> 00:31:34.147 matérialisée sous forme de coupures de presse sur Wikidata. 00:31:36.305 --> 00:31:41.898 Pour vous expliquer simplement, les archives de pays et de sujets 00:31:42.668 --> 00:31:48.773 sont organisées selon une hiérarchie de pays 00:31:48.773 --> 00:31:50.882 et d'autres entités géographiques, 00:31:52.499 --> 00:31:56.443 et sont traduites en anglais, ce qui rend les choses plus faciles. 00:31:56.443 --> 00:32:01.861 Et la langue allemande s'est profondément imbriquée... 00:32:03.881 --> 00:32:08.064 profondément imbriquée dans la classification des sujets 00:32:08.064 --> 00:32:11.593 Et cette combinaison définit un... 00:32:13.032 --> 00:32:15.906 un (s'exprime en allemand) 00:32:16.289 --> 00:32:21.128 Donc, nous souhaitons à présent les faire correspondre 00:32:21.128 --> 00:32:24.575 à une structure de Wikidata, et d'intégrer les données. 00:32:25.972 --> 00:32:26.972 Merci ! 00:32:26.972 --> 00:32:29.338 Et je veux vous inviter 00:32:29.338 --> 00:32:33.801 à participer à ce beau défi 00:32:33.801 --> 00:32:36.272 en termes d'organisation des savoirs. 00:32:37.739 --> 00:32:40.713 Il s'agit donc d'un projet Wiki dont la progression est suivie, 00:32:40.713 --> 00:32:46.288 et vous pouvez le suivre ou y participer. 00:32:46.591 --> 00:32:48.908 Voilà, merci beaucoup. 00:32:49.639 --> 00:32:51.723 (applaudissements) 00:33:03.999 --> 00:33:07.284 Amenons donc maintenant les arts du spectacle dans Wikidata, 00:33:07.735 --> 00:33:11.930 et donc dans le cloud lié, 00:33:11.930 --> 00:33:15.595 en créant un écosystème de données ouvertes liées pour les arts de la scène. 00:33:16.164 --> 00:33:21.068 Et la question à laquelle j'essaie de répondre, 00:33:21.068 --> 00:33:24.463 et j'espère que vous m'y aiderez, 00:33:24.463 --> 00:33:27.012 est : « Quelle place donne-t-on à Wikidata, et cetera ? » 00:33:27.012 --> 00:33:33.886 Mais permettez-moi de partager d'abord mes expériences de cette année, 00:33:34.503 --> 00:33:36.154 durant le premier semestre de l'année, 00:33:36.154 --> 00:33:39.350 quand j'ai eu le plaisir de travailler avec la CAPACOA, 00:33:39.350 --> 00:33:42.074 qui est l'Association canadienne des organismes artistiques, 00:33:42.074 --> 00:33:47.408 à l'initiative d'un projet appelé « Un avenir numérique lié ». 00:33:47.831 --> 00:33:51.221 Pour que l'ensemble des arts de la scène canadiens 00:33:51.221 --> 00:33:53.441 adoptent les données ouvertes liées. 00:33:53.441 --> 00:33:56.887 Ils ont lancé cette initiative en partant de l'observation 00:33:56.887 --> 00:33:59.042 qu'au cours des cinq dernières années, 00:33:59.731 --> 00:34:03.924 la problématique principale des arts du spectacle 00:34:03.924 --> 00:34:08.855 était que les métadonnées n'étaient pas disponibles en qualité suffisante 00:34:08.855 --> 00:34:11.780 ni interconnectées, ni même interopérables. 00:34:12.106 --> 00:34:16.498 C'est pourquoi certaines représentations, 00:34:16.498 --> 00:34:19.542 ou événements, ne sont pas si simples à indexer 00:34:19.542 --> 00:34:24.777 par Google et des assistants numériques, et cetera. 00:34:25.989 --> 00:34:29.757 Ainsi, la vision que nous avons eue ensemble, 00:34:29.757 --> 00:34:32.997 était de disposer d'une base de connaissances 00:34:34.013 --> 00:34:35.646 pour de nombreux acteurs simultanément. 00:34:35.646 --> 00:34:39.636 Nous avons donc examiné l'ensemble du réseau de valeurs des arts de la scène, 00:34:39.636 --> 00:34:42.073 nous y avons identifié les principaux acteurs, 00:34:42.073 --> 00:34:44.255 nous avons passé en revue les scénarios d'utilisation 00:34:44.255 --> 00:34:46.632 que nous souhaitions implémenter, 00:34:47.719 --> 00:34:52.074 et l'avons en quelque sorte cartographié à l'ensemble de l'architecture 00:34:52.074 --> 00:34:54.447 d'une telle base de connaissances, 00:34:54.447 --> 00:34:57.097 ou des différentes plateformes qui s'y trouvent, 00:34:57.097 --> 00:34:59.535 ce qui est, évidemment, une architecture distribuée, 00:34:59.535 --> 00:35:01.361 et pas un seul grand monolithe. 00:35:02.499 --> 00:35:07.504 Je vais simplement survoler cette partie car nous disposons de dix minutes chacun, 00:35:09.035 --> 00:35:13.796 mais je pense que nous aurons du temps pour approfondir cela ce soir ou demain, 00:35:13.796 --> 00:35:16.318 si des personnes veulent en savoir un peu plus. 00:35:16.318 --> 00:35:19.116 Nous sommes donc partis de ce réseau de valeurs des arts de la scène 00:35:19.116 --> 00:35:23.263 ce qui, curieusement, a été publié l'année dernière, 00:35:23.263 --> 00:35:27.691 nous avons donc eu la chance de pouvoir nous appuyer sur des travaux antérieurs, 00:35:27.691 --> 00:35:31.098 par exemple, on a la chaîne de valeur primaire des arts du spectacle au milieu, 00:35:31.098 --> 00:35:34.177 et les différents acteurs autour. 00:35:34.177 --> 00:35:37.387 Au total, nous avons identifié 20 groupes d'acteurs, 00:35:37.387 --> 00:35:43.384 que nous pouvons ensuite rassembler en sept grandes catégories. 00:35:43.395 --> 00:35:45.464 Pour chacun des groupes d'acteurs, 00:35:45.464 --> 00:35:51.558 nous avons en quelque sorte formulé le type de besoins 00:35:51.558 --> 00:35:54.718 qu'ils auraient d'une telle infrastructure, 00:35:54.718 --> 00:35:58.572 ce qu'ils seraient en mesure de réaliser si le tout était interconnecté 00:35:58.572 --> 00:36:02.062 et que les données étaient accessibles au public. 00:36:02.637 --> 00:36:04.990 On peut donc voir ici les types... 00:36:04.990 --> 00:36:09.177 les différents types : Production, Présentation et promotion, 00:36:09.177 --> 00:36:13.852 Couverture et réutilisation, le Live, Consommation en ligne, Héritage, 00:36:13.852 --> 00:36:15.959 Recherche et éducation. 00:36:15.959 --> 00:36:21.275 Et après avoir rassemblé cela en un tout, dont on peut voir la première partie ici, 00:36:21.275 --> 00:36:23.878 nous avons pu, disons, comparer, examiner 00:36:23.878 --> 00:36:26.954 quel type de données ont été utilisées dans l'ensemble du tableau, 00:36:26.954 --> 00:36:31.248 par les différents groupes d'acteurs. 00:36:31.248 --> 00:36:36.863 Et la base de données qui leur est commune est plutôt importante 00:36:36.863 --> 00:36:43.063 et c'est bien là que ça a du sens d'incorporer et de garder... 00:36:43.063 --> 00:36:45.988 de conserver ces données ensemble. 00:36:47.602 --> 00:36:50.651 Donc, lorsque l'on parle de l'architecture de la plateforme, 00:36:50.651 --> 00:36:53.648 on peut voir que nous avons quatre couches ici. 00:36:54.096 --> 00:36:56.448 En bas, apparaît la couche de données, 00:36:56.448 --> 00:36:58.717 bien évidemment, Wikidata y joue un rôle, 00:36:58.717 --> 00:37:02.733 mais aussi de nombreuses autres bases de données distribuées 00:37:02.733 --> 00:37:07.769 qui peuvent publier des données via des points de terminaison SPARQL. 00:37:09.204 --> 00:37:13.106 Le nuage jaune au milieu est la couche sémantique, 00:37:13.106 --> 00:37:16.080 c'est notre langue commune pour décrire les choses, 00:37:16.080 --> 00:37:18.620 pour créer des déclarations 00:37:18.620 --> 00:37:22.400 autour des arts de la scène, de l'ontologie. 00:37:22.400 --> 00:37:25.243 Nous avons ensuite une couche d'application 00:37:25.243 --> 00:37:30.551 qui se compose de différents modules, par exemple, l'analyse des données, 00:37:30.551 --> 00:37:31.843 l'extraction de données, 00:37:31.843 --> 00:37:36.029 comment transformer des données non structurées en données structurées, 00:37:36.029 --> 00:37:38.749 comment assister cette tâche par des outils. 00:37:39.436 --> 00:37:42.478 Puis, évidemment, il y a la visualisation des données, 00:37:42.478 --> 00:37:44.961 par exemple, s'il existe de grandes quantités de données, 00:37:44.961 --> 00:37:47.801 vous voudrez les visualiser d'une manière ou d'une autre. 00:37:47.801 --> 00:37:50.155 Et au sommet, vous avez la couche de présentation, 00:37:50.155 --> 00:37:56.199 c'est ce avec quoi les gens ordinaires interagissent quotidiennement : 00:37:56.199 --> 00:37:59.615 les moteurs de recherche, les encyclopédies, les agendas culturels, 00:37:59.615 --> 00:38:02.097 et tout un tas d'autres services. 00:38:03.395 --> 00:38:05.386 Nous ne partons pas de zéro. 00:38:05.386 --> 00:38:08.535 Certains travaux ont déjà été menés dans ce domaine. 00:38:09.107 --> 00:38:13.043 Je me contenterai de citer quelques exemples de projets 00:38:13.043 --> 00:38:15.245 auxquels j'ai participé, 00:38:15.245 --> 00:38:18.149 ainsi que d'autres sujets. 00:38:18.149 --> 00:38:21.195 J'ai donc débuté dans ce domaine 00:38:21.195 --> 00:38:24.476 avec les Archives suisses des arts du spectacle. 00:38:24.751 --> 00:38:27.795 En plus de la construction d'une base de données sur les arts de la scène, 00:38:27.795 --> 00:38:31.046 nous en avons créé l'ontologie, 00:38:31.046 --> 00:38:33.931 qui est actuellement implémentée en RDF, 00:38:34.701 --> 00:38:37.681 et on dispose déjà d'une base de données 00:38:37.681 --> 00:38:43.053 regroupant 60 à 70 ans d'histoire du spectacle Suisse, 00:38:43.053 --> 00:38:45.145 c'est donc quelque chose qui peut servir de base, 00:38:45.145 --> 00:38:48.999 et ça a été transformé en RDF. 00:38:49.968 --> 00:38:54.621 Et il y existe déjà une plateforme où ces données peuvent être consultées. 00:38:56.073 --> 00:39:01.498 Alors nous avons fait plusieurs injections dans Wikidata, 00:39:01.498 --> 00:39:02.877 en partie de la Suisse, 00:39:02.877 --> 00:39:08.990 mais aussi des instituts des arts du spectacle. 00:39:09.680 --> 00:39:12.357 Bart Magnus a par exemple participé à ce projet. 00:39:12.883 --> 00:39:15.078 Il en a été le moteur. 00:39:15.078 --> 00:39:17.223 Il y existe aussi des éléments de Wikimedia Commons, 00:39:17.223 --> 00:39:21.361 mais qui ne sont pas très bien reliés au reste de nos métadonnées, 00:39:21.361 --> 00:39:25.097 et évidemment, en procédant à cette injection, 00:39:25.097 --> 00:39:31.222 nous avons pu aussi implémenter une partie de ce modèle dans Wikidata. 00:39:32.767 --> 00:39:39.013 L'un de nos partenaires Canadien est Culture Creates. 00:39:39.013 --> 00:39:43.872 Ils gèrent une plateforme qui récupère les données des sites web des théâtres 00:39:43.872 --> 00:39:46.873 et les injectent dans un graphique de connaissances, 00:39:48.293 --> 00:39:51.698 pour ensuite l'exposer aux moteurs de recherche 00:39:51.698 --> 00:39:55.438 et d'autres dispositifs de recherche. 00:39:56.415 --> 00:39:58.811 Et là encore, 00:39:58.811 --> 00:40:03.261 nous avons en quelque sorte implémenté et étendu ce système à l'ontologie. 00:40:03.261 --> 00:40:05.389 Et comme on peut le voir sur la diapositive, 00:40:05.389 --> 00:40:09.599 il y a encore beaucoup d'espaces vides, mais il y a aussi des chevauchements, 00:40:09.599 --> 00:40:13.456 et un chevauchement important qui est évidemment la langue commune partagée, 00:40:13.456 --> 00:40:18.693 ce qui nous aidera à interconnecter les différents ensembles de données. 00:40:20.759 --> 00:40:22.587 Il est également important 00:40:22.587 --> 00:40:26.404 d'utiliser les même registres de base et fichiers d'autorité, 00:40:26.406 --> 00:40:31.368 et Wikidata joue un rôle important dans ce domaine 00:40:31.368 --> 00:40:33.967 en interconnectant. 00:40:34.619 --> 00:40:37.799 J'aimerais maintenant vous faire part des recommandations 00:40:37.799 --> 00:40:41.882 par le comité consultatif de l'initiative « Un avenir numérique lié », 00:40:42.769 --> 00:40:45.169 tout du moins, des deux premières recommandations. 00:40:45.169 --> 00:40:49.450 Donc, pour les Canadiens, il est désormais crucial de remplir 00:40:49.450 --> 00:40:53.173 leur propre graphique des connaissances sur les arts du spectacle, 00:40:53.173 --> 00:40:55.851 car, contrairement aux Archives suisses des arts du spectacle, 00:40:55.851 --> 00:40:59.389 ils n'ont pas une base de données déjà existante, 00:40:59.389 --> 00:41:01.906 mais ils peuvent la créer, 00:41:01.906 --> 00:41:04.468 et il est absolument crucial d'y avoir des données. 00:41:04.468 --> 00:41:06.934 Et deuxièmement, comme vous pouvez le voir, 00:41:06.934 --> 00:41:09.024 cela concerne Wikidata. 00:41:09.024 --> 00:41:12.342 Wikidata, aux yeux du comité consultatif, 00:41:12.342 --> 00:41:16.718 a été considéré comme source complémentaire à Artsdata.ca, 00:41:16.718 --> 00:41:18.347 ce graphique de connaissance, 00:41:18.347 --> 00:41:20.794 et, par conséquent, des efforts devraient être faits 00:41:20.794 --> 00:41:22.703 pour contribuer à sa population 00:41:22.703 --> 00:41:25.813 par le biais de données relatives aux arts du spectacle. 00:41:25.813 --> 00:41:30.775 Et c'est à ces fins que nous allons œuvrer au cours des mois et des années à venir, 00:41:30.775 --> 00:41:34.748 et c'est aussi pourquoi je suis un peu à l'affût 00:41:34.748 --> 00:41:38.454 de voir qui d'autre se joindra à cet effort. 00:41:38.454 --> 00:41:40.556 Wikidata et le WD classique sont complémentaires. 00:41:40.556 --> 00:41:44.942 Donc, évidemment, actuellement, nous les disons complémentaires. 00:41:44.942 --> 00:41:46.631 Nous devons donc réfléchir 00:41:46.631 --> 00:41:49.844 aux avantages et inconvénients de chacune des approches, 00:41:49.844 --> 00:41:52.073 et on peut voir ici une comparaison 00:41:52.073 --> 00:41:56.120 entre les approches Wikidata et les données ouvertes liées classiques. 00:41:56.887 --> 00:41:59.947 Je serais heureux d'approfondir le sujet avec vous, 00:41:59.947 --> 00:42:02.549 quelles expériences vous avez de cela, 00:42:02.814 --> 00:42:05.767 mais mon point de vue est que Wikidata est un atout considérable, 00:42:05.767 --> 00:42:07.727 parce que c'est une plateforme de crowdsourcing, 00:42:07.727 --> 00:42:11.671 et qu'il est facile d'inviter d'autres acteurs à y contribuer. 00:42:11.683 --> 00:42:17.482 Le point négatif, évidemment, est la perte de contrôle : 00:42:17.658 --> 00:42:20.424 les propriétaires de données doivent abandonner le contrôle 00:42:20.424 --> 00:42:22.162 de leurs graphiques, 00:42:22.162 --> 00:42:26.554 de la qualité et l'exhaustivité des données. 00:42:26.554 --> 00:42:29.353 Il est plus difficile d'effectuer un suivi sur Wikidata 00:42:29.353 --> 00:42:31.493 que si vous en aviez le contrôle. 00:42:31.493 --> 00:42:36.236 Une autre force de Wikidata est que ça exige 00:42:36.236 --> 00:42:39.617 une intégration immédiate dans ce graphique mondial, 00:42:39.617 --> 00:42:41.734 et vous pouvez le faire... 00:42:42.544 --> 00:42:46.768 pas à pas par rapport à d'autres bases de données, 00:42:46.768 --> 00:42:49.528 ce qui peut également être vu par certains comme un avantage, 00:42:49.528 --> 00:42:53.914 mais bien sûr, si vous cherchez de l'intégration et de l'interopérabilité, 00:42:53.914 --> 00:42:56.792 Wikidata vous oblige à aller le chercher depuis le début. 00:42:59.184 --> 00:43:03.157 Et puis, évidemment, l'harmonisation des pratiques de modélisation des données 00:43:03.157 --> 00:43:05.552 pose problème dans les deux options. 00:43:06.039 --> 00:43:08.611 Mais cela peut vous sembler plus facile, au début, 00:43:08.611 --> 00:43:10.671 de le faire dans votre propre silo, 00:43:10.671 --> 00:43:13.356 parce qu'à un moment donné, vous en aurez terminé avec cette tâche, 00:43:13.356 --> 00:43:16.693 sinon ça resterait une tâche en cours sur Wikidata. 00:43:18.280 --> 00:43:22.883 Ainsi, lorsqu'il s'agit de définir les données à injecter en priorité, 00:43:23.535 --> 00:43:28.395 voici les règles, que je vais passer en revue. 00:43:30.055 --> 00:43:32.325 Tout d'abord, on injectera les données 00:43:32.325 --> 00:43:36.191 là où l'autorité naturelle n'est pas clairement définie, 00:43:36.191 --> 00:43:40.433 il s'agit donc évidemment de données qui seront gérées de manière partagée. 00:43:40.902 --> 00:43:43.941 On injectera des données 00:43:43.941 --> 00:43:47.149 là où nous voyons un potentiel élevé de crowdsourcing. 00:43:47.149 --> 00:43:49.133 On injectera des données 00:43:49.133 --> 00:43:51.693 là où elles sont susceptibles d'être réutilisées 00:43:51.693 --> 00:43:53.965 dans le contexte de Wikipédia. 00:43:54.813 --> 00:44:00.262 Et il y a aussi un espoir qu'une partie de la coordination internationale 00:44:00.262 --> 00:44:03.064 autour de l'ensemble de la modélisation des données, 00:44:03.064 --> 00:44:04.364 autour de la normalisation, 00:44:04.364 --> 00:44:07.531 puisse avoir avoir lieu directement sur Wikidata, 00:44:07.531 --> 00:44:09.484 si ce n'est ailleurs, 00:44:09.484 --> 00:44:12.309 parce que cela force les gens à interagir 00:44:12.309 --> 00:44:14.816 s'ils injectent leurs données dans un même endroit. 00:44:15.963 --> 00:44:19.490 Et j'aimerais maintenant aborder 00:44:19.490 --> 00:44:22.181 les registres de base et les fichiers d'autorité 00:44:22.181 --> 00:44:25.785 car ils nous aident en quelque sorte à créer des liens 00:44:25.785 --> 00:44:29.010 entre les différentes données et des vocabulaires contrôlés 00:44:29.010 --> 00:44:32.833 comme une extension de l'ontologie existante. 00:44:33.965 --> 00:44:35.994 Il nous reste donc à voir deux autres diapositives. 00:44:36.480 --> 00:44:40.978 La prochaine étape consiste à passer de la « somme des GLAM » 00:44:40.978 --> 00:44:42.888 et à « Wiki aime les arts du spectacle ». 00:44:42.888 --> 00:44:47.524 Cela signifie que nous décrivons les lieux et organismes 00:44:47.524 --> 00:44:51.106 et essayons d'envoyer ces données dans Wikipedia 00:44:51.106 --> 00:44:54.414 sous forme d'infoboxes et infobulles. 00:44:54.414 --> 00:44:59.769 L'autre projet que je vais mener est le COST Action, 00:45:00.336 --> 00:45:02.001 que nous présenterons l'année prochaine 00:45:02.930 --> 00:45:06.037 autour de cet écosystème de données ouvertes liées pour les arts du spectacle. 00:45:06.037 --> 00:45:07.927 COST est un programme européen 00:45:07.927 --> 00:45:10.347 qui soutient les activités de mise en réseau, 00:45:10.347 --> 00:45:13.929 et les sujets à traiter sont énumérés ici. 00:45:13.929 --> 00:45:16.404 J'en ai souligné deux d'entre eux : 00:45:16.404 --> 00:45:20.702 l'un d'entre eux traite de la question de fédération entre Wikidata 00:45:20.702 --> 00:45:23.717 et une approche de données ouvertes liées. 00:45:24.368 --> 00:45:27.744 Et l'autre est également très important à mon sens, 00:45:27.744 --> 00:45:30.528 et présente un énorme potentiel, 00:45:30.528 --> 00:45:33.133 il s'agit de mettre en œuvre des campagnes internationales 00:45:33.133 --> 00:45:35.993 pour suppléer les données sur Wikidata. 00:45:37.627 --> 00:45:38.975 Eh bien, voilà ! 00:45:38.975 --> 00:45:41.365 Je vous remercie de votre attention. 00:45:41.365 --> 00:45:45.762 Maintenant, je vais demander à mes collègues de me rejoindre. 00:45:47.086 --> 00:45:50.529 Pour le panel, nous aurons peut-être des microphones également. 00:45:53.903 --> 00:45:55.682 Et puis j'aimerais... 00:45:57.473 --> 00:45:59.940 vous donner la possibilité de poser des questions, 00:46:01.042 --> 00:46:05.185 et bien sûr demander à mes collègues 00:46:05.753 --> 00:46:08.071 s'ils ont des questions les uns pour les autres. 00:46:12.049 --> 00:46:15.327 Alors, avons-nous une question du public ? 00:46:18.114 --> 00:46:19.974 (rires) 00:46:20.502 --> 00:46:22.587 (un·e intervenant·e parle sans micro) 00:46:22.587 --> 00:46:23.587 (rires) 00:46:23.587 --> 00:46:27.033 (intervenant·e 2) J'aimerais demander à chacun d'entre vous 00:46:27.033 --> 00:46:30.842 où vous traceriez la ligne... 00:46:30.842 --> 00:46:33.076 en gros, comment vous définiriez 00:46:33.076 --> 00:46:35.956 le moment où il est nécessaire de gérer votre propre Wikibase, 00:46:35.956 --> 00:46:39.328 et ce vous mettriez sur Wikidata ? 00:46:39.328 --> 00:46:45.257 Est-ce qu'il y a une délimitation claire derrière la mise en ordre ? 00:46:48.211 --> 00:46:51.484 Je peux répondre en premier parce que j'ai le micro. 00:46:51.484 --> 00:46:56.955 Donc, je pense que l'un des enjeux est la notoriété. 00:46:59.212 --> 00:47:02.084 J'y réponds dans un autre projet. 00:47:02.084 --> 00:47:05.898 Et je pense que la licence pourrait en être un aussi, 00:47:05.898 --> 00:47:08.580 parce que vous pouvez imposer vos propres conditions 00:47:08.580 --> 00:47:13.782 dans votre propre base de données, lorsque c'est possible. 00:47:14.284 --> 00:47:19.882 Et troisièmement, je dirais qu'il faut avoir un bac à sable, 00:47:19.882 --> 00:47:23.078 pour préparer l'injection des données dans Wikidata. 00:47:23.078 --> 00:47:26.085 Voici les trois idées qui me viennent pour l'instant, 00:47:26.085 --> 00:47:28.554 mais je peux en trouver d'autres. 00:47:29.976 --> 00:47:32.369 Pour moi, les droits seront toujours un problème. 00:47:32.369 --> 00:47:36.686 Donc, si la Bibliothèque nationale voulait se diriger vers une Wikibase, 00:47:36.686 --> 00:47:39.740 cela leur permettrait de continuer à contrôler l'octroi des licences 00:47:39.740 --> 00:47:42.539 pour le travail qu'ils ont accompli sur les termes en langue maori. 00:47:43.438 --> 00:47:46.483 La base de données kakapo ne contient que des données 00:47:46.483 --> 00:47:49.977 que le Ministère de la conservation a estimé pouvoir rendre publique, 00:47:49.977 --> 00:47:52.739 mais s'ils le voyaient en état de marche, 00:47:52.739 --> 00:47:55.980 ils pourraient être tentés d'utiliser une Wikibase privée 00:47:55.980 --> 00:47:58.128 pour gérer leur propre base de données, 00:47:58.128 --> 00:48:00.884 tout bonnement à cause de certains des outils de visualisation 00:48:00.884 --> 00:48:03.567 qui pourraient être appliqués et seraient bien plus efficaces 00:48:03.567 --> 00:48:07.417 qu'un système de tableur Excel qu'ils utilisent actuellement. 00:48:12.337 --> 00:48:16.556 Eh bien, je pense que cela dépend beaucoup du type de données. 00:48:17.609 --> 00:48:22.359 Avec les archives de presse, nous avons été assez chanceux, 00:48:22.359 --> 00:48:26.984 en ce sens qu'il s'agissait d'un support qui a été publié... 00:48:26.984 --> 00:48:29.829 qui a été publié à l'époque, 00:48:30.153 --> 00:48:31.780 mais sa publication a été coûteuse. 00:48:33.082 --> 00:48:36.234 Donc, c'est assez simple. 00:48:36.234 --> 00:48:39.449 Je pense aussi que les projets... 00:48:40.101 --> 00:48:42.476 et c'était un projet classique : 00:48:42.476 --> 00:48:45.726 il a été financé pendant un temps donné, puis le financement a pris fin, 00:48:46.466 --> 00:48:51.516 et puis les données ont été enfermées dans un silo, 00:48:52.136 --> 00:48:55.106 au sein de certains logiciels qui ne sont pas éternels. 00:48:55.846 --> 00:48:59.436 Et donc, cela fait absolument sens à mes yeux. 00:48:59.896 --> 00:49:02.776 À l'époque, Wikidata n'existait pas, mais maintenant il est là, 00:49:03.376 --> 00:49:06.066 et c'est tout à fait logique pour notre projet 00:49:06.066 --> 00:49:09.324 d'en discuter la viabilité 00:49:09.324 --> 00:49:14.763 dans un contexte où la question est l'intégration à un écosystème plus vaste 00:49:15.227 --> 00:49:17.137 comme Wikidata, 00:49:17.137 --> 00:49:18.878 et ce que c'est exactement, 00:49:18.878 --> 00:49:21.408 en discuter avec la communauté Wikidata, 00:49:21.408 --> 00:49:26.864 quel en est l'aspect notable et quel sens ça a de l'ajouter à Wikidata, 00:49:26.864 --> 00:49:32.093 et quel sens ça a de le conserver sous forme de propriété, 00:49:32.093 --> 00:49:37.753 peut-être sous une forme plus simple qu'une application sophistiquée, 00:49:37.753 --> 00:49:43.055 mais de le rendre accessible et le relier au cloud de big data 00:49:43.055 --> 00:49:46.032 au lieu d'investir beaucoup d'argent 00:49:46.032 --> 00:49:52.692 dans un silo qui ne tiendra pas. 00:49:55.201 --> 00:50:00.121 Comme je l'ai déjà dit dans le projet que j'ai présenté ici, 00:50:00.121 --> 00:50:04.926 comme les dualités entre Wikidata et les données ouvertes liées classiques, 00:50:04.926 --> 00:50:07.928 il ne s'agit donc pas tant de la mise en place d'une Wikibase privée. 00:50:11.147 --> 00:50:14.504 Nous avons également fait face à un défi, dans Wikidata : 00:50:14.504 --> 00:50:19.760 lorsqu'on injecte ses propres données, on doit également faire un peu de ménage, 00:50:20.744 --> 00:50:23.509 et nettoyer ce qu'ont fait les autres, en réalité. 00:50:24.043 --> 00:50:25.968 Ça peut en décourager certains, 00:50:25.968 --> 00:50:29.888 ou bien ça veut dire qu'on va devoir s'en occuper pas à pas. 00:50:30.375 --> 00:50:33.466 Il y aura donc, dans un premier temps, une base de données vivant 00:50:33.873 --> 00:50:35.581 dans un Web de données classique 00:50:35.581 --> 00:50:38.395 qu'on commencera à relier à Wikidata, 00:50:38.395 --> 00:50:42.985 et il s'agit d'un processus continu pour déterminer pour quels domaines 00:50:42.985 --> 00:50:47.643 les données de références vivront finalement sur Wikidata, 00:50:48.168 --> 00:50:51.946 et pour quels domaines elles vivront sur d'autres bases de données. 00:50:52.620 --> 00:50:54.865 Il est évident que nous aurons des défis à relever 00:50:54.865 --> 00:50:57.135 concernant la synchronisation, 00:50:57.135 --> 00:51:01.507 comme nous l'avons probablement tous au travers de ce champ de Web de données. 00:51:01.507 --> 00:51:04.826 où il nous faut encore négocier à qui l'on peut se fier, 00:51:05.160 --> 00:51:08.720 qui possède les droits, sur quoi. 00:51:13.830 --> 00:51:15.820 (assistant·e) D'autres questions ? 00:51:23.981 --> 00:51:25.550 (intervenant·e 3) Merci. 00:51:26.090 --> 00:51:31.030 Alors, je suis tout à fait d'accord avec cette question de... 00:51:32.395 --> 00:51:36.909 déterminer où placer la limite 00:51:36.909 --> 00:51:41.607 entre les raisons pour lesquelles nous mettons des données sur Wikidata, 00:51:43.044 --> 00:51:49.144 ou pourquoi on les garde, on les crée, les gére et les met à jour 00:51:49.144 --> 00:51:53.444 dans les bases de données locales et à quelles fins. 00:51:53.778 --> 00:51:57.213 Et je pense qu'il s'agit d'un grand débat 00:51:57.213 --> 00:52:02.383 qui va au-delà du simple enthousiasme 00:52:02.383 --> 00:52:07.423 de mettre des données sur Wikidata parce que c'est public, 00:52:07.432 --> 00:52:10.762 parce qu'il sert l'humanité, parce que... 00:52:11.031 --> 00:52:13.362 ou qu'il possède des outils sympas, 00:52:13.362 --> 00:52:18.132 et les choses sont plus compliquées dans la vie réelle, je pense. 00:52:19.162 --> 00:52:24.102 Eh bien, malgré cela, c'est un débat assez intéressant. 00:52:24.435 --> 00:52:29.744 Et il y a un autre problème qui est débattu 00:52:29.744 --> 00:52:35.034 dans cet événement où l'on présente différents panels : 00:52:35.775 --> 00:52:41.129 d'un côté, vous avez votre propre base de données, 00:52:41.129 --> 00:52:43.194 quelle que soit la technologie, 00:52:43.194 --> 00:52:46.763 et vous publiez des choses sur Wikidata, 00:52:47.233 --> 00:52:51.166 ou vous construisez votre propre système 00:52:51.166 --> 00:52:55.246 en termes de création et de gestion de l'information 00:52:55.246 --> 00:52:58.131 à partir de la technologie Wikibase. 00:52:58.591 --> 00:53:02.201 Et ensuite, vous synchronisez ou je ne sais quoi... 00:53:02.201 --> 00:53:04.281 fédérez ou bien autre chose ; 00:53:04.281 --> 00:53:08.314 il s'agit toujours d'une question de technologie utilisée, 00:53:09.182 --> 00:53:14.796 et le fait que vous utilisiez Wikidata juste pour la publication, 00:53:14.978 --> 00:53:18.637 ou l'infrastructure qui se trouve sous Wikidata 00:53:18.637 --> 00:53:23.002 pour créer et gérer vos données. 00:53:23.002 --> 00:53:24.092 Donc... 00:53:24.804 --> 00:53:26.104 (hésitation) 00:53:27.116 --> 00:53:30.914 Je veux dire que nous avons eu une discussion 00:53:30.914 --> 00:53:34.254 sur le panel de la Wikibase, 00:53:34.254 --> 00:53:36.912 et il y aura d'autres débats ici, 00:53:36.912 --> 00:53:40.815 mais je pense qu'il y a différents niveaux. 00:53:41.626 --> 00:53:47.756 Vous réagissez certainement à ce débat sur Wikibase ou Wikidata... 00:53:48.930 --> 00:53:52.427 Je pense que c'est problématique de tant nous concentrer 00:53:52.427 --> 00:53:54.429 sur cette infrastructure Wikibase, 00:53:54.429 --> 00:53:56.158 parce qu'il existe d'autres infrastructures, 00:53:56.158 --> 00:53:58.690 comme dans le domaine des arts du spectacle. 00:53:59.810 --> 00:54:02.274 Nous avons une communauté complémentaire supplémentaire 00:54:02.274 --> 00:54:04.054 qui est MusicBrainz, 00:54:04.054 --> 00:54:08.954 qui tourne sur sa propre plateforme, qui fournit des données ouvertes liées 00:54:09.614 --> 00:54:12.692 et tel que je le comprends, 00:54:14.160 --> 00:54:17.232 il existe un accord au sein de la communauté Wikidata 00:54:17.232 --> 00:54:19.731 qui dit que nous n'allons pas doubler toutes les données... 00:54:19.731 --> 00:54:21.489 nous n'allons pas copier toutes les données, 00:54:21.489 --> 00:54:24.848 mais nous acceptons qu'ils soient complémentaires. 00:54:24.848 --> 00:54:26.166 Alors, que se passera-t-il 00:54:26.166 --> 00:54:30.246 lorsqu'on commencera à intégrer ces données dans Wikipédia ? 00:54:30.246 --> 00:54:31.907 les infoboxes, par exemple. 00:54:31.907 --> 00:54:34.064 Serons-nous en mesure d'extraire ces données 00:54:34.064 --> 00:54:36.764 directement à partir de leur points de terminaison SPARQL ? 00:54:36.764 --> 00:54:39.603 Ou serons-nous obligés de copier toutes les données, 00:54:39.603 --> 00:54:42.225 et quel type de processus cela fait appelle ? 00:54:42.225 --> 00:54:44.915 (intervenant·e 4) Le débat est ouvert, je pense, 00:54:44.915 --> 00:54:46.785 parce que dans le cadre de cet événement, 00:54:46.785 --> 00:54:49.615 vous avez ces communautés intéressées... 00:54:49.615 --> 00:54:51.975 celles qui s'intéressent à Wikibase, 00:54:51.975 --> 00:54:54.002 celles qui s'intéressent à Wikidata, 00:54:54.002 --> 00:54:56.282 et celles qui s'intéressent aux deux. 00:54:56.282 --> 00:54:59.562 Oui, mais nous n'allons pas les obliger à aller vers Wikibase. 00:55:00.002 --> 00:55:03.118 - (i. 4) Pas nécessairement. - MusicBrainz ne tourne pas sur Wikibase. 00:55:03.118 --> 00:55:04.992 (i. 4) Non, je voulais simplement dire 00:55:04.992 --> 00:55:06.802 que ce sont des problèmes bien distincts. 00:55:06.802 --> 00:55:10.964 Parfois, ils sont reliés, parfois non, ils sont complètement séparés. 00:55:12.479 --> 00:55:16.573 Et j'avais une autre question ou remarque 00:55:16.573 --> 00:55:22.013 concernant la gestion des hiérarchies dans les vocabulaires contrôlés, 00:55:22.013 --> 00:55:26.473 comme la source, comme vous dans Finto. 00:55:27.703 --> 00:55:30.563 Vous avez les lieux... 00:55:31.503 --> 00:55:34.956 et les maoris... 00:55:36.418 --> 00:55:40.554 les rubriques maories... 00:55:42.262 --> 00:55:46.440 Eh bien, ils doivent faire face à la gestion des concepts 00:55:46.440 --> 00:55:48.360 dans la hiérarchie. 00:55:48.360 --> 00:55:52.320 Quelle est votre opinion 00:55:52.320 --> 00:55:57.042 sur la possibilité de gérer ce contrôle... 00:55:58.850 --> 00:56:02.364 de l'organisation des connaissances dans les Wikidata ? 00:56:07.166 --> 00:56:10.169 Je pense que dans le cas des lieux Finto et YSO, 00:56:11.499 --> 00:56:14.391 le référenciel sera une collection 00:56:14.391 --> 00:56:18.936 de plusieurs sources, à terme. 00:56:18.936 --> 00:56:21.613 Il est de toute façon en pleine mutation. 00:56:21.613 --> 00:56:24.528 Donc, nous n'avons pas besoin de... 00:56:24.528 --> 00:56:28.383 Bon, je ne représente pas la Bibliothèque nationale, 00:56:28.383 --> 00:56:31.512 mais dans ce projet potentiel, 00:56:31.512 --> 00:56:35.711 nous n'aurions pas à entretenir... 00:56:35.711 --> 00:56:38.540 ou plutôt, lutter avec une structure existante. 00:56:38.540 --> 00:56:40.414 Donc, en ce sens, 00:56:40.414 --> 00:56:45.394 il s'agit d'un domaine ouvert à l'exploration. 00:56:48.912 --> 00:56:54.311 Les rubriques maories semblent se prêter à la structure Wikidata, 00:56:54.311 --> 00:56:56.961 mais la licence, bien sûr, l'interdit. 00:56:56.961 --> 00:56:59.491 Si la licence était différente 00:56:59.491 --> 00:57:01.511 et que les données étaient mises dans Wikidata, 00:57:01.511 --> 00:57:04.562 si quelqu'un décidait qu'il n'en aimait pas la hiérarchie 00:57:04.562 --> 00:57:06.162 et tentait de modifier quelque chose, 00:57:06.162 --> 00:57:10.001 il y aurait un tollé immédiat des personnes ayant travaillé très dur 00:57:10.001 --> 00:57:12.301 pour créer cette structure 00:57:12.301 --> 00:57:15.641 et on chercherait à obtenir confirmation auprès des Maoris 00:57:15.641 --> 00:57:17.942 que c'était bien la bonne hiérarchie. 00:57:18.382 --> 00:57:20.841 C'est donc un problème qu'il faut essayer de résoudre. 00:57:23.812 --> 00:57:26.502 Je pense qu'en termes de connaissances des systèmes d'organisation, 00:57:26.502 --> 00:57:28.116 ils sont tous différents. 00:57:28.116 --> 00:57:31.752 Et je ne suis pas certain que ce serait une bonne idée 00:57:31.752 --> 00:57:36.855 de représenter les différentes hiérarchies dans Wikidata en tant que tel, 00:57:37.650 --> 00:57:42.101 mais ça peut être intéressant de réfléchir à des superpositions 00:57:42.941 --> 00:57:45.022 des données, 00:57:45.431 --> 00:57:48.371 et donc, de cartographier les contenus. 00:57:49.091 --> 00:57:54.021 Par exemple, en tant que partenaire ZBW pour le Thesaurus d'économie, 00:57:55.420 --> 00:57:59.150 ce thésaurus établit sa propre hiérarchie, 00:57:59.680 --> 00:58:04.020 et, bien sûr, il serait possible de projeter la hiérarchie 00:58:04.461 --> 00:58:08.452 de ce thésaurus en concepts Wikidata 00:58:08.452 --> 00:58:11.541 sans pour autant stocker ce type de structure 00:58:12.180 --> 00:58:14.840 comme structure alternative dans Wikidata 00:58:14.840 --> 00:58:18.640 ce qui créerait beaucoup de confusion. 00:58:18.640 --> 00:58:22.859 Mais je pense que nous devrions voir Wikidata 00:58:22.859 --> 00:58:24.789 comme un réservoir de concepts 00:58:24.789 --> 00:58:29.651 qui seraient connectés en couches extérieures, 00:58:30.264 --> 00:58:33.489 et donneraient une autre vision du monde 00:58:33.489 --> 00:58:39.080 mais qui ne feraient pas nécessairement partie de Wikidata. 00:58:45.775 --> 00:58:48.203 (assistant·e) Très bien. D'autres questions ? 00:58:49.096 --> 00:58:51.527 Sinon... d'accord. 00:58:54.769 --> 00:58:57.781 (intervenant·e 6) Joachim, je voulais juste donner suite à ce dernier point. 00:58:57.781 --> 00:59:01.064 Donc, ces couches, comme vous les imaginez, 00:59:02.196 --> 00:59:04.143 seraient-elles maintenues à l'extérieur 00:59:04.143 --> 00:59:07.404 et d'une manière ou d'une autre intégrées... 00:59:08.964 --> 00:59:11.764 à Wikidata, d'un point de vue Wikidata, 00:59:11.764 --> 00:59:17.143 ou avez-vous réfléchi un peu plus 00:59:17.143 --> 00:59:19.463 à la manière dont tout cela pourrait être géré ? 00:59:22.351 --> 00:59:24.931 En réalité, non, je n'ai pas... 00:59:25.271 --> 00:59:30.361 J'ai fait des essais avec ZBW et Wikidata. 00:59:30.361 --> 00:59:33.132 J'étais [inaudible] à Wikidata. 00:59:33.132 --> 00:59:38.837 Mais je pense que c'est une nouveauté tout à fait complexe, 00:59:39.261 --> 00:59:46.210 et donc, c'est sujet à débat, [de renoncer à beaucoup de contrôle] 00:59:46.409 --> 00:59:47.908 pour faire une telle chose. 00:59:47.908 --> 00:59:50.178 Mais il faudrait trouver une solution. 00:59:56.638 --> 00:59:57.959 Encore une autre ? 00:59:57.959 --> 00:59:59.686 (intervenant·e 5) Ah, super. 00:59:59.686 --> 01:00:02.628 J'avais une question concernant le projet kakapo. 01:00:03.875 --> 01:00:05.000 Mmh-mmh. 01:00:05.000 --> 01:00:10.805 (intervenant·e 5) OK, donc, avez-vous reçu un refus de la communauté Wikidata 01:00:10.805 --> 01:00:14.636 sur le fait de référencer des individus de la faune ? 01:00:15.576 --> 01:00:16.606 Pas encore. 01:00:16.606 --> 01:00:19.215 (i. 5) Quelqu'un a-t-il entendu parler de ce sujet auparavant ? 01:00:19.215 --> 01:00:20.245 « Pas encore » 01:00:20.245 --> 01:00:23.085 parce que personne n'en a encore entendu parler ? 01:00:23.085 --> 01:00:26.095 Ça fait déjà un certain temps qu'on en discute... 01:00:26.095 --> 01:00:29.235 avec des personnes intéressées dans ce genre de choses dans Wikidata, 01:00:29.235 --> 01:00:32.215 et nous semblons tous penser qu'il s'agit d'une extension naturelle 01:00:32.215 --> 01:00:34.355 d'accorder aux individus des articles Wikidata 01:00:34.355 --> 01:00:35.855 comme un cheval de course célèbre 01:00:35.855 --> 01:00:39.755 ou le chat de quelqu'un, qui... C'est assez bien modélisé. 01:00:39.764 --> 01:00:44.444 Je pense que l'audace, c'est d'y référencer toute l'espèce. 01:00:44.444 --> 01:00:48.113 Mais je pense que c'est tout à fait gérable. 01:00:48.113 --> 01:00:50.173 N'essayez pas avec des chats ou des chiens. 01:00:50.173 --> 01:00:52.027 (rires) 01:00:52.027 --> 01:00:54.337 (assistant·e) Parfait, je pense que le temps est écoulé. 01:00:54.337 --> 01:00:55.767 Merci beaucoup de votre présence. 01:00:55.767 --> 01:00:59.267 Nous sommes toujours ouverts aux questions durant la pause, 01:00:59.267 --> 01:01:00.797 et amusez-vous bien. 01:01:00.797 --> 01:01:02.292 Merci beaucoup. 01:01:02.292 --> 01:01:04.047 (applaudissements) 01:01:07.376 --> 01:01:11.376 WIKI DATA CON 2019 Wikidata et les langues