WEBVTT
00:00:00.987 --> 00:00:03.588
Panel GLAM
00:00:03.588 --> 00:00:06.048
GLAM : galeries d'art,
bibliothèques, archives et musées
00:00:06.254 --> 00:00:08.249
Bonjour à tous.
00:00:08.929 --> 00:00:12.068
Bienvenue à notre panel GLAM.
00:00:13.124 --> 00:00:17.009
Avant de commencer,
j'ai deux annonces à vous faire.
00:00:17.329 --> 00:00:23.049
La première : n'hésitez pas à utiliser
notre Etherpad pour prendre des notes.
00:00:23.781 --> 00:00:27.998
La deuxième annonce s'adresse
à ceux qui nous regardent de chez eux,
00:00:27.998 --> 00:00:29.819
ou bien où qu'ils se trouvent :
00:00:29.819 --> 00:00:30.958
si vous avez des questions,
00:00:30.958 --> 00:00:34.028
vous pouvez également
les noter sur l'Etherpad,
00:00:34.028 --> 00:00:37.828
et nos bonnes âmes de la salle
pourront suivre vos interrogations.
00:00:39.328 --> 00:00:44.348
Nous avons donc décidé
pour le panel de cette année,
00:00:45.388 --> 00:00:48.868
après avoir vu toutes les contributions,
00:00:49.128 --> 00:00:52.046
que nous nous concentrerions
sur le rôle de Wikidata
00:00:52.046 --> 00:00:53.551
dans les écosystèmes de données
00:00:53.551 --> 00:00:57.199
qui vont au-delà
des projets Wikimedia en cours,
00:00:57.199 --> 00:00:59.747
ce qui est également en phase
00:00:59.747 --> 00:01:03.677
avec la nouvelle statégie
de la fondation Wikimedia.
00:01:04.652 --> 00:01:07.947
Et nous sommes accompagnés,
aujourd'hui, de quatre membres du panel.
00:01:08.387 --> 00:01:09.876
Trois plus un.
00:01:09.876 --> 00:01:13.636
Je vais donc vous demander
de monter sur scène
00:01:13.636 --> 00:01:15.875
afin que je puisse
vous présenter à l'assemblée.
00:01:16.536 --> 00:01:20.500
(bruits de pas)
00:01:22.205 --> 00:01:24.706
Nous avons donc Susanna Ånäs.
00:01:25.385 --> 00:01:29.296
Susanna milite depuis très longtemps
pour la liberté du savoir,
00:01:29.296 --> 00:01:31.276
est engagée dans de nombreux WikiProjects,
00:01:31.776 --> 00:01:33.596
et aujourd'hui,
elle nous fera le compte-rendu
00:01:33.596 --> 00:01:35.526
d'un projet en coopération
00:01:35.526 --> 00:01:38.396
avec la Bibliothèque
nationale finlandaise.
00:01:38.856 --> 00:01:43.435
Ensuite, j'ai à côté de moi
Mike Dickison,
00:01:43.435 --> 00:01:46.325
qui interviendra en deuxième.
00:01:46.995 --> 00:01:50.283
Il est conservateur de musée
et est originaire de Nouvelle-Zélande.
00:01:50.283 --> 00:01:53.815
Il est également zoologue
et rédacteur en chef de Wikipédia.
00:01:53.815 --> 00:01:58.788
Il a été le premier Wikipédien
néo-zélandais en résidence
00:01:58.788 --> 00:02:02.565
en 2018 et 2019,
00:02:02.565 --> 00:02:06.634
et il nous parlera
de son expérience dans ce rôle,
00:02:06.634 --> 00:02:13.105
et ce que cela a fait de travailler
pour Wikidata dans ce contexte.
00:02:15.784 --> 00:02:18.135
Nous avons ensuite Joachim Neubert
00:02:18.135 --> 00:02:23.461
du centre d'information de Leibniz
pour l'économie à Kiel et Hambourg.
00:02:24.011 --> 00:02:25.601
Il travaille à rendre
00:02:25.601 --> 00:02:29.131
les plus grandes archives publiques
de la presse au monde
00:02:29.131 --> 00:02:31.435
plus accessible au public,
00:02:31.435 --> 00:02:34.745
et il utilise Wikidata à cette fin.
00:02:35.890 --> 00:02:37.661
J'interviendrai en dernier.
00:02:37.661 --> 00:02:39.091
Je m'appelle Beat Estermann.
00:02:39.091 --> 00:02:43.080
Je travaille pour l'Université de Berne
des sciences appliquées, en Suisse.
00:02:43.640 --> 00:02:49.950
Je promeus depuis très longtemps
l'OpenGLAM en Suisse et en Autriche,
00:02:50.335 --> 00:02:54.280
et je ferai aujourd'hui
un compte-rendu de mes activités
00:02:54.280 --> 00:02:55.960
en relation avec le mandat
00:02:55.960 --> 00:02:59.460
de l'Association canadienne
des organismes artistiques,
00:02:59.460 --> 00:03:01.270
à savoir les arts du spectacle,
00:03:02.121 --> 00:03:04.440
pas nécessairement
par le biais de Wikidata,
00:03:04.440 --> 00:03:08.421
mais vous verrez qu'il commence
à jouer un rôle dans ce domaine.
00:03:08.970 --> 00:03:13.250
À présent, la plupart d'entre nous
allons prendre place ici,
00:03:13.250 --> 00:03:16.980
et je vais donner la parole à Susanna.
00:03:17.760 --> 00:03:19.149
(Susanna) Bien.
00:03:20.469 --> 00:03:22.769
Bonjour, je m'appelle Susana Ånäs,
00:03:22.769 --> 00:03:25.579
et je travaille à temps partiel
pour Wikimedia Finlande
00:03:25.579 --> 00:03:27.079
en tant que coordinatrice du GLAM,
00:03:27.079 --> 00:03:32.655
et je suis également consultante
dans le domaine des savoirs libres,
00:03:32.655 --> 00:03:36.049
Alors, ça peut être
un discours [inaudible],
00:03:36.049 --> 00:03:38.719
j'ai donc participé à la réalisation
00:03:38.719 --> 00:03:41.940
d'un groupe...
00:03:43.132 --> 00:03:46.650
d'un groupe de données géographiques du...
00:03:48.439 --> 00:03:51.147
je n'ai pas vérifié le terme en anglais,
00:03:51.147 --> 00:03:53.617
mais, c'était à l'initiative
du gouvernement royal finlandais
00:03:53.617 --> 00:03:54.917
au nom du patrimoine culturel.
00:03:54.917 --> 00:03:59.775
Il s'agit donc de noms de lieux
00:03:59.775 --> 00:04:03.300
et de la manière dont ils sont représentés
00:04:03.300 --> 00:04:07.466
dans différents référentiels
du secteur des GLAM en Finlande,
00:04:07.466 --> 00:04:11.755
comment les GLAM essaient
de rassembler ces différentes sources,
00:04:11.755 --> 00:04:15.899
et comment les lieux sont décrits
par le biais de la modélisation
00:04:15.899 --> 00:04:17.906
dans Wikidata et ailleurs.
00:04:17.906 --> 00:04:23.315
On retrouve ici les trois sources
principales du projet YSO Places
00:04:23.315 --> 00:04:27.944
faisant partie de l'ontologie générale.
00:04:27.944 --> 00:04:29.665
AHAA désigne les archives finlandaises,
00:04:29.665 --> 00:04:31.645
Melinda, les bibliothèques finlandaises,
00:04:31.645 --> 00:04:33.750
et KOOKOS, les musées finlandais.
00:04:33.750 --> 00:04:37.585
Il existe donc trois systèmes
de gestion de contenu
00:04:37.585 --> 00:04:40.290
réunis dans le projet YSO Places.
00:04:40.745 --> 00:04:47.365
Des échanges entre Wikidata
sont déjà en cours,
00:04:47.965 --> 00:04:53.065
ainsi qu'un projet de toponymie
pour le Service National Cartographique.
00:04:53.065 --> 00:04:56.285
Et puis, il existe un troisième projet,
les archives de toponymie finlandaise,
00:04:56.285 --> 00:05:00.391
qui n'y contribue pas encore,
00:05:00.391 --> 00:05:02.715
mais c'est en prévision.
00:05:02.715 --> 00:05:09.175
L'un des points clés de la modélisation
dans cette problématique
00:05:09.175 --> 00:05:15.226
est que trois types d'éléments
de la toponymie des lieux
00:05:16.116 --> 00:05:18.195
sont représentés dans ce projet,
00:05:18.195 --> 00:05:21.236
l'un d'eux étant le lieu,
son emplacement géographique,
00:05:21.236 --> 00:05:24.766
un autre étant le nom du lieu,
00:05:25.006 --> 00:05:27.696
le dernier étant les sources,
c'est-à-dire les documents
00:05:27.696 --> 00:05:30.756
d'où ces deux premiers
éléments sont tirés,
00:05:30.756 --> 00:05:32.565
ou encore, étayés.
00:05:32.565 --> 00:05:34.115
Le projet YSO Places,
00:05:34.115 --> 00:05:38.799
ici, en haut à droite,
on retrouve les mêmes diagrammes
00:05:38.799 --> 00:05:41.189
ce projet YSO se concentre
principalement sur les lieux.
00:05:42.619 --> 00:05:46.279
Ce projet est sous la houlette
de la Bibliothèque nationale de Finlande,
00:05:46.279 --> 00:05:49.329
et du projet Finto.
00:05:50.199 --> 00:05:55.608
Il compte à présent plus de 7 000 lieux
en finnois et en suédois,
00:05:55.608 --> 00:06:02.318
et plus de 3 000 en anglais,
sous licence CC0.
00:06:02.772 --> 00:06:06.008
On retrouve ici le service Finto.
00:06:06.008 --> 00:06:09.883
Et j'ai choisi pour lieu Sevettijärvi,
00:06:09.883 --> 00:06:13.908
qui fait désormais partie
de notre projet linguistique
00:06:13.908 --> 00:06:15.268
aux côtés des Skolt Sámi..
00:06:15.268 --> 00:06:18.877
Sevettijärvi est un lieu situé
dans l'extrême nord de la Finlande,
00:06:18.877 --> 00:06:21.765
habité par les Skolt Sámi.
00:06:21.765 --> 00:06:27.264
On peut donc voir ici
le lieu qui appartient à...
00:06:27.264 --> 00:06:32.724
enfin... voilà les données
concernant cet endroit.
00:06:32.724 --> 00:06:37.952
On peut voir qu'il est
relié à un Wikidata,
00:06:37.952 --> 00:06:42.344
et retrouver les données
du Service National Cartopgraphique.
00:06:43.192 --> 00:06:47.406
On voit ici plus en détail ces éléments.
00:06:48.582 --> 00:06:52.360
Les données sont également hiérarchisées
00:06:52.360 --> 00:06:56.310
dans ce référentiel.
00:06:57.670 --> 00:07:00.460
En réalité, ce lieu n'est pas affiché ici,
00:07:00.460 --> 00:07:05.880
mais on le retrouve
sous cette municipalité,
00:07:05.880 --> 00:07:07.880
ainsi que sa région,
00:07:07.880 --> 00:07:10.154
et la Finlande en tant que pays,
et les pays nordiques,
00:07:10.154 --> 00:07:12.650
comme région frontalière.
00:07:12.650 --> 00:07:14.400
On peut voir ici
que beaucoup de ces données
00:07:14.400 --> 00:07:17.891
ont été associées
avec Wikidata auparavant,
00:07:18.730 --> 00:07:22.230
par le biais d'un Mix'n'Match,
et il en reste encore à associer.
00:07:22.230 --> 00:07:27.900
Cependant, la quantité d'entrées
n'est pas si élevée :
00:07:28.411 --> 00:07:30.844
il y a un peu moins de 5 000.
00:07:31.570 --> 00:07:33.860
Il existe également cet autre référentiel
00:07:33.860 --> 00:07:38.040
du projet de plateforme
géospatial finlandaise,
00:07:38.040 --> 00:07:39.199
les Place Names Cards.
00:07:39.199 --> 00:07:42.130
Ce sont tous les noms de lieux
qui figurent sur les cartes finlandaises.
00:07:42.130 --> 00:07:48.308
Les données qui y sont reliées,
sont sous licence CC BY 4.0.
00:07:48.518 --> 00:07:52.628
Ce sont 800 000 étiquettes de cartes
en finnois, suédois,
00:07:52.628 --> 00:07:55.778
et dans les trois langues sámi
que l'on parle en Finlande.
00:07:55.997 --> 00:07:58.877
Et il existe deux types d'entités :
00:07:58.877 --> 00:08:02.651
certaines sont des lieux,
et les autres des noms de lieux.
00:08:02.651 --> 00:08:05.271
Et elles ont toutes deux
leur adresse PURL.
00:08:06.001 --> 00:08:09.721
Par exemple, ici, ce même Sevettijärvi,
apparaît en finnois, à la première ligne,
00:08:09.721 --> 00:08:12.141
puis dans les trois langues sámi,
00:08:12.141 --> 00:08:17.301
ainsi que ses données géographiques,
et davantage d'informations
00:08:17.301 --> 00:08:20.841
comme le type de lieu, et ainsi de suite.
00:08:21.640 --> 00:08:28.815
Voici le tableau pour cette toponymie
ayant son propre URI.
00:08:29.943 --> 00:08:33.738
Désolé, apparemment,
ça n'est pas traduit en anglais...
00:08:34.432 --> 00:08:39.151
Il semblerait que le multilinguisme
ne couvre pas l'ensemble du projet.
00:08:40.057 --> 00:08:42.523
Nous arrivons ensuite
à l'archivage des toponymes finlandais.
00:08:42.523 --> 00:08:46.234
Il s'agit d'un projet mené par
l'Institut de langues de Finlande,
00:08:46.234 --> 00:08:50.456
qui ne traite ni des lieux,
ni de leur toponymes,
00:08:50.456 --> 00:08:52.603
mais des sources de ces derniers.
00:08:52.603 --> 00:08:57.123
Il s'agit donc de trois millions
de notes sur le terrain des noms de lieux,
00:08:57.723 --> 00:08:59.529
et il s'agit d'un projet Wikibase.
00:08:59.529 --> 00:09:01.139
Ces données sont dans une Wikibase,
00:09:01.139 --> 00:09:03.325
principalement en finnois,
certaines en suédois,
00:09:03.325 --> 00:09:08.111
dans quantité de langues sámi d'intérêt,
00:09:08.111 --> 00:09:10.141
et elles sont sous licence CC BY 4.0,
00:09:10.380 --> 00:09:14.850
ce qui représente également un défi
du point de vue Wikidata,
00:09:14.850 --> 00:09:17.640
mais s'il existait
une Wikibase locale finlandaise,
00:09:17.640 --> 00:09:22.632
nous serions peut-être en mesure
de les travailler en premier.
00:09:23.034 --> 00:09:25.343
Voici donc une capture d'écran
00:09:26.443 --> 00:09:31.323
montrant qu'il y a des informations
concernant le lieu, les cartes...
00:09:31.323 --> 00:09:35.227
et des anciennes cartes
que les collectionneurs utilisaient,
00:09:35.227 --> 00:09:40.713
ainsi que des cartes générées
sur la base des données récoltées.
00:09:41.455 --> 00:09:46.416
Voici donc une de ces cartes
00:09:46.416 --> 00:09:50.186
générée sur base des données.
00:09:51.166 --> 00:09:53.301
Nous avons également ce projet
00:09:53.301 --> 00:09:56.336
mené par le Laboratoire des humanités
numériques d'Helsinki
00:09:56.336 --> 00:10:01.446
et le groupe de recherche en sémantique
informatique de l'université d'Aalto,
00:10:01.446 --> 00:10:06.525
en partenariat avec l'Institut
de langues de Finlande,
00:10:06.525 --> 00:10:07.994
le projet Names Sampo.
00:10:07.994 --> 00:10:11.024
Et il s'agit d'une interface
de recherche agrégée
00:10:11.024 --> 00:10:13.503
selon plusieurs sources de toponymie.
00:10:13.503 --> 00:10:17.704
Ici, on peut voir nombre de sources
à gauche de l'écran,
00:10:17.704 --> 00:10:20.763
et on peut générer
différentes représentations
00:10:20.763 --> 00:10:22.653
sur la base de ces données.
00:10:22.653 --> 00:10:24.438
Et... oui, c'est ça.
00:10:25.289 --> 00:10:30.603
J'ai donc évoqué cette idée
de modélisation d'une Wikibase locale
00:10:30.603 --> 00:10:32.693
que nous pourrions réaliser
avec ces données.
00:10:32.693 --> 00:10:36.280
Mais lorsque nous évoquons
ces questions de modélisation,
00:10:36.280 --> 00:10:37.770
ou comment modéliser,
00:10:37.770 --> 00:10:41.589
il y existe différentes
manières de procéder.
00:10:42.105 --> 00:10:43.693
Et donc...
00:10:44.662 --> 00:10:45.682
Oui.
00:10:45.682 --> 00:10:48.160
Ce qu'il y a de bien,
00:10:48.160 --> 00:10:50.569
c'est que cela pourrait
servir les langues minoritaires
00:10:50.569 --> 00:10:52.593
avec très peu d'efforts.
00:10:53.243 --> 00:10:57.179
Très bien, nous avons
donc ici deux options :
00:10:57.179 --> 00:11:01.660
le modèle SAPO, c'est-à-dire l'ontologie
spatio-temporelle finlandaise,
00:11:02.841 --> 00:11:04.421
et le modèle Wikidata.
00:11:04.421 --> 00:11:06.909
On peut voir ici que les éléments
Wikidata ont tendance à...
00:11:06.909 --> 00:11:12.871
eh bien, dans l'idéal, rester identiques
avec des propriétés changeantes,
00:11:12.871 --> 00:11:16.909
alors que, dans le modèle SAPO,
ces éléments deviennent nouveaux
00:11:16.909 --> 00:11:20.399
lorsqu'il y a un changement,
comme un changement de zone ou de nom.
00:11:21.179 --> 00:11:26.219
Revenons à ce schéma divisé
00:11:26.219 --> 00:11:31.719
entre ces trois différentes dimensions.
00:11:32.099 --> 00:11:35.869
Ainsi, devrions-nous faire
de ces toponymes
00:11:35.869 --> 00:11:37.659
des entités ou des propriétés ?
00:11:37.659 --> 00:11:39.248
Wikidata utilise des propriétés,
00:11:39.248 --> 00:11:43.098
tandis que le Service National
Cartopgraphique parle d'entités.
00:11:43.838 --> 00:11:46.177
Ou devrions-nous en faire des lexèmes ?
00:11:46.177 --> 00:11:52.106
Wikidata a choisi de travailler
avec des propriétés textuelles
00:11:52.106 --> 00:11:54.956
pour les toponymes plutôt que des lexèmes.
00:11:55.567 --> 00:11:57.818
Je suis désolée, c'est l'inverse.
00:11:57.818 --> 00:11:59.631
Donc, les noms sont...
00:12:03.056 --> 00:12:04.941
des propriétés, pas des lexèmes.
00:12:05.874 --> 00:12:06.877
Bien.
00:12:07.165 --> 00:12:11.132
Je dirais que la faiblesse de la Wikibase
00:12:11.132 --> 00:12:16.340
est peut-être l'absence de
données topographiques
00:12:16.340 --> 00:12:20.958
comme dans la configuration de base,
00:12:20.958 --> 00:12:24.748
il faudrait donc rendre
le système plus performant
00:12:24.748 --> 00:12:29.688
pour pouvoir utiliser
les topographies locales.
00:12:29.688 --> 00:12:31.823
Et une fédération
serait vraiment la bienvenue
00:12:31.823 --> 00:12:38.048
pour pouvoir profiter du corpus Wikidata.
00:12:38.648 --> 00:12:41.926
Donc, je crois bien être arrivée
à la fin de la présentation !
00:12:41.926 --> 00:12:43.058
Merci !
00:12:43.616 --> 00:12:45.827
(applaudissements)
00:12:49.381 --> 00:12:52.071
(bruits de pas)
00:13:01.255 --> 00:13:02.514
Bien.
00:13:03.274 --> 00:13:05.011
(s'exprimant en maori)
00:13:05.011 --> 00:13:06.165
(Mike) Bienvenue à tous.
00:13:06.165 --> 00:13:08.375
Je m'appelle Mike Dickison.
00:13:08.375 --> 00:13:10.149
Et durant un an,
00:13:10.149 --> 00:13:13.075
j'ai été un wikipédien
néo-zélandais en résidence.
00:13:13.935 --> 00:13:16.935
Vous vous demandez peut-être
ce qu'est un wikipédien en résidence,
00:13:17.856 --> 00:13:20.825
parce que si vous cherchez,
vous ne trouverez rien à ce sujet,
00:13:20.825 --> 00:13:22.275
comme on peut le voir ici.
00:13:22.735 --> 00:13:25.855
C'est un terme que j'ai inventé
dans la proposition de subvention,
00:13:26.153 --> 00:13:29.003
ce que la fondation
a semblé beaucoup apprécier.
00:13:29.983 --> 00:13:31.533
Et donc, nous avons gardé ce terme.
00:13:32.303 --> 00:13:36.633
Durant un an, je suis passé par
35 institutions différentes,
00:13:37.053 --> 00:13:41.053
les résidences qui, pour la plupart,
organisaient des sessions de formation,
00:13:41.493 --> 00:13:44.363
des événements publics,
et essayaient de développer
00:13:44.363 --> 00:13:47.230
une stratégie Wikimedia,
chacune de leur côté.
00:13:47.808 --> 00:13:49.498
Ça a été une expérience très intéressante,
00:13:49.498 --> 00:13:53.267
où j'ai découvert un large éventail
de projets et de personnes,
00:13:53.267 --> 00:13:58.211
et j'aimerais passer en revue
quelques-uns des différents projets
00:13:58.211 --> 00:14:00.345
qui portaient sur Wikidata,
00:14:00.872 --> 00:14:05.171
d'une manière intéressante,
ou tout au moins éclairante,
00:14:05.171 --> 00:14:07.181
dont les gens pourront débattre.
00:14:07.181 --> 00:14:08.621
Le projet était axé sur Wikipedia...
00:14:08.621 --> 00:14:11.961
Le projet était initialement
estampillé Wikipédia
00:14:11.961 --> 00:14:14.651
simplement parce que les gens
étaient familiers de Wikipedia,
00:14:15.281 --> 00:14:18.360
et nous avons donc organisé
de multiples événements différents
00:14:18.360 --> 00:14:23.135
lors d'edit-a-thons traditionnels
sur les écarts entre les sexes...
00:14:24.607 --> 00:14:26.752
[dont beaucoup ont été très fructueux],
00:14:27.105 --> 00:14:30.812
ainsi qu'une série recrutement
de rédacteurs en chef tout aussi réussie.
00:14:31.754 --> 00:14:34.454
Nous avons effectué des téléchargements
en masse vers les Commons.
00:14:35.454 --> 00:14:41.246
En l'occurrence ici, une collection
de plus de 1 000 œuvres d'art originales
00:14:41.246 --> 00:14:46.047
de l'illustrateur
entomologiste, Des Helmore,
00:14:46.047 --> 00:14:47.927
qui se trouvait sur un disque dur,
00:14:47.927 --> 00:14:50.167
qui correspondait
à une décennie de recherche,
00:14:50.167 --> 00:14:52.322
et nous avons pu obtenir
l'autorisation de les publier
00:14:52.322 --> 00:14:54.245
le tout sous licence CC BY.
00:14:54.245 --> 00:14:57.963
Donc, de petites victoires que nous avons
pu montrer aux gens de là-bas.
00:14:57.963 --> 00:15:01.095
Tout le monde peut comprendre
des images de coléoptères.
00:15:01.095 --> 00:15:02.850
Tout le monde peut comprendre
00:15:02.850 --> 00:15:07.250
les ateliers consacrés à la réduction
de l'écart entre les sexes.
00:15:07.250 --> 00:15:10.251
Mais Wikidata est beaucoup plus
difficile à vendre
00:15:10.251 --> 00:15:12.280
aux personnes du secteur GLAM,
00:15:12.280 --> 00:15:15.005
ou toute personne extérieure
de notre mouvement.
00:15:16.107 --> 00:15:19.717
J'ai donc commencé à réaliser que Wikidata
00:15:19.717 --> 00:15:22.634
allait devenir une voie
de plus en plus importante
00:15:22.634 --> 00:15:25.883
dans ces projets
de wikipédiens en résidence.
00:15:25.883 --> 00:15:28.232
Ainsi, au fur et à mesure
que nous avancions,
00:15:28.232 --> 00:15:31.849
cette composante a pris de plus en plus
d'importance dans mon travail,
00:15:31.849 --> 00:15:36.350
et j'ai commencé à essayer d'en apprendre
plus sur Wikidata moi-même,
00:15:36.800 --> 00:15:39.515
parce que je commençais
à en comprendre l'importance.
00:15:40.287 --> 00:15:41.989
Donc, voici un projet...
00:15:41.989 --> 00:15:46.325
le kakapo est un perroquet grimpeur
endémique de Nouvelle-Zélande.
00:15:48.096 --> 00:15:51.335
Nous avons travaillé en partenariat
avec le Ministère de la conservation,
00:15:51.335 --> 00:15:54.299
dont le travail est de sauver
cette espèce de l'extinction,
00:15:54.299 --> 00:15:55.643
et l'idée était :
00:15:55.643 --> 00:15:59.253
« Et si nous référencions
chaque kakapo dans Wikidata ? »
00:16:01.221 --> 00:16:02.701
Cela peut sembler risible,
00:16:02.701 --> 00:16:05.580
mais c'est en fait
un projet parfaitement réalisable.
00:16:05.981 --> 00:16:08.427
Quelques-uns d'entre eux y sont déjà.
00:16:09.100 --> 00:16:11.601
Un élément clé à noter ici
est qu'il n'y a très peu de kakapos.
00:16:11.615 --> 00:16:13.245
C'est donc une tâche gérable.
00:16:13.245 --> 00:16:16.656
Il y en existait 148 quand j'ai commencé,
un est mort depuis,
00:16:16.935 --> 00:16:19.001
et la dernière saison
de reproduction a été bonne
00:16:19.001 --> 00:16:21.765
puisqu'on en dénombre 213 à présent.
00:16:21.765 --> 00:16:25.045
C'est formidable car on n'avait pas
atteint ce nombre depuis plus de 50 ans.
00:16:25.505 --> 00:16:28.260
Ça a été une grosse affaire,
00:16:28.260 --> 00:16:30.725
ça faisait les manchettes
tous les jours en Nouvelle-Zélande.
00:16:31.285 --> 00:16:32.694
Et... oui ?
00:16:32.694 --> 00:16:34.414
(intervenant·e 1) Même le New York Times !
00:16:34.414 --> 00:16:35.673
(Mike) Vraiment ? Merveilleux.
00:16:35.673 --> 00:16:38.522
Oui, ça a eu une ampleur nationale,
tout le monde aime ces oiseaux.
00:16:39.002 --> 00:16:40.663
Mais ce qui les rend intéressants,
00:16:40.663 --> 00:16:43.932
c'est que, contrairement aux espèces
qui sont plus peuplées,
00:16:43.932 --> 00:16:49.817
chaque kakapo a un nom
et un numéro d'identification propre,
00:16:49.817 --> 00:16:52.442
et on dispose souvent
de données biographiques complètes
00:16:52.442 --> 00:16:54.672
sur le lieu et la date de leur naissance,
00:16:54.672 --> 00:16:56.972
où ils ont été couvés,
qui étaient le père et la mère,
00:16:56.972 --> 00:16:58.713
quand ils sont morts, s'ils sont morts.
00:16:58.713 --> 00:17:01.312
Il existe donc une base de données
au Ministère de la conservation
00:17:01.312 --> 00:17:02.882
qui répertorie toutes ces informations.
00:17:02.882 --> 00:17:06.723
Et l'un des plus célèbres kakapos,
bien entendu, est Sirocco,
00:17:06.723 --> 00:17:09.726
qui, comme vous pouvez le voir,
est nommé d'après le vent.
00:17:09.726 --> 00:17:13.225
Sirocco a un compte Twitter,
00:17:13.705 --> 00:17:15.927
avec lequel Wikidata
rencontrait quelques problèmes,
00:17:15.927 --> 00:17:17.162
parce que, apparemment,
00:17:17.162 --> 00:17:20.342
ils ne peuvent tout simplement
pas avoir de compte Twitter, bref.
00:17:21.121 --> 00:17:23.456
Il a même fait la couverture
d'un album, et cetera.
00:17:23.456 --> 00:17:25.716
Il y a donc eu de multiples
propriétés à cela,
00:17:25.716 --> 00:17:28.258
à probablement
l'un des plus célèbres kakapo.
00:17:28.258 --> 00:17:30.337
J'ai donc proposé
au Ministère de la conservation :
00:17:30.337 --> 00:17:33.245
« Pourquoi n'essayons-nous pas
de faire cela avec chacun d'entre eux ? »
00:17:33.245 --> 00:17:37.665
Alors, il leur a fallu réfléchir
à combien des données biographiques
00:17:37.665 --> 00:17:39.365
pourraient être rendues publiques,
00:17:39.365 --> 00:17:41.225
et ils ont présenté une liste.
00:17:41.225 --> 00:17:45.094
Et maintenant nous en avons,
je crois, 212 ou 210...
00:17:45.094 --> 00:17:46.644
je crois qu'un couple est mort...
00:17:46.644 --> 00:17:50.333
kakapo vivants qui sont
à présent tous candidats.
00:17:50.333 --> 00:17:52.933
Et ils ne reçoivent un nom
que lorsqu'ils se couvrent de plumes,
00:17:52.933 --> 00:17:56.172
un code leur donné tant qu'il sont bébés.
00:17:56.172 --> 00:17:58.227
Donc, une fois la récolte
de données complète,
00:17:58.227 --> 00:18:01.806
nous allons créer un Wikidata complet...
00:18:01.806 --> 00:18:04.225
l'espèce entière sera
référencée dans Wikidata.
00:18:04.426 --> 00:18:06.605
Mais on doit arriver
à une propriété pour DOC ID...
00:18:06.605 --> 00:18:08.875
En fait, j'aimerais évoquer
ce sujet avec vous :
00:18:08.875 --> 00:18:11.266
devrions-nous utiliser
une identification très spécifique
00:18:11.266 --> 00:18:14.216
ou devrions-nous trouver
une identité qui fonctionnerait
00:18:14.216 --> 00:18:21.375
pour tous les oiseaux, plantes ou animaux
sujets de projets scientifique ?
00:18:21.965 --> 00:18:23.795
C'est une bonne question.
00:18:25.105 --> 00:18:27.695
Le deuxième projet concernait
la galerie d'art de Christchurch.
00:18:28.225 --> 00:18:31.523
Il y existe très peu de peintures
de Colin MacCahon,
00:18:31.523 --> 00:18:33.963
c'est l'un des plus célèbres
artistes de l'existence.
00:18:33.963 --> 00:18:36.704
Voici un dessin qu'il a fait
pour le New Zealand School Journal,
00:18:36.704 --> 00:18:38.424
financé par le gouvernement de l'époque.
00:18:38.424 --> 00:18:40.704
Il fait donc partie
des archives de Nouvelle-Zélande
00:18:40.704 --> 00:18:42.294
qui en détiennent les droits d'auteur.
00:18:42.294 --> 00:18:44.333
C'est une situation très inhabituelle.
00:18:44.774 --> 00:18:47.073
J'ai donc travaillé avec
la galerie d'art de Christchurch,
00:18:47.073 --> 00:18:48.993
qui, avec la galerie d'art d'Auckland,
00:18:48.993 --> 00:18:52.954
posséde un site appelé
« Trouvez des artistes néo-zélandais »,
00:18:52.954 --> 00:18:55.478
dont la tâche est de garder
une trace des exploitations...
00:18:55.478 --> 00:18:58.403
de chaque institution possédant
des propriétés d'artistes néo-zélandais,
00:18:58.403 --> 00:19:03.163
soit une base données
d'environ 18 000 artistes,
00:19:03.163 --> 00:19:05.517
dont la majorité est très peu documentée.
00:19:06.233 --> 00:19:08.992
Nous avons donc procédé
à une sorte de Mix'n'Match standard.
00:19:08.992 --> 00:19:12.133
Nous avons exporté
les données ayant au moins
00:19:12.133 --> 00:19:17.545
une date de naissance ou de décès,
ou un lieu de naissance ou de mort.
00:19:17.545 --> 00:19:20.614
Donc, le champs était large.
00:19:20.614 --> 00:19:23.484
Or, même là, on en a extrait peu,
00:19:23.484 --> 00:19:25.954
mais aujourd'hui,
nous en avons environ 1 500
00:19:25.954 --> 00:19:28.603
reliés à des artistes connus
dans Wikidata,
00:19:28.603 --> 00:19:30.123
ce qui est bien.
00:19:30.123 --> 00:19:31.783
Mais ce qui les intéressait...
00:19:31.783 --> 00:19:33.523
Voici leur site web,
00:19:33.523 --> 00:19:39.213
qui ne fait que répertorier
les liens d'exploitation,
00:19:39.213 --> 00:19:44.523
sachant qu'il créent manuellement
ces données biographiques
00:19:44.523 --> 00:19:46.063
pour chaque artiste,
00:19:46.063 --> 00:19:48.803
eh bien, l'acte d'exporter
et la mise en place d'un Mix'n'Match
00:19:48.803 --> 00:19:52.363
a mis en lumière de nombreuses coquilles
et toute sorte d'erreurs,
00:19:52.363 --> 00:19:53.723
qu'ils n'avaient pas remarquées.
00:19:53.723 --> 00:19:56.123
Et ce n'est que qu'en traitant
les données dans un Excel
00:19:56.123 --> 00:19:57.272
que les erreurs ressortent.
00:19:57.272 --> 00:20:01.520
Et ils ont tout à coup réalisé
la valeur de Wikidata
00:20:01.520 --> 00:20:02.547
quand je leur ai dit :
00:20:02.547 --> 00:20:06.537
« Il vous suffit de pomper
ces informations de Wikidata ».
00:20:06.548 --> 00:20:09.507
Ça leur a ouvert les yeux.
00:20:09.507 --> 00:20:11.748
Je pense donc que c'est
un des arguments vendeurs.
00:20:11.748 --> 00:20:14.907
Lorsque vous avez un site web
soigneusement créé à la main,
00:20:14.907 --> 00:20:17.154
avec 18 000 entrées pleines d'erreurs,
00:20:17.154 --> 00:20:19.344
et qu'on vous dit qu'il existe
un autre moyen,
00:20:19.344 --> 00:20:23.192
que d'autres personnes peuvent vérifier
et corriger pour vous les informations,
00:20:23.192 --> 00:20:24.813
c'est là que l'idée fait son chemin.
00:20:25.143 --> 00:20:30.083
Et puis, je leur ai lancé l'idée
de « Wikidatafier » l'intégralité ce livre
00:20:30.083 --> 00:20:33.333
sur l'histoire des artistes néo-zélandais
à Christchurch dans les années 30,
00:20:33.333 --> 00:20:39.453
et de passer en revue chaque personne,
lien, lieu, exposition, et cetera.
00:20:39.453 --> 00:20:43.103
C'est un projet de taille raisonnable,
et ils sont très enthousiastes.
00:20:43.943 --> 00:20:46.843
Et troisièmement, je voulais vous montrer
le projet des rubriques Maori.
00:20:46.843 --> 00:20:50.811
Waka est le nom maori
qui désigne un certain type de canoë,
00:20:50.811 --> 00:20:52.732
un canoë de guerre.
00:20:52.732 --> 00:20:55.812
Ainsi, à la Bibliothèque nationale
de la Nouvelle-Zélande,
00:20:55.812 --> 00:20:57.090
il existe une entrée pour waka,
00:20:57.090 --> 00:21:00.925
parce que la Bibliothèque nationale
a en réalité son propre dictionnaire
00:21:00.925 --> 00:21:04.234
des rubriques Maori, en langue maori.
00:21:04.234 --> 00:21:09.755
Donc, ici, il définit le waka
en maori et en anglais.
00:21:10.182 --> 00:21:12.372
Mais il comporte également
beaucoup de termes maoris...
00:21:12.372 --> 00:21:16.237
on peut voir ici, sur le côté,
une taurapa maorie typique.
00:21:16.237 --> 00:21:19.774
La définition apparaît
d'abord en maori, puis en anglais.
00:21:19.774 --> 00:21:22.475
Ce qu'on voit ici,
c'est un étambot sculpté.
00:21:22.475 --> 00:21:24.252
En français, on appellerait
cela « étambot »,
00:21:24.252 --> 00:21:26.989
mais on ne peut pas utiliser
le mot « étambot » pour une taurapa,
00:21:26.989 --> 00:21:28.750
car on ne voit la taurapa
00:21:28.750 --> 00:21:31.420
que sur certains types
de canoës de guerre.
00:21:31.420 --> 00:21:34.460
Donc, il n'existe pas
d'équivalent en français.
00:21:35.108 --> 00:21:36.909
Et j'ai soudain réalisé qu'il y avait ici
00:21:36.909 --> 00:21:39.929
toute une ontologie
de termes spécifiques à la culture
00:21:39.929 --> 00:21:42.867
qui ont été soigneusement
répertoriés et vérifiés
00:21:42.867 --> 00:21:45.043
par la Bibliothèque nationale
avec les Maoris,
00:21:45.043 --> 00:21:49.733
régulièrement mis à jour et suppléés
par des définitions et des descriptions,
00:21:49.733 --> 00:21:51.803
en anglais et en maori.
00:21:51.803 --> 00:21:52.956
Vraiment passionnant !
00:21:52.956 --> 00:21:56.228
J'ai soudain pensé que nous pourrions
injecter tout cela dans Wikidata,
00:21:56.228 --> 00:21:57.993
en maori d'abord,
00:21:57.993 --> 00:22:00.596
puis traduits en anglais,
selon les besoins,
00:22:00.596 --> 00:22:02.291
ça change un peu, n'est-ce pas ?
00:22:03.081 --> 00:22:05.046
Voici la licence de droit d'auteur.
00:22:05.046 --> 00:22:08.726
Et malheureusement, elle en empêche
l'exploitation commerciale.
00:22:10.346 --> 00:22:14.626
Je dois reprendre les échanges avec eux :
pourquoi ont-ils choisi cette license ?
00:22:15.675 --> 00:22:19.970
Peut-être parce qu'ils ont
[négocié] avec les Maoris,
00:22:19.970 --> 00:22:22.679
qui ont accepté la diffusion
de ces informations
00:22:22.679 --> 00:22:27.149
à condition qu'aucune de ces informations
ne soit utilisée à des fins commerciales.
00:22:27.920 --> 00:22:31.999
C'est donc l'un des aspects
les plus frustrants de cette tâche :
00:22:31.999 --> 00:22:34.238
se heurter à ce genre de restrictions.
00:22:34.238 --> 00:22:36.869
Voici donc les trois projets
que je voulais mettre en avant
00:22:36.869 --> 00:22:38.379
et ouvrir à la discussion.
00:22:38.379 --> 00:22:40.878
Répertorier une espèce entière
dans Wikidata,
00:22:40.878 --> 00:22:44.107
ce qu'il faut pour changer la vision
d'un conservateur de galerie d'art
00:22:44.107 --> 00:22:46.078
sur la valeur des Wikidatas,
00:22:46.078 --> 00:22:49.838
et que faire lorsque nous voyons
une ontologie entière
00:22:49.838 --> 00:22:51.277
dans une autre langue qui,
00:22:51.277 --> 00:22:55.697
malheureusement, est freinée
par une licence Creative Commons.
00:22:55.697 --> 00:22:56.997
Je vous remercie.
00:22:56.997 --> 00:22:58.737
(applaudissements)
00:23:04.574 --> 00:23:07.024
Faire don de données à Wikidata :
00:23:07.024 --> 00:23:09.664
première expérience
avec les archives de presse du 20e siècle.
00:23:11.412 --> 00:23:14.077
(Joachim) Bonjour !
Je m'appelle Joachim Neubert.
00:23:14.077 --> 00:23:16.472
Je travaille pour la ZBW,
00:23:17.522 --> 00:23:20.947
c'est-à-dire le centre d'information
pour l'économie à Hambourg,
00:23:21.407 --> 00:23:24.306
en tant que développeur
de logiciels scientifiques.
00:23:24.726 --> 00:23:27.248
Et une de mes tâches l'année dernière
00:23:27.248 --> 00:23:31.408
a été de préparer
un don de données à Wikidata.
00:23:31.878 --> 00:23:37.193
Je voudrais donc faire un compte-rendu
de cette première expérience
00:23:37.613 --> 00:23:43.259
de don de métadonnées
des archives de presse du 20e siècle.
00:23:46.463 --> 00:23:48.299
À notre connaissance,
00:23:48.299 --> 00:23:52.678
il s'agit des plus grandes archives
de presse publiques dans le monde.
00:23:54.018 --> 00:23:59.158
Elles ont été collectées
entre 1908 et 2005,
00:24:01.008 --> 00:24:04.244
et ont été obtenues de...
00:24:05.174 --> 00:24:10.312
de plus de 1 500 journaux
et périodiques d'Allemagne,
00:24:10.312 --> 00:24:13.333
mais aussi à l'échelle internationale.
00:24:14.651 --> 00:24:18.841
Et elles couvrent tout ce qui pourrait
présenter un intérêt
00:24:18.841 --> 00:24:22.820
pour Hambourg...
00:24:25.870 --> 00:24:28.030
pour les hommes d'affaires de Hambourg
00:24:28.030 --> 00:24:32.410
qui voudraient développer
leur commerce à travers le monde.
00:24:34.611 --> 00:24:36.550
Comme vous pouvez le constater,
00:24:36.550 --> 00:24:41.790
les contenus ont été découpés des journaux
et fixés sur des feuilles,
00:24:41.790 --> 00:24:44.731
puis rassemblés dans des dossiers,
00:24:45.211 --> 00:24:50.451
comme ici, on aperçoit
une partie d'une pièce d'archive,
00:24:51.255 --> 00:24:56.182
et, de même, l'information
qui a été collectée des entreprises,
00:24:56.182 --> 00:24:59.762
sur des sujets généraux, sur...
00:24:59.762 --> 00:25:01.533
(bafouillements)
00:25:01.533 --> 00:25:05.557
sur tout ce qui pourrait être intéressant.
00:25:06.978 --> 00:25:11.074
Ces dossiers ont été scannés
00:25:12.652 --> 00:25:15.868
jusqu'à l'année 1949 environ,
00:25:17.076 --> 00:25:23.123
dans le cadre d'un projet financé
par la DFG de 2004 à 2007.
00:25:24.268 --> 00:25:30.591
Par conséquent, jusqu'à présent,
ce sont 25 000 dossiers thématiques
00:25:31.727 --> 00:25:33.759
de cette époque qui ont été scannés.
00:25:33.771 --> 00:25:37.913
Les archives contiennent
un peu plus de 2 millions de pages,
00:25:38.845 --> 00:25:41.522
et on peut les retrouver sur Internet
00:25:43.633 --> 00:25:48.461
grâce à l'application développée
à l'époque par ZBW,
00:25:50.006 --> 00:25:55.931
qui semble aujourd'hui un peu dépassée,
n'est pas très agréable à regarder,
00:25:55.931 --> 00:25:58.597
mais plus qu'un programme,
NOTE Paragraph
00:25:58.597 --> 00:26:04.350
c'est une application qui a été construite
avec une architecture Oracle,
00:26:04.350 --> 00:26:08.662
elle a été construite sur ColdFusion,
elle fonctionne sur des serveurs Windows,
00:26:09.227 --> 00:26:14.992
elle n'est donc pas
très viable à long terme.
00:26:16.008 --> 00:26:19.384
Nous nous sommes demandés
si nous devions la migrer
00:26:19.384 --> 00:26:22.755
vers une application de données
ouvertes liées plus sophistiquée,
00:26:23.931 --> 00:26:27.964
ou si nous devions
prendre des mesures radicales
00:26:27.964 --> 00:26:31.749
et mettre toutes ces données
en consultation libre.
00:26:32.843 --> 00:26:37.416
Nous avons attribué
une licence CC0 à ces données
00:26:37.416 --> 00:26:40.938
et nous déplaçons
actuellement certaines...
00:26:42.036 --> 00:26:46.463
certaines couches -- principale
et primaire -- de découvertes...
00:26:47.233 --> 00:26:50.587
vers des données ouvertes liées
00:26:51.315 --> 00:26:53.801
là où...
00:26:53.801 --> 00:27:00.580
cela a le plus de sens d'intégrer
des métadonnées dans Wikidata,
00:27:02.367 --> 00:27:06.781
et afin de s'assurer que tous les dossiers
00:27:07.594 --> 00:27:10.633
des collections sont reliés à Wikidata
00:27:11.485 --> 00:27:13.308
pour qu'ils soient trouvables,
00:27:14.240 --> 00:27:17.795
et que toutes les métadonnées
concernant ces dossiers
00:27:18.444 --> 00:27:22.977
soient également transférées sur Wikidata.
00:27:23.344 --> 00:27:27.886
Elles pourront donc y être utilisées,
et éventuellement enrichies,
00:27:28.780 --> 00:27:32.237
des corrections pourront être
apportées à ces données.
00:27:32.645 --> 00:27:36.224
Mais ZBW continuera de gérer l'application
00:27:36.224 --> 00:27:39.274
et prendre en charge
le coût de stockage des images
00:27:39.947 --> 00:27:43.882
auxquelles nous ne pouvons pas,
de quelque manière que ce soit,
00:27:45.548 --> 00:27:47.326
attribuer de licence,
00:27:47.326 --> 00:27:51.179
parce qu'elles restent la propriété
de leurs créateurs d'origine.
00:27:52.271 --> 00:27:54.954
Mais nous veillerons
à ce qu'elles soient accessibles
00:27:56.500 --> 00:28:02.138
à certains fichiers de métadonnées
via DFG Viewer
00:28:03.108 --> 00:28:06.108
à l'avenir par les manifestes de l'IIIF.
00:28:06.849 --> 00:28:11.050
Et nous allons mettre en place
quelques pages d'atterrissage statiques
00:28:11.707 --> 00:28:18.333
qui serviront de point de données
de référence pour Wikidata,
00:28:18.333 --> 00:28:22.596
tout en continuant
à mettre à disposition des données
00:28:22.600 --> 00:28:26.174
qui ne s'intègrent pas bien dans Wikidata.
00:28:31.253 --> 00:28:36.815
Pour nous, il s'agit de la migration
et du don de données à Wikidata
00:28:37.165 --> 00:28:42.873
grâce notre infrastructure sur mesure
de points de terminaison SPARQL
00:28:42.873 --> 00:28:44.837
de ces données,
00:28:45.887 --> 00:28:49.100
et nous avons essentiellement
utilisé des requêtes fédérées
00:28:49.990 --> 00:28:53.834
entre les points de terminaison
et le service de recherche Wikidata
00:28:53.834 --> 00:28:57.633
pour créer des déclarations concordantes
00:28:59.207 --> 00:29:02.107
au travers de [résultats] concaténés
00:29:02.107 --> 00:29:06.937
dans les requêtes SPARQL elles-mêmes,
ou transformés par un script,
00:29:07.907 --> 00:29:12.254
ce qui a également généré
des références pour ces déclarations
00:29:12.742 --> 00:29:17.496
et on a ensuite intégré cela
aux QuickStatements du code
00:29:17.496 --> 00:29:20.446
pour les utiliser en ligne.
00:29:20.785 --> 00:29:22.544
Enrichissement Wikidata
en metadonnées PM20.
00:29:22.544 --> 00:29:24.073
Voilà donc ce que nous obtenons.
00:29:24.073 --> 00:29:25.886
Il ne s'agit pas uniquement
de données simples
00:29:25.886 --> 00:29:27.955
comme les dates de naissance, mais...
00:29:27.955 --> 00:29:29.835
oups, pardonnez-moi...
00:29:29.835 --> 00:29:34.998
mais aussi de déclarations complexes
00:29:34.998 --> 00:29:39.787
sur des éléments déjà existants,
00:29:39.787 --> 00:29:42.700
comme par exemple,
si cette personne est un superviseur
00:29:42.700 --> 00:29:45.790
membre du conseil
d'administration de ladite société
00:29:46.682 --> 00:29:48.905
durant cette période,
00:29:49.663 --> 00:29:54.196
et est référencé dans...
00:29:54.409 --> 00:29:56.149
(hésitation)
00:29:56.149 --> 00:30:01.864
utilisé dans un contexte scientifique.
00:30:04.926 --> 00:30:06.488
Première étape du don de données ZBW :
00:30:06.488 --> 00:30:07.763
L'archive personnelle - achevé
00:30:07.763 --> 00:30:10.939
La première étape de ce don
de données a été achevée.
00:30:12.736 --> 00:30:17.201
Les archives personnelles
sont entièrement reliées à Wikidata.
00:30:18.333 --> 00:30:23.652
C'est aussi devenu
un outil d'informations.
00:30:23.652 --> 00:30:27.360
Beaucoup d'éléments qui ont déjà été...
00:30:27.360 --> 00:30:30.422
n'avaient pas de références externes.
00:30:31.278 --> 00:30:35.674
Et nous avons généré
un peu plus de 6 000 déclarations,
00:30:36.201 --> 00:30:41.924
maintenant sourcées
dans les métadonnées de cette archive.
00:30:43.737 --> 00:30:45.288
Le prochain grand défi.
00:30:45.288 --> 00:30:49.951
Eh bien, c'était la partie la plus facile,
00:30:50.880 --> 00:30:54.785
parce que les personnes sont facilement
identifiables dans Wikidata.
00:30:56.494 --> 00:31:00.443
Plus de 90 % d'entre-elles
y existaient déjà,
00:31:00.443 --> 00:31:02.412
donc nous pouvions
relier les informations.
00:31:02.412 --> 00:31:06.486
Nous avons créé une centaine
d'articles pour ces derniers,
00:31:06.486 --> 00:31:08.807
et pour ceux qui manquaient.
00:31:09.296 --> 00:31:10.996
Mais à présent,
00:31:12.666 --> 00:31:18.165
nous travaillons
sur le reste des archives,
00:31:18.165 --> 00:31:20.432
notamment sur les sujets
des archives,
00:31:21.243 --> 00:31:24.787
ce qui signifie cartographier
un système historique
00:31:24.787 --> 00:31:29.884
pour l'organisation du savoir
sur le monde entier,
00:31:29.884 --> 00:31:34.147
matérialisée sous forme
de coupures de presse sur Wikidata.
00:31:36.305 --> 00:31:41.898
Pour vous expliquer simplement,
les archives de pays et de sujets
00:31:42.668 --> 00:31:48.773
sont organisées
selon une hiérarchie de pays
00:31:48.773 --> 00:31:50.882
et d'autres entités géographiques,
00:31:52.499 --> 00:31:56.443
et sont traduites en anglais,
ce qui rend les choses plus faciles.
00:31:56.443 --> 00:32:01.861
Et la langue allemande
s'est profondément imbriquée...
00:32:03.881 --> 00:32:08.064
profondément imbriquée
dans la classification des sujets
00:32:08.064 --> 00:32:11.593
Et cette combinaison définit un...
00:32:13.032 --> 00:32:15.906
un (s'exprime en allemand)
00:32:16.289 --> 00:32:21.128
Donc, nous souhaitons à présent
les faire correspondre
00:32:21.128 --> 00:32:24.575
à une structure de Wikidata,
et d'intégrer les données.
00:32:25.972 --> 00:32:26.972
Merci !
00:32:26.972 --> 00:32:29.338
Et je veux vous inviter
00:32:29.338 --> 00:32:33.801
à participer à ce beau défi
00:32:33.801 --> 00:32:36.272
en termes d'organisation des savoirs.
00:32:37.739 --> 00:32:40.713
Il s'agit donc d'un projet Wiki
dont la progression est suivie,
00:32:40.713 --> 00:32:46.288
et vous pouvez le suivre
ou y participer.
00:32:46.591 --> 00:32:48.908
Voilà, merci beaucoup.
00:32:49.639 --> 00:32:51.723
(applaudissements)
00:33:03.999 --> 00:33:07.284
Amenons donc maintenant
les arts du spectacle dans Wikidata,
00:33:07.735 --> 00:33:11.930
et donc dans le cloud lié,
00:33:11.930 --> 00:33:15.595
en créant un écosystème de données
ouvertes liées pour les arts de la scène.
00:33:16.164 --> 00:33:21.068
Et la question à laquelle
j'essaie de répondre,
00:33:21.068 --> 00:33:24.463
et j'espère que vous m'y aiderez,
00:33:24.463 --> 00:33:27.012
est : « Quelle place donne-t-on
à Wikidata, et cetera ? »
00:33:27.012 --> 00:33:33.886
Mais permettez-moi de partager
d'abord mes expériences de cette année,
00:33:34.503 --> 00:33:36.154
durant le premier semestre de l'année,
00:33:36.154 --> 00:33:39.350
quand j'ai eu le plaisir
de travailler avec la CAPACOA,
00:33:39.350 --> 00:33:42.074
qui est l'Association canadienne
des organismes artistiques,
00:33:42.074 --> 00:33:47.408
à l'initiative d'un projet appelé
« Un avenir numérique lié ».
00:33:47.831 --> 00:33:51.221
Pour que l'ensemble
des arts de la scène canadiens
00:33:51.221 --> 00:33:53.441
adoptent les données ouvertes liées.
00:33:53.441 --> 00:33:56.887
Ils ont lancé cette initiative
en partant de l'observation
00:33:56.887 --> 00:33:59.042
qu'au cours des cinq dernières années,
00:33:59.731 --> 00:34:03.924
la problématique principale
des arts du spectacle
00:34:03.924 --> 00:34:08.855
était que les métadonnées n'étaient pas
disponibles en qualité suffisante
00:34:08.855 --> 00:34:11.780
ni interconnectées,
ni même interopérables.
00:34:12.106 --> 00:34:16.498
C'est pourquoi certaines représentations,
00:34:16.498 --> 00:34:19.542
ou événements, ne sont pas
si simples à indexer
00:34:19.542 --> 00:34:24.777
par Google et des assistants
numériques, et cetera.
00:34:25.989 --> 00:34:29.757
Ainsi, la vision
que nous avons eue ensemble,
00:34:29.757 --> 00:34:32.997
était de disposer
d'une base de connaissances
00:34:34.013 --> 00:34:35.646
pour de nombreux acteurs simultanément.
00:34:35.646 --> 00:34:39.636
Nous avons donc examiné l'ensemble
du réseau de valeurs des arts de la scène,
00:34:39.636 --> 00:34:42.073
nous y avons identifié
les principaux acteurs,
00:34:42.073 --> 00:34:44.255
nous avons passé en revue
les scénarios d'utilisation
00:34:44.255 --> 00:34:46.632
que nous souhaitions implémenter,
00:34:47.719 --> 00:34:52.074
et l'avons en quelque sorte cartographié
à l'ensemble de l'architecture
00:34:52.074 --> 00:34:54.447
d'une telle base de connaissances,
00:34:54.447 --> 00:34:57.097
ou des différentes plateformes
qui s'y trouvent,
00:34:57.097 --> 00:34:59.535
ce qui est, évidemment,
une architecture distribuée,
00:34:59.535 --> 00:35:01.361
et pas un seul grand monolithe.
00:35:02.499 --> 00:35:07.504
Je vais simplement survoler cette partie
car nous disposons de dix minutes chacun,
00:35:09.035 --> 00:35:13.796
mais je pense que nous aurons du temps
pour approfondir cela ce soir ou demain,
00:35:13.796 --> 00:35:16.318
si des personnes veulent
en savoir un peu plus.
00:35:16.318 --> 00:35:19.116
Nous sommes donc partis de ce réseau
de valeurs des arts de la scène
00:35:19.116 --> 00:35:23.263
ce qui, curieusement,
a été publié l'année dernière,
00:35:23.263 --> 00:35:27.691
nous avons donc eu la chance de pouvoir
nous appuyer sur des travaux antérieurs,
00:35:27.691 --> 00:35:31.098
par exemple, on a la chaîne de valeur
primaire des arts du spectacle au milieu,
00:35:31.098 --> 00:35:34.177
et les différents acteurs autour.
00:35:34.177 --> 00:35:37.387
Au total, nous avons identifié
20 groupes d'acteurs,
00:35:37.387 --> 00:35:43.384
que nous pouvons ensuite rassembler
en sept grandes catégories.
00:35:43.395 --> 00:35:45.464
Pour chacun des groupes d'acteurs,
00:35:45.464 --> 00:35:51.558
nous avons en quelque sorte
formulé le type de besoins
00:35:51.558 --> 00:35:54.718
qu'ils auraient
d'une telle infrastructure,
00:35:54.718 --> 00:35:58.572
ce qu'ils seraient en mesure
de réaliser si le tout était interconnecté
00:35:58.572 --> 00:36:02.062
et que les données
étaient accessibles au public.
00:36:02.637 --> 00:36:04.990
On peut donc voir ici les types...
00:36:04.990 --> 00:36:09.177
les différents types : Production,
Présentation et promotion,
00:36:09.177 --> 00:36:13.852
Couverture et réutilisation, le Live,
Consommation en ligne, Héritage,
00:36:13.852 --> 00:36:15.959
Recherche et éducation.
00:36:15.959 --> 00:36:21.275
Et après avoir rassemblé cela en un tout,
dont on peut voir la première partie ici,
00:36:21.275 --> 00:36:23.878
nous avons pu, disons, comparer, examiner
00:36:23.878 --> 00:36:26.954
quel type de données ont été utilisées
dans l'ensemble du tableau,
00:36:26.954 --> 00:36:31.248
par les différents groupes d'acteurs.
00:36:31.248 --> 00:36:36.863
Et la base de données
qui leur est commune est plutôt importante
00:36:36.863 --> 00:36:43.063
et c'est bien là que ça a du sens
d'incorporer et de garder...
00:36:43.063 --> 00:36:45.988
de conserver ces données ensemble.
00:36:47.602 --> 00:36:50.651
Donc, lorsque l'on parle
de l'architecture de la plateforme,
00:36:50.651 --> 00:36:53.648
on peut voir que nous avons
quatre couches ici.
00:36:54.096 --> 00:36:56.448
En bas, apparaît la couche de données,
00:36:56.448 --> 00:36:58.717
bien évidemment, Wikidata y joue un rôle,
00:36:58.717 --> 00:37:02.733
mais aussi de nombreuses
autres bases de données distribuées
00:37:02.733 --> 00:37:07.769
qui peuvent publier des données
via des points de terminaison SPARQL.
00:37:09.204 --> 00:37:13.106
Le nuage jaune au milieu
est la couche sémantique,
00:37:13.106 --> 00:37:16.080
c'est notre langue commune
pour décrire les choses,
00:37:16.080 --> 00:37:18.620
pour créer des déclarations
00:37:18.620 --> 00:37:22.400
autour des arts de la scène,
de l'ontologie.
00:37:22.400 --> 00:37:25.243
Nous avons ensuite
une couche d'application
00:37:25.243 --> 00:37:30.551
qui se compose de différents modules,
par exemple, l'analyse des données,
00:37:30.551 --> 00:37:31.843
l'extraction de données,
00:37:31.843 --> 00:37:36.029
comment transformer des données
non structurées en données structurées,
00:37:36.029 --> 00:37:38.749
comment assister
cette tâche par des outils.
00:37:39.436 --> 00:37:42.478
Puis, évidemment,
il y a la visualisation des données,
00:37:42.478 --> 00:37:44.961
par exemple, s'il existe
de grandes quantités de données,
00:37:44.961 --> 00:37:47.801
vous voudrez les visualiser
d'une manière ou d'une autre.
00:37:47.801 --> 00:37:50.155
Et au sommet, vous avez
la couche de présentation,
00:37:50.155 --> 00:37:56.199
c'est ce avec quoi les gens ordinaires
interagissent quotidiennement :
00:37:56.199 --> 00:37:59.615
les moteurs de recherche,
les encyclopédies, les agendas culturels,
00:37:59.615 --> 00:38:02.097
et tout un tas d'autres services.
00:38:03.395 --> 00:38:05.386
Nous ne partons pas de zéro.
00:38:05.386 --> 00:38:08.535
Certains travaux ont déjà
été menés dans ce domaine.
00:38:09.107 --> 00:38:13.043
Je me contenterai de citer
quelques exemples de projets
00:38:13.043 --> 00:38:15.245
auxquels j'ai participé,
00:38:15.245 --> 00:38:18.149
ainsi que d'autres sujets.
00:38:18.149 --> 00:38:21.195
J'ai donc débuté dans ce domaine
00:38:21.195 --> 00:38:24.476
avec les Archives suisses
des arts du spectacle.
00:38:24.751 --> 00:38:27.795
En plus de la construction d'une base
de données sur les arts de la scène,
00:38:27.795 --> 00:38:31.046
nous en avons créé l'ontologie,
00:38:31.046 --> 00:38:33.931
qui est actuellement implémentée en RDF,
00:38:34.701 --> 00:38:37.681
et on dispose déjà
d'une base de données
00:38:37.681 --> 00:38:43.053
regroupant 60 à 70 ans
d'histoire du spectacle Suisse,
00:38:43.053 --> 00:38:45.145
c'est donc quelque chose
qui peut servir de base,
00:38:45.145 --> 00:38:48.999
et ça a été transformé en RDF.
00:38:49.968 --> 00:38:54.621
Et il y existe déjà une plateforme
où ces données peuvent être consultées.
00:38:56.073 --> 00:39:01.498
Alors nous avons fait
plusieurs injections dans Wikidata,
00:39:01.498 --> 00:39:02.877
en partie de la Suisse,
00:39:02.877 --> 00:39:08.990
mais aussi des instituts
des arts du spectacle.
00:39:09.680 --> 00:39:12.357
Bart Magnus a par exemple
participé à ce projet.
00:39:12.883 --> 00:39:15.078
Il en a été le moteur.
00:39:15.078 --> 00:39:17.223
Il y existe aussi des éléments
de Wikimedia Commons,
00:39:17.223 --> 00:39:21.361
mais qui ne sont pas très bien
reliés au reste de nos métadonnées,
00:39:21.361 --> 00:39:25.097
et évidemment,
en procédant à cette injection,
00:39:25.097 --> 00:39:31.222
nous avons pu aussi implémenter
une partie de ce modèle dans Wikidata.
00:39:32.767 --> 00:39:39.013
L'un de nos partenaires Canadien
est Culture Creates.
00:39:39.013 --> 00:39:43.872
Ils gèrent une plateforme qui récupère
les données des sites web des théâtres
00:39:43.872 --> 00:39:46.873
et les injectent
dans un graphique de connaissances,
00:39:48.293 --> 00:39:51.698
pour ensuite l'exposer
aux moteurs de recherche
00:39:51.698 --> 00:39:55.438
et d'autres dispositifs de recherche.
00:39:56.415 --> 00:39:58.811
Et là encore,
00:39:58.811 --> 00:40:03.261
nous avons en quelque sorte implémenté
et étendu ce système à l'ontologie.
00:40:03.261 --> 00:40:05.389
Et comme on peut le voir
sur la diapositive,
00:40:05.389 --> 00:40:09.599
il y a encore beaucoup d'espaces vides,
mais il y a aussi des chevauchements,
00:40:09.599 --> 00:40:13.456
et un chevauchement important qui est
évidemment la langue commune partagée,
00:40:13.456 --> 00:40:18.693
ce qui nous aidera à interconnecter
les différents ensembles de données.
00:40:20.759 --> 00:40:22.587
Il est également important
00:40:22.587 --> 00:40:26.404
d'utiliser les même registres de base
et fichiers d'autorité,
00:40:26.406 --> 00:40:31.368
et Wikidata joue un rôle important
dans ce domaine
00:40:31.368 --> 00:40:33.967
en interconnectant.
00:40:34.619 --> 00:40:37.799
J'aimerais maintenant vous faire part
des recommandations
00:40:37.799 --> 00:40:41.882
par le comité consultatif de l'initiative
« Un avenir numérique lié »,
00:40:42.769 --> 00:40:45.169
tout du moins, des deux premières
recommandations.
00:40:45.169 --> 00:40:49.450
Donc, pour les Canadiens,
il est désormais crucial de remplir
00:40:49.450 --> 00:40:53.173
leur propre graphique des connaissances
sur les arts du spectacle,
00:40:53.173 --> 00:40:55.851
car, contrairement aux Archives suisses
des arts du spectacle,
00:40:55.851 --> 00:40:59.389
ils n'ont pas une base de données
déjà existante,
00:40:59.389 --> 00:41:01.906
mais ils peuvent la créer,
00:41:01.906 --> 00:41:04.468
et il est absolument crucial
d'y avoir des données.
00:41:04.468 --> 00:41:06.934
Et deuxièmement,
comme vous pouvez le voir,
00:41:06.934 --> 00:41:09.024
cela concerne Wikidata.
00:41:09.024 --> 00:41:12.342
Wikidata, aux yeux du comité consultatif,
00:41:12.342 --> 00:41:16.718
a été considéré comme source
complémentaire à Artsdata.ca,
00:41:16.718 --> 00:41:18.347
ce graphique de connaissance,
00:41:18.347 --> 00:41:20.794
et, par conséquent,
des efforts devraient être faits
00:41:20.794 --> 00:41:22.703
pour contribuer à sa population
00:41:22.703 --> 00:41:25.813
par le biais de données relatives
aux arts du spectacle.
00:41:25.813 --> 00:41:30.775
Et c'est à ces fins que nous allons œuvrer
au cours des mois et des années à venir,
00:41:30.775 --> 00:41:34.748
et c'est aussi pourquoi
je suis un peu à l'affût
00:41:34.748 --> 00:41:38.454
de voir qui d'autre
se joindra à cet effort.
00:41:38.454 --> 00:41:40.556
Wikidata et le WD classique
sont complémentaires.
00:41:40.556 --> 00:41:44.942
Donc, évidemment, actuellement,
nous les disons complémentaires.
00:41:44.942 --> 00:41:46.631
Nous devons donc réfléchir
00:41:46.631 --> 00:41:49.844
aux avantages et inconvénients
de chacune des approches,
00:41:49.844 --> 00:41:52.073
et on peut voir ici une comparaison
00:41:52.073 --> 00:41:56.120
entre les approches Wikidata
et les données ouvertes liées classiques.
00:41:56.887 --> 00:41:59.947
Je serais heureux d'approfondir
le sujet avec vous,
00:41:59.947 --> 00:42:02.549
quelles expériences vous avez de cela,
00:42:02.814 --> 00:42:05.767
mais mon point de vue est
que Wikidata est un atout considérable,
00:42:05.767 --> 00:42:07.727
parce que c'est une plateforme
de crowdsourcing,
00:42:07.727 --> 00:42:11.671
et qu'il est facile d'inviter
d'autres acteurs à y contribuer.
00:42:11.683 --> 00:42:17.482
Le point négatif, évidemment,
est la perte de contrôle :
00:42:17.658 --> 00:42:20.424
les propriétaires de données
doivent abandonner le contrôle
00:42:20.424 --> 00:42:22.162
de leurs graphiques,
00:42:22.162 --> 00:42:26.554
de la qualité et l'exhaustivité
des données.
00:42:26.554 --> 00:42:29.353
Il est plus difficile d'effectuer
un suivi sur Wikidata
00:42:29.353 --> 00:42:31.493
que si vous en aviez le contrôle.
00:42:31.493 --> 00:42:36.236
Une autre force de Wikidata
est que ça exige
00:42:36.236 --> 00:42:39.617
une intégration immédiate
dans ce graphique mondial,
00:42:39.617 --> 00:42:41.734
et vous pouvez le faire...
00:42:42.544 --> 00:42:46.768
pas à pas par rapport
à d'autres bases de données,
00:42:46.768 --> 00:42:49.528
ce qui peut également être vu
par certains comme un avantage,
00:42:49.528 --> 00:42:53.914
mais bien sûr, si vous cherchez
de l'intégration et de l'interopérabilité,
00:42:53.914 --> 00:42:56.792
Wikidata vous oblige
à aller le chercher depuis le début.
00:42:59.184 --> 00:43:03.157
Et puis, évidemment, l'harmonisation
des pratiques de modélisation des données
00:43:03.157 --> 00:43:05.552
pose problème dans les deux options.
00:43:06.039 --> 00:43:08.611
Mais cela peut vous sembler
plus facile, au début,
00:43:08.611 --> 00:43:10.671
de le faire dans votre propre silo,
00:43:10.671 --> 00:43:13.356
parce qu'à un moment donné,
vous en aurez terminé avec cette tâche,
00:43:13.356 --> 00:43:16.693
sinon ça resterait
une tâche en cours sur Wikidata.
00:43:18.280 --> 00:43:22.883
Ainsi, lorsqu'il s'agit de définir
les données à injecter en priorité,
00:43:23.535 --> 00:43:28.395
voici les règles,
que je vais passer en revue.
00:43:30.055 --> 00:43:32.325
Tout d'abord, on injectera les données
00:43:32.325 --> 00:43:36.191
là où l'autorité naturelle
n'est pas clairement définie,
00:43:36.191 --> 00:43:40.433
il s'agit donc évidemment de données
qui seront gérées de manière partagée.
00:43:40.902 --> 00:43:43.941
On injectera des données
00:43:43.941 --> 00:43:47.149
là où nous voyons un potentiel élevé
de crowdsourcing.
00:43:47.149 --> 00:43:49.133
On injectera des données
00:43:49.133 --> 00:43:51.693
là où elles sont susceptibles
d'être réutilisées
00:43:51.693 --> 00:43:53.965
dans le contexte de Wikipédia.
00:43:54.813 --> 00:44:00.262
Et il y a aussi un espoir qu'une partie
de la coordination internationale
00:44:00.262 --> 00:44:03.064
autour de l'ensemble
de la modélisation des données,
00:44:03.064 --> 00:44:04.364
autour de la normalisation,
00:44:04.364 --> 00:44:07.531
puisse avoir avoir lieu
directement sur Wikidata,
00:44:07.531 --> 00:44:09.484
si ce n'est ailleurs,
00:44:09.484 --> 00:44:12.309
parce que cela force les gens à interagir
00:44:12.309 --> 00:44:14.816
s'ils injectent leurs données
dans un même endroit.
00:44:15.963 --> 00:44:19.490
Et j'aimerais maintenant aborder
00:44:19.490 --> 00:44:22.181
les registres de base
et les fichiers d'autorité
00:44:22.181 --> 00:44:25.785
car ils nous aident en quelque sorte
à créer des liens
00:44:25.785 --> 00:44:29.010
entre les différentes données
et des vocabulaires contrôlés
00:44:29.010 --> 00:44:32.833
comme une extension
de l'ontologie existante.
00:44:33.965 --> 00:44:35.994
Il nous reste donc à voir
deux autres diapositives.
00:44:36.480 --> 00:44:40.978
La prochaine étape consiste
à passer de la « somme des GLAM »
00:44:40.978 --> 00:44:42.888
et à « Wiki aime les arts du spectacle ».
00:44:42.888 --> 00:44:47.524
Cela signifie que nous décrivons
les lieux et organismes
00:44:47.524 --> 00:44:51.106
et essayons d'envoyer
ces données dans Wikipedia
00:44:51.106 --> 00:44:54.414
sous forme d'infoboxes et infobulles.
00:44:54.414 --> 00:44:59.769
L'autre projet que je vais mener
est le COST Action,
00:45:00.336 --> 00:45:02.001
que nous présenterons l'année prochaine
00:45:02.930 --> 00:45:06.037
autour de cet écosystème de données
ouvertes liées pour les arts du spectacle.
00:45:06.037 --> 00:45:07.927
COST est un programme européen
00:45:07.927 --> 00:45:10.347
qui soutient les activités
de mise en réseau,
00:45:10.347 --> 00:45:13.929
et les sujets à traiter sont énumérés ici.
00:45:13.929 --> 00:45:16.404
J'en ai souligné deux d'entre eux :
00:45:16.404 --> 00:45:20.702
l'un d'entre eux traite de la question
de fédération entre Wikidata
00:45:20.702 --> 00:45:23.717
et une approche de données ouvertes liées.
00:45:24.368 --> 00:45:27.744
Et l'autre est également
très important à mon sens,
00:45:27.744 --> 00:45:30.528
et présente un énorme potentiel,
00:45:30.528 --> 00:45:33.133
il s'agit de mettre en œuvre
des campagnes internationales
00:45:33.133 --> 00:45:35.993
pour suppléer les données sur Wikidata.
00:45:37.627 --> 00:45:38.975
Eh bien, voilà !
00:45:38.975 --> 00:45:41.365
Je vous remercie de votre attention.
00:45:41.365 --> 00:45:45.762
Maintenant, je vais demander
à mes collègues de me rejoindre.
00:45:47.086 --> 00:45:50.529
Pour le panel, nous aurons peut-être
des microphones également.
00:45:53.903 --> 00:45:55.682
Et puis j'aimerais...
00:45:57.473 --> 00:45:59.940
vous donner la possibilité
de poser des questions,
00:46:01.042 --> 00:46:05.185
et bien sûr demander à mes collègues
00:46:05.753 --> 00:46:08.071
s'ils ont des questions
les uns pour les autres.
00:46:12.049 --> 00:46:15.327
Alors, avons-nous une question du public ?
00:46:18.114 --> 00:46:19.974
(rires)
00:46:20.502 --> 00:46:22.587
(un·e intervenant·e parle sans micro)
00:46:22.587 --> 00:46:23.587
(rires)
00:46:23.587 --> 00:46:27.033
(intervenant·e 2) J'aimerais demander
à chacun d'entre vous
00:46:27.033 --> 00:46:30.842
où vous traceriez la ligne...
00:46:30.842 --> 00:46:33.076
en gros, comment vous définiriez
00:46:33.076 --> 00:46:35.956
le moment où il est nécessaire
de gérer votre propre Wikibase,
00:46:35.956 --> 00:46:39.328
et ce vous mettriez sur Wikidata ?
00:46:39.328 --> 00:46:45.257
Est-ce qu'il y a une délimitation claire
derrière la mise en ordre ?
00:46:48.211 --> 00:46:51.484
Je peux répondre en premier
parce que j'ai le micro.
00:46:51.484 --> 00:46:56.955
Donc, je pense que l'un des enjeux
est la notoriété.
00:46:59.212 --> 00:47:02.084
J'y réponds dans un autre projet.
00:47:02.084 --> 00:47:05.898
Et je pense que la licence
pourrait en être un aussi,
00:47:05.898 --> 00:47:08.580
parce que vous pouvez imposer
vos propres conditions
00:47:08.580 --> 00:47:13.782
dans votre propre base de données,
lorsque c'est possible.
00:47:14.284 --> 00:47:19.882
Et troisièmement,
je dirais qu'il faut avoir un bac à sable,
00:47:19.882 --> 00:47:23.078
pour préparer l'injection
des données dans Wikidata.
00:47:23.078 --> 00:47:26.085
Voici les trois idées
qui me viennent pour l'instant,
00:47:26.085 --> 00:47:28.554
mais je peux en trouver d'autres.
00:47:29.976 --> 00:47:32.369
Pour moi, les droits seront
toujours un problème.
00:47:32.369 --> 00:47:36.686
Donc, si la Bibliothèque nationale
voulait se diriger vers une Wikibase,
00:47:36.686 --> 00:47:39.740
cela leur permettrait de continuer
à contrôler l'octroi des licences
00:47:39.740 --> 00:47:42.539
pour le travail qu'ils ont accompli
sur les termes en langue maori.
00:47:43.438 --> 00:47:46.483
La base de données kakapo
ne contient que des données
00:47:46.483 --> 00:47:49.977
que le Ministère de la conservation
a estimé pouvoir rendre publique,
00:47:49.977 --> 00:47:52.739
mais s'ils le voyaient en état de marche,
00:47:52.739 --> 00:47:55.980
ils pourraient être tentés
d'utiliser une Wikibase privée
00:47:55.980 --> 00:47:58.128
pour gérer leur propre base de données,
00:47:58.128 --> 00:48:00.884
tout bonnement à cause de certains
des outils de visualisation
00:48:00.884 --> 00:48:03.567
qui pourraient être appliqués
et seraient bien plus efficaces
00:48:03.567 --> 00:48:07.417
qu'un système de tableur Excel
qu'ils utilisent actuellement.
00:48:12.337 --> 00:48:16.556
Eh bien, je pense que cela dépend
beaucoup du type de données.
00:48:17.609 --> 00:48:22.359
Avec les archives de presse,
nous avons été assez chanceux,
00:48:22.359 --> 00:48:26.984
en ce sens qu'il s'agissait
d'un support qui a été publié...
00:48:26.984 --> 00:48:29.829
qui a été publié à l'époque,
00:48:30.153 --> 00:48:31.780
mais sa publication a été coûteuse.
00:48:33.082 --> 00:48:36.234
Donc, c'est assez simple.
00:48:36.234 --> 00:48:39.449
Je pense aussi que les projets...
00:48:40.101 --> 00:48:42.476
et c'était un projet classique :
00:48:42.476 --> 00:48:45.726
il a été financé pendant un temps donné,
puis le financement a pris fin,
00:48:46.466 --> 00:48:51.516
et puis les données
ont été enfermées dans un silo,
00:48:52.136 --> 00:48:55.106
au sein de certains logiciels
qui ne sont pas éternels.
00:48:55.846 --> 00:48:59.436
Et donc, cela fait
absolument sens à mes yeux.
00:48:59.896 --> 00:49:02.776
À l'époque, Wikidata n'existait pas,
mais maintenant il est là,
00:49:03.376 --> 00:49:06.066
et c'est tout à fait logique
pour notre projet
00:49:06.066 --> 00:49:09.324
d'en discuter la viabilité
00:49:09.324 --> 00:49:14.763
dans un contexte où la question est
l'intégration à un écosystème plus vaste
00:49:15.227 --> 00:49:17.137
comme Wikidata,
00:49:17.137 --> 00:49:18.878
et ce que c'est exactement,
00:49:18.878 --> 00:49:21.408
en discuter avec la communauté Wikidata,
00:49:21.408 --> 00:49:26.864
quel en est l'aspect notable
et quel sens ça a de l'ajouter à Wikidata,
00:49:26.864 --> 00:49:32.093
et quel sens ça a de le conserver
sous forme de propriété,
00:49:32.093 --> 00:49:37.753
peut-être sous une forme plus simple
qu'une application sophistiquée,
00:49:37.753 --> 00:49:43.055
mais de le rendre accessible
et le relier au cloud de big data
00:49:43.055 --> 00:49:46.032
au lieu d'investir beaucoup d'argent
00:49:46.032 --> 00:49:52.692
dans un silo qui ne tiendra pas.
00:49:55.201 --> 00:50:00.121
Comme je l'ai déjà dit
dans le projet que j'ai présenté ici,
00:50:00.121 --> 00:50:04.926
comme les dualités entre Wikidata
et les données ouvertes liées classiques,
00:50:04.926 --> 00:50:07.928
il ne s'agit donc pas tant
de la mise en place d'une Wikibase privée.
00:50:11.147 --> 00:50:14.504
Nous avons également fait face
à un défi, dans Wikidata :
00:50:14.504 --> 00:50:19.760
lorsqu'on injecte ses propres données,
on doit également faire un peu de ménage,
00:50:20.744 --> 00:50:23.509
et nettoyer ce qu'ont fait
les autres, en réalité.
00:50:24.043 --> 00:50:25.968
Ça peut en décourager certains,
00:50:25.968 --> 00:50:29.888
ou bien ça veut dire
qu'on va devoir s'en occuper pas à pas.
00:50:30.375 --> 00:50:33.466
Il y aura donc, dans un premier temps,
une base de données vivant
00:50:33.873 --> 00:50:35.581
dans un Web de données classique
00:50:35.581 --> 00:50:38.395
qu'on commencera à relier à Wikidata,
00:50:38.395 --> 00:50:42.985
et il s'agit d'un processus continu
pour déterminer pour quels domaines
00:50:42.985 --> 00:50:47.643
les données de références
vivront finalement sur Wikidata,
00:50:48.168 --> 00:50:51.946
et pour quels domaines elles vivront
sur d'autres bases de données.
00:50:52.620 --> 00:50:54.865
Il est évident que nous aurons
des défis à relever
00:50:54.865 --> 00:50:57.135
concernant la synchronisation,
00:50:57.135 --> 00:51:01.507
comme nous l'avons probablement tous
au travers de ce champ de Web de données.
00:51:01.507 --> 00:51:04.826
où il nous faut encore négocier
à qui l'on peut se fier,
00:51:05.160 --> 00:51:08.720
qui possède les droits, sur quoi.
00:51:13.830 --> 00:51:15.820
(assistant·e) D'autres questions ?
00:51:23.981 --> 00:51:25.550
(intervenant·e 3) Merci.
00:51:26.090 --> 00:51:31.030
Alors, je suis tout à fait d'accord
avec cette question de...
00:51:32.395 --> 00:51:36.909
déterminer où placer la limite
00:51:36.909 --> 00:51:41.607
entre les raisons pour lesquelles
nous mettons des données sur Wikidata,
00:51:43.044 --> 00:51:49.144
ou pourquoi on les garde,
on les crée, les gére et les met à jour
00:51:49.144 --> 00:51:53.444
dans les bases de données locales
et à quelles fins.
00:51:53.778 --> 00:51:57.213
Et je pense qu'il s'agit d'un grand débat
00:51:57.213 --> 00:52:02.383
qui va au-delà du simple enthousiasme
00:52:02.383 --> 00:52:07.423
de mettre des données sur Wikidata
parce que c'est public,
00:52:07.432 --> 00:52:10.762
parce qu'il sert l'humanité, parce que...
00:52:11.031 --> 00:52:13.362
ou qu'il possède des outils sympas,
00:52:13.362 --> 00:52:18.132
et les choses sont plus compliquées
dans la vie réelle, je pense.
00:52:19.162 --> 00:52:24.102
Eh bien, malgré cela,
c'est un débat assez intéressant.
00:52:24.435 --> 00:52:29.744
Et il y a un autre problème
qui est débattu
00:52:29.744 --> 00:52:35.034
dans cet événement
où l'on présente différents panels :
00:52:35.775 --> 00:52:41.129
d'un côté, vous avez
votre propre base de données,
00:52:41.129 --> 00:52:43.194
quelle que soit la technologie,
00:52:43.194 --> 00:52:46.763
et vous publiez des choses sur Wikidata,
00:52:47.233 --> 00:52:51.166
ou vous construisez votre propre système
00:52:51.166 --> 00:52:55.246
en termes de création
et de gestion de l'information
00:52:55.246 --> 00:52:58.131
à partir de la technologie Wikibase.
00:52:58.591 --> 00:53:02.201
Et ensuite, vous synchronisez
ou je ne sais quoi...
00:53:02.201 --> 00:53:04.281
fédérez ou bien autre chose ;
00:53:04.281 --> 00:53:08.314
il s'agit toujours d'une question
de technologie utilisée,
00:53:09.182 --> 00:53:14.796
et le fait que vous utilisiez Wikidata
juste pour la publication,
00:53:14.978 --> 00:53:18.637
ou l'infrastructure
qui se trouve sous Wikidata
00:53:18.637 --> 00:53:23.002
pour créer et gérer vos données.
00:53:23.002 --> 00:53:24.092
Donc...
00:53:24.804 --> 00:53:26.104
(hésitation)
00:53:27.116 --> 00:53:30.914
Je veux dire que nous avons
eu une discussion
00:53:30.914 --> 00:53:34.254
sur le panel de la Wikibase,
00:53:34.254 --> 00:53:36.912
et il y aura d'autres débats ici,
00:53:36.912 --> 00:53:40.815
mais je pense qu'il y a
différents niveaux.
00:53:41.626 --> 00:53:47.756
Vous réagissez certainement à ce débat
sur Wikibase ou Wikidata...
00:53:48.930 --> 00:53:52.427
Je pense que c'est problématique
de tant nous concentrer
00:53:52.427 --> 00:53:54.429
sur cette infrastructure Wikibase,
00:53:54.429 --> 00:53:56.158
parce qu'il existe
d'autres infrastructures,
00:53:56.158 --> 00:53:58.690
comme dans le domaine
des arts du spectacle.
00:53:59.810 --> 00:54:02.274
Nous avons une communauté
complémentaire supplémentaire
00:54:02.274 --> 00:54:04.054
qui est MusicBrainz,
00:54:04.054 --> 00:54:08.954
qui tourne sur sa propre plateforme,
qui fournit des données ouvertes liées
00:54:09.614 --> 00:54:12.692
et tel que je le comprends,
00:54:14.160 --> 00:54:17.232
il existe un accord
au sein de la communauté Wikidata
00:54:17.232 --> 00:54:19.731
qui dit que nous n'allons pas
doubler toutes les données...
00:54:19.731 --> 00:54:21.489
nous n'allons pas copier
toutes les données,
00:54:21.489 --> 00:54:24.848
mais nous acceptons
qu'ils soient complémentaires.
00:54:24.848 --> 00:54:26.166
Alors, que se passera-t-il
00:54:26.166 --> 00:54:30.246
lorsqu'on commencera à intégrer
ces données dans Wikipédia ?
00:54:30.246 --> 00:54:31.907
les infoboxes, par exemple.
00:54:31.907 --> 00:54:34.064
Serons-nous en mesure
d'extraire ces données
00:54:34.064 --> 00:54:36.764
directement à partir
de leur points de terminaison SPARQL ?
00:54:36.764 --> 00:54:39.603
Ou serons-nous obligés
de copier toutes les données,
00:54:39.603 --> 00:54:42.225
et quel type de processus
cela fait appelle ?
00:54:42.225 --> 00:54:44.915
(intervenant·e 4)
Le débat est ouvert, je pense,
00:54:44.915 --> 00:54:46.785
parce que dans le cadre de cet événement,
00:54:46.785 --> 00:54:49.615
vous avez ces communautés intéressées...
00:54:49.615 --> 00:54:51.975
celles qui s'intéressent à Wikibase,
00:54:51.975 --> 00:54:54.002
celles qui s'intéressent à Wikidata,
00:54:54.002 --> 00:54:56.282
et celles qui s'intéressent aux deux.
00:54:56.282 --> 00:54:59.562
Oui, mais nous n'allons pas
les obliger à aller vers Wikibase.
00:55:00.002 --> 00:55:03.118
- (i. 4) Pas nécessairement.
- MusicBrainz ne tourne pas sur Wikibase.
00:55:03.118 --> 00:55:04.992
(i. 4) Non,
je voulais simplement dire
00:55:04.992 --> 00:55:06.802
que ce sont des problèmes bien distincts.
00:55:06.802 --> 00:55:10.964
Parfois, ils sont reliés, parfois non,
ils sont complètement séparés.
00:55:12.479 --> 00:55:16.573
Et j'avais une autre question ou remarque
00:55:16.573 --> 00:55:22.013
concernant la gestion des hiérarchies
dans les vocabulaires contrôlés,
00:55:22.013 --> 00:55:26.473
comme la source, comme vous dans Finto.
00:55:27.703 --> 00:55:30.563
Vous avez les lieux...
00:55:31.503 --> 00:55:34.956
et les maoris...
00:55:36.418 --> 00:55:40.554
les rubriques maories...
00:55:42.262 --> 00:55:46.440
Eh bien, ils doivent faire face
à la gestion des concepts
00:55:46.440 --> 00:55:48.360
dans la hiérarchie.
00:55:48.360 --> 00:55:52.320
Quelle est votre opinion
00:55:52.320 --> 00:55:57.042
sur la possibilité de gérer ce contrôle...
00:55:58.850 --> 00:56:02.364
de l'organisation des connaissances
dans les Wikidata ?
00:56:07.166 --> 00:56:10.169
Je pense que dans le cas
des lieux Finto et YSO,
00:56:11.499 --> 00:56:14.391
le référenciel sera une collection
00:56:14.391 --> 00:56:18.936
de plusieurs sources, à terme.
00:56:18.936 --> 00:56:21.613
Il est de toute façon en pleine mutation.
00:56:21.613 --> 00:56:24.528
Donc, nous n'avons pas besoin de...
00:56:24.528 --> 00:56:28.383
Bon, je ne représente pas
la Bibliothèque nationale,
00:56:28.383 --> 00:56:31.512
mais dans ce projet potentiel,
00:56:31.512 --> 00:56:35.711
nous n'aurions pas à entretenir...
00:56:35.711 --> 00:56:38.540
ou plutôt, lutter
avec une structure existante.
00:56:38.540 --> 00:56:40.414
Donc, en ce sens,
00:56:40.414 --> 00:56:45.394
il s'agit d'un domaine
ouvert à l'exploration.
00:56:48.912 --> 00:56:54.311
Les rubriques maories semblent
se prêter à la structure Wikidata,
00:56:54.311 --> 00:56:56.961
mais la licence, bien sûr, l'interdit.
00:56:56.961 --> 00:56:59.491
Si la licence était différente
00:56:59.491 --> 00:57:01.511
et que les données
étaient mises dans Wikidata,
00:57:01.511 --> 00:57:04.562
si quelqu'un décidait
qu'il n'en aimait pas la hiérarchie
00:57:04.562 --> 00:57:06.162
et tentait de modifier quelque chose,
00:57:06.162 --> 00:57:10.001
il y aurait un tollé immédiat
des personnes ayant travaillé très dur
00:57:10.001 --> 00:57:12.301
pour créer cette structure
00:57:12.301 --> 00:57:15.641
et on chercherait à obtenir
confirmation auprès des Maoris
00:57:15.641 --> 00:57:17.942
que c'était bien la bonne hiérarchie.
00:57:18.382 --> 00:57:20.841
C'est donc un problème
qu'il faut essayer de résoudre.
00:57:23.812 --> 00:57:26.502
Je pense qu'en termes de connaissances
des systèmes d'organisation,
00:57:26.502 --> 00:57:28.116
ils sont tous différents.
00:57:28.116 --> 00:57:31.752
Et je ne suis pas certain
que ce serait une bonne idée
00:57:31.752 --> 00:57:36.855
de représenter les différentes hiérarchies
dans Wikidata en tant que tel,
00:57:37.650 --> 00:57:42.101
mais ça peut être intéressant
de réfléchir à des superpositions
00:57:42.941 --> 00:57:45.022
des données,
00:57:45.431 --> 00:57:48.371
et donc, de cartographier les contenus.
00:57:49.091 --> 00:57:54.021
Par exemple, en tant que partenaire ZBW
pour le Thesaurus d'économie,
00:57:55.420 --> 00:57:59.150
ce thésaurus établit sa propre hiérarchie,
00:57:59.680 --> 00:58:04.020
et, bien sûr, il serait possible
de projeter la hiérarchie
00:58:04.461 --> 00:58:08.452
de ce thésaurus en concepts Wikidata
00:58:08.452 --> 00:58:11.541
sans pour autant stocker
ce type de structure
00:58:12.180 --> 00:58:14.840
comme structure alternative
dans Wikidata
00:58:14.840 --> 00:58:18.640
ce qui créerait beaucoup de confusion.
00:58:18.640 --> 00:58:22.859
Mais je pense
que nous devrions voir Wikidata
00:58:22.859 --> 00:58:24.789
comme un réservoir de concepts
00:58:24.789 --> 00:58:29.651
qui seraient connectés
en couches extérieures,
00:58:30.264 --> 00:58:33.489
et donneraient une autre vision du monde
00:58:33.489 --> 00:58:39.080
mais qui ne feraient
pas nécessairement partie de Wikidata.
00:58:45.775 --> 00:58:48.203
(assistant·e) Très bien.
D'autres questions ?
00:58:49.096 --> 00:58:51.527
Sinon... d'accord.
00:58:54.769 --> 00:58:57.781
(intervenant·e 6) Joachim, je voulais
juste donner suite à ce dernier point.
00:58:57.781 --> 00:59:01.064
Donc, ces couches,
comme vous les imaginez,
00:59:02.196 --> 00:59:04.143
seraient-elles maintenues à l'extérieur
00:59:04.143 --> 00:59:07.404
et d'une manière
ou d'une autre intégrées...
00:59:08.964 --> 00:59:11.764
à Wikidata, d'un point de vue Wikidata,
00:59:11.764 --> 00:59:17.143
ou avez-vous réfléchi un peu plus
00:59:17.143 --> 00:59:19.463
à la manière dont tout cela
pourrait être géré ?
00:59:22.351 --> 00:59:24.931
En réalité, non, je n'ai pas...
00:59:25.271 --> 00:59:30.361
J'ai fait des essais avec ZBW et Wikidata.
00:59:30.361 --> 00:59:33.132
J'étais [inaudible] à Wikidata.
00:59:33.132 --> 00:59:38.837
Mais je pense que c'est une nouveauté
tout à fait complexe,
00:59:39.261 --> 00:59:46.210
et donc, c'est sujet à débat,
[de renoncer à beaucoup de contrôle]
00:59:46.409 --> 00:59:47.908
pour faire une telle chose.
00:59:47.908 --> 00:59:50.178
Mais il faudrait trouver une solution.
00:59:56.638 --> 00:59:57.959
Encore une autre ?
00:59:57.959 --> 00:59:59.686
(intervenant·e 5) Ah, super.
00:59:59.686 --> 01:00:02.628
J'avais une question
concernant le projet kakapo.
01:00:03.875 --> 01:00:05.000
Mmh-mmh.
01:00:05.000 --> 01:00:10.805
(intervenant·e 5) OK, donc, avez-vous
reçu un refus de la communauté Wikidata
01:00:10.805 --> 01:00:14.636
sur le fait de référencer
des individus de la faune ?
01:00:15.576 --> 01:00:16.606
Pas encore.
01:00:16.606 --> 01:00:19.215
(i. 5) Quelqu'un a-t-il entendu
parler de ce sujet auparavant ?
01:00:19.215 --> 01:00:20.245
« Pas encore »
01:00:20.245 --> 01:00:23.085
parce que personne
n'en a encore entendu parler ?
01:00:23.085 --> 01:00:26.095
Ça fait déjà un certain temps
qu'on en discute...
01:00:26.095 --> 01:00:29.235
avec des personnes intéressées
dans ce genre de choses dans Wikidata,
01:00:29.235 --> 01:00:32.215
et nous semblons tous penser
qu'il s'agit d'une extension naturelle
01:00:32.215 --> 01:00:34.355
d'accorder aux individus
des articles Wikidata
01:00:34.355 --> 01:00:35.855
comme un cheval de course célèbre
01:00:35.855 --> 01:00:39.755
ou le chat de quelqu'un, qui...
C'est assez bien modélisé.
01:00:39.764 --> 01:00:44.444
Je pense que l'audace,
c'est d'y référencer toute l'espèce.
01:00:44.444 --> 01:00:48.113
Mais je pense
que c'est tout à fait gérable.
01:00:48.113 --> 01:00:50.173
N'essayez pas avec des chats
ou des chiens.
01:00:50.173 --> 01:00:52.027
(rires)
01:00:52.027 --> 01:00:54.337
(assistant·e) Parfait, je pense
que le temps est écoulé.
01:00:54.337 --> 01:00:55.767
Merci beaucoup de votre présence.
01:00:55.767 --> 01:00:59.267
Nous sommes toujours ouverts
aux questions durant la pause,
01:00:59.267 --> 01:01:00.797
et amusez-vous bien.
01:01:00.797 --> 01:01:02.292
Merci beaucoup.
01:01:02.292 --> 01:01:04.047
(applaudissements)
01:01:07.376 --> 01:01:11.376
WIKI DATA CON 2019
Wikidata et les langues