-
Panel GLAM
-
GLAM : galeries d'art,
bibliothèques, archives et musées
-
Bonjour à tous.
-
Bienvenue à notre panel GLAM.
-
Avant de commencer,
j'ai deux annonces à vous faire.
-
La première : n'hésitez pas à utiliser
notre Etherpad pour prendre des notes.
-
La deuxième annonce s'adresse
à ceux qui nous regardent de chez eux,
-
ou bien où qu'ils se trouvent :
-
si vous avez des questions,
-
vous pouvez également
les noter sur l'Etherpad,
-
et nos bonnes âmes de la salle
pourront suivre vos interrogations.
-
Nous avons donc décidé
pour le panel de cette année,
-
après avoir vu toutes les contributions,
-
que nous nous concentrerions
sur le rôle de Wikidata
-
dans les écosystèmes de données
-
qui vont au-delà
des projets Wikimedia en cours,
-
ce qui est également en phase
-
avec la nouvelle statégie
de la fondation Wikimedia.
-
Et nous sommes accompagnés,
aujourd'hui, de quatre membres du panel.
-
Trois plus un.
-
Je vais donc vous demander
de monter sur scène
-
afin que je puisse
vous présenter à l'assemblée.
-
(bruits de pas)
-
Nous avons donc Susanna Ånäs.
-
Susanna milite depuis très longtemps
pour la liberté du savoir,
-
est engagée dans de nombreux WikiProjects,
-
et aujourd'hui,
elle nous fera le compte-rendu
-
d'un projet en coopération
-
avec la Bibliothèque
nationale finlandaise.
-
Ensuite, j'ai à côté de moi
Mike Dickison,
-
qui interviendra en deuxième.
-
Il est conservateur de musée
et est originaire de Nouvelle-Zélande.
-
Il est également zoologue
et rédacteur en chef de Wikipédia.
-
Il a été le premier Wikipédien
néo-zélandais en résidence
-
en 2018 et 2019,
-
et il nous parlera
de son expérience dans ce rôle,
-
et ce que cela a fait de travailler
pour Wikidata dans ce contexte.
-
Nous avons ensuite Joachim Neubert
-
du centre d'information de Leibniz
pour l'économie à Kiel et Hambourg.
-
Il travaille à rendre
-
les plus grandes archives publiques
de la presse au monde
-
plus accessible au public,
-
et il utilise Wikidata à cette fin.
-
J'interviendrai en dernier.
-
Je m'appelle Beat Estermann.
-
Je travaille pour l'Université de Berne
des sciences appliquées, en Suisse.
-
Je promeus depuis très longtemps
l'OpenGLAM en Suisse et en Autriche,
-
et je ferai aujourd'hui
un compte-rendu de mes activités
-
en relation avec le mandat
-
de l'Association canadienne
des organismes artistiques,
-
à savoir les arts du spectacle,
-
pas nécessairement
par le biais de Wikidata,
-
mais vous verrez qu'il commence
à jouer un rôle dans ce domaine.
-
À présent, la plupart d'entre nous
allons prendre place ici,
-
et je vais donner la parole à Susanna.
-
(Susanna) Bien.
-
Bonjour, je m'appelle Susana Ånäs,
-
et je travaille à temps partiel
pour Wikimedia Finlande
-
en tant que coordinatrice du GLAM,
-
et je suis également consultante
dans le domaine des savoirs libres,
-
Alors, ça peut être
un discours [inaudible],
-
j'ai donc participé à la réalisation
-
d'un groupe...
-
d'un groupe de données géographiques du...
-
je n'ai pas vérifié le terme en anglais,
-
mais, c'était à l'initiative
du gouvernement royal finlandais
-
au nom du patrimoine culturel.
-
Il s'agit donc de noms de lieux
-
et de la manière dont ils sont représentés
-
dans différents référentiels
du secteur des GLAM en Finlande,
-
comment les GLAM essaient
de rassembler ces différentes sources,
-
et comment les lieux sont décrits
par le biais de la modélisation
-
dans Wikidata et ailleurs.
-
On retrouve ici les trois sources
principales du projet YSO Places
-
faisant partie de l'ontologie générale.
-
AHAA désigne les archives finlandaises,
-
Melinda, les bibliothèques finlandaises,
-
et KOOKOS, les musées finlandais.
-
Il existe donc trois systèmes
de gestion de contenu
-
réunis dans le projet YSO Places.
-
Des échanges entre Wikidata
sont déjà en cours,
-
ainsi qu'un projet de toponymie
pour le Service National Cartographique.
-
Et puis, il existe un troisième projet,
les archives de toponymie finlandaise,
-
qui n'y contribue pas encore,
-
mais c'est en prévision.
-
L'un des points clés de la modélisation
dans cette problématique
-
est que trois types d'éléments
de la toponymie des lieux
-
sont représentés dans ce projet,
-
l'un d'eux étant le lieu,
son emplacement géographique,
-
un autre étant le nom du lieu,
-
le dernier étant les sources,
c'est-à-dire les documents
-
d'où ces deux premiers
éléments sont tirés,
-
ou encore, étayés.
-
Le projet YSO Places,
-
ici, en haut à droite,
on retrouve les mêmes diagrammes
-
ce projet YSO se concentre
principalement sur les lieux.
-
Ce projet est sous la houlette
de la Bibliothèque nationale de Finlande,
-
et du projet Finto.
-
Il compte à présent plus de 7 000 lieux
en finnois et en suédois,
-
et plus de 3 000 en anglais,
sous licence CC0.
-
On retrouve ici le service Finto.
-
Et j'ai choisi pour lieu Sevettijärvi,
-
qui fait désormais partie
de notre projet linguistique
-
aux côtés des Skolt Sámi..
-
Sevettijärvi est un lieu situé
dans l'extrême nord de la Finlande,
-
habité par les Skolt Sámi.
-
On peut donc voir ici
le lieu qui appartient à...
-
enfin... voilà les données
concernant cet endroit.
-
On peut voir qu'il est
relié à un Wikidata,
-
et retrouver les données
du Service National Cartopgraphique.
-
On voit ici plus en détail ces éléments.
-
Les données sont également hiérarchisées
-
dans ce référentiel.
-
En réalité, ce lieu n'est pas affiché ici,
-
mais on le retrouve
sous cette municipalité,
-
ainsi que sa région,
-
et la Finlande en tant que pays,
et les pays nordiques,
-
comme région frontalière.
-
On peut voir ici
que beaucoup de ces données
-
ont été associées
avec Wikidata auparavant,
-
par le biais d'un Mix'n'Match,
et il en reste encore à associer.
-
Cependant, la quantité d'entrées
n'est pas si élevée :
-
il y a un peu moins de 5 000.
-
Il existe également cet autre référentiel
-
du projet de plateforme
géospatial finlandaise,
-
les Place Names Cards.
-
Ce sont tous les noms de lieux
qui figurent sur les cartes finlandaises.
-
Les données qui y sont reliées,
sont sous licence CC BY 4.0.
-
Ce sont 800 000 étiquettes de cartes
en finnois, suédois,
-
et dans les trois langues sámi
que l'on parle en Finlande.
-
Et il existe deux types d'entités :
-
certaines sont des lieux,
et les autres des noms de lieux.
-
Et elles ont toutes deux
leur adresse PURL.
-
Par exemple, ici, ce même Sevettijärvi,
apparaît en finnois, à la première ligne,
-
puis dans les trois langues sámi,
-
ainsi que ses données géographiques,
et davantage d'informations
-
comme le type de lieu, et ainsi de suite.
-
Voici le tableau pour cette toponymie
ayant son propre URI.
-
Désolé, apparemment,
ça n'est pas traduit en anglais...
-
Il semblerait que le multilinguisme
ne couvre pas l'ensemble du projet.
-
Nous arrivons ensuite
à l'archivage des toponymes finlandais.
-
Il s'agit d'un projet mené par
l'Institut de langues de Finlande,
-
qui ne traite ni des lieux,
ni de leur toponymes,
-
mais des sources de ces derniers.
-
Il s'agit donc de trois millions
de notes sur le terrain des noms de lieux,
-
et il s'agit d'un projet Wikibase.
-
Ces données sont dans une Wikibase,
-
principalement en finnois,
certaines en suédois,
-
dans quantité de langues sámi d'intérêt,
-
et elles sont sous licence CC BY 4.0,
-
ce qui représente également un défi
du point de vue Wikidata,
-
mais s'il existait
une Wikibase locale finlandaise,
-
nous serions peut-être en mesure
de les travailler en premier.
-
Voici donc une capture d'écran
-
montrant qu'il y a des informations
concernant le lieu, les cartes...
-
et des anciennes cartes
que les collectionneurs utilisaient,
-
ainsi que des cartes générées
sur la base des données récoltées.
-
Voici donc une de ces cartes
-
générée sur base des données.
-
Nous avons également ce projet
-
mené par le Laboratoire des humanités
numériques d'Helsinki
-
et le groupe de recherche en sémantique
informatique de l'université d'Aalto,
-
en partenariat avec l'Institut
de langues de Finlande,
-
le projet Names Sampo.
-
Et il s'agit d'une interface
de recherche agrégée
-
selon plusieurs sources de toponymie.
-
Ici, on peut voir nombre de sources
à gauche de l'écran,
-
et on peut générer
différentes représentations
-
sur la base de ces données.
-
Et... oui, c'est ça.
-
J'ai donc évoqué cette idée
de modélisation d'une Wikibase locale
-
que nous pourrions réaliser
avec ces données.
-
Mais lorsque nous évoquons
ces questions de modélisation,
-
ou comment modéliser,
-
il y existe différentes
manières de procéder.
-
Et donc...
-
Oui.
-
Ce qu'il y a de bien,
-
c'est que cela pourrait
servir les langues minoritaires
-
avec très peu d'efforts.
-
Très bien, nous avons
donc ici deux options :
-
le modèle SAPO, c'est-à-dire l'ontologie
spatio-temporelle finlandaise,
-
et le modèle Wikidata.
-
On peut voir ici que les éléments
Wikidata ont tendance à...
-
eh bien, dans l'idéal, rester identiques
avec des propriétés changeantes,
-
alors que, dans le modèle SAPO,
ces éléments deviennent nouveaux
-
lorsqu'il y a un changement,
comme un changement de zone ou de nom.
-
Revenons à ce schéma divisé
-
entre ces trois différentes dimensions.
-
Ainsi, devrions-nous faire
de ces toponymes
-
des entités ou des propriétés ?
-
Wikidata utilise des propriétés,
-
tandis que le Service National
Cartopgraphique parle d'entités.
-
Ou devrions-nous en faire des lexèmes ?
-
Wikidata a choisi de travailler
avec des propriétés textuelles
-
pour les toponymes plutôt que des lexèmes.
-
Je suis désolée, c'est l'inverse.
-
Donc, les noms sont...
-
des propriétés, pas des lexèmes.
-
Bien.
-
Je dirais que la faiblesse de la Wikibase
-
est peut-être l'absence de
données topographiques
-
comme dans la configuration de base,
-
il faudrait donc rendre
le système plus performant
-
pour pouvoir utiliser
les topographies locales.
-
Et une fédération
serait vraiment la bienvenue
-
pour pouvoir profiter du corpus Wikidata.
-
Donc, je crois bien être arrivée
à la fin de la présentation !
-
Merci !
-
(applaudissements)
-
(bruits de pas)
-
Bien.
-
(s'exprimant en maori)
-
(Mike) Bienvenue à tous.
-
Je m'appelle Mike Dickison.
-
Et durant un an,
-
j'ai été un wikipédien
néo-zélandais en résidence.
-
Vous vous demandez peut-être
ce qu'est un wikipédien en résidence,
-
parce que si vous cherchez,
vous ne trouverez rien à ce sujet,
-
comme on peut le voir ici.
-
C'est un terme que j'ai inventé
dans la proposition de subvention,
-
ce que la fondation
a semblé beaucoup apprécier.
-
Et donc, nous avons gardé ce terme.
-
Durant un an, je suis passé par
35 institutions différentes,
-
les résidences qui, pour la plupart,
organisaient des sessions de formation,
-
des événements publics,
et essayaient de développer
-
une stratégie Wikimedia,
chacune de leur côté.
-
Ça a été une expérience très intéressante,
-
où j'ai découvert un large éventail
de projets et de personnes,
-
et j'aimerais passer en revue
quelques-uns des différents projets
-
qui portaient sur Wikidata,
-
d'une manière intéressante,
ou tout au moins éclairante,
-
dont les gens pourront débattre.
-
Le projet était axé sur Wikipedia...
-
Le projet était initialement
estampillé Wikipédia
-
simplement parce que les gens
étaient familiers de Wikipedia,
-
et nous avons donc organisé
de multiples événements différents
-
lors d'edit-a-thons traditionnels
sur les écarts entre les sexes...
-
[dont beaucoup ont été très fructueux],
-
ainsi qu'une série recrutement
de rédacteurs en chef tout aussi réussie.
-
Nous avons effectué des téléchargements
en masse vers les Commons.
-
En l'occurrence ici, une collection
de plus de 1 000 œuvres d'art originales
-
de l'illustrateur
entomologiste, Des Helmore,
-
qui se trouvait sur un disque dur,
-
qui correspondait
à une décennie de recherche,
-
et nous avons pu obtenir
l'autorisation de les publier
-
le tout sous licence CC BY.
-
Donc, de petites victoires que nous avons
pu montrer aux gens de là-bas.
-
Tout le monde peut comprendre
des images de coléoptères.
-
Tout le monde peut comprendre
-
les ateliers consacrés à la réduction
de l'écart entre les sexes.
-
Mais Wikidata est beaucoup plus
difficile à vendre
-
aux personnes du secteur GLAM,
-
ou toute personne extérieure
de notre mouvement.
-
J'ai donc commencé à réaliser que Wikidata
-
allait devenir une voie
de plus en plus importante
-
dans ces projets
de wikipédiens en résidence.
-
Ainsi, au fur et à mesure
que nous avancions,
-
cette composante a pris de plus en plus
d'importance dans mon travail,
-
et j'ai commencé à essayer d'en apprendre
plus sur Wikidata moi-même,
-
parce que je commençais
à en comprendre l'importance.
-
Donc, voici un projet...
-
le kakapo est un perroquet grimpeur
endémique de Nouvelle-Zélande.
-
Nous avons travaillé en partenariat
avec le Ministère de la conservation,
-
dont le travail est de sauver
cette espèce de l'extinction,
-
et l'idée était :
-
« Et si nous référencions
chaque kakapo dans Wikidata ? »
-
Cela peut sembler risible,
-
mais c'est en fait
un projet parfaitement réalisable.
-
Quelques-uns d'entre eux y sont déjà.
-
Un élément clé à noter ici
est qu'il n'y a très peu de kakapos.
-
C'est donc une tâche gérable.
-
Il y en existait 148 quand j'ai commencé,
un est mort depuis,
-
et la dernière saison
de reproduction a été bonne
-
puisqu'on en dénombre 213 à présent.
-
C'est formidable car on n'avait pas
atteint ce nombre depuis plus de 50 ans.
-
Ça a été une grosse affaire,
-
ça faisait les manchettes
tous les jours en Nouvelle-Zélande.
-
Et... oui ?
-
(intervenant·e 1) Même le New York Times !
-
(Mike) Vraiment ? Merveilleux.
-
Oui, ça a eu une ampleur nationale,
tout le monde aime ces oiseaux.
-
Mais ce qui les rend intéressants,
-
c'est que, contrairement aux espèces
qui sont plus peuplées,
-
chaque kakapo a un nom
et un numéro d'identification propre,
-
et on dispose souvent
de données biographiques complètes
-
sur le lieu et la date de leur naissance,
-
où ils ont été couvés,
qui étaient le père et la mère,
-
quand ils sont morts, s'ils sont morts.
-
Il existe donc une base de données
au Ministère de la conservation
-
qui répertorie toutes ces informations.
-
Et l'un des plus célèbres kakapos,
bien entendu, est Sirocco,
-
qui, comme vous pouvez le voir,
est nommé d'après le vent.
-
Sirocco a un compte Twitter,
-
avec lequel Wikidata
rencontrait quelques problèmes,
-
parce que, apparemment,
-
ils ne peuvent tout simplement
pas avoir de compte Twitter, bref.
-
Il a même fait la couverture
d'un album, et cetera.
-
Il y a donc eu de multiples
propriétés à cela,
-
à probablement
l'un des plus célèbres kakapo.
-
J'ai donc proposé
au Ministère de la conservation :
-
« Pourquoi n'essayons-nous pas
de faire cela avec chacun d'entre eux ? »
-
Alors, il leur a fallu réfléchir
à combien des données biographiques
-
pourraient être rendues publiques,
-
et ils ont présenté une liste.
-
Et maintenant nous en avons,
je crois, 212 ou 210...
-
je crois qu'un couple est mort...
-
kakapo vivants qui sont
à présent tous candidats.
-
Et ils ne reçoivent un nom
que lorsqu'ils se couvrent de plumes,
-
un code leur donné tant qu'il sont bébés.
-
Donc, une fois la récolte
de données complète,
-
nous allons créer un Wikidata complet...
-
l'espèce entière sera
référencée dans Wikidata.
-
Mais on doit arriver
à une propriété pour DOC ID...
-
En fait, j'aimerais évoquer
ce sujet avec vous :
-
devrions-nous utiliser
une identification très spécifique
-
ou devrions-nous trouver
une identité qui fonctionnerait
-
pour tous les oiseaux, plantes ou animaux
sujets de projets scientifique ?
-
C'est une bonne question.
-
Le deuxième projet concernait
la galerie d'art de Christchurch.
-
Il y existe très peu de peintures
de Colin MacCahon,
-
c'est l'un des plus célèbres
artistes de l'existence.
-
Voici un dessin qu'il a fait
pour le New Zealand School Journal,
-
financé par le gouvernement de l'époque.
-
Il fait donc partie
des archives de Nouvelle-Zélande
-
qui en détiennent les droits d'auteur.
-
C'est une situation très inhabituelle.
-
J'ai donc travaillé avec
la galerie d'art de Christchurch,
-
qui, avec la galerie d'art d'Auckland,
-
posséde un site appelé
« Trouvez des artistes néo-zélandais »,
-
dont la tâche est de garder
une trace des exploitations...
-
de chaque institution possédant
des propriétés d'artistes néo-zélandais,
-
soit une base données
d'environ 18 000 artistes,
-
dont la majorité est très peu documentée.
-
Nous avons donc procédé
à une sorte de Mix'n'Match standard.
-
Nous avons exporté
les données ayant au moins
-
une date de naissance ou de décès,
ou un lieu de naissance ou de mort.
-
Donc, le champs était large.
-
Or, même là, on en a extrait peu,
-
mais aujourd'hui,
nous en avons environ 1 500
-
reliés à des artistes connus
dans Wikidata,
-
ce qui est bien.
-
Mais ce qui les intéressait...
-
Voici leur site web,
-
qui ne fait que répertorier
les liens d'exploitation,
-
sachant qu'il créent manuellement
ces données biographiques
-
pour chaque artiste,
-
eh bien, l'acte d'exporter
et la mise en place d'un Mix'n'Match
-
a mis en lumière de nombreuses coquilles
et toute sorte d'erreurs,
-
qu'ils n'avaient pas remarquées.
-
Et ce n'est que qu'en traitant
les données dans un Excel
-
que les erreurs ressortent.
-
Et ils ont tout à coup réalisé
la valeur de Wikidata
-
quand je leur ai dit :
-
« Il vous suffit de pomper
ces informations de Wikidata ».
-
Ça leur a ouvert les yeux.
-
Je pense donc que c'est
un des arguments vendeurs.
-
Lorsque vous avez un site web
soigneusement créé à la main,
-
avec 18 000 entrées pleines d'erreurs,
-
et qu'on vous dit qu'il existe
un autre moyen,
-
que d'autres personnes peuvent vérifier
et corriger pour vous les informations,
-
c'est là que l'idée fait son chemin.
-
Et puis, je leur ai lancé l'idée
de « Wikidatafier » l'intégralité ce livre
-
sur l'histoire des artistes néo-zélandais
à Christchurch dans les années 30,
-
et de passer en revue chaque personne,
lien, lieu, exposition, et cetera.
-
C'est un projet de taille raisonnable,
et ils sont très enthousiastes.
-
Et troisièmement, je voulais vous montrer
le projet des rubriques Maori.
-
Waka est le nom maori
qui désigne un certain type de canoë,
-
un canoë de guerre.
-
Ainsi, à la Bibliothèque nationale
de la Nouvelle-Zélande,
-
il existe une entrée pour waka,
-
parce que la Bibliothèque nationale
a en réalité son propre dictionnaire
-
des rubriques Maori, en langue maori.
-
Donc, ici, il définit le waka
en maori et en anglais.
-
Mais il comporte également
beaucoup de termes maoris...
-
on peut voir ici, sur le côté,
une taurapa maorie typique.
-
La définition apparaît
d'abord en maori, puis en anglais.
-
Ce qu'on voit ici,
c'est un étambot sculpté.
-
En français, on appellerait
cela « étambot »,
-
mais on ne peut pas utiliser
le mot « étambot » pour une taurapa,
-
car on ne voit la taurapa
-
que sur certains types
de canoës de guerre.
-
Donc, il n'existe pas
d'équivalent en français.
-
Et j'ai soudain réalisé qu'il y avait ici
-
toute une ontologie
de termes spécifiques à la culture
-
qui ont été soigneusement
répertoriés et vérifiés
-
par la Bibliothèque nationale
avec les Maoris,
-
régulièrement mis à jour et suppléés
par des définitions et des descriptions,
-
en anglais et en maori.
-
Vraiment passionnant !
-
J'ai soudain pensé que nous pourrions
injecter tout cela dans Wikidata,
-
en maori d'abord,
-
puis traduits en anglais,
selon les besoins,
-
ça change un peu, n'est-ce pas ?
-
Voici la licence de droit d'auteur.
-
Et malheureusement, elle en empêche
l'exploitation commerciale.
-
Je dois reprendre les échanges avec eux :
pourquoi ont-ils choisi cette license ?
-
Peut-être parce qu'ils ont
[négocié] avec les Maoris,
-
qui ont accepté la diffusion
de ces informations
-
à condition qu'aucune de ces informations
ne soit utilisée à des fins commerciales.
-
C'est donc l'un des aspects
les plus frustrants de cette tâche :
-
se heurter à ce genre de restrictions.
-
Voici donc les trois projets
que je voulais mettre en avant
-
et ouvrir à la discussion.
-
Répertorier une espèce entière
dans Wikidata,
-
ce qu'il faut pour changer la vision
d'un conservateur de galerie d'art
-
sur la valeur des Wikidatas,
-
et que faire lorsque nous voyons
une ontologie entière
-
dans une autre langue qui,
-
malheureusement, est freinée
par une licence Creative Commons.
-
Je vous remercie.
-
(applaudissements)
-
Faire don de données à Wikidata :
-
première expérience
avec les archives de presse du 20e siècle.
-
(Joachim) Bonjour !
Je m'appelle Joachim Neubert.
-
Je travaille pour la ZBW,
-
c'est-à-dire le centre d'information
pour l'économie à Hambourg,
-
en tant que développeur
de logiciels scientifiques.
-
Et une de mes tâches l'année dernière
-
a été de préparer
un don de données à Wikidata.
-
Je voudrais donc faire un compte-rendu
de cette première expérience
-
de don de métadonnées
des archives de presse du 20e siècle.
-
À notre connaissance,
-
il s'agit des plus grandes archives
de presse publiques dans le monde.
-
Elles ont été collectées
entre 1908 et 2005,
-
et ont été obtenues de...
-
de plus de 1 500 journaux
et périodiques d'Allemagne,
-
mais aussi à l'échelle internationale.
-
Et elles couvrent tout ce qui pourrait
présenter un intérêt
-
pour Hambourg...
-
pour les hommes d'affaires de Hambourg
-
qui voudraient développer
leur commerce à travers le monde.
-
Comme vous pouvez le constater,
-
les contenus ont été découpés des journaux
et fixés sur des feuilles,
-
puis rassemblés dans des dossiers,
-
comme ici, on aperçoit
une partie d'une pièce d'archive,
-
et, de même, l'information
qui a été collectée des entreprises,
-
sur des sujets généraux, sur...
-
(bafouillements)
-
sur tout ce qui pourrait être intéressant.
-
Ces dossiers ont été scannés
-
jusqu'à l'année 1949 environ,
-
dans le cadre d'un projet financé
par la DFG de 2004 à 2007.
-
Par conséquent, jusqu'à présent,
ce sont 25 000 dossiers thématiques
-
de cette époque qui ont été scannés.
-
Les archives contiennent
un peu plus de 2 millions de pages,
-
et on peut les retrouver sur Internet
-
grâce à l'application développée
à l'époque par ZBW,
-
qui semble aujourd'hui un peu dépassée,
n'est pas très agréable à regarder,
-
mais plus qu'un programme,
-
c'est une application qui a été construite
avec une architecture Oracle,
-
elle a été construite sur ColdFusion,
elle fonctionne sur des serveurs Windows,
-
elle n'est donc pas
très viable à long terme.
-
Nous nous sommes demandés
si nous devions la migrer
-
vers une application de données
ouvertes liées plus sophistiquée,
-
ou si nous devions
prendre des mesures radicales
-
et mettre toutes ces données
en consultation libre.
-
Nous avons attribué
une licence CC0 à ces données
-
et nous déplaçons
actuellement certaines...
-
certaines couches -- principale
et primaire -- de découvertes...
-
vers des données ouvertes liées
-
là où...
-
cela a le plus de sens d'intégrer
des métadonnées dans Wikidata,
-
et afin de s'assurer que tous les dossiers
-
des collections sont reliés à Wikidata
-
pour qu'ils soient trouvables,
-
et que toutes les métadonnées
concernant ces dossiers
-
soient également transférées sur Wikidata.
-
Elles pourront donc y être utilisées,
et éventuellement enrichies,
-
des corrections pourront être
apportées à ces données.
-
Mais ZBW continuera de gérer l'application
-
et prendre en charge
le coût de stockage des images
-
auxquelles nous ne pouvons pas,
de quelque manière que ce soit,
-
attribuer de licence,
-
parce qu'elles restent la propriété
de leurs créateurs d'origine.
-
Mais nous veillerons
à ce qu'elles soient accessibles
-
à certains fichiers de métadonnées
via DFG Viewer
-
à l'avenir par les manifestes de l'IIIF.
-
Et nous allons mettre en place
quelques pages d'atterrissage statiques
-
qui serviront de point de données
de référence pour Wikidata,
-
tout en continuant
à mettre à disposition des données
-
qui ne s'intègrent pas bien dans Wikidata.
-
Pour nous, il s'agit de la migration
et du don de données à Wikidata
-
grâce notre infrastructure sur mesure
de points de terminaison SPARQL
-
de ces données,
-
et nous avons essentiellement
utilisé des requêtes fédérées
-
entre les points de terminaison
et le service de recherche Wikidata
-
pour créer des déclarations concordantes
-
au travers de [résultats] concaténés
-
dans les requêtes SPARQL elles-mêmes,
ou transformés par un script,
-
ce qui a également généré
des références pour ces déclarations
-
et on a ensuite intégré cela
aux QuickStatements du code
-
pour les utiliser en ligne.
-
Enrichissement Wikidata
en metadonnées PM20.
-
Voilà donc ce que nous obtenons.
-
Il ne s'agit pas uniquement
de données simples
-
comme les dates de naissance, mais...
-
oups, pardonnez-moi...
-
mais aussi de déclarations complexes
-
sur des éléments déjà existants,
-
comme par exemple,
si cette personne est un superviseur
-
membre du conseil
d'administration de ladite société
-
durant cette période,
-
et est référencé dans...
-
(hésitation)
-
utilisé dans un contexte scientifique.
-
Première étape du don de données ZBW :
-
L'archive personnelle - achevé
-
La première étape de ce don
de données a été achevée.
-
Les archives personnelles
sont entièrement reliées à Wikidata.
-
C'est aussi devenu
un outil d'informations.
-
Beaucoup d'éléments qui ont déjà été...
-
n'avaient pas de références externes.
-
Et nous avons généré
un peu plus de 6 000 déclarations,
-
maintenant sourcées
dans les métadonnées de cette archive.
-
Le prochain grand défi.
-
Eh bien, c'était la partie la plus facile,
-
parce que les personnes sont facilement
identifiables dans Wikidata.
-
Plus de 90 % d'entre-elles
y existaient déjà,
-
donc nous pouvions
relier les informations.
-
Nous avons créé une centaine
d'articles pour ces derniers,
-
et pour ceux qui manquaient.
-
Mais à présent,
-
nous travaillons
sur le reste des archives,
-
notamment sur les sujets
des archives,
-
ce qui signifie cartographier
un système historique
-
pour l'organisation du savoir
sur le monde entier,
-
matérialisée sous forme
de coupures de presse sur Wikidata.
-
Pour vous expliquer simplement,
les archives de pays et de sujets
-
sont organisées
selon une hiérarchie de pays
-
et d'autres entités géographiques,
-
et sont traduites en anglais,
ce qui rend les choses plus faciles.
-
Et la langue allemande
s'est profondément imbriquée...
-
profondément imbriquée
dans la classification des sujets
-
Et cette combinaison définit un...
-
un (s'exprime en allemand)
-
Donc, nous souhaitons à présent
les faire correspondre
-
à une structure de Wikidata,
et d'intégrer les données.
-
Merci !
-
Et je veux vous inviter
-
à participer à ce beau défi
-
en termes d'organisation des savoirs.
-
Il s'agit donc d'un projet Wiki
dont la progression est suivie,
-
et vous pouvez le suivre
ou y participer.
-
Voilà, merci beaucoup.
-
(applaudissements)
-
Amenons donc maintenant
les arts du spectacle dans Wikidata,
-
et donc dans le cloud lié,
-
en créant un écosystème de données
ouvertes liées pour les arts de la scène.
-
Et la question à laquelle
j'essaie de répondre,
-
et j'espère que vous m'y aiderez,
-
est : « Quelle place donne-t-on
à Wikidata, et cetera ? »
-
Mais permettez-moi de partager
d'abord mes expériences de cette année,
-
durant le premier semestre de l'année,
-
quand j'ai eu le plaisir
de travailler avec la CAPACOA,
-
qui est l'Association canadienne
des organismes artistiques,
-
à l'initiative d'un projet appelé
« Un avenir numérique lié ».
-
Pour que l'ensemble
des arts de la scène canadiens
-
adoptent les données ouvertes liées.
-
Ils ont lancé cette initiative
en partant de l'observation
-
qu'au cours des cinq dernières années,
-
la problématique principale
des arts du spectacle
-
était que les métadonnées n'étaient pas
disponibles en qualité suffisante
-
ni interconnectées,
ni même interopérables.
-
C'est pourquoi certaines représentations,
-
ou événements, ne sont pas
si simples à indexer
-
par Google et des assistants
numériques, et cetera.
-
Ainsi, la vision
que nous avons eue ensemble,
-
était de disposer
d'une base de connaissances
-
pour de nombreux acteurs simultanément.
-
Nous avons donc examiné l'ensemble
du réseau de valeurs des arts de la scène,
-
nous y avons identifié
les principaux acteurs,
-
nous avons passé en revue
les scénarios d'utilisation
-
que nous souhaitions implémenter,
-
et l'avons en quelque sorte cartographié
à l'ensemble de l'architecture
-
d'une telle base de connaissances,
-
ou des différentes plateformes
qui s'y trouvent,
-
ce qui est, évidemment,
une architecture distribuée,
-
et pas un seul grand monolithe.
-
Je vais simplement survoler cette partie
car nous disposons de dix minutes chacun,
-
mais je pense que nous aurons du temps
pour approfondir cela ce soir ou demain,
-
si des personnes veulent
en savoir un peu plus.
-
Nous sommes donc partis de ce réseau
de valeurs des arts de la scène
-
ce qui, curieusement,
a été publié l'année dernière,
-
nous avons donc eu la chance de pouvoir
nous appuyer sur des travaux antérieurs,
-
par exemple, on a la chaîne de valeur
primaire des arts du spectacle au milieu,
-
et les différents acteurs autour.
-
Au total, nous avons identifié
20 groupes d'acteurs,
-
que nous pouvons ensuite rassembler
en sept grandes catégories.
-
Pour chacun des groupes d'acteurs,
-
nous avons en quelque sorte
formulé le type de besoins
-
qu'ils auraient
d'une telle infrastructure,
-
ce qu'ils seraient en mesure
de réaliser si le tout était interconnecté
-
et que les données
étaient accessibles au public.
-
On peut donc voir ici les types...
-
les différents types : Production,
Présentation et promotion,
-
Couverture et réutilisation, le Live,
Consommation en ligne, Héritage,
-
Recherche et éducation.
-
Et après avoir rassemblé cela en un tout,
dont on peut voir la première partie ici,
-
nous avons pu, disons, comparer, examiner
-
quel type de données ont été utilisées
dans l'ensemble du tableau,
-
par les différents groupes d'acteurs.
-
Et la base de données
qui leur est commune est plutôt importante
-
et c'est bien là que ça a du sens
d'incorporer et de garder...
-
de conserver ces données ensemble.
-
Donc, lorsque l'on parle
de l'architecture de la plateforme,
-
on peut voir que nous avons
quatre couches ici.
-
En bas, apparaît la couche de données,
-
bien évidemment, Wikidata y joue un rôle,
-
mais aussi de nombreuses
autres bases de données distribuées
-
qui peuvent publier des données
via des points de terminaison SPARQL.
-
Le nuage jaune au milieu
est la couche sémantique,
-
c'est notre langue commune
pour décrire les choses,
-
pour créer des déclarations
-
autour des arts de la scène,
de l'ontologie.
-
Nous avons ensuite
une couche d'application
-
qui se compose de différents modules,
par exemple, l'analyse des données,
-
l'extraction de données,
-
comment transformer des données
non structurées en données structurées,
-
comment assister
cette tâche par des outils.
-
Puis, évidemment,
il y a la visualisation des données,
-
par exemple, s'il existe
de grandes quantités de données,
-
vous voudrez les visualiser
d'une manière ou d'une autre.
-
Et au sommet, vous avez
la couche de présentation,
-
c'est ce avec quoi les gens ordinaires
interagissent quotidiennement :
-
les moteurs de recherche,
les encyclopédies, les agendas culturels,
-
et tout un tas d'autres services.
-
Nous ne partons pas de zéro.
-
Certains travaux ont déjà
été menés dans ce domaine.
-
Je me contenterai de citer
quelques exemples de projets
-
auxquels j'ai participé,
-
ainsi que d'autres sujets.
-
J'ai donc débuté dans ce domaine
-
avec les Archives suisses
des arts du spectacle.
-
En plus de la construction d'une base
de données sur les arts de la scène,
-
nous en avons créé l'ontologie,
-
qui est actuellement implémentée en RDF,
-
et on dispose déjà
d'une base de données
-
regroupant 60 à 70 ans
d'histoire du spectacle Suisse,
-
c'est donc quelque chose
qui peut servir de base,
-
et ça a été transformé en RDF.
-
Et il y existe déjà une plateforme
où ces données peuvent être consultées.
-
Alors nous avons fait
plusieurs injections dans Wikidata,
-
en partie de la Suisse,
-
mais aussi des instituts
des arts du spectacle.
-
Bart Magnus a par exemple
participé à ce projet.
-
Il en a été le moteur.
-
Il y existe aussi des éléments
de Wikimedia Commons,
-
mais qui ne sont pas très bien
reliés au reste de nos métadonnées,
-
et évidemment,
en procédant à cette injection,
-
nous avons pu aussi implémenter
une partie de ce modèle dans Wikidata.
-
L'un de nos partenaires Canadien
est Culture Creates.
-
Ils gèrent une plateforme qui récupère
les données des sites web des théâtres
-
et les injectent
dans un graphique de connaissances,
-
pour ensuite l'exposer
aux moteurs de recherche
-
et d'autres dispositifs de recherche.
-
Et là encore,
-
nous avons en quelque sorte implémenté
et étendu ce système à l'ontologie.
-
Et comme on peut le voir
sur la diapositive,
-
il y a encore beaucoup d'espaces vides,
mais il y a aussi des chevauchements,
-
et un chevauchement important qui est
évidemment la langue commune partagée,
-
ce qui nous aidera à interconnecter
les différents ensembles de données.
-
Il est également important
-
d'utiliser les même registres de base
et fichiers d'autorité,
-
et Wikidata joue un rôle important
dans ce domaine
-
en interconnectant.
-
J'aimerais maintenant vous faire part
des recommandations
-
par le comité consultatif de l'initiative
« Un avenir numérique lié »,
-
tout du moins, des deux premières
recommandations.
-
Donc, pour les Canadiens,
il est désormais crucial de remplir
-
leur propre graphique des connaissances
sur les arts du spectacle,
-
car, contrairement aux Archives suisses
des arts du spectacle,
-
ils n'ont pas une base de données
déjà existante,
-
mais ils peuvent la créer,
-
et il est absolument crucial
d'y avoir des données.
-
Et deuxièmement,
comme vous pouvez le voir,
-
cela concerne Wikidata.
-
Wikidata, aux yeux du comité consultatif,
-
a été considéré comme source
complémentaire à Artsdata.ca,
-
ce graphique de connaissance,
-
et, par conséquent,
des efforts devraient être faits
-
pour contribuer à sa population
-
par le biais de données relatives
aux arts du spectacle.
-
Et c'est à ces fins que nous allons œuvrer
au cours des mois et des années à venir,
-
et c'est aussi pourquoi
je suis un peu à l'affût
-
de voir qui d'autre
se joindra à cet effort.
-
Wikidata et le WD classique
sont complémentaires.
-
Donc, évidemment, actuellement,
nous les disons complémentaires.
-
Nous devons donc réfléchir
-
aux avantages et inconvénients
de chacune des approches,
-
et on peut voir ici une comparaison
-
entre les approches Wikidata
et les données ouvertes liées classiques.
-
Je serais heureux d'approfondir
le sujet avec vous,
-
quelles expériences vous avez de cela,
-
mais mon point de vue est
que Wikidata est un atout considérable,
-
parce que c'est une plateforme
de crowdsourcing,
-
et qu'il est facile d'inviter
d'autres acteurs à y contribuer.
-
Le point négatif, évidemment,
est la perte de contrôle :
-
les propriétaires de données
doivent abandonner le contrôle
-
de leurs graphiques,
-
de la qualité et l'exhaustivité
des données.
-
Il est plus difficile d'effectuer
un suivi sur Wikidata
-
que si vous en aviez le contrôle.
-
Une autre force de Wikidata
est que ça exige
-
une intégration immédiate
dans ce graphique mondial,
-
et vous pouvez le faire...
-
pas à pas par rapport
à d'autres bases de données,
-
ce qui peut également être vu
par certains comme un avantage,
-
mais bien sûr, si vous cherchez
de l'intégration et de l'interopérabilité,
-
Wikidata vous oblige
à aller le chercher depuis le début.
-
Et puis, évidemment, l'harmonisation
des pratiques de modélisation des données
-
pose problème dans les deux options.
-
Mais cela peut vous sembler
plus facile, au début,
-
de le faire dans votre propre silo,
-
parce qu'à un moment donné,
vous en aurez terminé avec cette tâche,
-
sinon ça resterait
une tâche en cours sur Wikidata.
-
Ainsi, lorsqu'il s'agit de définir
les données à injecter en priorité,
-
voici les règles,
que je vais passer en revue.
-
Tout d'abord, on injectera les données
-
là où l'autorité naturelle
n'est pas clairement définie,
-
il s'agit donc évidemment de données
qui seront gérées de manière partagée.
-
On injectera des données
-
là où nous voyons un potentiel élevé
de crowdsourcing.
-
On injectera des données
-
là où elles sont susceptibles
d'être réutilisées
-
dans le contexte de Wikipédia.
-
Et il y a aussi un espoir qu'une partie
de la coordination internationale
-
autour de l'ensemble
de la modélisation des données,
-
autour de la normalisation,
-
puisse avoir avoir lieu
directement sur Wikidata,
-
si ce n'est ailleurs,
-
parce que cela force les gens à interagir
-
s'ils injectent leurs données
dans un même endroit.
-
Et j'aimerais maintenant aborder
-
les registres de base
et les fichiers d'autorité
-
car ils nous aident en quelque sorte
à créer des liens
-
entre les différentes données
et des vocabulaires contrôlés
-
comme une extension
de l'ontologie existante.
-
Il nous reste donc à voir
deux autres diapositives.
-
La prochaine étape consiste
à passer de la « somme des GLAM »
-
et à « Wiki aime les arts du spectacle ».
-
Cela signifie que nous décrivons
les lieux et organismes
-
et essayons d'envoyer
ces données dans Wikipedia
-
sous forme d'infoboxes et infobulles.
-
L'autre projet que je vais mener
est le COST Action,
-
que nous présenterons l'année prochaine
-
autour de cet écosystème de données
ouvertes liées pour les arts du spectacle.
-
COST est un programme européen
-
qui soutient les activités
de mise en réseau,
-
et les sujets à traiter sont énumérés ici.
-
J'en ai souligné deux d'entre eux :
-
l'un d'entre eux traite de la question
de fédération entre Wikidata
-
et une approche de données ouvertes liées.
-
Et l'autre est également
très important à mon sens,
-
et présente un énorme potentiel,
-
il s'agit de mettre en œuvre
des campagnes internationales
-
pour suppléer les données sur Wikidata.
-
Eh bien, voilà !
-
Je vous remercie de votre attention.
-
Maintenant, je vais demander
à mes collègues de me rejoindre.
-
Pour le panel, nous aurons peut-être
des microphones également.
-
Et puis j'aimerais...
-
vous donner la possibilité
de poser des questions,
-
et bien sûr demander à mes collègues
-
s'ils ont des questions
les uns pour les autres.
-
Alors, avons-nous une question du public ?
-
(rires)
-
(un·e intervenant·e parle sans micro)
-
(rires)
-
(intervenant·e 2) J'aimerais demander
à chacun d'entre vous
-
où vous traceriez la ligne...
-
en gros, comment vous définiriez
-
le moment où il est nécessaire
de gérer votre propre Wikibase,
-
et ce vous mettriez sur Wikidata ?
-
Est-ce qu'il y a une délimitation claire
derrière la mise en ordre ?
-
Je peux répondre en premier
parce que j'ai le micro.
-
Donc, je pense que l'un des enjeux
est la notoriété.
-
J'y réponds dans un autre projet.
-
Et je pense que la licence
pourrait en être un aussi,
-
parce que vous pouvez imposer
vos propres conditions
-
dans votre propre base de données,
lorsque c'est possible.
-
Et troisièmement,
je dirais qu'il faut avoir un bac à sable,
-
pour préparer l'injection
des données dans Wikidata.
-
Voici les trois idées
qui me viennent pour l'instant,
-
mais je peux en trouver d'autres.
-
Pour moi, les droits seront
toujours un problème.
-
Donc, si la Bibliothèque nationale
voulait se diriger vers une Wikibase,
-
cela leur permettrait de continuer
à contrôler l'octroi des licences
-
pour le travail qu'ils ont accompli
sur les termes en langue maori.
-
La base de données kakapo
ne contient que des données
-
que le Ministère de la conservation
a estimé pouvoir rendre publique,
-
mais s'ils le voyaient en état de marche,
-
ils pourraient être tentés
d'utiliser une Wikibase privée
-
pour gérer leur propre base de données,
-
tout bonnement à cause de certains
des outils de visualisation
-
qui pourraient être appliqués
et seraient bien plus efficaces
-
qu'un système de tableur Excel
qu'ils utilisent actuellement.
-
Eh bien, je pense que cela dépend
beaucoup du type de données.
-
Avec les archives de presse,
nous avons été assez chanceux,
-
en ce sens qu'il s'agissait
d'un support qui a été publié...
-
qui a été publié à l'époque,
-
mais sa publication a été coûteuse.
-
Donc, c'est assez simple.
-
Je pense aussi que les projets...
-
et c'était un projet classique :
-
il a été financé pendant un temps donné,
puis le financement a pris fin,
-
et puis les données
ont été enfermées dans un silo,
-
au sein de certains logiciels
qui ne sont pas éternels.
-
Et donc, cela fait
absolument sens à mes yeux.
-
À l'époque, Wikidata n'existait pas,
mais maintenant il est là,
-
et c'est tout à fait logique
pour notre projet
-
d'en discuter la viabilité
-
dans un contexte où la question est
l'intégration à un écosystème plus vaste
-
comme Wikidata,
-
et ce que c'est exactement,
-
en discuter avec la communauté Wikidata,
-
quel en est l'aspect notable
et quel sens ça a de l'ajouter à Wikidata,
-
et quel sens ça a de le conserver
sous forme de propriété,
-
peut-être sous une forme plus simple
qu'une application sophistiquée,
-
mais de le rendre accessible
et le relier au cloud de big data
-
au lieu d'investir beaucoup d'argent
-
dans un silo qui ne tiendra pas.
-
Comme je l'ai déjà dit
dans le projet que j'ai présenté ici,
-
comme les dualités entre Wikidata
et les données ouvertes liées classiques,
-
il ne s'agit donc pas tant
de la mise en place d'une Wikibase privée.
-
Nous avons également fait face
à un défi, dans Wikidata :
-
lorsqu'on injecte ses propres données,
on doit également faire un peu de ménage,
-
et nettoyer ce qu'ont fait
les autres, en réalité.
-
Ça peut en décourager certains,
-
ou bien ça veut dire
qu'on va devoir s'en occuper pas à pas.
-
Il y aura donc, dans un premier temps,
une base de données vivant
-
dans un Web de données classique
-
qu'on commencera à relier à Wikidata,
-
et il s'agit d'un processus continu
pour déterminer pour quels domaines
-
les données de références
vivront finalement sur Wikidata,
-
et pour quels domaines elles vivront
sur d'autres bases de données.
-
Il est évident que nous aurons
des défis à relever
-
concernant la synchronisation,
-
comme nous l'avons probablement tous
au travers de ce champ de Web de données.
-
où il nous faut encore négocier
à qui l'on peut se fier,
-
qui possède les droits, sur quoi.
-
(assistant·e) D'autres questions ?
-
(intervenant·e 3) Merci.
-
Alors, je suis tout à fait d'accord
avec cette question de...
-
déterminer où placer la limite
-
entre les raisons pour lesquelles
nous mettons des données sur Wikidata,
-
ou pourquoi on les garde,
on les crée, les gére et les met à jour
-
dans les bases de données locales
et à quelles fins.
-
Et je pense qu'il s'agit d'un grand débat
-
qui va au-delà du simple enthousiasme
-
de mettre des données sur Wikidata
parce que c'est public,
-
parce qu'il sert l'humanité, parce que...
-
ou qu'il possède des outils sympas,
-
et les choses sont plus compliquées
dans la vie réelle, je pense.
-
Eh bien, malgré cela,
c'est un débat assez intéressant.
-
Et il y a un autre problème
qui est débattu
-
dans cet événement
où l'on présente différents panels :
-
d'un côté, vous avez
votre propre base de données,
-
quelle que soit la technologie,
-
et vous publiez des choses sur Wikidata,
-
ou vous construisez votre propre système
-
en termes de création
et de gestion de l'information
-
à partir de la technologie Wikibase.
-
Et ensuite, vous synchronisez
ou je ne sais quoi...
-
fédérez ou bien autre chose ;
-
il s'agit toujours d'une question
de technologie utilisée,
-
et le fait que vous utilisiez Wikidata
juste pour la publication,
-
ou l'infrastructure
qui se trouve sous Wikidata
-
pour créer et gérer vos données.
-
Donc...
-
(hésitation)
-
Je veux dire que nous avons
eu une discussion
-
sur le panel de la Wikibase,
-
et il y aura d'autres débats ici,
-
mais je pense qu'il y a
différents niveaux.
-
Vous réagissez certainement à ce débat
sur Wikibase ou Wikidata...
-
Je pense que c'est problématique
de tant nous concentrer
-
sur cette infrastructure Wikibase,
-
parce qu'il existe
d'autres infrastructures,
-
comme dans le domaine
des arts du spectacle.
-
Nous avons une communauté
complémentaire supplémentaire
-
qui est MusicBrainz,
-
qui tourne sur sa propre plateforme,
qui fournit des données ouvertes liées
-
et tel que je le comprends,
-
il existe un accord
au sein de la communauté Wikidata
-
qui dit que nous n'allons pas
doubler toutes les données...
-
nous n'allons pas copier
toutes les données,
-
mais nous acceptons
qu'ils soient complémentaires.
-
Alors, que se passera-t-il
-
lorsqu'on commencera à intégrer
ces données dans Wikipédia ?
-
les infoboxes, par exemple.
-
Serons-nous en mesure
d'extraire ces données
-
directement à partir
de leur points de terminaison SPARQL ?
-
Ou serons-nous obligés
de copier toutes les données,
-
et quel type de processus
cela fait appelle ?
-
(intervenant·e 4)
Le débat est ouvert, je pense,
-
parce que dans le cadre de cet événement,
-
vous avez ces communautés intéressées...
-
celles qui s'intéressent à Wikibase,
-
celles qui s'intéressent à Wikidata,
-
et celles qui s'intéressent aux deux.
-
Oui, mais nous n'allons pas
les obliger à aller vers Wikibase.
-
- (i. 4) Pas nécessairement.
- MusicBrainz ne tourne pas sur Wikibase.
-
(i. 4) Non,
je voulais simplement dire
-
que ce sont des problèmes bien distincts.
-
Parfois, ils sont reliés, parfois non,
ils sont complètement séparés.
-
Et j'avais une autre question ou remarque
-
concernant la gestion des hiérarchies
dans les vocabulaires contrôlés,
-
comme la source, comme vous dans Finto.
-
Vous avez les lieux...
-
et les maoris...
-
les rubriques maories...
-
Eh bien, ils doivent faire face
à la gestion des concepts
-
dans la hiérarchie.
-
Quelle est votre opinion
-
sur la possibilité de gérer ce contrôle...
-
de l'organisation des connaissances
dans les Wikidata ?
-
Je pense que dans le cas
des lieux Finto et YSO,
-
le référenciel sera une collection
-
de plusieurs sources, à terme.
-
Il est de toute façon en pleine mutation.
-
Donc, nous n'avons pas besoin de...
-
Bon, je ne représente pas
la Bibliothèque nationale,
-
mais dans ce projet potentiel,
-
nous n'aurions pas à entretenir...
-
ou plutôt, lutter
avec une structure existante.
-
Donc, en ce sens,
-
il s'agit d'un domaine
ouvert à l'exploration.
-
Les rubriques maories semblent
se prêter à la structure Wikidata,
-
mais la licence, bien sûr, l'interdit.
-
Si la licence était différente
-
et que les données
étaient mises dans Wikidata,
-
si quelqu'un décidait
qu'il n'en aimait pas la hiérarchie
-
et tentait de modifier quelque chose,
-
il y aurait un tollé immédiat
des personnes ayant travaillé très dur
-
pour créer cette structure
-
et on chercherait à obtenir
confirmation auprès des Maoris
-
que c'était bien la bonne hiérarchie.
-
C'est donc un problème
qu'il faut essayer de résoudre.
-
Je pense qu'en termes de connaissances
des systèmes d'organisation,
-
ils sont tous différents.
-
Et je ne suis pas certain
que ce serait une bonne idée
-
de représenter les différentes hiérarchies
dans Wikidata en tant que tel,
-
mais ça peut être intéressant
de réfléchir à des superpositions
-
des données,
-
et donc, de cartographier les contenus.
-
Par exemple, en tant que partenaire ZBW
pour le Thesaurus d'économie,
-
ce thésaurus établit sa propre hiérarchie,
-
et, bien sûr, il serait possible
de projeter la hiérarchie
-
de ce thésaurus en concepts Wikidata
-
sans pour autant stocker
ce type de structure
-
comme structure alternative
dans Wikidata
-
ce qui créerait beaucoup de confusion.
-
Mais je pense
que nous devrions voir Wikidata
-
comme un réservoir de concepts
-
qui seraient connectés
en couches extérieures,
-
et donneraient une autre vision du monde
-
mais qui ne feraient
pas nécessairement partie de Wikidata.
-
(assistant·e) Très bien.
D'autres questions ?
-
Sinon... d'accord.
-
(intervenant·e 6) Joachim, je voulais
juste donner suite à ce dernier point.
-
Donc, ces couches,
comme vous les imaginez,
-
seraient-elles maintenues à l'extérieur
-
et d'une manière
ou d'une autre intégrées...
-
à Wikidata, d'un point de vue Wikidata,
-
ou avez-vous réfléchi un peu plus
-
à la manière dont tout cela
pourrait être géré ?
-
En réalité, non, je n'ai pas...
-
J'ai fait des essais avec ZBW et Wikidata.
-
J'étais [inaudible] à Wikidata.
-
Mais je pense que c'est une nouveauté
tout à fait complexe,
-
et donc, c'est sujet à débat,
[de renoncer à beaucoup de contrôle]
-
pour faire une telle chose.
-
Mais il faudrait trouver une solution.
-
Encore une autre ?
-
(intervenant·e 5) Ah, super.
-
J'avais une question
concernant le projet kakapo.
-
Mmh-mmh.
-
(intervenant·e 5) OK, donc, avez-vous
reçu un refus de la communauté Wikidata
-
sur le fait de référencer
des individus de la faune ?
-
Pas encore.
-
(i. 5) Quelqu'un a-t-il entendu
parler de ce sujet auparavant ?
-
« Pas encore »
-
parce que personne
n'en a encore entendu parler ?
-
Ça fait déjà un certain temps
qu'on en discute...
-
avec des personnes intéressées
dans ce genre de choses dans Wikidata,
-
et nous semblons tous penser
qu'il s'agit d'une extension naturelle
-
d'accorder aux individus
des articles Wikidata
-
comme un cheval de course célèbre
-
ou le chat de quelqu'un, qui...
C'est assez bien modélisé.
-
Je pense que l'audace,
c'est d'y référencer toute l'espèce.
-
Mais je pense
que c'est tout à fait gérable.
-
N'essayez pas avec des chats
ou des chiens.
-
(rires)
-
(assistant·e) Parfait, je pense
que le temps est écoulé.
-
Merci beaucoup de votre présence.
-
Nous sommes toujours ouverts
aux questions durant la pause,
-
et amusez-vous bien.
-
Merci beaucoup.
-
(applaudissements)
-
WIKI DATA CON 2019
Wikidata et les langues