Panel GLAM
Buenas tardes a todos.
Bienvenidos a nuestro panel GLAM.
Antes de comenzar,
tengo dos anuncios que hacer.
El primero, usen ampliamente
nuestro Etherpad para tomar notas.
Y el segundo, está dirigido
a nuestra audiencia en casa,
o donde sea que estén.
Si tienen alguna pregunta
también pueden escribirla en el Etherpad,
y nuestros ángeles
de la sala tomarán nota.
Decidimos que para el panel de este año,
después de ver todas las contribuciones
que se hicieron,
nos centraríamos en el papel de Wikidata
dentro de los ecosistemas de datos,
que van más allá
de los proyectos reales de Wikimedia,
que también están completamente en línea
con la nueva estrategia
de la Fundación Wikimedia.
Y hoy tenemos cuatro panelistas.
Tres más uno.
Me gustaría que subieran al escenario
para presentarlos.
El papel de Wikidata en los ecosistemas
que se extienden más allá
del dominio de los proyectos Wikimedia.
Tenemos a Susanna Ånäs.
Ella es una activista del conocimiento
de libre acceso, de larga trayectoria,
involucrada en muchos WikiProjects.
Y nos informará
sobre el proyecto en cooperación
con la Biblioteca Nacional finlandesa.
Luego, a mi lado está Mike Dickison,
quien será el segundo, en este caso.
Es curador de museos de Nueva Zelanda.
Es zoólogo y editor de Wikipedia.
Y fue el iniciador
de Wikipedian At Large de Nueva Zelanda
en 2018 y 2019
y nos contará
su experiencia en ese puesto,
y qué rol Wikidata
está empezando a desempeñar
en ese contexto.
Luego tenemos a Joachim Neubert
del Leibniz Information Center
for Economics en Kiel y Hamburgo.
Trabajó para que los archivos
de prensa pública más grandes del mundo
sean más accesibles al público
utilizando Wikidata.
Y luego, yo seré el último.
Mi nombre es Beat Estermann.
Trabajo para la Universidad
de Ciencias Aplicadas de Berna, en Suiza.
Y desde hace mucho he sido promotor
de OpenGLAM en Suiza y Austria.
Y hoy informaré
sobre mis actividades en relación
con el mandato de Canadian Arts
Presenting Association,
de enfocarnos en las artes escénicas.
No principalmente en Wikidata,
pero notarán que Wikidata
comienza a tener una función ahí.
Entonces, tomaremos asiento,
y le daré la palabra a Susanna.
Hola, me llamo Susana Ånäs,
y trabajo a tiempo parcial
para Wikimedia Finlandia
como coordinadora de GLAM,
y también hago consultoría
en el ámbito del conocimiento abierto.
Y esto se relaciona
más bien con lo último.
He estado involucrada en el trabajo...
del grupo de datos geográficos de la...
Lo busqué, pero no está en inglés,
pero es la iniciativa de patrimonio
cultural del gobierno real finlandés.
Se trata de nombres de lugares
y cómo están representados
en diferentes repositorios
en el sector GLAM en Finlandia,
cómo están tratando
de aunar estas diferentes fuentes,
y cómo se informan modelando
en Wikidata y en otros lugares.
Aquí vemos las tres fuentes principales
del proyecto YSO Places,
que forman parte de la ontología nacional,
ontología general.
AHAA son las siglas
de Archivos finlandeses,
Melinda es de Bibliotecas finlandesas,
y KOOKOS es de Museos finlandeses.
Hay también tres sistemas
de gestión de contenido
reunidos en el proyecto YSO Places.
Y ya se están realizando intercambios
entre Wikidata,
así como el proyecto de toponimia
por la Dirección Nacional
de Estudios Topográficos.
Y luego hay un tercer proyecto,
el Archivo topográfico finlandés
que aún no contribuye a esto,
pero hay planes para ello.
Uno de los problemas clave
de modelado en esta área
es que hay tres tipos
de elementos de la toponimia
representados en este proyecto.
Uno de ellos es el lugar,
la ubicación geográfica
y uno de ellos es el nombre del lugar,
el topónimo, por ejemplo.
Luego, hay fuentes que son documentos
de los cuales ambos se derivan
o respaldan.
El proyecto YSO Places,
aquí en la parte superior derecha,
verán el mismo diagrama,
se centra principalmente en los lugares.
Este proyecto lo gestiona
la Biblioteca Nacional de Finlandia,
tanto como el proyecto Finto.
Ahora hay más de 7.000
lugares en finlandés y sueco
y más de 3.000 en inglés,
bajo licencia CC0.
Aquí pueden ver el servicio Finto.
Y como lugar... elegí Sevettijärvi.
También está relacionado
con nuestro proyecto lingüístico
de la lengua Skolt Sami,
Sevettijärvi es un lugar
en el extremo norte de Finlandia
habitado por Skolt Sámi.
Entonces, aquí pueden ver
el lugar que pertenece al...
pueden ver los datos sobre este lugar.
Pueden ver
que está conectado a una Wikidata,
así como a estos datos
de la National Land Survey.
Aquí se ve con más detalle.
También está ordenado jerárquicamente
dentro de este repositorio.
En realidad, el lugar real no se ve,
pero está debajo de este municipio,
así como la región,
y Finlandia como país,
y los países nórdicos,
la región fronteriza.
Aquí pueden ver que muchos de estos
han sido compatibilizados
con Wikidata previamente,
a través de Mix'n'Match,
y todavía quedan más por asociar.
Pero la cantidad de nombres
no es tan grande,
es menor a 5.000.
Hay otro repositorio
del proyecto
de Plataforma geoespacial finlandés,
llamado Place Names Cards.
Son los nombres de lugares
que están en los mapas finlandeses.
Tienen los datos vinculados,
bajo licencia es CC BY 4.0.
Hay 800.000 etiquetas de mapas en finés,
sueco y las tres lenguas saami
que se hablan en Finlandia.
Y luego hay
dos tipos diferentes de entidades.
Unas son lugares y las otras
son nombres de lugares, topónimos
y ambos tienen localizador
persistente uniforme para recursos (PURL).
Por ejemplo, el mismo Sevettijärvi,
primero en finlandés
y luego en las tres lenguas saami,
así como los datos geográficos,
Luego hay más información,
como el tipo de lugar,
etcétera.
Esta es la tarjeta de esta toponimia
con su propio URI.
Lo siento, aparentemente
no está traducido al inglés.
El proyecto no abarca en su totalidad
el multilingüismo.
Llegamos al Archivo
de topónimos finlandeses.
Es un proyecto del Instituto
de lenguas de Finlandia,
y estos no representan los lugares,
ni los nombres de los lugares,
sino que, en realidad,
son fuentes de ellos.
Estos son tres millones de notas
de campo de nombres de lugares,
y es un proyecto de Wikibase.
Están en una Wikibase, principalmente
en finés, algunas en sueco.
Una colección notable de nombres saami,
que nos interesa mucho,
bajo licencia CC BY.
Y también es un desafío,
desde el punto de vista de Wikidata,
pero si existiera
una Wikibase local finlandesa,
quizás podríamos trabajar
primero en ellos en ese proyecto.
Aquí hay una captura
de pantalla de eso,
que muestra información
sobre el lugar, los mapas,
los mapas que usaban
inicialmente los coleccionistas,
y las tarjetas que se hicieron
basadas en los datos recopilados.
Aquí está una de esas tarjetas
con los datos desglosados.
Enviaron este proyecto de datos enlazados
del Laboratorio
de humanidades digitales de Helsinki
y del grupo de tecnologías semánticas,
el grupo de informática
de la Universidad de Aalto,
junto con el Instituto
de lenguas de Finlandia,
el proyecto Names Sampo.
Y esta es una interfaz
de búsqueda agregada
a varias fuentes de nombres de lugares.
Aquí pueden ver que muchas
de las fuentes están a la izquierda,
y pueden hacer diferentes visualizaciones
basadas en estos datos.
Y sí...
He estado planteando esta idea
de modelar para una Wikibase local
que podríamos hacer con estos datos.
Pero cuando planteamos
estas preguntas de modelado,
o cómo modelar,
hay diferentes formas, usos de hacerlo.
Y lo bueno es que también
podría servir con lenguas minoritarias,
con muy poco esfuerzo.
Aquí tenemos las dos opciones básicas:
el modelo SAPO, que es la ontología
del espacio-tiempo finlandesa
y el modelo de Wikidata.
Aquí verán que los elementos
de Wikidata tienden a disminuir.
Idealmente, permanecen igual
con las propiedades cambiantes.
Mientras que, en el modelo SAPO,
estos elementos se vuelven nuevos
cuando hay un cambio,
como un cambio de área o nombre.
Aquí volvemos a esta división
entre estas tres dimensiones
diferentes de lugares, nombres de lugares.
¿Deberíamos convertir estos nombres
de lugares en entidades o propiedades?
Wikidata usa propiedades, mientras que
el proyecto de Estudios topográficos
habla de entidades.
¿O deberíamos convertirlos en lexemas?
Wikidata ha elegido trabajar
con propiedades,
propiedades textuales
para nombres de lugares
en lugar de lexemas.
Disculpen, es al revés.
Entonces, los nombres son...
propiedades, no lexemas.
Bien.
Y tal vez la limitación de Wikibase
es la falta
de configuraciones geográficas en...
como en la configuración básica
de la misma,
así es necesario aplicar tecnología
para poder usar
configuraciones geográficas locales.
Y realmente se necesita una federación
para poder aprovechar
el corpus de Wikidata.
He terminado.
Gracias.
(aplausos y risas de la oradora)
Bien.
(hablando en maorí)
Sean todos bienvenidos.
Me llamo Mike Dickison.
Y por un año estuve a cargo
de Wikipedian at Large de Nueva Zelanda.
Quizás se pregunten
qué es Wikipedian at Large.
Porque si lo buscan,
no encontrarán nada, como pueden ver.
Es un término que inventé
en la propuesta de subvención,
que a la fundación le gustó mucho.
Así que, lo implementamos.
Durante un año,
pasé por 35 instituciones diferentes,
residentes, y en la mayoría de ellos,
realizando sesiones de entrenamiento,
organizando eventos públicos
y tratando de desarrollar
una estrategia de Wikimedia para cada uno.
Fue una experiencia muy interesante,
con una amplia gama
de proyectos y personas.
Y quería hablar
sobre algunos de los proyectos
realizados con Wikidata
de manera interesante
o, tal vez, esclarecedora,
que podría ser útil que la gente discuta.
El proyecto fue inicialmente
un proyecto de Wikipedia por el nombre,
porque eso era lo que la gente conocía,
y organizamos múltiples eventos
con editatón muy tradicional,
trabajo con diferenciación
entre los géneros, etc.,
[muchos de los cuales
han tenido mucho éxito]
y un grupo de editores
nuevos muy exitosos, y demás.
Hicimos cargas masivas en Commons.
En este caso, una colección de más
de 1.000 obras de arte originales
de un ilustrador entomológico,
Des Helmore,
que estaban guardadas en un disco duro
sin estudio durante diez años,
y pudimos obtener autorización
para publicarlas,
bajo licencia CC BY.
Son pequeñas victorias
que podemos mostrar a la gente.
Todos pueden entender
estas fotos de escarabajos.
Todos pueden entender talleres dedicados
a solucionar la brecha de género.
Pero Wikidata
es mucho más difícil de vender
a las personas en el sector GLAM,
o a cualquier persona
fuera de nuestro movimiento particular.
Empecé a darme cuenta de que Wikidata
se convertiría en un camino muy importante
de los proyectos Wikipedian at Large.
A medida que avanzábamos,
este componente se ha vuelto
cada vez más importante en mi trabajo,
y, también, comencé
a aprender más sobre Wikidata,
porque comencé a ver
lo importante que era.
Este es uno de los proyectos,
el kakapo es un loro
no volador autóctono de Nueva Zelanda.
Trabajamos
con el Departamento de Conservación,
cuyo trabajo es salvar
a esta especie de la extinción,
y propuso:
"¿Qué pasa si ponemos
a cada kakapo en Wikidata?".
Y eso puede parecer ridículo,
pero en realidad
es un proyecto perfectamente factible.
Algunos de ellos ya figuran allí.
Una cosa clave para notar aquí
es que no hay muchos kakapos,
entonces, es una tarea viable.
Había 148 cuando comencé,
y luego uno murió.
Y tuvieron una excelente temporada
de reproducción, ahora son 213.
Esto es genial, porque no ha habido
tantos kakapos en más de 50 años,
así que también fue muy importante.
Fue noticia
todos los días en Nueva Zelanda.
[Inaudible]
(Persona 1) Salió en el New York Times.
(Mike) ¿Ah, sí? Estupendo.
Sí, fue de interés nacional;
todos aman a estas aves.
Algo interesante sobre ellas
es que a diferencia
de las especies que más abundan,
cada kakapo tiene un nombre único
y un número de identificación único.
A menudo encontramos
buenos datos biográficos
sobre dónde y cuándo nacieron,
dónde eclosionaron,
quiénes fueron su padre y su madre,
y cuándo murieron, si murieron.
De hecho, hay una base de datos
del Departamento de Conservación
con toda esta información.
Y uno de los kakapos
más famosos es Sirocco,
como pueden ver,
lleva el nombre de un viento, nació allí.
Sirocco tiene una cuenta en Twitter,
con el que Wikidata
tuvo algunos problemas,
porque, aparentemente,
ellos no pueden tener cuentas en Twitter.
Eso no lo sé.
Incluso apareció
en una portada, entre otras cosas.
Hay múltiples propiedades de esto,
probablemente
es uno de los kakapos más famosos.
Así que, llamé
al Departamento de Conservación,
"¿Por qué no hacemos esto con cada uno?",
y tuvieron que pensar
en qué cantidad de datos biográficos
se podrían publicar.
Pensaron en una lista breve.
Y ahora tenemos, creo,
212, 210, murió un par,
210 kakapos vivos y todos son candidatos.
Y solo reciben
un nombre cuando salen del nido
y tienen un número de código
mientras son bebés.
Cuando tengamos la producción completa,
vamos a crear una Wikidata completa,
toda la especie estará en Wikidata.
Pero debemos llegar
a una propiedad para DOC ID.
De hecho,
me gustaría hablarlo con ustedes:
¿deberíamos usar
una identificación muy específica,
o deberíamos crear una identificación
que resulte para todas las aves,
plantas o animales
que han sido etiquetados en algún proyecto
de investigación científica.
Es una buena pregunta.
El segundo proyecto
fue Christchurch Art Gallery.
Hay muy pocas pinturas
de Colin MacCahon,
el artista más famoso de Nueva Zelanda.
Este es un dibujo que hizo
para el New Zealand School Journal,
que fue financiado
por el gobierno en ese momento.
En realidad está
en los Archivos de Nueva Zelanda
que poseen los derechos de autor.
Esta es una situación muy inusual.
Trabajé con Christchurch Art Gallery,
que junto con Auckland Art Gallery,
lleva a cabo una página web llamada
"Find New Zealand artists".
Uno de los trabajos es hacer
un seguimiento de las existencias:
todas las instituciones que tienen
participaciones del artista neozelandés.
Hay alrededor de 18.000 artistas
en su base de datos,
y la mayoría con muy poca información.
Entonces, hicimos una combinación.
Exportamos aquellos que tenían
al menos fecha de nacimiento,
o una fecha o lugar de nacimiento,
o lugar de fallecimiento.
Eso no lo restringe demasiado,
incluso así,
no pudimos encontrar suficientes,
pero tenemos alrededor de 1.500 ahora,
que coinciden
con artistas conocidos en Wikidata,
lo cual es bueno.
Pero lo que les atraía,
este es su sitio web,
que en realidad solo mantiene
los enlaces operativos allí.
Pero estos datos biográficos,
que se crean manualmente,
para cada artista,
y el trabajo de exportar
y configurar un Mix'n'Match,
expuso numerosos errores tipográficos
y errores que no habían notado,
y es solo cuando se llevan a Excel
que estas cosas aparecen.
Y entendieron el valor de Wikidata
cuando dije: "Pueden extraer
esa información de Wikidata".
Les abrió los ojos.
Creo que este es uno de los atractivos.
Cuando tienes este sitio web
cuidadosamente seleccionado
con 18.000 entradas, llenas de errores,
y decirles que hay otra forma,
que pueden hacer que otras personas
hagan esta verificación de datos
y corrección por ellos,
así la idea se abre camino.
Y luego anuncié esta idea
de que podrían "wikidatalizar"
todo este libro de historia
de los artistas de Nueva Zelanda
en Christchurch en los años 30,
y repasar, (recién publicado),
y repasar a cada persona,
conexión, lugar, exposición, etc.
Es un proyecto viable,
y están muy entusiasmados con esto.
Y en tercer lugar, quería mostrarles
los Encabezados temáticos maoríes.
Una waka es el nombre maorí
de un tipo de canoa,
una canoa de guerra.
En la Biblioteca Nacional
de Nueva Zelanda,
hay un listado de las wakas,
porque la Biblioteca Nacional,
en realidad, tiene su propio diccionario
de Encabezados temáticos maoríes,
en el idioma maorí.
Entonces, allí está la definición de waka,
en maorí e inglés.
Pero también
tiene muchos otros términos maoríes,
pueden verlo de ese lado,
una taurapa maorí típica.
Y una definición primero en maorí,
y luego en inglés.
Allí puedes ver el codaste esculpido
que en inglés se llama sternpost,
pero no puedes usar
la palabra sternpost para taurapa,
porque taurapa solo describe
determinadas canoas de guerra.
No hay una palabra equivalente en inglés.
Y me di cuenta de que aquí hay
una ontología completa
de términos culturales específicos
que han sido cuidadosamente elaborados
y verificados
por la Biblioteca Nacional con maoríes,
que son constantemente
actualizados y mejorados
con definiciones y descripciones,
tanto en inglés como en maorí.
Es realmente emocionante.
Se me ocurrió que podríamos
poner todo esto en Wikidata.
Primero en maorí
y luego al inglés, si es preciso.
Es un buen cambio, ¿no?
Y esta es la licencia
de derechos de autor.
Desafortunadamente,
es No comercial-Sin obras derivadas.
Tengo que reanudar
las conversaciones con ellos
para saber
por qué escogieron esa licencia.
Posiblemente porque llegaron
a un acuerdo con los maoríes,
quienes acordaron elaborarlo,
si se garantizaba
de que ninguna información
se utilizara con fines comerciales.
Ese es uno de los aspectos frustrantes
de la tarea,
cuando hay este tipo de restricciones.
Esas son las tres cosas
que quería mencionar
para generar un debate.
Poner una especie entera en Wikidata,
lo que se necesita para cambiar
la mente del curador de una galería
sobre el valor de Wikidata,
y lo que hacemos si viéramos
una ontología completa
en otra lengua que,
lamentablemente, ha sido limitada
con una licencia restrictiva
Creative Commons.
Gracias.
(aplausos)
Hola, me llamo Joachim Neubert.
Trabajo para el ZBW,
que es el Centro de información
para la economía en Hamburgo,
como desarrollador de software científico.
Y una de mis tareas el año pasado
fue preparar una donación
de datos a Wikidata
y quiero dar un informe
sobre nuestras primeras experiencias
al donar metadatos
de los Archivos de prensa del siglo XX.
Según tenemos entendido,
este es el archivo de prensa pública
más grande del mundo.
Se ha recopilado entre 1908 y 2005,
y ha sido obtenido
de más de 1.500 periódicos y revistas
de Alemania y, también, de otros países.
Y ha tratado todo
lo que podría ser de interés
para Hamburgo,
para los empresarios de Hamburgo
con intenciones
de expandirse por el mundo.
Como pueden ver, este material
ha sido recortado de periódicos,
pegado en papel,
y coleccionado en carpetas.
Aquí se ve un pequeño rincón
del Archivo de la Persona,
y, también, se ha recopilado
información sobre empresas,
de temas generales, de bienes.
de todo lo que pueda ser de interés.
Estas carpetas han sido escaneadas
hasta aproximadamente 1949,
como parte de un proyecto financiado
por DFG en 2004 a 2007.
Como resultado, hasta ahora,
hay 25.000 dosiers temáticos
de esa época.
Estos comprenden
más de 2 millones de páginas
y todos estos están en línea.
Esta aplicación desarrollada
en ese momento por ZBW,
ahora parece un poco anticuada
no es tan elegante,
y parece más bien un programa.
Es una aplicación construida
estructuralmente en Oracle,
creada en ColdFusion,
y se ejecuta en servidores Windows,
así que no es sostenible a largo plazo.
Y hemos discutido
si deberíamos migrar esto
a una aplicación
de datos enlazados más elegante,
o deberíamos tomar otras medidas
y publicar todos estos datos.
A esos datos le asignamos la licencia CC0
y estamos migrando,
las principales capas de acceso,
a la capa de descubrimiento principal,
a la web de datos abiertos enlazados,
allí donde realmente tiene sentido
poner algunos metadatos en Wikidata,
y para asegurarnos
de que todas las carpetas
de las colecciones
están enlazadas a Wikidata,
para que puedan ser encontradas,
y que todos los metadatos
sobre estas carpetas
también se transfieran a Wikidata.
Así podrá usarse y enriquecerse allí,
posiblemente
hacer correcciones a esos datos.
La ZBW aún sostiene
el almacenamiento de las imágenes,
las que no se pueden utilizar,
o no podemos dar una licencia de ellas,
porque son propiedad
de los creadores originales.
Pero nos aseguramos de que sean accesibles
mediante archivos
de metadatos a través del DFG Viewer,
en el futuro por los manifiestos de IIIF.
Y prepararemos algunas páginas
de inicio estáticas
que servirán como punto de referencia
de datos para Wikidata,
así como también
pondremos a disposición los datos
que no se ajustan bien a Wikidata.
Para nosotros es la migración
y la donación de datos a Wikidata
con nuestra infraestructura personalizada
de la terminal SPARQL de esos datos.
Y básicamente utilizamos
consultas federadas
entre esa terminal
y el Servicio de consultas de Wikidata
para crear declaraciones acordes,
concatenadas
con el lenguaje de consulta SPARQL
o transformadas a través de un script,
que también generaron referencias
para las declaraciones.
Luego utilizamos
QuickStatements para codificar
y poder usarlo en línea.
Entonces esto es lo que tenemos.
No son solo cosas simples,
como las fechas de nacimiento,
sino que, disculpen,
también declaraciones complejas
sobre elementos ya existentes,
como es el caso de esta persona,
miembro del consejo
de supervisión de esa compañía
durante este período de tiempo,
y citada
para su uso en...
en el ámbito científico.
La primera parte de esta donación
de datos está terminada.
El Archivo de la Persona
está enteramente enlazado a Wikidata
y también es
una herramienta de información.
Muchos elementos previos
no tenían ninguna referencia externa.
Y tuvimos más de 6.000 declaraciones,
obtenidas de los metadatos
de este archivo.
Esa fue la parte más fácil,
porque las personas
son fácilmente identificables en Wikidata.
Más del 90 % ya se encontraban aquí,
así que pudimos enlazarlo.
Creamos 100 artículos para estos,
para los que faltaban.
Pero ahora estamos trabajando
en el resto del archivo,
particularmente en el archivo de temas.
Eso implica mapear un sistema histórico
para la organización del conocimiento
sobre el mundo entero,
y materializado en forma
de recortes de periódicos en Wikidata.
Para que se hagan una idea,
el Archivo de países y temas,
está organizado
por una jerarquía de países
y otras entidades geográficas,
traducido al inglés,
para que sea más fácil,
y el alemán está
profundamente jerarquizado...
tiene una intensa clasificación
de temas jerarquizados,
y esta combinación define un...
un dosier.
Lo que queremos hacer ahora
es hacer coincidir esto,
como estructura de Wikidata,
e incorporar los datos.
Y quiero invitarlos
a unirse a este desafío realmente genial
de organización del conocimiento.
Es un WikiProject
donde se rastrea este trabajo,
y puedes seguirlo o participar en él.
Muchas gracias.
(aplausos)
Estamos llevando las artes
escénicas a Wikidata.
Y las llevamos a la nube
de datos abiertos enlazados,
creando un ecosistema de datos abiertos
enlazados para las artes escénicas.
Y trato de responder una pregunta,
que espero me ayuden a hacerlo,
y es qué lugar tiene Wikidata y todo eso.
Pero comenzaré con las experiencias
de lo que hice este año.
La primera mitad del año,
cuando tuve el placer
de trabajar con CAPACOA,
que es la Canadian Arts
Presenting Association,
que lanzó un proyecto
llamado Linked Digital Future Initiative,
para lograr que todo el sector artístico
en Canadá
adopte los datos abiertos enlazados.
Hicieron eso observando
que en los últimos cinco años
el tema más importante,
dentro de las artes escénicas,
fue que los metadatos
no tenían la suficiente calidad
y no estaban enlazados
ni eran compatibles.
Por eso, algunas de las actuaciones,
algunos de los eventos
no son tan fáciles
de encontrar por Google,
asistentes informáticos y demás.
La idea que formulamos
fue una base de conocimiento
para todos los interesados.
Así que analizamos toda la red de valor
de las artes escénicas,
identificamos interesados clave allí,
vimos dónde lo podríamos implementar.
Mapeamos toda la arquitectura
de esa base de conocimiento,
o de las diferentes plataformas,
que, obviamente,
es una arquitectura distribuida,
y no un gran monolito.
Hablaré de ello rápidamente,
porque tenemos diez minutos cada uno,
aunque tendremos mucho tiempo
hoy y mañana para profundizarlo,
si alguien está interesado
en los detalles.
Comenzamos desde esa Red de valor
de las artes escénicas,
que se publicó el año pasado.
Tenemos la suerte de construir
sobre el trabajo anterior,
tenemos en el medio
la cadena de valor primaria
de las artes escénicas,
y, alrededor, las partes interesadas.
En total identificamos
20 grupos de partes interesadas
que luego resumimos
a siete grandes categorías,
de cada uno de los grupos.
Formulamos
qué tipo de necesidades tendrían,
en términos de dicha infraestructura,
y qué se lograría
si todo estuviera interconectado
y los datos fueran de acceso público.
Pueden ver las categorías aquí.
Las categorías son Producción,
luego Presentación y Promoción,
Difusión y Reutilización,
Audiencias en vivo,
Consumo en línea, Legado,
Investigación y Educación.
Después de elaborar este gran cuadro,
que ahora solo se ve la primera parte,
pudimos comparar,
observamos qué tipo de datos
fueron utilizados en todos los ámbitos
por todos los diferentes
grupos interesadas.
Y hay una base bastante grande de datos
que es común a todos ellos,
y es ahí donde tiene
mucho sentido incorporar
y mantener... los datos juntos.
Cuando hablamos
de arquitectura de plataforma,
pueden ver que tenemos cuatro capas aquí.
En la parte inferior
se muestra la capa de datos.
Por supuesto, Wikidata
juega un papel en ello,
pero también muchas otras
bases de datos distribuidas
que pueden exponer datos
a través de terminales SPARQL.
La parte amarilla del medio
es la capa semántica.
Nuestro lenguaje común
es describir nuestras cosas,
hacer declaraciones sobre lo relacionado
con las artes escénicas, la ontología.
Después tenemos una capa de aplicación
que consiste en varios módulos,
por ejemplo, análisis de datos,
extracción de datos...
es decir, cómo convertir los datos
no estructurados en datos estructurados,
cómo respaldarlos con herramientas.
Obviamente,
hay una visualización de datos:
si hay grandes cantidades de datos,
querrán que se visualicen.
Y en la parte superior,
tienen la capa de presentación,
que representa lo que la gente común
interactúa diariamente,
motores de búsqueda,
enciclopedias, agendas culturales,
y una variedad de otros servicios.
No estamos empezando desde cero,
ya se han hecho trabajos en esta área.
Citaré algunos ejemplos de un proyecto
en el que he estado involucrado
y de otros actualmente también.
Comencé en esta área
con el Archivo suizo
de las artes escénicas.
Hasta construir una base de datos
suiza de artes escénicas,
creamos la ontología
de las artes escénicas,
que actualmente
se está implementando en RDF.
Y ahí tenemos la base de datos
de 60, 70 años de historia
de la actuación en Suiza.
Es algo sobre lo que se puede construir,
y es algo que se ha transformado en RDF.
Y había una plataforma de construcción
para acceder a estos datos.
Luego hicimos
varias incorporaciones a Wikidata,
en parte de Suiza,
en parte también
de los institutos de artes escénicas,
por ejemplo,
Bart Magnus estuvo involucrado.
Fue el impulsor de todo.
También hay cosas de Wikimedia Commons,
pero no muy bien enlazados
con el resto de metadatos.
Y obviamente, al hacer esta incorporación,
comenzamos a implementar
partes de este modelo reformulado
en Wikidata.
Uno de los socios
de implementación canadiense
es Culture Creates.
Están haciendo una plataforma que recopila
datos de los sitios web de los teatros,
y lo ingresa
en un gráfico de conocimiento,
para exponerlo a motores
y dispositivos de búsqueda.
Y de nuevo, implementamos
y extendimos esto en ontología.
Y como pueden ver en la diapositiva,
es que hay varios espacios vacíos,
pero también hay cierta superposición
y una superposición importante,
obviamente, es el lenguaje compartido
que nos ayudará a interrelacionar
los distintos conjuntos de datos.
Lo que también es importante, obviamente,
es que estamos usando los mismos
registros base y archivos de autoridad,
y es aquí que Wikidata
juega un papel importante
al interrelacionarlos.
Ahora, me gustaría
compartir las recomendaciones
del Comité Asesor
de las Linked Data Future Initiatives.
Al menos las dos primeras recomendaciones.
Para los canadienses,
es absolutamente crucial
cumplimentar el gráfico de conocimiento
de artes escénicas de Canadá,
porque a diferencia del Archivo suizo
de las artes escénicas,
ellos no cuentan
con una base de datos ya existente,
sino que lo están creando desde cero.
Y es absolutamente
crucial tener datos allí.
Y segundo, como pueden ver,
ya está en Wikidata.
Wikidata, por el Comité Asesor,
es un complemento de Artsdata.ca,
este gráfico de conocimiento,
y, por lo tanto,
se deben realizar esfuerzos
para contribuir a su población
con datos relacionados
con las artes escénicas.
Y trabajaremos
en ello los próximos meses y años,
y por eso busco a alguien
que quiera unirse a este esfuerzo.
En este momento
decimos que son complementarios,
así que hay que analizar las ventajas
y desventajas de cada uno
de los enfoques.
Y pueden ver aquí una comparación
entre Wikidata y el Enfoque clásico
de datos abiertos enlazados.
Me encantaría discutirlo más con ustedes,
y conocer sus experiencias al respecto.
Como lo veo, Wikidata es una ventaja
porque es una plataforma de crowdsourcing,
y es fácil invitar a otras partes
para que contribuyan.
La desventaja
es una pérdida de control.
Los propietarios de los datos deben ceder
el control de sus gráficos,
la calidad de los datos,
y sobre la totalidad.
Es más difícil
hacer un seguimiento de Wikidata
si no lo tienes bajo tu control.
El otro punto fuerte de Wikidata
es que requiere una integración inmediata
dentro de ese gráfico mundial.
Y de alguna manera lo haces...
compatibilizas paso a paso
con otras bases de datos,
que algunos pueden considerar una ventaja,
pero si buscas integración
e interoperabilidad,
Wikidata te obliga
a hacerlo desde el principio.
Y, obviamente, unificar las prácticas
de modelado de datos
es un problema en ambos casos.
Pero puede parecer más fácil
hacerlo al inicio en su propio núcleo,
porque en algún momento,
la tarea se termina
y en Wikidata sería una tarea continua.
Así que, cuando se trata de priorizar
los datos incorporados,
sería como las reglas
que voy a plantear ahora.
En primer lugar, lo incorporaríamos
donde no esté claro quién será
la autoridad natural en el área.
Son datos que se gestionarán
de manera compartida.
Lo incorporaríamos
donde haya un alto potencial
para los enfoques de crowdsourcing.
Incorporaríamos datos
donde se puedan reutilizar
en el contexto de Wikipedia.
Y también hay esperanza
de que parte
de la coordinación internacional
en torno al modelado de datos,
sobre la estandarización,
tenga lugar directamente en Wikidata,
si no se está haciendo en otro lugar,
porque obliga a las personas a interactuar
si están ingresando la misma parte.
Y nos centramos en los registros base
y los archivos de autoridad,
porque nos ayudan a crear los enlaces
entre diferentes datos
y vocabularios no controlados,
como una extensión
de la ontología existente.
Solo dos diapositivas más.
Los próximos pasos serán tomar
la totalidad de los enfoques GLAM
hacia Wiki Loves Performing Arts.
Eso significa que describiremos
lugares y organizaciones,
y enviar los datos a Wikipedia
en forma de cuadros de información
y plantillas de burbuja.
Y el otro proyecto
que llevaré a cabo es COST Action,
que publicaremos el año que viene
en torno al Ecosistema
de datos abiertos enlazados
para las artes escénicas.
COST es un programa europeo
que apoya actividades de redes,
y los temas a tratar se enumeran aquí.
He resaltado dos:
uno de ellos es la cuestión
de la federación entre Wikidata
y los enfoques clásicos
de datos abiertos enlazados.
Y creo que el otro también
es muy importante,
donde tenemos un gran potencial,
implementando campañas internacionales
para complementar
los datos sobre Wikidata.
Eso es todo.
Gracias por su atención.
Ahora quiero invitar
a mis colegas al escenario.
Al panel, darles micrófonos...
Y luego me gustaría...
darles la oportunidad de hacer preguntas.
Y, obviamente, también a mis colegas
si tienen preguntas para hacerse.
¿Tenemos alguna pregunta de la audiencia?
(risas de la audiencia y del panel)
(una persona habla sin micrófono)
(risas)
(persona 1) Me gustaría saber
qué opina cada uno de ustedes
sobre cómo delimitarían,
básicamente, ¿cómo precisarían...
cuándo administrar su propia Wikibase,
y que desearían poner en Wikidata?
¿Hay una clara delimitación
de lo que se publica
de lo que se presenta?
Puedo responder primero
porque tengo el micrófono.
Pienso que uno de los problemas
es la notoriedad.
Eso lo abordo en un proyecto diferente.
Y creo que la licencia podría ser una,
porque puedes aplicar tus propios términos
en tu propia base de datos,
y luego donde sea posible.
El tercero es solo tenerlo
como un entorno limitado,
prepararlo
para la incorporación a Wikidata.
Estas son las tres cosas principales
que se me ocurren,
pero puedo pensar en más.
Para mí, los derechos
siempre serán un problema.
Si la Biblioteca Nacional
quisiera desplazarse a Wikibase,
les permitiría seguir
controlando las licencias
del trabajo que han hecho
con la lengua maorí.
La base de datos de kakapo
solo contiene datos
que el Departamento de Conservación
consideró que podían hacerse públicos,
pero sospecho
que si lo ven en funcionamiento,
podrían verse tentados a usar
una Wikibase privada
para mantener su propia base de datos,
simplemente porque algunas
de las herramientas de visualización
que podrían aplicarse
podrían ser mejor que el sistema
de hojas de cálculo de Excel
que usan actualmente.
Creo que esto depende mucho
del tipo de datos.
Con el Archivo de Prensa tenemos suerte,
porque se trata de material publicado,
fue publicado en su momento,
pero fue costoso hacer eso.
Esto es bastante fácil.
Creo, también, los proyectos...
y este es un proyecto típico
que fue financiado
por algún tiempo nada más,
y qué pasa con los datos
que están encerrados en algún núcleo,
y tienen un software
que no se ejecutará para siempre.
Y para mí tiene absoluto sentido.
En ese momento
no existía Wikidata, pero ahora sí.
Y tiene sentido para nuestro proyecto
discutir la sostenibilidad en el contexto
de cómo podríamos poner esto
en un ecosistema más grande como Wikidata.
Además, discutir esto
con la comunidad de datos,
y agregar esto a Wikidata,
y tiene sentido mantenerlo
como una forma patentada,
quizá más simple
que una aplicación sofisticada,
pero que sea reconocible
y que esté enlazada a la nube de datos,
en lugar de invertir mucho dinero
en un núcleo que no será sostenido.
Como dije antes en el proyecto
que presentaba aquí,
es un dualismo entre Wikidata
y los enfoques clásicos
de datos abiertos enlazados.
No se trata tanto de configurar
una Wikibase privada,
Como un desafío que hemos tenido,
y, por supuesto, en Wikidata,
cuando incorporas datos allí,
también tienes que hacer
un mantenimiento de personas,
de otras personas, en realidad.
Esto puede significar
que se postergue a algunos,
o que serán abordados gradualmente.
Habrá, por el momento,
una base de datos alojados...
en datos abiertos enlazados clásicos
y comenzamos a enlazarlos con Wikidata.
Es un proceso continuo analizando
qué áreas tendrán
la mayor cantidad de datos en Wikidata,
y qué áreas
perdurarán en otras bases de datos.
Obviamente, tendremos desafíos
con respecto a la sincronización,
como probablemente todos tenemos,
porque de ese campo de datos enlazados,
todavía tenemos que acordar
en quién confiamos,
quién tiene autoridad sobre qué.
(Persona 1) ¿Otras preguntas?
(Persona 2) Gracias.
Estoy totalmente de acuerdo
con el tema de...
dejar en claro por qué
incorporamos datos en Wikidata,
o por qué los mantenemos,
creamos, gestionamos y actualizamos
en bases de datos locales
y para qué fines.
Y creo que esta es una gran discusión
qué va más allá del entusiasmo
de poner datos en Wikidata
porque es público,
porque sirve a la humanidad, porque...
tiene dos herramientas geniales,
las cosas son más complicadas
en la vida real, creo.
A pesar de esto,
es una discusión bastante interesante.
Y hay otro problema, también,
u otro problema que se está discutiendo
en este caso, en diferentes paneles
es, por un lado,
tener una base de datos propia,
cualquiera sea la tecnología
y publicar cosas en Wikidata,
o construir un sistema propio
para crear y gestionar información
con la tecnología Wikibase
y, luego, sincronizar,
federar y esas cosas.
Así que se trata
de la tecnología que se implementa
y el hecho de usar Wikidata
solo para publicar,
o de la infraestructura
soporte de Wikidata
para crear y administrar datos.
Quiero agregar que discutimos
sobre el panel de Wikibase,
y habrá otras discusiones aquí,
pero las cosas están
en diferentes niveles, creo.
Tal vez para responder brevemente
esa discusión sobre Wikibase o Wikidata.
Creo que es problemático centrarnos tanto
en esta infraestructura de Wikibase,
porque hay otras,
como en el área de las artes escénicas.
Tenemos otra comunidad complementaria,
que es MusicBrainz
que se ejecuta en su propia plataforma,
que proporciona datos abiertos enlazados,
y, según entiendo,
hay un acuerdo dentro
de la comunidad de Wikidata
de que no vamos a duplicar
todos sus datos,
no vamos a copiar todos sus datos,
pero aceptamos que son complementarios.
¿Qué sucederá cuando se integren
estos datos en Wikipedia?
Paneles informativos, por ejemplo.
¿Podríamos extraer esos datos
directamente de la terminal SPARQL?
¿O estaríamos obligados
a copiar todos los datos,
y qué procesos están involucrados?
(Persona 2) Las discusiones
están abiertas, creo,
porque en este evento,
tenemos a ambas comunidades interesadas:
aquellos interesados en Wikibase,
y aquellos interesados en Wikidata,
y aquellos que están interesados en ambos.
Sí, pero no vamos a obligarlos
a mudarse a Wikibase.
(Persona 2) No necesariamente.
MusicBrainz no se ejecuta en Wikibase.
(Persona 2) No, solo quería decir
que tienes problemas diferentes,
a veces interrelacionados,
a veces no completamente diferentes.
Se presentó otra pregunta o comentario
con respecto a la gestión de jerarquías
en vocabularios controlados,
como la fuente, como tú en Finto.
Figuran los lugares
en los Encabezados
temáticos maoríes,
allí, tienen que abordar la gestión
de conceptos en jerarquía.
¿Cuál es tu opinión
sobre la posibilidad de gestionar
estos sistemas controlados
de organización
del conocimiento en Wikidata?
Creo que en el caso de Finto y YSO Places,
el repositorio será una colección
de varias fuentes, eventualmente.
De todos modos, está en marcha.
No debemos, necesariamente,
en realidad, no represento
a la Biblioteca Nacional,
pero en ese posible proyecto,
no tendríamos que mantener una existente,
o lidiar con una estructura existente.
En ese sentido,
es un área abierta a la exploración.
Los Encabezamientos temáticos maoríes
se prestan muy bien
a la estructura de Wikidata,
pero la licencia,
por supuesto, lo prohíbe.
Creo que si las licencias
fueran diferentes
y los temas se pusieran en Wikidata,
en cuanto alguien decida
que no le gusta la jerarquía
y empiece a cambiar cosas,
habrá reclamos de las personas
que trabajaron mucho
para crear esa estructura
y que consiguieron la aprobación
de varios maoríes diferentes
de la jerarquía actual.
Ese es un problema que resolver.
Pienso que los sistemas
de organización del conocimiento
son todos diferentes.
Y no estoy seguro si sería una buena idea
representar diferentes jerarquías
en Wikidata como tal,
pero quizás tenga sentido pensar
en superposiciones de los datos
para hacer un mapeo
del nivel de contenido.
Por ejemplo, como ZBW
Partnership Thesaurus for Economics.
Y este tesauro
establece su propia jerarquía,
y, por supuesto,
sería posible proyectar la jerarquía
de este tesauro
en los conceptos de Wikidata
sin almacenar este tipo de estructura,
como una estructura
alternativa dentro de Wikidata,
lo cuál causaría mucha confusión.
Creo que deberíamos pensar en Wikidata
como un conjunto de conceptos
que se pueden conectar en capas externas
y que den otra visión del mundo,
que no necesariamente
deban estar en Wikidata.
(Persona 1) ¿Tienen más preguntas?
De otro modo... bien.
(Persona 3) Joachim, quisiera seguir
con ese último punto.
Entonces, esas capas,
de la manera en la que la representa,
¿se mantendrían externamente
y de algún modo se integrarán
con Wikidata
como un aspecto de Wikidata?
¿O han pensado otra manera
sobre cómo se podría administrar?
No, en realidad no...
He hecho experimentos con ZBW y Wikidata,
sobre [inaudible] Wikidata,
pero creo que es nuevo y complejo,
y depende de discutir
a renunciar a mucho control
para hacer tales cosas,
pero hay que analizarlo.
¿Respondemos otra?
(Persona 3) Genial.
Me preguntaba sobre el proyecto kakapo.
Ajá.
(Persona 3) ¿Recibieron algún rechazo
de la comunidad de Wikidata
sobre tener animales individuales
de esos elementos?
De momento no.
(Persona 3) ¿Alguien ha oído
hablar de esto antes?
Dijo "De momento no", ¿ y es porque nadie
ha oído hablar de eso todavía?
Desde hace bastante tiempo
ha habido una discusión...
por parte de las personas interesadas
en esto en Wikidata,
y todos pensamos
que es una consecuencia natural
de gestionar artículos de Wikidata
sobre un famoso caballo de carreras
o el gato de alguien,
que está modelado bastante bien.
Supongo que lo audaz
es poner a toda la especie allí.
Pero creo que es perfectamente manejable.
No lo intenten con gatos y perros.
(risas)
(Persona 2) Bien, se acabó el tiempo.
Muchas gracias por asistir.
Los altavoces permanecerán abiertos
para las preguntas y el descanso.
Diviértanse.
Muchas gracias.
(aplausos)