0:00:05.945,0:00:09.476
Hola a todos los del panel[br]de Calidad de Datos.
0:00:10.288,0:00:13.671
La calidad de los datos importa[br]porque cada vez más personas
0:00:13.672,0:00:19.289
confían en que nuestros datos están bien,[br]así que hablaremos de su calidad,
0:00:20.029,0:00:26.000
y habrán cuatro oradores[br]quienes darán breves presentaciones
0:00:26.000,0:00:29.539
sobre temas de la calidad de los datos[br]y luego tendremos preguntas y respuestas.
0:00:30.130,0:00:32.234
Y el primero es Lucas.
0:00:34.385,0:00:35.385
Gracias.
0:00:35.901,0:00:39.899
(Lucas) Hola, soy Lucas y voy a comenzar[br]con una descripción general
0:00:39.899,0:00:43.806
de las herramientas de calidad de datos[br]que ya tenemos en Wikidata
0:00:43.807,0:00:46.109
y también algunas cosas[br]que vendrán pronto.
0:00:46.932,0:00:50.623
Y los he agrupado[br]en algunos temas generales
0:00:50.623,0:00:53.761
sobre hacer los errores más visibles,[br]hacer que los problemas sean procesables,
0:00:53.762,0:00:56.322
ver mejor los datos para que la gente[br]note los problemas,
0:00:56.945,0:01:02.616
arreglar fuentes comunes de errores,[br]mantener calidad de los datos existentes
0:01:02.616,0:01:03.966
y también la curación humana.
0:01:05.063,0:01:09.874
Y los que están disponibles actualmente[br]comienzan con restricciones de propiedad.
0:01:10.228,0:01:12.421
Así que tal vez ya has visto esto[br]si estás en Wikidata.
0:01:12.422,0:01:14.029
A veces puedes obtener estos íconos
0:01:14.530,0:01:17.241
revisando la consistencia interna[br]de los datos.
0:01:17.242,0:01:20.800
Por ejemplo, si un evento sigue al otro,
0:01:20.801,0:01:23.760
entonces el otro evento debería[br]también ser seguido por este,
0:01:23.761,0:01:27.161
que en el artículo de WikidataCon[br]al parecer faltaba.
0:01:27.162,0:01:29.360
No estoy seguro,[br]esta característica es de unos días.
0:01:30.040,0:01:34.681
Y también, si esto es demasiado limitado[br]o simple para usted,
0:01:34.682,0:01:38.080
puedes escribir cualquier chequeo[br]que quieras usando el servicio de consulta
0:01:38.081,0:01:39.842
que es útil para muchas cosas[br]por supuesto,
0:01:39.843,0:01:44.543
pero también puedes usarlo[br]para encontrar errores.
0:01:44.544,0:01:46.974
Si te diste cuenta[br]de la ocurrencia de un error,
0:01:46.975,0:01:49.709
entonces puedes verificar[br]si hay otros lugares
0:01:49.710,0:01:51.738
donde la gente ha hecho[br]un error muy similar
0:01:51.738,0:01:53.438
y encontrarlo con el Servicio[br]de Consultas.
0:01:53.439,0:01:54.720
También puedes combinar los dos
0:01:54.720,0:01:57.874
y buscar violaciones de restricciones[br]en el Servicio de Consulta,
0:01:57.875,0:02:01.240
por ejemplo,[br]las violaciones en alguna área
0:02:01.241,0:02:03.762
o WikiProject que sea[br]relevante para usted,
0:02:03.762,0:02:06.828
aunque los resultados no están[br]completos actualmente, lamentablemente.
0:02:08.422,0:02:09.877
Hay puntuación de revisión.
0:02:10.540,0:02:12.666
Eso es... creo que esto[br]es de los cambios recientes
0:02:12.667,0:02:16.217
también puedes incluir en tu lista[br]una evaluación automática
0:02:16.217,0:02:20.249
de si es probable que esta edición sea[br]de buena fe o de mala fe
0:02:20.250,0:02:22.312
y si es probable que sea[br]dañino o no dañino,
0:02:22.313,0:02:24.205
creo que esas son las dos dimensiones.
0:02:24.206,0:02:25.686
Entonces puedes, si quieres,
0:02:25.687,0:02:29.898
centrarte en solo mirar las ediciones[br]perjudiciales pero de buena fe.
0:02:29.899,0:02:32.523
Si te sientes particularmente[br]amable y acogedor
0:02:32.524,0:02:37.121
puedes decirle a estos editores,[br]"Gracias por tu contribución,
0:02:37.122,0:02:40.560
así es como deberías haberlo hecho,[br]pero igualmente gracias".
0:02:40.561,0:02:42.186
Y si no te sientes así,
0:02:42.187,0:02:44.452
puedes irte por la mala fe,[br]las ediciones perjudiciales,
0:02:44.453,0:02:45.573
y revertir los vándalos.
0:02:47.544,0:02:49.761
También hay, similar a eso,[br]puntuación de la entidad.
0:02:49.762,0:02:52.590
Entonces, en lugar de anotar una edición,[br]el cambio que hizo,
0:02:52.591,0:02:53.904
puedes puntuar toda la revisión,
0:02:53.904,0:02:56.483
y creo que es la misma medida de calidad
0:02:56.483,0:02:59.863
que Lydia menciona[br]al comienzo de la conferencia.
0:03:00.372,0:03:04.569
Eso da un guión de usuario aquí arriba[br]y te da una puntuación de uno a cinco,
0:03:04.570,0:03:08.176
Creo que trata, de qué calidad[br]es el artículo actual.
0:03:10.043,0:03:14.888
La herramienta de fuentes primarias es[br]para cualquier base de datos
0:03:14.888,0:03:18.064
que quieras importar pero no es de calidad[br]suficiente para agregar a Wikidata,
0:03:18.064,0:03:20.775
entonces a su vez lo agregas[br]a la herramienta de fuentes primarias,
0:03:20.775,0:03:22.956
y luego las personas pueden decidir
0:03:22.956,0:03:26.024
si deben agregar estas declaraciones[br]individuales o no.
0:03:28.595,0:03:31.451
Mostrar coordenadas como mapas[br]principalmente es una característica
0:03:31.451,0:03:34.038
de conveniencia, pero también es[br]útil para el control de calidad.
0:03:34.038,0:03:36.937
Supón que esta es[br]la oficina de Wikimedia en Alemania
0:03:36.938,0:03:39.400
y si las coordenadas están[br]en algún lugar del Océano Índico,
0:03:39.401,0:03:41.529
entonces sabes que algo no está bien
0:03:41.530,0:03:44.790
y puedes verlo mucho más fácil[br]que si solo tuvieras los números.
0:03:46.382,0:03:49.576
Este es un dispositivo llamado[br]el indicador de integridad relativa
0:03:49.577,0:03:52.480
que te muestra este pequeño icono aquí
0:03:53.007,0:03:55.482
diciéndote cuán completo[br]cree que es este artículo
0:03:55.482,0:03:57.613
y también qué propiedades[br]es muy probable que falten,
0:03:57.614,0:03:59.889
lo cual es realmente útil[br]si estás editando un elemento
0:03:59.889,0:04:03.172
y estás en un área[br]con la que no estás muy familiarizado
0:04:03.172,0:04:05.661
y no sabes qué propiedades correctas usar,
0:04:05.662,0:04:08.230
entonces se tiene un dispositivo muy útil.
0:04:09.604,0:04:11.401
Y tenemos Shape Expressions.
0:04:11.402,0:04:15.624
Creo que Andra o José[br]van a hablar más sobre esto
0:04:15.624,0:04:19.547
pero básicamente, es una forma[br]muy poderosa de comparar los datos
0:04:19.547,0:04:20.758
que tienes versus el esquema,
0:04:20.759,0:04:22.910
como qué declaración deberían[br]ciertas entidades tener,
0:04:22.910,0:04:25.677
a qué otras entidades deberían vincularse[br]y cómo deberían ser,
0:04:26.229,0:04:29.374
y así puedes encontrar[br]problemas de esa manera.
0:04:30.366,0:04:32.361
Creo que... No, todavía hay más.
0:04:32.362,0:04:34.321
Panel de integralidad o propiedad.
0:04:34.322,0:04:36.773
Te da una visión general rápida[br]de los datos que ya tienes.
0:04:36.774,0:04:39.147
Por ejemplo, esto es de[br]los pandas rojos de WikiProject,
0:04:39.657,0:04:41.681
y puedes ver que tenemos el sexo
0:04:41.682,0:04:43.561
para casi todos los pandas rojos,
0:04:43.561,0:04:46.854
la fecha de nacimiento varía mucho[br]debido al zoológico del que provienen
0:04:46.854,0:04:50.255
y no tenemos casi ningún panda muerto,[br]lo cual es maravilloso,
0:04:51.437,0:04:52.600
porque son muy lindos.
0:04:53.699,0:04:55.654
Entonces esto también es útil.
0:04:56.377,0:04:59.185
Aquí vamos, bien,[br]con lo que vamos a seguir.
0:04:59.889,0:05:03.784
Puente de Wikidata, o también conocido,[br]antes conocido como edición del cliente,
0:05:03.785,0:05:07.076
así que editar Wikidata desde las cajas[br]de información de Wikipedia
0:05:07.675,0:05:11.635
lo que por un lado se obtendrá[br]más enfoque en los datos
0:05:11.635,0:05:13.441
porque más personas pueden[br]ver los datos allí
0:05:13.441,0:05:18.721
y con suerte alentará más el uso[br]de Wikidata en las Wikipedias
0:05:18.721,0:05:20.620
y eso significa que más personas[br]pueden notar
0:05:20.620,0:05:23.689
si, por ejemplo, algunos datos están[br]desactualizados y necesitan actualizarse
0:05:23.857,0:05:27.000
en lugar de solo verlos en Wikidata.
0:05:28.630,0:05:30.656
También hay referencias corrompidas.
0:05:30.657,0:05:33.959
La idea aquí es que si editas[br]un valor de declaración,
0:05:34.683,0:05:37.169
es posible que también desees[br]actualizar las referencias,
0:05:37.169,0:05:39.373
a menos que solo fuera[br]un error tipográfico o algo así.
0:05:39.897,0:05:43.662
Y estas referencias corrompidas[br]le dicen eso a los editores
0:05:43.663,0:05:49.756
y también que otros editores[br]ven qué otras modificaciones se hicieron
0:05:49.756,0:05:52.471
que editaron un valor de declaración[br]y no actualizaron una referencia
0:05:52.472,0:05:56.766
entonces puedes limpiar después de eso[br]y decidir si eso es...
0:05:57.737,0:05:59.566
¿Necesitas hacer algo más que eso
0:05:59.566,0:06:02.796
o está realmente bien y no necesitas[br]actualizar la referencia.
0:06:03.543,0:06:09.336
Se relaciona con declaraciones firmadas[br]que vienen de una preocupación, creo,
0:06:09.336,0:06:12.355
que algunos proveedores[br]de datos tienen como...
0:06:14.131,0:06:17.231
Hay una declaración a la que se hace[br]referencia a través de la UNESCO o algo
0:06:17.232,0:06:19.872
y de repente, alguien destroza[br]la declaración
0:06:19.873,0:06:21.836
y se preocupan de que se verá como
0:06:22.827,0:06:26.992
esta organización, como la UNESCO,[br]que aún establece este valor de vandalismo
0:06:26.993,0:06:28.706
y así, con las declaraciones firmadas,
0:06:28.706,0:06:31.488
pueden criptográficamente[br]firmar esta referencia
0:06:31.488,0:06:33.562
y eso no evita ninguna edición,
0:06:34.169,0:06:37.644
pero al menos, si alguien[br]destroza la declaración
0:06:37.644,0:06:40.255
o la edita de cualquier manera,[br]entonces la firma ya no es válida,
0:06:40.255,0:06:43.401
y puedes decir que eso no es exactamente[br]lo que dijo la organización,
0:06:43.402,0:06:47.064
y quizás sea una buena edición y deban[br]volver a firmar la nueva declaración,
0:06:47.065,0:06:49.851
pero también quizás deba revertirse.
0:06:51.203,0:06:54.166
Y también, esto va a ser[br]muy emocionante, creo,
0:06:54.166,0:06:56.846
Citoid es este asombroso sistema[br]que tienen en Wikipedia
0:06:57.379,0:07:01.340
donde puedes pegar una URL,[br]o un identificador, o un ISBN
0:07:01.340,0:07:04.759
o un ID de Wikidata o básicamente[br]cualquier cosa en el editor visual,
0:07:05.260,0:07:08.241
y lanza una referencia[br]que está bien formateada
0:07:08.242,0:07:11.049
y tiene todos los datos que quieres[br]y es maravilloso de usar.
0:07:11.049,0:07:14.337
Y en comparación, en Wikidata,[br]si quiero agregar una referencia
0:07:14.338,0:07:18.711
debo agregar una URL de referencia,[br]título, cadena del nombre del autor,
0:07:18.711,0:07:20.449
lugar de publicación,[br]fecha de publicación,
0:07:20.450,0:07:25.141
fechas de recuperación,[br]al menos esos, y eso es molesto,
0:07:25.141,0:07:29.261
e integrando Citoid en Wikibase[br]se espera a que ayude con eso.
0:07:30.245,0:07:33.604
Y creo que eso es todo lo que tengo, sí.
0:07:33.604,0:07:36.400
Así que, ahora voy a pasarles a Cristina.
0:07:37.788,0:07:42.339
(aplausos)
0:07:43.780,0:07:45.331
(Cristina) Hola, soy Cristina.
0:07:45.331,0:07:47.812
Soy una investigadora científica[br]de la Universidad de Zürich,
0:07:47.812,0:07:51.417
y también soy una miembro activa[br]de la Comunidad Suiza.
0:07:52.698,0:07:57.901
Cuando Claudia Müller-Birn[br]y yo le enviamos esto a WikidataCon,
0:07:57.902,0:08:00.410
lo que queríamos hacer[br]es continuar nuestra discusión
0:08:00.411,0:08:02.424
que empezamos a principios de año
0:08:02.424,0:08:07.442
con un taller sobre calidad de datos[br]y también algunas sesiones en Wikimania.
0:08:07.442,0:08:10.535
Entonces el objetivo de esta charla[br]es básicamente traer algunos pensamientos
0:08:10.536,0:08:14.432
que hemos estado recolectando[br]de la comunidad y de nosotros mismos
0:08:14.432,0:08:16.560
y continuar la discusión.
0:08:16.561,0:08:20.065
Entonces, lo que nos gustaría es continuar[br]interactuando bastante con ustedes.
0:08:21.557,0:08:23.371
Entonces, lo que pensamos[br]es muy importante
0:08:23.372,0:08:27.580
es que le preguntamos continuamente[br]a todo tipo de usuarios en la comunidad
0:08:27.581,0:08:32.020
sobre lo que realmente necesitan,[br]qué problemas tienen con la calidad
0:08:32.020,0:08:35.000
de los datos; no solo a editores,[br]sino además a las personas que codifican,
0:08:35.000,0:08:36.241
o consumen los datos,
0:08:36.242,0:08:39.494
y también a investigadores que usan[br]todo el historial de edición
0:08:39.494,0:08:40.970
para analizar lo que está pasando.
0:08:42.367,0:08:48.431
Así que revisamos alrededor de 80[br]herramientas que existen en Wikidata
0:08:48.431,0:08:52.380
y las alineamos a las diferentes[br]dimensiones de calidad de datos.
0:08:52.380,0:08:54.360
Y lo que vimos fue que en realidad,
0:08:54.361,0:08:57.681
muchas de ellas se enfocan en,[br]monitoreo de integridad,
0:08:57.682,0:09:02.820
pero en realidad... algunas de ellas[br]también habilitan la interconexión.
0:09:02.820,0:09:08.442
Pero hay una gran necesidad[br]de herramientas que busquen la diversidad,
0:09:08.443,0:09:12.824
lo cual es una de las cosas[br]que realmente podemos tener en Wikidata,
0:09:12.824,0:09:15.958
especialmente este principio[br]de diseño de Wikidata
0:09:15.959,0:09:17.901
donde podemos tener pluralidad
0:09:17.902,0:09:20.308
y diferentes declaraciones[br]con diferentes valores
0:09:20.834,0:09:22.236
procedentes de diferentes fuentes.
0:09:22.236,0:09:25.081
Debido a que es una fuente secundaria,[br]realmente no tenemos herramientas
0:09:25.081,0:09:27.750
que nos digan cuántas[br]declaraciones plurales hay,
0:09:27.751,0:09:30.889
y cuántas podemos mejorar y cómo,
0:09:30.890,0:09:32.833
y tampoco sabemos realmente
0:09:32.833,0:09:35.538
cuáles son todas las razones[br]de pluralidad que podemos tener.
0:09:36.491,0:09:39.201
Entonces, de estas reuniones comunitarias,
0:09:39.201,0:09:43.084
lo que discutimos fueron los desafíos[br]que aún necesitan atención.
0:09:43.084,0:09:47.149
Por ejemplo, que tener[br]todas estas comunidades de crowdsourcing
0:09:47.149,0:09:49.613
es muy bueno porque diversas personas[br]atacan diferentes partes
0:09:49.613,0:09:51.833
de los datos o el gráfico,
0:09:51.834,0:09:54.615
y también tenemos[br]conocimiento de fondo diferente
0:09:54.616,0:09:59.161
pero en realidad, es muy difícil alinear[br]todo en algo homogéneo
0:09:59.162,0:10:04.920
porque diversas personas están usando[br]diferentes propiedades de distintas formas
0:10:04.920,0:10:08.401
y también esperan cosas diferentes[br]de las descripciones de entidades.
0:10:09.003,0:10:12.721
La gente también dijo que también[br]necesitan más herramientas
0:10:12.722,0:10:16.000
que den una mejor visión general[br]del estado global de las cosas.
0:10:16.000,0:10:20.733
Entonces, qué entidades faltan[br]en términos de integridad,
0:10:20.733,0:10:26.121
pero además en qué las personas[br]trabajan la mayor parte del tiempo,
0:10:26.121,0:10:30.516
y también mencionan muchas veces[br]una colaboración más estrecha
0:10:30.517,0:10:33.311
a través de, no solo idiomas,[br]sino los WikiProjects
0:10:33.311,0:10:35.571
y las diferentes plataformas de Wikimedia.
0:10:35.571,0:10:38.859
Y publicamos todos[br]los comentarios transcritos
0:10:38.860,0:10:42.959
de todas estas discusiones[br]en esos enlaces aquí en los Etherpads
0:10:42.959,0:10:46.162
y también en la página wiki de Wikimania.
0:10:46.162,0:10:48.481
Algunas soluciones que aparecieron
0:10:48.481,0:10:53.001
iban encaminados en compartir[br]más las mejores prácticas
0:10:53.001,0:10:55.762
que se están desarrollando[br]en diferentes WikiProjects,
0:10:55.762,0:11:01.238
pero también la gente quiere herramientas[br]que ayuden a ordenar el trabajo en equipos
0:11:01.239,0:11:03.845
o al menos entender[br]quién está trabajando en eso,
0:11:03.845,0:11:07.815
y también mencionaron[br]que quieren más vitrinas
0:11:07.816,0:11:12.019
y más plantillas que los ayuden[br]a crear cosas de una mejor manera.
0:11:12.946,0:11:15.161
Y del contacto que tenemos
0:11:15.162,0:11:18.721
con organizaciones de datos[br]gubernamentales abiertos,
0:11:18.722,0:11:20.068
y en particular,
0:11:20.068,0:11:23.102
estoy en contacto con el cantón[br]y la ciudad de Zürich,
0:11:23.102,0:11:26.207
están muy interesados[br]en trabajar con Wikidata
0:11:26.207,0:11:29.896
porque quieren que sus datos[br]sean accesibles para todos
0:11:29.897,0:11:33.681
en el lugar donde va la gente[br]y consulta o accede a los datos.
0:11:33.682,0:11:36.550
Entonces para ellos, algo[br]que sería realmente interesante
0:11:36.551,0:11:38.600
es tener algún tipo[br]de indicadores de calidad
0:11:38.600,0:11:41.082
ambos en wiki, algo que ya sucede,
0:11:41.082,0:11:42.801
y también en los resultados SPARQL,
0:11:42.802,0:11:46.066
para saber si pueden confiar[br]o no en esos datos de la comunidad.
0:11:46.067,0:11:48.230
Y luego, también quieren saber
0:11:48.230,0:11:51.417
qué partes de sus propios conjuntos[br]de datos son útiles para Wikidata
0:11:51.418,0:11:56.040
y les encantaría tener una herramienta[br]que los ayude a evaluarlo automáticamente.
0:11:56.041,0:11:59.066
También necesitan algún tipo[br]de metodología o herramienta
0:11:59.067,0:12:03.894
que les ayude a decidir si deberían[br]importar o vincular sus datos
0:12:03.894,0:12:04.894
porque en algunos casos,
0:12:04.895,0:12:07.567
también tienen sus propios[br]conjuntos de datos abiertos vinculados,
0:12:07.567,0:12:09.746
así que no saben si[br]simplemente ingerir los datos
0:12:09.747,0:12:13.424
o seguir creando enlaces[br]de los conjuntos de datos a Wikidata
0:12:13.425,0:12:14.425
y a la inversa.
0:12:14.950,0:12:20.043
Y también quieren saber a dónde[br]se refieren sus sitios web en Wikidata.
0:12:20.044,0:12:23.361
Y cuando ejecutan tal consulta[br]en el servicio de consulta,
0:12:23.362,0:12:24.848
a menudo obtienen tiempos de espera,
0:12:24.849,0:12:28.181
entonces tal vez deberíamos[br]realmente crear más herramientas
0:12:28.181,0:12:32.240
que les ayude a responder sus preguntas.
0:12:33.148,0:12:36.208
Y además de eso,
0:12:36.208,0:12:39.361
a nosotros, los investigadores de wiki,[br]también a veces
0:12:39.362,0:12:42.023
nos falta algo de información[br]en la edición de resúmenes.
0:12:42.024,0:12:44.953
Entonces me acuerdo de eso cuando[br]estábamos haciendo algo de trabajo
0:12:44.954,0:12:48.919
para comprender el comportamiento[br]diferente de los editores
0:12:48.919,0:12:53.403
con herramientas o robots[br]o usuarios anónimos, etc.
0:12:53.403,0:12:56.154
realmente nos faltaba, por ejemplo,
0:12:56.154,0:13:01.112
una forma estándar para rastrear[br]que las herramientas se usaban.
0:13:01.113,0:13:03.154
Y hay algunas herramientas[br]que ya están haciendo eso
0:13:03.155,0:13:05.230
como PetScan y muchas otras,
0:13:05.230,0:13:07.720
pero tal vez deberíamos en la comunidad
0:13:07.721,0:13:13.531
discutir más sobre cómo grabarlas[br]para una procedencia detallada.
0:13:14.169,0:13:15.321
Y más adelante,
0:13:15.322,0:13:20.801
creemos que necesitamos pensar sobre[br]dimensiones de calidad de datos
0:13:20.802,0:13:24.961
más concretas que se relacionen[br]con los datos del enlace
0:13:24.962,0:13:30.721
pero no todos los tipos de datos,[br]así que trabajamos en algunas medidas
0:13:30.722,0:13:33.751
para acceder a la ganancia de información[br]habilitada por los enlaces,
0:13:33.751,0:13:36.681
y lo que queremos decir es que cuando[br]enlazamos Wikidata a otros conjuntos
0:13:36.682,0:13:38.201
de datos, también deberíamos pensar
0:13:38.202,0:13:41.921
cuánto en realidad están ganando[br]las entidades en la clasificación,
0:13:41.922,0:13:45.601
también en la descripción,[br]pero también en los vocabularios que usan.
0:13:45.602,0:13:51.041
Solo para dar un ejemplo muy simple[br]de lo que quiero decir con esto
0:13:51.042,0:13:54.269
es que podemos pensar en...[br]en este caso, que sería Wikidata
0:13:54.270,0:13:57.771
o el conjunto de datos externos[br]que se vincula a Wikidata,
0:13:57.772,0:14:00.487
tenemos la entidad para una persona[br]que se llama Natasha Noy,
0:14:00.487,0:14:02.601
tenemos la afiliación y otras cosas,
0:14:02.602,0:14:05.239
y luego decimos que sí,[br]nos vinculamos a un lugar externo,
0:14:05.240,0:14:08.919
y esa entidad también tiene ese nombre,[br]pero en realidad tenemos el mismo valor.
0:14:08.920,0:14:12.889
Lo que sería mejor es que lo vinculemos[br]a algo que tenga un nombre distinto,
0:14:12.889,0:14:16.881
eso aún es válido, porque esta persona[br]tiene dos formas de escribir el nombre,
0:14:16.882,0:14:19.714
y también otra información[br]que no tenemos en Wikidata
0:14:19.715,0:14:21.760
o que no tenemos[br]en el otro conjunto de datos.
0:14:22.390,0:14:24.652
Pero además, lo que es aún mejor
0:14:24.653,0:14:27.770
es que en realidad estamos mirando[br]en el conjunto de datos de destino
0:14:27.770,0:14:31.392
que también tienen nuevas formas[br]de clasificar la información.
0:14:31.393,0:14:35.354
Entonces no solo es una persona,[br]sino que en el otro conjunto de datos,
0:14:35.355,0:14:39.525
también dicen que es una mujer o cualquier[br]otra cosa con que la clasifiquen.
0:14:39.526,0:14:43.401
Y si en el otro conjunto de datos,[br]están usando muchos otros vocabularios
0:14:43.402,0:14:46.588
que también ayuda en todo el asunto[br]de recuperación de información.
0:14:47.371,0:14:51.233
Entonces con eso,[br]también me gustaría decir
0:14:51.234,0:14:55.809
que creemos que podemos[br]mostrar mejor las consultas federadas
0:14:55.810,0:15:00.448
porque cuando miramos el registro[br]de consultas brindado por Malyshev et al.,
0:15:01.285,0:15:04.301
vemos en realidad[br]que de las consultas orgánicas,
0:15:04.302,0:15:06.921
solo tenemos muy pocas[br]consultas federadas.
0:15:06.922,0:15:12.801
Y en realidad, la federación es una[br]de las ventajas clave de tener datos
0:15:12.802,0:15:16.903
de enlace, entonces quizás la comunidad[br]o las personas que usan Wikidata
0:15:16.903,0:15:18.898
también necesitan más ejemplos de esto.
0:15:18.898,0:15:22.666
Y si miramos la lista de puntos finales[br]que se están usando,
0:15:22.667,0:15:25.401
no es una lista completa[br]y tenemos muchos más.
0:15:25.402,0:15:30.479
Desde luego, estos datos fueron analizados[br]de consultas hasta marzo de 2018,
0:15:30.480,0:15:34.807
pero deberíamos mirar en la lista[br]de puntos finales federados que tenemos
0:15:34.808,0:15:37.048
y ver si realmente[br]los estamos usando o no.
0:15:37.813,0:15:40.441
Dos preguntas que tengo para la audiencia
0:15:40.442,0:15:43.001
que tal vez podamos usar[br]luego para la discusión son:
0:15:43.001,0:15:45.791
qué problemas de calidad de datos[br]debemos abordar en su opinión,
0:15:45.791,0:15:47.412
de acuerdo a las necesidades que tengan,
0:15:47.412,0:15:50.401
pero además, dónde necesitan[br]más automatización
0:15:50.402,0:15:52.943
que los ayude[br]con la edición o la vigilancia.
0:15:53.866,0:15:55.146
Eso es todo, muchas gracias.
0:15:55.779,0:15:57.527
(aplausos)
0:16:06.030,0:16:08.595
(Jose Emilio Labra) Bien,[br]entonces de lo que voy a hablar
0:16:08.595,0:16:14.715
es de algunas herramientas que estábamos[br]desarrollando sobre Shape Expressions.
0:16:15.536,0:16:19.371
Entonces de esto es de lo que quiero[br]hablar... Soy Jose Emilio Labra,
0:16:19.371,0:16:23.215
pero esto... todas estas herramientas[br]han sido hechas por diferentes personas,
0:16:23.920,0:16:28.480
relacionadas principalmente con W3C ShEx,[br]Grupo de Comunidad de Shape Expressions.
0:16:28.481,0:16:29.481
Grupo de Comunidad ShEx.
0:16:30.144,0:16:36.081
La primera herramienta que deseo mencionar[br]es RDFShape, es una herramienta general,
0:16:36.082,0:16:40.681
porque Shape Expressions[br]no es solo para Wikidata,
0:16:40.682,0:16:44.168
las expresiones de forma es un lenguaje[br]para validar RDF en general.
0:16:44.168,0:16:47.568
Entonces, esta herramienta fue[br]desarrollada principalmente por mí
0:16:47.568,0:16:50.880
y es una herramienta[br]para validar RDF en general.
0:16:50.881,0:16:55.139
Entonces, si quieres aprender sobre RDF[br]o quieres validar RDF
0:16:55.140,0:16:58.621
o puntos finales SPARQL[br]no solo en Wikidata,
0:16:58.622,0:17:00.891
mi consejo es que puedes[br]usar esta herramienta.
0:17:00.891,0:17:03.255
También para enseñar.
0:17:03.255,0:17:05.640
Soy profesor en la universidad
0:17:05.641,0:17:09.151
y la uso en mi curso semántico web[br]para enseñar RDF.
0:17:09.161,0:17:12.121
Entonces, si quieres aprender RDF,[br]creo que es una buena herramienta.
0:17:13.033,0:17:17.598
Por ejemplo, esta es una visualización[br]de un gráfico RDF con la herramienta.
0:17:18.587,0:17:22.643
Pero antes de venir aquí,[br]en el último mes,
0:17:22.643,0:17:28.441
empecé una bifurcación de rdfshape[br]específicamente para Wikidata,
0:17:28.443,0:17:33.082
porque pensé... se llama WikiShape y ayer[br]lo presenté como un regalo para Wikidata.
0:17:33.082,0:17:34.441
Entonces lo que tomé es...
0:17:34.442,0:17:39.898
lo que hice fue eliminar todas las cosas[br]que no estaban relacionadas con Wikidata
0:17:39.898,0:17:44.801
y poner varias cosas, codificadas,[br]por ejemplo, el punto final de Wikidata
0:17:44.802,0:17:49.041
SPARQL, pero ahora, alguien me preguntó[br]si pudiera hacerlo también para Wikibase.
0:17:49.042,0:17:52.000
Y también es muy fácil[br]hacerlo para Wikibase.
0:17:52.760,0:17:56.280
Entonces, esta herramienta,[br]WikiShape, es bastante nueva.
0:17:57.015,0:17:59.843
Creo que funciona,[br]la mayoría de las características,
0:17:59.844,0:18:02.468
pero hay algunas características[br]que tal vez no funcionen,
0:18:02.469,0:18:06.281
y si lo intentas y quieres[br]mejorarla, por favor dímelo.
0:18:06.281,0:18:12.680
Estas son capturas [inaudible],[br]pero creo que puedo intentar, veámos.
0:18:15.385,0:18:16.945
Entonces, veamos si funciona.
0:18:16.953,0:18:20.070
Primero, tengo que salir de...
0:18:22.453,0:18:23.453
Aquí.
0:18:24.226,0:18:28.124
De acuerdo, sí. Esta es la herramienta.
0:18:28.124,0:18:29.844
Cosas que puedes hacer con la herramienta,
0:18:29.845,0:18:35.275
por ejemplo, es que puedes[br]comprobar esquemas, esquemas de entidad.
0:18:35.276,0:18:38.611
Sabes que hay un nuevo espacio[br]de nombres que es "E lo que sea",
0:18:38.612,0:18:44.805
así que si comienzas, por ejemplo,[br]escribe por ejemplo "humano"...
0:18:44.806,0:18:48.812
Mientras escribes, su autocompletado[br]te permite verificar,
0:18:48.812,0:18:52.001
por ejemplo, estas son[br]las Shape Expressions de un humano,
0:18:52.790,0:18:55.937
y estas son las Shape Expressions aquí.
0:18:55.938,0:18:59.841
Y como puedes ver,[br]este editor tiene resaltado de sintaxis,
0:18:59.842,0:19:04.559
esto es... bueno,[br]tal vez es muy pequeña, la pantalla.
0:19:05.676,0:19:07.590
Puedo intentar hacerla más grande.
0:19:09.194,0:19:10.973
Quizás lo veas mejor ahora.
0:19:10.973,0:19:14.241
Y este es el editor con resaltado[br]de sintaxis y también tiene...
0:19:14.241,0:19:17.851
Quiero decir, este editor[br]proviene del mismo código fuente
0:19:17.851,0:19:19.641
del servicio de consulta de Wikidata.
0:19:19.642,0:19:23.960
Así que por ejemplo,[br]si pasas el ratón por aquí,
0:19:23.961,0:19:27.961
te muestra las etiquetas[br]de las diferentes propiedades.
0:19:27.962,0:19:31.298
Entonces creo que es muy útil[br]porque ahora los esquemas de entidad
0:19:32.588,0:19:38.601
que están en Wikidata[br]son solo una idea de texto plano,
0:19:38.602,0:19:42.493
y creo que este editor es mucho mejor[br]porque tiene autocompletado
0:19:42.494,0:19:43.743
y también tiene...
0:19:43.744,0:19:48.241
Quiero decir, si tú, por ejemplo,[br]querías agregar una restricción,
0:19:48.241,0:19:51.570
dices "wdt:"
0:19:51.570,0:19:56.884
Empiezas a escribir "autor"[br]y luego haces clic en Ctrl + Espacio
0:19:56.884,0:19:58.922
y te sugiere las diferentes cosas.
0:19:58.922,0:20:02.388
Entonces esto es similar[br]al servicio de consulta de Wikidata
0:20:02.389,0:20:06.445
pero específicamente[br]para Shape Expressions
0:20:06.445,0:20:11.975
porque lo que siento es que crear[br]Shape Expressions
0:20:11.976,0:20:15.841
no es más difícil[br]que escribir consultas SPARQL.
0:20:15.842,0:20:21.255
Entonces algunas personas piensan[br]que está al mismo nivel,
0:20:22.278,0:20:26.296
Probablemente sea más fácil, creo,[br]porque Shape Expressions era,
0:20:26.296,0:20:31.241
cuando lo diseñamos, lo hicimos[br]para que fuera más fácil de trabajar.
0:20:31.242,0:20:35.001
Bien, esta es una de las primeras cosas,[br]que tienes este editor
0:20:35.001,0:20:36.620
para Shape Expressions.
0:20:37.371,0:20:41.467
Y luego también tienes la posibilidad,[br]por ejemplo, de visualizar.
0:20:41.468,0:20:44.801
Si tienes un Shape Expression,[br]usar por ejemplo...
0:20:44.802,0:20:49.386
Creo, "trabajo escrito" es[br]un buen Shape Expression
0:20:49.386,0:20:53.300
porque tiene algunas relaciones[br]entre diferentes cosas.
0:20:54.823,0:20:58.160
Y esta es la visualización UML[br]del trabajo escrito.
0:20:58.161,0:21:02.090
En un UML, es fácil ver[br]las diferentes propiedades.
0:21:02.790,0:21:06.794
Cuando haces esto, me di cuenta[br]cuando intenté con varias personas,
0:21:06.795,0:21:09.216
que encuentran algunos errores[br]en sus Shape Expressions
0:21:09.217,0:21:12.988
porque es fácil detectar cuáles son[br]las propiedades faltantes o lo que sea.
0:21:13.588,0:21:15.771
Entonces hay otra posibilidad aquí
0:21:15.772,0:21:19.520
es que también puedes validar,[br]creo que lo tengo aquí, la validación.
0:21:20.496,0:21:25.285
Creo que lo tenía en alguna etiqueta,[br]tal vez lo cerré.
0:21:26.267,0:21:30.988
Bien, pero puedes, por ejemplo,[br]puedes hacer clic aquí, Validar entidades.
0:21:32.308,0:21:34.232
Tú, por ejemplo,
0:21:35.404,0:21:41.921
"q42" con "e42", que es el autor.
0:21:42.818,0:21:46.180
Con "humano", creo que podemos[br]hacerlo con "humanos".
0:21:49.050,0:21:50.050
Y luego es...
0:21:50.688,0:21:56.365
Y está tomando un poco de tiempo hacerlo[br]porque está haciendo las consultas SPARQL
0:21:56.365,0:21:59.134
y ahora, por ejemplo,[br]está fallando por la red pero...
0:21:59.657,0:22:01.580
Puedes probarlo.
0:22:02.759,0:22:07.026
Bien, continuemos con la presentación,[br]con otras herramientas.
0:22:07.026,0:22:12.353
Así que que si quieres probarlo[br]y quieres algún comentario, házmelo saber.
0:22:13.133,0:22:15.540
Entonces para continuar[br]con la presentación...
0:22:18.923,0:22:20.233
Entonces esto es WikiShape.
0:22:23.800,0:22:26.509
Bien, ya dije esto,
0:22:27.681,0:22:34.157
el editor de Shape Expressions[br]es un proyecto independiente en GitHub.
0:22:35.605,0:22:37.472
Puedes usarlo en tu propio proyecto.
0:22:37.472,0:22:41.036
Si quieres hacer una herramienta[br]de Shape Expressions,
0:22:41.036,0:22:45.635
puedes incrustarlo[br]en cualquier otro proyecto,
0:22:45.636,0:22:48.235
está en GitHub y puedes usarlo.
0:22:48.868,0:22:51.970
El mismo autor, es uno de mis alumnos,
0:22:52.684,0:22:55.534
él también creó[br]un editor para Shape Expressions,
0:22:55.534,0:22:57.799
también inspirado por el servicio[br]de consulta de Wikidata
0:22:57.800,0:23:00.681
donde, en una columna,
0:23:00.682,0:23:05.103
tienes este editor más visual[br]de consultas SPARQL
0:23:05.104,0:23:07.135
donde puedes poner este tipo de cosas.
0:23:07.136,0:23:09.123
Esta es una captura de pantalla.
0:23:09.123,0:23:12.662
Puedes ver que esas son[br]las Shape Expressions en el texto
0:23:12.662,0:23:17.822
pero es una forma de Shape Expressions[br]donde tal vez tome un poco más de tiempo
0:23:18.595,0:23:23.400
donde puedes poner las diferentes filas[br]en los diferentes campos.
0:23:23.401,0:23:25.800
Luego está ShExEr.
0:23:26.879,0:23:31.882
Tenemos que... Lo hizo un estudiante[br]de doctorado de la universidad de Oviedo
0:23:31.883,0:23:34.080
y él está aquí,[br]así que puedes presentar ShExEr.
0:23:38.147,0:23:40.024
(Danny) Hola, soy Danny Fernández,
0:23:40.025,0:23:43.340
Soy un estudiante de doctorado[br]de la Universidad de Oviedo
0:23:43.340,0:23:44.710
y trabajo con Labra.
0:23:44.710,0:23:47.725
Ya que hay poco tiempo,[br]hagamos esto rápido,
0:23:47.726,0:23:52.641
no tomemos ninguna demostración real,[br]solo con algunas capturas de pantalla.
0:23:52.642,0:23:57.897
La forma habitual de trabajar[br]con Shape Expressions o cualquier lenguaje
0:23:57.897,0:23:59.521
es que tienes un experto en dominios
0:23:59.522,0:24:02.313
que define a priori[br]cómo debería verse el gráfico,
0:24:02.314,0:24:03.555
define algunas estructuras,
0:24:03.556,0:24:06.983
y luego usas estas estructuras[br]para validar los datos reales con él.
0:24:08.124,0:24:11.641
Esta herramienta, que es tan buena como[br]la que Labra ha estado presentando,
0:24:11.642,0:24:14.441
es una herramienta de uso general[br]para cualquier fuente RDF,
0:24:14.442,0:24:17.375
está diseñada para hacer lo contrario.
0:24:17.376,0:24:18.758
Ya tienes algunos datos,
0:24:18.759,0:24:23.165
selecciona de qué nodos[br]quieres tener la forma
0:24:23.165,0:24:26.718
y luego automáticamente[br]extrae o infiere la forma.
0:24:26.719,0:24:29.791
Aunque esta es una herramienta[br]de propósito general,
0:24:29.791,0:24:34.063
lo que hicimos para esta WikidataCon[br]es este botón elegante
0:24:34.884,0:24:37.081
que si haces clic en él,[br]esencialmente lo que pasa
0:24:37.081,0:24:42.079
es que hay tantos[br]parámetros de configuraciones
0:24:42.080,0:24:46.251
y lo configura para funcionar[br]con el punto final de Wikidata
0:24:46.251,0:24:47.971
y terminará pronto, lo siento.
0:24:48.733,0:24:52.883
Una vez que presionas este botón[br]lo que obtienes es esencialmente esto.
0:24:52.884,0:24:55.126
Después de haber seleccionado[br]qué tipo de nodos,
0:24:55.127,0:24:59.360
qué tipo de instancias de nuestra clase,[br]lo que sea que estés buscando,
0:24:59.361,0:25:01.321
obtienes un esquema automático.
0:25:02.319,0:25:07.111
Todas las restricciones están ordenadas[br]por cuántos nodos se ajusten a él,
0:25:07.112,0:25:09.772
puedes filtrar los menos comunes, etc.
0:25:09.772,0:25:12.126
Hay un cartel abajo de estas cosas
0:25:12.127,0:25:14.595
y bueno, estaré abajo y arriba
0:25:14.596,0:25:16.454
y por todo el lugar todo el día,
0:25:16.455,0:25:19.081
así que si tienes más interés[br]en esta herramienta,
0:25:19.082,0:25:21.476
solo háblame durante este viaje.
0:25:21.477,0:25:24.624
Y ahora, le devolveré[br]el micrófono a Labra, gracias.
0:25:24.625,0:25:29.265
(aplausos)
0:25:29.812,0:25:32.578
(Jose) Bien, continuemos[br]con las otras herramientas.
0:25:32.579,0:25:34.984
La otra herramienta es ShapeDesigner.
0:25:34.984,0:25:37.241
Andra, ¿quieres hacer[br]el ShapeDesigner ahora
0:25:37.242,0:25:39.287
o tal vez más tarde o en el taller?
0:25:39.287,0:25:40.603
Hay un taller...
0:25:40.603,0:25:44.437
Esta tarde hay un taller específicamente[br]para Shape Expressions, y...
0:25:45.265,0:25:47.939
La idea es que iba a practicarse más,
0:25:47.940,0:25:52.324
y si quieres practicar[br]un poco de ShEx, puedes hacerlo allí.
0:25:52.875,0:25:55.720
Esta herramienta es ShEx...[br]y ahí está Eric,
0:25:55.721,0:25:56.890
así que puedes presentarla.
0:25:57.969,0:26:00.687
(Eric) Así que rápidamente,[br]lo que quiero decir
0:26:00.687,0:26:05.711
es que probablemente[br]ya has visto la interfaz de ShEx
0:26:05.711,0:26:07.601
está hecho para Wikidata.
0:26:07.602,0:26:12.930
Está efectivamente despojado[br]y diseñado específicamente para Wikidata,
0:26:12.930,0:26:17.667
el genérico tiene más características[br]pero pensé que ya lo había mencionado
0:26:17.667,0:26:19.977
porque una de esas características[br]es particularmente útil
0:26:19.978,0:26:23.201
para depurar esquemas de Wikidata,
0:26:23.201,0:26:29.224
la cual es que si vas[br]y seleccionas el modo de sorber,
0:26:29.225,0:26:31.444
lo que hace es decir[br]mientras estoy validando,
0:26:31.445,0:26:34.694
quiero derribar todos los triples[br]y eso significa
0:26:34.695,0:26:36.274
que si tengo un montón de fallas,
0:26:36.275,0:26:39.586
puedo pasar y empezar a buscar[br]esas fallas y decir,
0:26:39.587,0:26:41.800
cuáles son los triples que están aquí,
0:26:41.801,0:26:44.120
lo siento, los triples están aquí abajo,
0:26:44.121,0:26:45.757
esto es solo un registro de lo que pasó.
0:26:46.327,0:26:49.180
Luego puedes sentarte allí[br]y jugar con él en tiempo real
0:26:49.181,0:26:51.033
como si jugaras con algo que cambia.
0:26:51.033,0:26:54.160
Es una versión más rápida[br]para hacer todo eso.
0:26:55.201,0:26:56.481
Este es un formulario de ShExC,
0:26:56.482,0:26:59.455
esto es algo que [Joachim] había sugerido
0:27:00.035,0:27:04.631
podría ser útil para poblar[br]documentos de Wikidata
0:27:04.631,0:27:07.338
basados en una Shape Expression[br]para ese documento.
0:27:08.095,0:27:11.681
Esto no está diseñado para Wikidata,
0:27:11.682,0:27:13.981
pero es solo para decir[br]que puedes tener un esquema
0:27:13.981,0:27:15.402
y puedes tener algunas anotaciones
0:27:15.403,0:27:17.518
y decir específicamente cómo quiero[br]hacer ese esquema
0:27:17.519,0:27:19.031
y luego se construye un formulario,
0:27:19.031,0:27:21.191
y si tienes datos,[br]se puede llenar el formulario.
0:27:24.517,0:27:26.164
PyShEx [inaudible].
0:27:28.025,0:27:31.080
(Jose) Creo que este es el último.
0:27:31.821,0:27:34.080
Sí, el último es PyShEx.
0:27:34.675,0:27:38.151
PyShEx es una implementación Python[br]de Shape Expressions,
0:27:39.193,0:27:42.680
puedes jugar también con Jupyter Notebooks[br]si quieres ese tipo de cosas.
0:27:42.680,0:27:44.432
Bien, eso es todo de esto.
0:27:44.433,0:27:47.170
(aplausos)
0:27:52.916,0:27:57.073
(Andra) Voy a hablar sobre un proyecto[br]específico en el que estoy involucrado
0:27:57.074,0:27:58.074
llamado Gene Wiki,
0:27:58.075,0:28:04.596
y donde también estamos[br]lidiando con problemas de calidad.
0:28:04.597,0:28:06.684
Pero antes de entrar en la calidad,
0:28:06.685,0:28:09.229
una introducción rápida[br]sobre qué es Gene Wiki,
0:28:09.855,0:28:15.175
y recientemente lanzamos una preimpresión[br]de un artículo que acabamos de escribir
0:28:15.175,0:28:18.160
que explica los detalles del proyecto.
0:28:19.821,0:28:23.839
Veo gente tomando fotos,[br]pero básicamente, lo que hace Gene Wiki,
0:28:23.846,0:28:28.027
es tratar de obtener datos biomédicos,[br]datos públicos en Wikidata,
0:28:28.028,0:28:32.200
y seguimos un patrón específico[br]para obtener esos datos en Wikidata.
0:28:33.130,0:28:36.809
Y cuando tenemos un nuevo repositorio[br]o un nuevo conjunto de datos
0:28:36.810,0:28:39.390
que puede ser incluido en Wikidata,
0:28:39.390,0:28:41.403
el primer paso es la participación[br]de la comunidad.
0:28:41.403,0:28:43.784
No es necesario dirigirse[br]a una comunidad de Wikidata
0:28:43.785,0:28:46.120
sino a una comunidad[br]de investigación local,
0:28:46.121,0:28:50.286
y nos encontramos en persona[br]o en línea o en cualquier plataforma
0:28:50.286,0:28:52.881
e intentar crear un modelo de datos
0:28:52.882,0:28:56.197
que unan sus datos[br]con el modelo de Wikidata.
0:28:56.197,0:28:59.944
Aquí tengo una foto de un taller[br]que se hizo aquí el año pasado
0:28:59.945,0:29:02.663
donde se trataba de ver[br]un conjunto de datos específico
0:29:02.663,0:29:05.280
y, bueno, ves muchas discusiones,
0:29:05.281,0:29:09.780
luego alineándolo con schema.org[br]y otras ontologías que hay por ahí.
0:29:10.320,0:29:15.508
Luego, al final del primer paso, tenemos[br]un dibujo en pizarra del esquema
0:29:15.509,0:29:17.336
que queremos implementar en Wikidata.
0:29:17.337,0:29:20.440
Lo que ves allí, es claro,
0:29:20.441,0:29:21.766
lo tenemos al fondo,
0:29:21.767,0:29:25.240
incluso hoy podemos hacer[br]algunos esquemas dentro de este panel.
0:29:26.560,0:29:28.399
Una vez que tengamos[br]el esquema en su lugar,
0:29:28.400,0:29:31.320
lo siguiente es intentar hacer[br]ese esquema legible por la máquina
0:29:32.358,0:29:36.841
porque quieres tener modelos accionables[br]para unir los datos que traes
0:29:36.842,0:29:39.690
de cualquier base de datos[br]biomédica en Wikidata.
0:29:40.393,0:29:45.182
Y aquí estamos aplicando[br]Shape Expressions.
0:29:46.471,0:29:52.518
Y usamos eso porque Shape Expressions[br]te permite probar
0:29:52.518,0:29:57.040
si el conjunto de datos en realidad...[br]no, para ver primero
0:29:57.041,0:30:01.782
si los datos ya existentes en Wikidata[br]siguen el mismo modelo de datos
0:30:01.783,0:30:04.718
que se logró en el proceso anterior.
0:30:04.719,0:30:06.641
Entonces, con Shape Expression[br]podemos verificar:
0:30:06.642,0:30:10.926
los datos que están en este tema[br]en Wikidata, ¿necesitan algo de limpieza
0:30:10.926,0:30:15.013
o necesitamos adaptar nuestro modelo[br]al modelo de Wikidata o viceversa?
0:30:15.937,0:30:19.867
Una vez que esté en su lugar[br]y comenzamos a escribir robots,
0:30:20.670,0:30:23.801
y los robots están sembrando[br]la información
0:30:23.802,0:30:27.308
que está en las fuentes primarias[br]de Wikidata.
0:30:27.846,0:30:29.303
Y cuando los robots estén listos,
0:30:29.304,0:30:33.001
escribimos estos robots[br]con una plataforma llamada...
0:30:33.002,0:30:36.201
con una biblioteca de Python[br]llamada integrador de Wikidata
0:30:36.202,0:30:38.167
que salió de nuestro proyecto.
0:30:38.698,0:30:42.921
Una vez que tengamos nuestros robots,[br]usamos una plataforma llamada Jenkins
0:30:42.921,0:30:44.540
para una integración continua.
0:30:44.540,0:30:45.762
Y con Jenkins,
0:30:45.762,0:30:51.160
actualizamos continuamente[br]las fuentes primarias con Wikidata.
0:30:52.178,0:30:55.889
Este es un diagrama para el artículo[br]que mencioné previamente.
0:30:55.890,0:30:57.241
Este es nuestro panorama actual.
0:30:57.242,0:31:02.059
Cada caja naranja de ahí[br]es una fuente primaria de drogas,
0:31:02.060,0:31:07.827
proteínas, genes, enfermedades,[br]compuestos químicos con interacción,
0:31:07.827,0:31:10.870
y este modelo es[br]demasiado pequeño para leer
0:31:10.870,0:31:17.472
pero esta es la base de datos,[br]las fuentes que gestionamos en Wikidata
0:31:17.473,0:31:20.560
y se unen con las fuentes primarias.
0:31:20.561,0:31:22.355
Este es el flujo de trabajo.
0:31:22.870,0:31:25.312
Uno de nuestros socios[br]es la ontología de la enfermedad
0:31:25.312,0:31:27.672
la ontología de la enfermedad[br]es una ontología CC0,
0:31:28.179,0:31:31.990
y la ontología CC0[br]tiene un ciclo propio de curación,
0:31:32.756,0:31:35.736
ellos continuamente actualizan[br]la ontología de la enfermedad
0:31:35.737,0:31:39.687
para reflejar el espacio de la enfermedad[br]o la interpretación de enfermedades.
0:31:40.336,0:31:44.361
Ahí está también el ciclo de curación[br]de Wikidata en enfermedades
0:31:44.362,0:31:49.844
donde la comunidad de Wikidata[br]monitorea lo que ocurre en Wikidata.
0:31:50.406,0:31:51.601
Y luego tenemos dos roles,
0:31:51.602,0:31:55.477
los llamamos coloquialmente[br]el portero guardián,
0:31:56.009,0:31:59.561
este éramos un colega y yo hace cinco años
0:31:59.562,0:32:03.414
y nos sentábamos en nuestras computadoras[br]a monitorear Wikipedia y Wikidata,
0:32:03.415,0:32:08.601
si había un problema que fuera[br]reportado a la comunidad primaria,
0:32:08.602,0:32:11.765
las fuentes primarias, miraban[br]la implementación y decidían:
0:32:11.765,0:32:14.240
¿confiamos en la entrada de Wikidata?
0:32:14.850,0:32:18.555
Sí... entonces se considera,[br]y entra en el ciclo,
0:32:18.555,0:32:22.686
y la próxima iteración es parte[br]de la ontología de la enfermedad
0:32:22.687,0:32:25.411
y se retroalimentaba a Wikidata.
0:32:27.419,0:32:31.480
Estamos haciendo lo mismo en WikiPathways.
0:32:31.481,0:32:36.601
WikiPathways es una ruta inspirada[br]en MediaWiki y un repositorio de la ruta.
0:32:36.602,0:32:40.901
La misma historia, ya hay diferentes[br]recursos de ruta en Wikidata.
0:32:41.463,0:32:44.713
Puede haber conflictos[br]entre esos recursos de ruta
0:32:44.722,0:32:46.701
y estos conflictos se reportan de nuevo
0:32:46.702,0:32:49.521
por los porteros guardianes[br]a esa comunidad,
0:32:49.522,0:32:53.715
y tú mantienes[br]los ciclos de curación individual.
0:32:53.715,0:32:57.068
Pero si recuerdas el ciclo anterior,
0:32:57.069,0:33:03.041
aquí solo mencioné dos ciclos,[br]dos recursos,
0:33:03.566,0:33:06.300
tenemos que hacer eso[br]para cada recurso que tenemos
0:33:06.300,0:33:08.061
y tenemos que gestionar lo que ocurre
0:33:08.062,0:33:09.185
porque cuando digo curación,
0:33:09.185,0:33:11.787
Realmente me refiero a ir[br]a las páginas principales de Wikipedia,
0:33:11.787,0:33:14.544
entrar en las páginas principales[br]de Wikidata y tratar de hacer eso.
0:33:14.545,0:33:19.316
Eso no pesa para los dos porteros[br]guardianes que tuvimos.
0:33:19.860,0:33:22.777
Cuando estaba en una conferencia en 2016
0:33:22.778,0:33:26.933
donde Eric hizo una presentación[br]de Shape Expressions,
0:33:26.934,0:33:29.277
salté al carro y dije bien,
0:33:29.278,0:33:34.240
Shape Expressions puede ayudarnos[br]a detectar qué diferencias hay en Wikidata
0:33:34.240,0:33:41.159
y eso permite que los porteros guardianes[br]tengan informes más eficazes que reportar.
0:33:42.275,0:33:46.019
Entonces este año, estaba encantado[br]con la entidad del esquema
0:33:46.020,0:33:50.765
porque ahora, podemos almacenar[br]esos esquemas de entidad en Wikidata,
0:33:50.765,0:33:53.183
en el mismo Wikidata,[br]mientras que antes estaban en GitHub,
0:33:53.860,0:33:56.815
y esto se alinea[br]con la interfaz de Wikidata,
0:33:56.816,0:33:59.350
entonces tienes cosas[br]como discusiones de documentos
0:33:59.350,0:34:00.762
pero también tienes revisiones.
0:34:00.763,0:34:05.261
Puedes aprovechar las páginas principales[br]y las revisiones en Wikidata
0:34:05.262,0:34:12.255
y usar eso para discutir[br]sobre lo que hay en Wikidata
0:34:12.255,0:34:14.060
y qué hay en las fuentes primarias.
0:34:14.966,0:34:19.686
Entonces, lo que Eric acaba de presentar,[br]ya es un gran beneficio.
0:34:19.686,0:34:24.335
Así que aquí, creamos una Shape Expression[br]para el gen humano,
0:34:24.336,0:34:30.225
y luego lo ejecutamos en ShEx simple,[br]tal como puedes ver,
0:34:30.225,0:34:32.428
ya tenemos...
0:34:32.429,0:34:34.641
Hay un problema que necesita[br]ser monitoreado
0:34:34.642,0:34:37.316
es que hay un elemento[br]que no encaja en ese esquema,
0:34:37.316,0:34:43.139
y entonces ya puedes crear informes[br]de curación de entidades de esquema
0:34:43.140,0:34:46.240
basados en... y enviar eso[br]a los diferentes informes de curación.
0:34:48.058,0:34:52.788
Pero ShEx.js es una interfaz integrada,
0:34:52.788,0:34:55.860
y si puedo mostrar aquí, solo hago diez,
0:34:55.860,0:35:00.362
pero tenemos decenas de miles,[br]y eso nuevamente no pesa.
0:35:00.362,0:35:04.654
Entonces, ahora el integrador de Wikidata[br]también es compatible con ShEx,
0:35:05.168,0:35:07.431
y luego podemos enlazar[br]bucles de elementos
0:35:07.431,0:35:11.494
donde decimos sí-no, sí-no,[br]verdadero-falso, verdadero-falso.
0:35:11.495,0:35:12.495
Así que de nuevo,
0:35:13.065,0:35:16.514
aumentamos un poco la eficiencia[br]de lidiar con los informes.
0:35:17.256,0:35:22.662
Pero ahora, recientemente, se construye[br]en el servicio de consultas de Wikidata,
0:35:23.181,0:35:24.998
y bueno, recientemente[br]hemos ido acelerando
0:35:24.999,0:35:26.560
así que de nuevo, eso no pesa.
0:35:26.561,0:35:31.391
Aún es un proceso continuo,[br]el cómo lidiar con modelos en Wikidata.
0:35:32.202,0:35:36.682
Y de nuevo, ShEx no solo es intimidante
0:35:36.683,0:35:40.356
sino que también la escala es[br]demasiado grande para tratarla.
0:35:41.068,0:35:46.081
Así que empecé a trabajar, esta es[br]mi primera prueba de concepto o ejercicio
0:35:46.082,0:35:47.680
donde usé una herramienta llamada yED,
0:35:48.184,0:35:52.590
y empecé a dibujar[br]esas Shape Expressions porque...
0:35:52.591,0:35:58.098
y luego regenero este esquema
0:35:58.099,0:36:01.279
en este formato adyacente[br]de Shape Expressions,
0:36:01.280,0:36:04.520
así que eso ya se abriría a la audiencia
0:36:04.521,0:36:07.432
que está intimidada[br]por los lenguajes de Shape Expressions.
0:36:07.961,0:36:12.308
Pero en realidad, hay un problema[br]con esas descripciones visuales
0:36:12.309,0:36:18.229
porque también es un esquema[br]que fue dibujado en yEd por alguien.
0:36:18.230,0:36:23.838
Y aquí hay otro que es hermoso.
0:36:23.838,0:36:29.414
Me encantaría tenerlo en mi pared,[br]pero aún no es interoperable.
0:36:30.281,0:36:32.131
Así que quiero terminar mi charla con,
0:36:32.131,0:36:35.732
y la primera vez, me he estado robando[br]esta diapositiva, usando esta diapositiva.
0:36:35.732,0:36:37.594
Es un honor tenerlo en la audiencia
0:36:37.595,0:36:39.423
y realmente me gusta esto:
0:36:39.424,0:36:42.362
"La gente piensa que RDF es una molestia[br]porque es complicado.
0:36:42.362,0:36:43.985
La verdad es aún peor, es tan simple,
0:36:45.581,0:36:48.133
porque tienes que trabajar[br]con problemas de datos del mundo real
0:36:48.134,0:36:50.031
que son terriblemente complicados.
0:36:50.031,0:36:51.451
Si bien puedes evitar RDF,
0:36:51.451,0:36:55.760
es más difícil evitar datos complicados[br]y problemas informáticos complicados".
0:36:55.761,0:36:59.535
Esto es sobre RDF, pero creo[br]que también aplica al modelado.
0:37:00.112,0:37:02.769
Entonces, mi punto de discusión[br]es si realmente...
0:37:03.387,0:37:05.882
¿Cómo iniciamos el modelado?
0:37:05.882,0:37:10.826
¿Deberíamos discutir sobre ShEx,[br]o modelos visuales o...?
0:37:11.426,0:37:13.271
¿Cómo continuamos?
0:37:13.474,0:37:14.840
Muchas gracias por tu tiempo.
0:37:15.102,0:37:17.787
(aplausos)
0:37:20.001,0:37:21.188
(Lydia) Muchas gracias.
0:37:21.692,0:37:24.001
¿Vendrían aquí delante
0:37:24.002,0:37:27.741
para que podamos iniciar[br]con las preguntas de la audiencia?
0:37:28.610,0:37:30.203
¿Hay preguntas?
0:37:31.507,0:37:32.507
Sí.
0:37:34.253,0:37:36.890
Y creo que, para la cámara, necesitamos...
0:37:38.835,0:37:40.968
(Lydia riendo) Sí.
0:37:43.094,0:37:46.273
(persona 3) Una pregunta[br]para Cristina, creo.
0:37:47.366,0:37:51.641
Mencionaste el término[br]"ganancia de información"
0:37:51.642,0:37:53.689
y vincularse con otros sistemas.
0:37:53.690,0:37:55.460
Hay una medida teórica de la información
0:37:55.460,0:37:58.101
que usa estadística y probabilidad[br]llamada ganancia de información.
0:37:58.101,0:37:59.541
¿Tienes el mismo...
0:37:59.542,0:38:01.736
Quiero decir, ¿querías decir[br]exactamente esa medida,
0:38:01.736,0:38:04.173
la ganancia de información[br]de la teoría de la probabilidad
0:38:04.174,0:38:05.420
de la teoría de la información
0:38:05.420,0:38:09.024
o simplemente usar esta cosa conceptual[br]para medir la ganancia de información?
0:38:09.025,0:38:13.016
No, definimos e implementamos medidas
0:38:13.695,0:38:20.161
que usan la entropía de Shannon,[br]así que se entiende así.
0:38:20.162,0:38:22.596
No quise entrar en detalles[br]de las fórmulas concretas...
0:38:22.596,0:38:24.977
(persona 3) No, no, por supuesto,[br]por eso hice la pregunta.
0:38:24.978,0:38:26.818
- (Cristina) Pero, sí...[br]- (persona 3) Gracias.
0:38:33.091,0:38:35.047
(persona 4) Más un comentario[br]que una pregunta.
0:38:35.048,0:38:36.241
(Lydia) Dilo.
0:38:36.242,0:38:39.840
(persona 4) Ha habido[br]mucho enfoque a nivel de elemento
0:38:39.840,0:38:42.547
sobre calidad e integridad,
0:38:42.547,0:38:47.374
una de las cosas que me preocupa es[br]que no aplicamos lo mismo a las jerarquías
0:38:47.374,0:38:51.480
y creo que tenemos un problema, es que,[br]nuestra jerarquía a veces no es buena.
0:38:51.481,0:38:53.463
Vemos que va a ser un problema real
0:38:53.464,0:38:55.774
con la búsqueda de Commons y otras cosas.
0:38:56.771,0:39:00.601
Una de las habilidades que podemos[br]hacer es importar externos...
0:39:00.602,0:39:04.842
La forma en que los tesauros externos[br]estructuran sus jerarquías,
0:39:04.842,0:39:10.291
utilizando el calificador P4900[br]de concepto más amplio.
0:39:11.037,0:39:16.167
Pero lo que creo sería muy útil,[br]serían mejores herramientas que hagan eso
0:39:16.168,0:39:21.212
que puedan importar una jerarquía[br]de tesauros externos
0:39:21.212,0:39:24.111
y que la mapee en nuestros[br]elementos de Wikidata.
0:39:24.111,0:39:28.199
Una vez que esté en su lugar[br]con esos calificadores P4900,
0:39:28.200,0:39:31.494
puedes hacer buenas consultas[br]a través de SPARQL
0:39:32.490,0:39:37.534
para ver dónde nuestra jerarquía[br]diverge de esa jerarquía externa.
0:39:37.534,0:39:41.346
Por ejemplo, [Paula Morma],[br]usuario de PKM, tal vez sepas,
0:39:41.346,0:39:43.533
ella trabaja mucho en la moda.
0:39:43.533,0:39:50.524
Así que lo usamos para atraer la jerarquía[br]de tesauros de la moda europea
0:39:50.524,0:39:53.812
y la jerarquía Getty AAT[br]de tesauros de la moda,
0:39:53.812,0:39:57.957
y luego ver dónde estaban los huecos[br]en nuestros elementos de nivel superior,
0:39:57.957,0:40:00.511
lo cual es un problema real[br]para nosotros porque a menudo,
0:40:00.511,0:40:04.355
estas son cosas que solo existen[br]en páginas de desambiguación en Wikipedia,
0:40:04.356,0:40:09.270
así que nos faltan muchos elementos[br]de nivel superior en nuestras jerarquías
0:40:09.271,0:40:14.480
y es algo que debemos abordar[br]en términos de calidad e integridad,
0:40:14.480,0:40:15.971
pero lo que realmente ayudaría
0:40:16.643,0:40:20.871
serían mejores herramientas que la jungla[br]de guiones de extracción que escribí...
0:40:20.872,0:40:26.010
Si alguien pudiera poner eso[br]en una libreta PAWS de Python
0:40:26.561,0:40:31.972
para poder tomar un tesauro externo,[br]tomar su jerarquía,
0:40:31.973,0:40:34.595
que bien puede estar disponible[br]como datos vinculados o no,
0:40:35.379,0:40:40.580
y luego ponerlos en QuickStatements[br]para ponerlos en valores P4900.
0:40:41.165,0:40:42.165
Y luego,
0:40:42.166,0:40:44.527
cuando nuestra representación[br]se vuelva más completa,
0:40:44.528,0:40:49.691
se actualicen esos P4900 porque a medida[br]que a nuestra representación
0:40:49.691,0:40:51.590
se le pone fecha, se vuelve más densa,
0:40:51.590,0:40:55.377
los valores de estos calificadores[br]necesitan cambiar
0:40:56.230,0:40:59.526
para representar que tenemos más[br]de su jerarquía en nuestro sistema.
0:40:59.526,0:41:03.728
Si alguien pudiera hacer eso,[br]creo que sería muy útil,
0:41:03.728,0:41:07.121
y necesitamos también mirar otros enfoques
0:41:07.122,0:41:10.762
para mejorar la calidad[br]y la integridad a nivel jerárquico
0:41:10.763,0:41:12.378
no solo a nivel de elemento.
0:41:13.308,0:41:14.840
(Andra) ¿Puedo agregar a eso?
0:41:16.362,0:41:19.901
Sí, y de hecho hacemos eso,
0:41:19.911,0:41:23.551
y puedo recomendar mirar[br]la Shape Expression que hizo Finn
0:41:23.552,0:41:27.330
con los datos léxicos[br]donde crea Shape Expressions
0:41:27.330,0:41:29.640
y luego construye[br]en otras Shape Expressions
0:41:29.641,0:41:32.608
entonces tienes este concepto de Shape[br]Expressions vinculados en Wikidata,
0:41:32.608,0:41:35.005
y específicamente, el caso de uso,[br]si entiendo correctamente,
0:41:35.006,0:41:37.183
es exactamente lo que estamos[br]haciendo en Gene Wiki.
0:41:37.184,0:41:40.841
Tienes la ontología de la enfermedad[br]que se pone en Wikidata
0:41:40.842,0:41:44.681
y luego entran los datos de la enfermedad[br]y aplicamos las Shape Expressions
0:41:44.682,0:41:47.247
para ver si encaja con este tesauro.
0:41:47.248,0:41:50.919
Y hay otros tesauros u otras[br]ontologías de vocabularios controlados
0:41:50.920,0:41:52.409
que aún necesitan entrar en Wikidata,
0:41:52.409,0:41:54.961
y eso es exactamente por qué[br]Shape Expression es tan interesante
0:41:54.961,0:41:57.963
porque puedes tener una Shape Expression[br]para la ontología de la enfermedad,
0:41:57.964,0:41:59.734
puedes tener una Shape[br]Expression para MeSH,
0:41:59.734,0:42:01.881
puedes decir: bien, ahora[br]quiero verificar la calidad.
0:42:01.881,0:42:04.059
Porque también tienes[br]en Wikidata el contexto
0:42:04.060,0:42:09.567
de cuando tienes un vocabulario controlado[br]dices que la calidad está acorde a esto,
0:42:09.568,0:42:11.636
pero podrías tener[br]una comunidad en desacuerdo.
0:42:11.636,0:42:16.081
Las herramientas están en su lugar,[br]pero ahora toca crear esos modelos
0:42:16.082,0:42:18.144
y aplicarlos en los diferentes[br]casos de uso.
0:42:18.811,0:42:20.921
(persona 4) La Shape Expression[br]es muy útil
0:42:20.922,0:42:25.928
una vez que tengas la ontología externa[br]mapeada en Wikidata,
0:42:25.929,0:42:29.474
pero mi problema es que está[br]llegando a esa etapa,
0:42:29.475,0:42:34.881
funciona para ver cuánto de la ontología[br]externa aún no está en Wikidata
0:42:34.882,0:42:36.256
y dónde están los huecos,
0:42:36.257,0:42:40.660
y ahí es donde creo que al tener[br]herramientas mucho más robustas
0:42:40.660,0:42:44.286
para ver lo que falta[br]de ontologías externas
0:42:44.286,0:42:45.537
sería muy útil.
0:42:47.518,0:42:48.952
El mayor problema allí
0:42:48.952,0:42:51.351
no es tanto las herramientas[br]sino que faltan más licencias.
0:42:51.803,0:42:55.249
Entonces, meter las ontologías[br]en Wikidata es en realidad muy fácil
0:42:55.250,0:42:59.295
pero la mayoría de las ontologías tienen,[br]¿cómo puedo decirlo cortésmente?
0:42:59.965,0:43:03.256
licencia restrictiva,[br]y no son compatibles con Wikidata.
0:43:04.068,0:43:06.678
(persona 4) Hay un gran número[br]de tesauros del sector público
0:43:06.678,0:43:08.099
en los campos culturales.
0:43:08.099,0:43:10.851
- (Andra) Entonces tenemos que hablar.[br]- (persona 4) No hay problema.
0:43:10.852,0:43:12.384
(Andra) Entonces tenemos que hablar.
0:43:13.624,0:43:19.192
(persona 5) El comentario que quiero hacer[br]en realidad es una respuesta a James,
0:43:19.192,0:43:22.401
entonces, la cosa es que,[br]las jerarquías hacen gráficos,
0:43:22.374,0:43:24.041
y cuando lo quieras...
0:43:24.579,0:43:28.888
Básicamente quiero hablar sobre...[br]un problema común en las jerarquías
0:43:28.889,0:43:30.820
es las jerarquías circulares,
0:43:30.821,0:43:33.796
ellas vuelven la una a la otra[br]cuando hay un problema,
0:43:33.796,0:43:35.920
lo cual, no deberías tener[br]eso en las jerarquías.
0:43:37.022,0:43:41.295
Esto, curiosamente, sucede mucho[br]en las categorías de Wikipedia
0:43:41.295,0:43:42.990
tenemos muchos círculos en las categorías,
0:43:43.898,0:43:46.612
pero la buena noticia es que esto es...
0:43:47.713,0:43:51.582
Técnicamente, es un problema completo[br]de P... NP, así que no puedes hallar esto,
0:43:51.583,0:43:53.414
y fácilmente si construiste[br]un gráfico de eso,
0:43:54.473,0:43:57.046
pero hay muchas maneras[br]que se han desarrollado
0:43:57.047,0:44:00.624
para encontrar problemas[br]en estos gráficos de jerarquía.
0:44:00.625,0:44:04.860
Hay un artículo llamado Buscando Ciclos...
0:44:04.861,0:44:07.955
Rompiendo Ciclos en Jerarquías Ruidosas,
0:44:07.956,0:44:12.671
y se ha usado para ayudar a categorizar[br]la Wikipedia en inglés.
0:44:12.672,0:44:17.141
Puedes tomar esto y aplicar[br]estas jerarquías en Wikidata,
0:44:17.142,0:44:19.540
y luego puedes encontrar[br]cosas que son problemáticas
0:44:19.541,0:44:22.481
y solo quitar las que están[br]causando problemas
0:44:22.482,0:44:24.593
y encontrar los problemas, en realidad.
0:44:24.594,0:44:26.960
Esto es solo una idea, solo para que tú...
0:44:28.690,0:44:29.930
(persona 4) Eso está muy bien,
0:44:29.931,0:44:34.402
pero creo que estás subestimando[br]el número de malas relaciones de subclase
0:44:34.402,0:44:35.402
que tenemos.
0:44:35.403,0:44:39.680
Es como tener una ciudad[br]en un país totalmente equivocado,
0:44:40.250,0:44:44.874
y hay herramientas de geografía[br]para identificar eso,
0:44:44.875,0:44:49.201
y necesitamos tener mejores[br]herramientas en las jerarquías
0:44:49.202,0:44:53.477
para identificar dónde está[br]el equivalente del elemento para el país
0:44:53.478,0:44:57.673
que falta, o donde realmente[br]ha sido subclasificado
0:44:57.674,0:45:01.804
a algo que no significa[br]algo completamente distinto.
0:45:02.804,0:45:07.165
(Lydia) Sí, creo que estás llegando a algo
0:45:07.166,0:45:12.024
que mi equipo y yo seguimos escuchando[br]de personas que reutilizan nuestros datos
0:45:12.025,0:45:13.991
bastante bien, cierto,
0:45:14.782,0:45:16.858
el punto de datos individuales[br]podría ser excelente,
0:45:16.858,0:45:20.163
pero si tienes que mirar[br]en la ontología y demás,
0:45:20.164,0:45:21.857
entonces se pone muy...
0:45:22.388,0:45:26.437
Y creo que uno de los grandes problemas[br]del por qué ocurre
0:45:26.437,0:45:30.736
es que mucha edición en Wikidata
0:45:30.736,0:45:34.544
sucede sobre la base[br]de un elemento individual, correcto,
0:45:34.545,0:45:36.201
haces una edición de ese elemento,
0:45:37.653,0:45:42.075
sin darte cuenta de que esto[br]podría tener consecuencias muy globales
0:45:42.075,0:45:44.245
en el resto del gráfico, por ejemplo.
0:45:44.245,0:45:50.040
Y si la gente tiene ideas de cómo[br]hacer esto más visible,
0:45:50.041,0:45:53.185
las consecuencias[br]de una edición local individual,
0:45:54.005,0:45:56.537
creo que valdría la pena explorar,
0:45:57.550,0:46:01.583
para mostrarles mejor a la gente[br]cuál es la consecuencia de su edición
0:46:01.584,0:46:03.434
para que lo hagan de muy buena fe,
0:46:04.481,0:46:05.481
qué es eso.
0:46:06.939,0:46:12.237
¡Guao! Bien, comencemos con, sí, tú,[br]luego tú, luego tú, y luego tú.
0:46:12.237,0:46:13.921
(persona 5) Bueno,[br]después de la discusión,
0:46:13.922,0:46:18.262
solo deseo expresar mi acuerdo[br]con lo que James estaba diciendo.
0:46:18.263,0:46:22.467
Entonces, esencialmente, parece[br]que lo más peligroso es la jerarquía,
0:46:22.468,0:46:23.910
no la jerarquía, sino en general
0:46:23.911,0:46:28.022
la semántica de las relaciones de subclase[br]vistas en Wikidata, cierto.
0:46:28.022,0:46:32.561
Hace poco he estado estudiando lenguajes,[br]solo para los fines de esta conferencia,
0:46:32.562,0:46:35.257
y por ejemplo, encuentras muchos casos
0:46:35.257,0:46:39.463
donde un lenguaje es parte[br]de una subclase de la misma cosa, bien.
0:46:39.463,0:46:43.577
Entonces, sabes, puedes decir[br]que tenemos una ontología flexible.
0:46:43.577,0:46:46.256
Wikidata a veces te da[br]la libertad de expresar eso.
0:46:46.256,0:46:47.257
Porque, por ejemplo,
0:46:47.258,0:46:50.721
esa ontología de lenguajes también es[br]políticamente complicada, ¿verdad?
0:46:50.722,0:46:55.038
Incluso es bueno estar en una posición[br]para expresar un nivel de incertidumbre.
0:46:55.038,0:46:57.983
Pero imagina a cualquiera que quiera[br]hacer una lectura automática de eso.
0:46:57.984,0:46:59.468
Eso es realmente problemático.
0:46:59.468,0:47:00.468
Y luego de nuevo,
0:47:00.469,0:47:03.686
no creo que esa ontología[br]fuera importada de alguna parte,
0:47:03.687,0:47:05.490
es algo que es originalmente nuestro.
0:47:05.491,0:47:08.321
Se cosecha desde Wikipedia,[br]al principio lo diré.
0:47:08.322,0:47:11.324
Entonces, me pregunto...[br]esta cosa de Shape Expressions es genial,
0:47:11.325,0:47:15.575
y también validar y arreglar,[br]si quieres, la ontología de Wikidata
0:47:15.576,0:47:18.191
por recursos externos, hermosa idea.
0:47:19.026,0:47:20.026
En fin,
0:47:20.027,0:47:25.440
¿terminaremos reflexionando sobre[br]las ontologías externas en Wikidata?
0:47:25.441,0:47:28.651
Y además, ¿qué hacemos con la parte[br]central de nuestra ontología
0:47:28.652,0:47:30.642
que nunca se cosecha de recursos externos,
0:47:30.643,0:47:31.978
cómo vamos a arreglar eso?
0:47:31.979,0:47:35.276
Y realmente pienso que eso será[br]un problema por sí solo.
0:47:35.277,0:47:39.010
Tendremos que centrarnos en eso[br]independientemente de la idea
0:47:39.010,0:47:41.046
de validar la ontología con algo externo.
0:47:49.353,0:47:53.379
(persona 6) Bien, y las limitantes[br]y las formas son muy impresionantes
0:47:53.380,0:47:54.605
lo que podemos hacer con eso,
0:47:55.205,0:47:58.481
pero el punto principal no está[br]siendo realmente aclarado...
0:47:58.482,0:48:03.229
es porque ahora se puede hacer más[br]explícito lo que esperamos de los datos.
0:48:03.229,0:48:06.893
Antes, cada uno tenía que escribir[br]sus propias herramientas y guiones
0:48:06.894,0:48:10.601
y así es más visible[br]y podemos discutir sobre eso.
0:48:10.602,0:48:13.641
Pero no se trata[br]de lo que está mal o bien,
0:48:13.642,0:48:15.870
se trata de una expectativa,
0:48:15.870,0:48:18.105
y tendrás diferentes[br]expectativas y discusiones
0:48:18.106,0:48:20.737
acerca de cómo queremos[br]modelar las cosas en Wikidata,
0:48:21.246,0:48:23.095
y esto...
0:48:23.096,0:48:26.280
El estado actual es solo[br]un paso en la dirección
0:48:26.281,0:48:28.041
porque ahora necesitas
0:48:28.042,0:48:31.041
mucha experiencia técnica[br]para entrar en esto,
0:48:31.042,0:48:35.721
y necesitamos mejores formas[br]para visualizar esta restricción,
0:48:35.722,0:48:39.995
para transformarlo tal vez en un lenguaje[br]natural y la gente lo pueda entender mejor
0:48:40.939,0:48:43.768
pero se trata menos de lo que está[br]mal o lo que está bien.
0:48:44.925,0:48:45.925
(Lydia) Sí.
0:48:50.986,0:48:53.893
(persona 7) Por cuestiones de calidad,[br]solo lo quiero repetir como...
0:48:53.894,0:48:57.010
Me he encontrado que muchos[br]de los problemas han sido
0:48:58.838,0:49:02.330
diferencias de opinión[br]entre instancia de y subclase.
0:49:02.331,0:49:05.963
Yo diría que los errores[br]en esas situaciones
0:49:05.963,0:49:11.521
que he tratado de encontrar[br]han sido un proceso muy lento.
0:49:11.522,0:49:14.840
Lo que he encontrado es algo así: "si[br]encuentro elementos de muy alta impresión
0:49:14.840,0:49:16.171
que son algo... y luego uso todas
0:49:16.171,0:49:21.628
las instancias de subclase y encuentro[br]las declaraciones derivadas de esto",
0:49:21.628,0:49:26.215
esta es una forma muy útil[br]de buscar estos errores.
0:49:26.215,0:49:28.067
Pero tenía curiosidad[br]si Shape Expressions,
0:49:29.841,0:49:31.582
si hay...
0:49:31.583,0:49:36.934
Si se puede usar como una herramienta que[br]ayude a resolver esos problemas, y sí...
0:49:40.514,0:49:42.555
(persona 8) Si tiene[br]una huella estructural...
0:49:45.910,0:49:49.310
Si tiene una huella estructural[br]donde puedas... eso es algo falsificable,
0:49:49.310,0:49:51.191
puedes ver eso[br]y decir, bueno, eso está mal,
0:49:51.192,0:49:52.670
entonces sí, puedes hacer eso.
0:49:52.671,0:49:56.791
Pero si solo se trata de mapear[br]con objetos del mundo real,
0:49:56.791,0:49:59.272
entonces solo vas a necesitar[br]montones y montones de cerebros.
0:50:05.768,0:50:08.631
(persona 9) Hola, Pablo Mendes[br]de Apple Siri Knowledge.
0:50:09.154,0:50:12.770
Estamos aquí para descubrir cómo ayudar[br]al proyecto y a la comunidad
0:50:12.770,0:50:15.645
pero Cristina cometió el error[br]de preguntar qué queremos.
0:50:16.471,0:50:20.052
(risas) Entonces, creo que[br]una cosa que me gustaría ver,
0:50:20.958,0:50:23.521
se trata mucho de verificabilidad,
0:50:23.522,0:50:26.372
que es uno de los principios básicos[br]del proyecto en la comunidad,
0:50:27.062,0:50:28.590
y confiabilidad.
0:50:28.590,0:50:31.992
No todas las declaraciones son iguales,[br]algunas de ellas están muy disputadas,
0:50:31.992,0:50:33.653
algunas de ellas son fáciles de adivinar,
0:50:33.654,0:50:36.021
como la fecha de nacimiento[br]de alguien puede ser verificada,
0:50:36.071,0:50:39.212
como viste hoy en la Keynote, los asuntos[br]de género son mucho más complicados.
0:50:40.205,0:50:42.130
¿Puedes hablar un poco de lo que sabes
0:50:42.131,0:50:47.271
en esta área de calidad de datos[br]acerca de confiabilidad y verificabilidad?
0:50:55.442,0:50:58.138
Si no tienes mucho,[br]me encantaría ver mucho más. (risas)
0:51:00.646,0:51:01.646
(Lydia) Sí.
0:51:03.314,0:51:06.548
Aparentemente, no tenemos[br]mucho que decir sobre eso. (risas)
0:51:08.024,0:51:12.299
(Andra) Creo que podemos hacer mucho,[br]pero ayer tuve una discusión contigo.
0:51:12.300,0:51:15.774
Mi ejemplo favorito que aprendí ayer,[br]que ya está en desuso,
0:51:15.774,0:51:20.281
es que si vas a la Q2, que es la tierra,
0:51:20.282,0:51:23.343
hay una declaración[br]que afirma que la tierra es plana.
0:51:24.183,0:51:26.055
Y me encanta ese ejemplo
0:51:26.056,0:51:28.391
porque hay una comunidad[br]por ahí que lo afirma
0:51:28.392,0:51:30.417
y tienen recursos verificables.
0:51:30.418,0:51:32.254
Entonces, creo que es un caso genuino,
0:51:32.255,0:51:34.641
no debería estar en desuso,[br]debería estar en Wikidata.
0:51:34.642,0:51:40.385
Y creo que Shape Expressions[br]puede ser realmente instrumental allí,
0:51:40.386,0:51:41.832
debido a lo que puedes decir,
0:51:41.833,0:51:44.856
bien, estoy realmente interesado[br]en este caso de uso,
0:51:44.857,0:51:47.129
o este es un caso de uso[br]en el que no estás de acuerdo,
0:51:47.130,0:51:51.059
pero también puede haber un caso de uso[br]donde dices, bien, estoy interesado.
0:51:51.059,0:51:53.449
Entonces, hay un ejemplo,[br]que dices, tengo glucosa.
0:51:53.449,0:51:55.841
Y la glucosa, cuando eres biólogo,
0:51:55.842,0:52:00.176
no te importan las limitantes químicas[br]de la molécula de la glucosa,
0:52:00.177,0:52:03.201
tú simplemente...[br]Todo lo de glucosa es lo mismo.
0:52:03.202,0:52:05.973
Pero si eres químico,[br]te estremeces cuando escuchas eso,
0:52:05.973,0:52:08.191
tienes 200 algo...
0:52:08.191,0:52:10.343
Entonces, puedes tener[br]múltiples Shape Expressions,
0:52:10.343,0:52:12.721
bien, voy a poner que...[br]Estoy en un punto de vista químico,
0:52:12.722,0:52:13.887
estoy aplicando eso.
0:52:13.887,0:52:16.691
Y luego dices, estoy en un caso[br]de uso biológico,
0:52:16.691,0:52:18.524
Estoy aplicando esa Shape Expression.
0:52:18.524,0:52:20.358
Y luego, cuando quieres colaborar,
0:52:20.358,0:52:22.784
sí, bueno, deberías hablarle[br]a Eric sobre los mapas ShEx.
0:52:23.910,0:52:28.873
Y así... pero este viaje apenas comienza.
0:52:28.873,0:52:32.238
Pero yo personalmente creo[br]que es muy instrumental en esa área.
0:52:34.292,0:52:35.535
(Lydia) Bien. Por ahí.
0:52:37.949,0:52:39.168
(risas)
0:52:40.597,0:52:46.035
(persona 2) Tuve varias ideas[br]de algunos puntos en las discusiones,
0:52:46.035,0:52:50.902
así que intentaré no perderlas...[br]Tuve tres ideas, así que...
0:52:52.394,0:52:55.201
Según lo que dijo James hace un tiempo,
0:52:55.202,0:52:59.001
tenemos un problema muy, muy grande[br]en Wikidata desde el principio
0:52:59.002,0:53:01.574
para la ontología superior.
0:53:02.363,0:53:05.339
Lo hablamos hace dos años en WikidataCon,
0:53:05.340,0:53:07.432
y hablamos de eso en Wikimania.
0:53:07.432,0:53:09.818
Bueno, siempre que tenemos[br]una reunión de Wikidata
0:53:09.818,0:53:11.656
hablamos de eso,
0:53:11.656,0:53:15.782
porque es un gran problema[br]a un nivel muy, muy visual
0:53:15.783,0:53:23.118
qué entidad es, con qué trabajo es,[br]qué género es, arte,
0:53:23.118,0:53:25.461
son realmente el concepto más grande.
0:53:26.195,0:53:33.117
Y eso es realmente un punto[br]muy débil en la ontología global
0:53:33.118,0:53:37.453
porque la gente trata[br]de limpiar regularmente
0:53:38.017,0:53:41.047
y lo descompone todo,
0:53:42.516,0:53:48.649
porque sí, creo que algunos de ustedes[br]recuerdan al tipo que de buena fe
0:53:48.649,0:53:51.785
rompió absolutamente[br]todas las ciudades del mundo.
0:53:51.785,0:53:57.537
Ya no eran elementos geográficos, habían[br]restricciones de violación en todas partes
0:53:58.720,0:54:00.278
Y fue de buena fe,
0:54:00.278,0:54:03.623
porque realmente estaba[br]corrigiendo un error en un elemento,
0:54:04.170,0:54:05.732
pero todo se vino abajo.
0:54:06.349,0:54:09.373
Y no estoy segura de cómo[br]podemos resolver eso
0:54:10.216,0:54:15.709
porque en realidad no hay ninguna[br]institución externa a la que copiar
0:54:15.710,0:54:18.490
porque todos trabajan...
0:54:19.154,0:54:22.041
Bueno, si estoy realizando[br]una base de datos de arte,
0:54:22.042,0:54:24.601
solo iré al nivel de arte escénico,
0:54:24.601,0:54:29.361
pero no voy al concepto filosófico[br]de lo que es una entidad,
0:54:29.362,0:54:31.201
y eso es en realidad...
0:54:31.202,0:54:34.561
No conozco ninguna base de datos[br]que esté trabajando a este nivel,
0:54:34.562,0:54:36.827
pero ese es el punto[br]más débil de Wikidata.
0:54:37.936,0:54:40.812
Y probablemente, cuando hablamos[br]de calidad de datos,
0:54:40.812,0:54:44.034
tiene en realidad[br]una gran parte, así que...
0:54:44.034,0:54:48.569
Y creo que es lo mismo[br]que hemos expresado...
0:54:48.569,0:54:50.452
Lo siento, estoy cambiando de tema,
0:54:51.401,0:54:55.774
pero hemos expresado[br]en diferentes sesiones sobre cualidades,
0:54:55.774,0:54:59.398
que en realidad algunos de nosotros[br]hacemos un buen trabajo de modelado,
0:54:59.399,0:55:01.240
hacemos ShEx, hacemos cosas así.
0:55:01.967,0:55:07.655
La gente no lo ve en Wikidata,[br]no ven el ShEx,
0:55:07.655,0:55:10.392
no ven el WikiProject[br]en la página de discusión,
0:55:10.393,0:55:11.393
y a veces,
0:55:11.394,0:55:14.958
ni siquiera ven las páginas[br]de discusión de propiedades,
0:55:14.958,0:55:19.628
que declara explícitamente[br]a), esta propiedad se utiliza para eso.
0:55:19.628,0:55:23.887
La semana pasada, agregué[br]restricciones a una propiedad.
0:55:23.888,0:55:26.324
La restricción fue escrita explícitamente
0:55:26.325,0:55:28.690
en la discusión de la creación[br]de la propiedad.
0:55:28.690,0:55:34.548
Acabo de crear la parte técnica[br]de agregar la restricción, y alguien:
0:55:34.548,0:55:37.182
"¡Qué! ¡Estropeaste todas mis ediciones!"
0:55:37.183,0:55:41.542
Y él estaba usando incorrectamente[br]la propiedad durante los últimos dos años.
0:55:41.542,0:55:46.868
Y la propiedad era realmente muy clara,[br]pero no hubo advertencias,
0:55:46.869,0:55:49.922
y entonces, es lo mismo en el Pink Pony,[br]que dijimos en Wikimania
0:55:49.922,0:55:54.719
para hacer que WikiProject sea más visible[br]o para que ShEx sea más visible, pero...
0:55:54.719,0:55:56.917
Y eso es lo que dijo Cristina.
0:55:56.917,0:56:02.368
Tenemos un problema de visibilidad[br]de cuáles son las soluciones existentes.
0:56:02.368,0:56:04.242
Y en esta sesión,
0:56:04.242,0:56:06.862
todos estamos hablando[br]de cómo crear más ShEx,
0:56:06.863,0:56:10.727
o de facilitar los trabajos[br]para las personas que hacen la limpieza.
0:56:11.605,0:56:15.835
Pero estamos limpiando[br]desde el primer día de Wikidata,
0:56:15.836,0:56:20.921
y globalmente, estamos perdiendo,[br]y estamos perdiendo porque, bueno,
0:56:20.922,0:56:22.960
si supiera, los nombres son complicados,
0:56:22.961,0:56:26.162
pero yo soy el único[br]que hace el trabajo de limpieza,
0:56:26.662,0:56:29.671
el chico que agregó[br]el nombre de la escritura latina
0:56:29.672,0:56:31.584
a todos los investigadores chinos,
0:56:32.088,0:56:35.616
me llevará meses limpiar eso[br]y no puedo hacerlo solo,
0:56:35.616,0:56:38.777
y él hizo un lote masivo.
0:56:38.777,0:56:40.241
Entonces, realmente necesitamos...
0:56:40.242,0:56:44.158
Tenemos un problema de visibilidad[br]más que un problema de herramienta, creo,
0:56:44.158,0:56:45.733
porque tenemos muchas herramientas.
0:56:45.733,0:56:50.255
(Lydia) Correcto, desafortunadamente,[br]me han mostrado una señal (risas)
0:56:50.256,0:56:52.121
así que, tenemos que terminar esto.
0:56:52.122,0:56:53.563
Muchas gracias por sus comentarios,
0:56:53.563,0:56:56.611
espero que sigan discutiendo[br]durante el resto del día,
0:56:56.611,0:56:57.840
y gracias por su aporte.
0:56:58.359,0:56:59.944
(aplausos)