0:00:05.945,0:00:09.476 Hola a todos los del panel[br]de Calidad de Datos. 0:00:10.288,0:00:13.671 La calidad de los datos importa[br]porque cada vez más personas 0:00:13.672,0:00:19.289 confían en que nuestros datos están bien,[br]así que hablaremos de su calidad, 0:00:20.029,0:00:26.000 y habrán cuatro oradores[br]quienes darán breves presentaciones 0:00:26.000,0:00:29.539 sobre temas de la calidad de los datos[br]y luego tendremos preguntas y respuestas. 0:00:30.130,0:00:32.234 Y el primero es Lucas. 0:00:34.385,0:00:35.385 Gracias. 0:00:35.901,0:00:39.899 (Lucas) Hola, soy Lucas y voy a comenzar[br]con una descripción general 0:00:39.899,0:00:43.806 de las herramientas de calidad de datos[br]que ya tenemos en Wikidata 0:00:43.807,0:00:46.109 y también algunas cosas[br]que vendrán pronto. 0:00:46.932,0:00:50.623 Y los he agrupado[br]en algunos temas generales 0:00:50.623,0:00:53.761 sobre hacer los errores más visibles,[br]hacer que los problemas sean procesables, 0:00:53.762,0:00:56.322 ver mejor los datos para que la gente[br]note los problemas, 0:00:56.945,0:01:02.616 arreglar fuentes comunes de errores,[br]mantener calidad de los datos existentes 0:01:02.616,0:01:03.966 y también la curación humana. 0:01:05.063,0:01:09.874 Y los que están disponibles actualmente[br]comienzan con restricciones de propiedad. 0:01:10.228,0:01:12.421 Así que tal vez ya has visto esto[br]si estás en Wikidata. 0:01:12.422,0:01:14.029 A veces puedes obtener estos íconos 0:01:14.530,0:01:17.241 revisando la consistencia interna[br]de los datos. 0:01:17.242,0:01:20.800 Por ejemplo, si un evento sigue al otro, 0:01:20.801,0:01:23.760 entonces el otro evento debería[br]también ser seguido por este, 0:01:23.761,0:01:27.161 que en el artículo de WikidataCon[br]al parecer faltaba. 0:01:27.162,0:01:29.360 No estoy seguro,[br]esta característica es de unos días. 0:01:30.040,0:01:34.681 Y también, si esto es demasiado limitado[br]o simple para usted, 0:01:34.682,0:01:38.080 puedes escribir cualquier chequeo[br]que quieras usando el servicio de consulta 0:01:38.081,0:01:39.842 que es útil para muchas cosas[br]por supuesto, 0:01:39.843,0:01:44.543 pero también puedes usarlo[br]para encontrar errores. 0:01:44.544,0:01:46.974 Si te diste cuenta[br]de la ocurrencia de un error, 0:01:46.975,0:01:49.709 entonces puedes verificar[br]si hay otros lugares 0:01:49.710,0:01:51.738 donde la gente ha hecho[br]un error muy similar 0:01:51.738,0:01:53.438 y encontrarlo con el Servicio[br]de Consultas. 0:01:53.439,0:01:54.720 También puedes combinar los dos 0:01:54.720,0:01:57.874 y buscar violaciones de restricciones[br]en el Servicio de Consulta, 0:01:57.875,0:02:01.240 por ejemplo,[br]las violaciones en alguna área 0:02:01.241,0:02:03.762 o WikiProject que sea[br]relevante para usted, 0:02:03.762,0:02:06.828 aunque los resultados no están[br]completos actualmente, lamentablemente. 0:02:08.422,0:02:09.877 Hay puntuación de revisión. 0:02:10.540,0:02:12.666 Eso es... creo que esto[br]es de los cambios recientes 0:02:12.667,0:02:16.217 también puedes incluir en tu lista[br]una evaluación automática 0:02:16.217,0:02:20.249 de si es probable que esta edición sea[br]de buena fe o de mala fe 0:02:20.250,0:02:22.312 y si es probable que sea[br]dañino o no dañino, 0:02:22.313,0:02:24.205 creo que esas son las dos dimensiones. 0:02:24.206,0:02:25.686 Entonces puedes, si quieres, 0:02:25.687,0:02:29.898 centrarte en solo mirar las ediciones[br]perjudiciales pero de buena fe. 0:02:29.899,0:02:32.523 Si te sientes particularmente[br]amable y acogedor 0:02:32.524,0:02:37.121 puedes decirle a estos editores,[br]"Gracias por tu contribución, 0:02:37.122,0:02:40.560 así es como deberías haberlo hecho,[br]pero igualmente gracias". 0:02:40.561,0:02:42.186 Y si no te sientes así, 0:02:42.187,0:02:44.452 puedes irte por la mala fe,[br]las ediciones perjudiciales, 0:02:44.453,0:02:45.573 y revertir los vándalos. 0:02:47.544,0:02:49.761 También hay, similar a eso,[br]puntuación de la entidad. 0:02:49.762,0:02:52.590 Entonces, en lugar de anotar una edición,[br]el cambio que hizo, 0:02:52.591,0:02:53.904 puedes puntuar toda la revisión, 0:02:53.904,0:02:56.483 y creo que es la misma medida de calidad 0:02:56.483,0:02:59.863 que Lydia menciona[br]al comienzo de la conferencia. 0:03:00.372,0:03:04.569 Eso da un guión de usuario aquí arriba[br]y te da una puntuación de uno a cinco, 0:03:04.570,0:03:08.176 Creo que trata, de qué calidad[br]es el artículo actual. 0:03:10.043,0:03:14.888 La herramienta de fuentes primarias es[br]para cualquier base de datos 0:03:14.888,0:03:18.064 que quieras importar pero no es de calidad[br]suficiente para agregar a Wikidata, 0:03:18.064,0:03:20.775 entonces a su vez lo agregas[br]a la herramienta de fuentes primarias, 0:03:20.775,0:03:22.956 y luego las personas pueden decidir 0:03:22.956,0:03:26.024 si deben agregar estas declaraciones[br]individuales o no. 0:03:28.595,0:03:31.451 Mostrar coordenadas como mapas[br]principalmente es una característica 0:03:31.451,0:03:34.038 de conveniencia, pero también es[br]útil para el control de calidad. 0:03:34.038,0:03:36.937 Supón que esta es[br]la oficina de Wikimedia en Alemania 0:03:36.938,0:03:39.400 y si las coordenadas están[br]en algún lugar del Océano Índico, 0:03:39.401,0:03:41.529 entonces sabes que algo no está bien 0:03:41.530,0:03:44.790 y puedes verlo mucho más fácil[br]que si solo tuvieras los números. 0:03:46.382,0:03:49.576 Este es un dispositivo llamado[br]el indicador de integridad relativa 0:03:49.577,0:03:52.480 que te muestra este pequeño icono aquí 0:03:53.007,0:03:55.482 diciéndote cuán completo[br]cree que es este artículo 0:03:55.482,0:03:57.613 y también qué propiedades[br]es muy probable que falten, 0:03:57.614,0:03:59.889 lo cual es realmente útil[br]si estás editando un elemento 0:03:59.889,0:04:03.172 y estás en un área[br]con la que no estás muy familiarizado 0:04:03.172,0:04:05.661 y no sabes qué propiedades correctas usar, 0:04:05.662,0:04:08.230 entonces se tiene un dispositivo muy útil. 0:04:09.604,0:04:11.401 Y tenemos Shape Expressions. 0:04:11.402,0:04:15.624 Creo que Andra o José[br]van a hablar más sobre esto 0:04:15.624,0:04:19.547 pero básicamente, es una forma[br]muy poderosa de comparar los datos 0:04:19.547,0:04:20.758 que tienes versus el esquema, 0:04:20.759,0:04:22.910 como qué declaración deberían[br]ciertas entidades tener, 0:04:22.910,0:04:25.677 a qué otras entidades deberían vincularse[br]y cómo deberían ser, 0:04:26.229,0:04:29.374 y así puedes encontrar[br]problemas de esa manera. 0:04:30.366,0:04:32.361 Creo que... No, todavía hay más. 0:04:32.362,0:04:34.321 Panel de integralidad o propiedad. 0:04:34.322,0:04:36.773 Te da una visión general rápida[br]de los datos que ya tienes. 0:04:36.774,0:04:39.147 Por ejemplo, esto es de[br]los pandas rojos de WikiProject, 0:04:39.657,0:04:41.681 y puedes ver que tenemos el sexo 0:04:41.682,0:04:43.561 para casi todos los pandas rojos, 0:04:43.561,0:04:46.854 la fecha de nacimiento varía mucho[br]debido al zoológico del que provienen 0:04:46.854,0:04:50.255 y no tenemos casi ningún panda muerto,[br]lo cual es maravilloso, 0:04:51.437,0:04:52.600 porque son muy lindos. 0:04:53.699,0:04:55.654 Entonces esto también es útil. 0:04:56.377,0:04:59.185 Aquí vamos, bien,[br]con lo que vamos a seguir. 0:04:59.889,0:05:03.784 Puente de Wikidata, o también conocido,[br]antes conocido como edición del cliente, 0:05:03.785,0:05:07.076 así que editar Wikidata desde las cajas[br]de información de Wikipedia 0:05:07.675,0:05:11.635 lo que por un lado se obtendrá[br]más enfoque en los datos 0:05:11.635,0:05:13.441 porque más personas pueden[br]ver los datos allí 0:05:13.441,0:05:18.721 y con suerte alentará más el uso[br]de Wikidata en las Wikipedias 0:05:18.721,0:05:20.620 y eso significa que más personas[br]pueden notar 0:05:20.620,0:05:23.689 si, por ejemplo, algunos datos están[br]desactualizados y necesitan actualizarse 0:05:23.857,0:05:27.000 en lugar de solo verlos en Wikidata. 0:05:28.630,0:05:30.656 También hay referencias corrompidas. 0:05:30.657,0:05:33.959 La idea aquí es que si editas[br]un valor de declaración, 0:05:34.683,0:05:37.169 es posible que también desees[br]actualizar las referencias, 0:05:37.169,0:05:39.373 a menos que solo fuera[br]un error tipográfico o algo así. 0:05:39.897,0:05:43.662 Y estas referencias corrompidas[br]le dicen eso a los editores 0:05:43.663,0:05:49.756 y también que otros editores[br]ven qué otras modificaciones se hicieron 0:05:49.756,0:05:52.471 que editaron un valor de declaración[br]y no actualizaron una referencia 0:05:52.472,0:05:56.766 entonces puedes limpiar después de eso[br]y decidir si eso es... 0:05:57.737,0:05:59.566 ¿Necesitas hacer algo más que eso 0:05:59.566,0:06:02.796 o está realmente bien y no necesitas[br]actualizar la referencia. 0:06:03.543,0:06:09.336 Se relaciona con declaraciones firmadas[br]que vienen de una preocupación, creo, 0:06:09.336,0:06:12.355 que algunos proveedores[br]de datos tienen como... 0:06:14.131,0:06:17.231 Hay una declaración a la que se hace[br]referencia a través de la UNESCO o algo 0:06:17.232,0:06:19.872 y de repente, alguien destroza[br]la declaración 0:06:19.873,0:06:21.836 y se preocupan de que se verá como 0:06:22.827,0:06:26.992 esta organización, como la UNESCO,[br]que aún establece este valor de vandalismo 0:06:26.993,0:06:28.706 y así, con las declaraciones firmadas, 0:06:28.706,0:06:31.488 pueden criptográficamente[br]firmar esta referencia 0:06:31.488,0:06:33.562 y eso no evita ninguna edición, 0:06:34.169,0:06:37.644 pero al menos, si alguien[br]destroza la declaración 0:06:37.644,0:06:40.255 o la edita de cualquier manera,[br]entonces la firma ya no es válida, 0:06:40.255,0:06:43.401 y puedes decir que eso no es exactamente[br]lo que dijo la organización, 0:06:43.402,0:06:47.064 y quizás sea una buena edición y deban[br]volver a firmar la nueva declaración, 0:06:47.065,0:06:49.851 pero también quizás deba revertirse. 0:06:51.203,0:06:54.166 Y también, esto va a ser[br]muy emocionante, creo, 0:06:54.166,0:06:56.846 Citoid es este asombroso sistema[br]que tienen en Wikipedia 0:06:57.379,0:07:01.340 donde puedes pegar una URL,[br]o un identificador, o un ISBN 0:07:01.340,0:07:04.759 o un ID de Wikidata o básicamente[br]cualquier cosa en el editor visual, 0:07:05.260,0:07:08.241 y lanza una referencia[br]que está bien formateada 0:07:08.242,0:07:11.049 y tiene todos los datos que quieres[br]y es maravilloso de usar. 0:07:11.049,0:07:14.337 Y en comparación, en Wikidata,[br]si quiero agregar una referencia 0:07:14.338,0:07:18.711 debo agregar una URL de referencia,[br]título, cadena del nombre del autor, 0:07:18.711,0:07:20.449 lugar de publicación,[br]fecha de publicación, 0:07:20.450,0:07:25.141 fechas de recuperación,[br]al menos esos, y eso es molesto, 0:07:25.141,0:07:29.261 e integrando Citoid en Wikibase[br]se espera a que ayude con eso. 0:07:30.245,0:07:33.604 Y creo que eso es todo lo que tengo, sí. 0:07:33.604,0:07:36.400 Así que, ahora voy a pasarles a Cristina. 0:07:37.788,0:07:42.339 (aplausos) 0:07:43.780,0:07:45.331 (Cristina) Hola, soy Cristina. 0:07:45.331,0:07:47.812 Soy una investigadora científica[br]de la Universidad de Zürich, 0:07:47.812,0:07:51.417 y también soy una miembro activa[br]de la Comunidad Suiza. 0:07:52.698,0:07:57.901 Cuando Claudia Müller-Birn[br]y yo le enviamos esto a WikidataCon, 0:07:57.902,0:08:00.410 lo que queríamos hacer[br]es continuar nuestra discusión 0:08:00.411,0:08:02.424 que empezamos a principios de año 0:08:02.424,0:08:07.442 con un taller sobre calidad de datos[br]y también algunas sesiones en Wikimania. 0:08:07.442,0:08:10.535 Entonces el objetivo de esta charla[br]es básicamente traer algunos pensamientos 0:08:10.536,0:08:14.432 que hemos estado recolectando[br]de la comunidad y de nosotros mismos 0:08:14.432,0:08:16.560 y continuar la discusión. 0:08:16.561,0:08:20.065 Entonces, lo que nos gustaría es continuar[br]interactuando bastante con ustedes. 0:08:21.557,0:08:23.371 Entonces, lo que pensamos[br]es muy importante 0:08:23.372,0:08:27.580 es que le preguntamos continuamente[br]a todo tipo de usuarios en la comunidad 0:08:27.581,0:08:32.020 sobre lo que realmente necesitan,[br]qué problemas tienen con la calidad 0:08:32.020,0:08:35.000 de los datos; no solo a editores,[br]sino además a las personas que codifican, 0:08:35.000,0:08:36.241 o consumen los datos, 0:08:36.242,0:08:39.494 y también a investigadores que usan[br]todo el historial de edición 0:08:39.494,0:08:40.970 para analizar lo que está pasando. 0:08:42.367,0:08:48.431 Así que revisamos alrededor de 80[br]herramientas que existen en Wikidata 0:08:48.431,0:08:52.380 y las alineamos a las diferentes[br]dimensiones de calidad de datos. 0:08:52.380,0:08:54.360 Y lo que vimos fue que en realidad, 0:08:54.361,0:08:57.681 muchas de ellas se enfocan en,[br]monitoreo de integridad, 0:08:57.682,0:09:02.820 pero en realidad... algunas de ellas[br]también habilitan la interconexión. 0:09:02.820,0:09:08.442 Pero hay una gran necesidad[br]de herramientas que busquen la diversidad, 0:09:08.443,0:09:12.824 lo cual es una de las cosas[br]que realmente podemos tener en Wikidata, 0:09:12.824,0:09:15.958 especialmente este principio[br]de diseño de Wikidata 0:09:15.959,0:09:17.901 donde podemos tener pluralidad 0:09:17.902,0:09:20.308 y diferentes declaraciones[br]con diferentes valores 0:09:20.834,0:09:22.236 procedentes de diferentes fuentes. 0:09:22.236,0:09:25.081 Debido a que es una fuente secundaria,[br]realmente no tenemos herramientas 0:09:25.081,0:09:27.750 que nos digan cuántas[br]declaraciones plurales hay, 0:09:27.751,0:09:30.889 y cuántas podemos mejorar y cómo, 0:09:30.890,0:09:32.833 y tampoco sabemos realmente 0:09:32.833,0:09:35.538 cuáles son todas las razones[br]de pluralidad que podemos tener. 0:09:36.491,0:09:39.201 Entonces, de estas reuniones comunitarias, 0:09:39.201,0:09:43.084 lo que discutimos fueron los desafíos[br]que aún necesitan atención. 0:09:43.084,0:09:47.149 Por ejemplo, que tener[br]todas estas comunidades de crowdsourcing 0:09:47.149,0:09:49.613 es muy bueno porque diversas personas[br]atacan diferentes partes 0:09:49.613,0:09:51.833 de los datos o el gráfico, 0:09:51.834,0:09:54.615 y también tenemos[br]conocimiento de fondo diferente 0:09:54.616,0:09:59.161 pero en realidad, es muy difícil alinear[br]todo en algo homogéneo 0:09:59.162,0:10:04.920 porque diversas personas están usando[br]diferentes propiedades de distintas formas 0:10:04.920,0:10:08.401 y también esperan cosas diferentes[br]de las descripciones de entidades. 0:10:09.003,0:10:12.721 La gente también dijo que también[br]necesitan más herramientas 0:10:12.722,0:10:16.000 que den una mejor visión general[br]del estado global de las cosas. 0:10:16.000,0:10:20.733 Entonces, qué entidades faltan[br]en términos de integridad, 0:10:20.733,0:10:26.121 pero además en qué las personas[br]trabajan la mayor parte del tiempo, 0:10:26.121,0:10:30.516 y también mencionan muchas veces[br]una colaboración más estrecha 0:10:30.517,0:10:33.311 a través de, no solo idiomas,[br]sino los WikiProjects 0:10:33.311,0:10:35.571 y las diferentes plataformas de Wikimedia. 0:10:35.571,0:10:38.859 Y publicamos todos[br]los comentarios transcritos 0:10:38.860,0:10:42.959 de todas estas discusiones[br]en esos enlaces aquí en los Etherpads 0:10:42.959,0:10:46.162 y también en la página wiki de Wikimania. 0:10:46.162,0:10:48.481 Algunas soluciones que aparecieron 0:10:48.481,0:10:53.001 iban encaminados en compartir[br]más las mejores prácticas 0:10:53.001,0:10:55.762 que se están desarrollando[br]en diferentes WikiProjects, 0:10:55.762,0:11:01.238 pero también la gente quiere herramientas[br]que ayuden a ordenar el trabajo en equipos 0:11:01.239,0:11:03.845 o al menos entender[br]quién está trabajando en eso, 0:11:03.845,0:11:07.815 y también mencionaron[br]que quieren más vitrinas 0:11:07.816,0:11:12.019 y más plantillas que los ayuden[br]a crear cosas de una mejor manera. 0:11:12.946,0:11:15.161 Y del contacto que tenemos 0:11:15.162,0:11:18.721 con organizaciones de datos[br]gubernamentales abiertos, 0:11:18.722,0:11:20.068 y en particular, 0:11:20.068,0:11:23.102 estoy en contacto con el cantón[br]y la ciudad de Zürich, 0:11:23.102,0:11:26.207 están muy interesados[br]en trabajar con Wikidata 0:11:26.207,0:11:29.896 porque quieren que sus datos[br]sean accesibles para todos 0:11:29.897,0:11:33.681 en el lugar donde va la gente[br]y consulta o accede a los datos. 0:11:33.682,0:11:36.550 Entonces para ellos, algo[br]que sería realmente interesante 0:11:36.551,0:11:38.600 es tener algún tipo[br]de indicadores de calidad 0:11:38.600,0:11:41.082 ambos en wiki, algo que ya sucede, 0:11:41.082,0:11:42.801 y también en los resultados SPARQL, 0:11:42.802,0:11:46.066 para saber si pueden confiar[br]o no en esos datos de la comunidad. 0:11:46.067,0:11:48.230 Y luego, también quieren saber 0:11:48.230,0:11:51.417 qué partes de sus propios conjuntos[br]de datos son útiles para Wikidata 0:11:51.418,0:11:56.040 y les encantaría tener una herramienta[br]que los ayude a evaluarlo automáticamente. 0:11:56.041,0:11:59.066 También necesitan algún tipo[br]de metodología o herramienta 0:11:59.067,0:12:03.894 que les ayude a decidir si deberían[br]importar o vincular sus datos 0:12:03.894,0:12:04.894 porque en algunos casos, 0:12:04.895,0:12:07.567 también tienen sus propios[br]conjuntos de datos abiertos vinculados, 0:12:07.567,0:12:09.746 así que no saben si[br]simplemente ingerir los datos 0:12:09.747,0:12:13.424 o seguir creando enlaces[br]de los conjuntos de datos a Wikidata 0:12:13.425,0:12:14.425 y a la inversa. 0:12:14.950,0:12:20.043 Y también quieren saber a dónde[br]se refieren sus sitios web en Wikidata. 0:12:20.044,0:12:23.361 Y cuando ejecutan tal consulta[br]en el servicio de consulta, 0:12:23.362,0:12:24.848 a menudo obtienen tiempos de espera, 0:12:24.849,0:12:28.181 entonces tal vez deberíamos[br]realmente crear más herramientas 0:12:28.181,0:12:32.240 que les ayude a responder sus preguntas. 0:12:33.148,0:12:36.208 Y además de eso, 0:12:36.208,0:12:39.361 a nosotros, los investigadores de wiki,[br]también a veces 0:12:39.362,0:12:42.023 nos falta algo de información[br]en la edición de resúmenes. 0:12:42.024,0:12:44.953 Entonces me acuerdo de eso cuando[br]estábamos haciendo algo de trabajo 0:12:44.954,0:12:48.919 para comprender el comportamiento[br]diferente de los editores 0:12:48.919,0:12:53.403 con herramientas o robots[br]o usuarios anónimos, etc. 0:12:53.403,0:12:56.154 realmente nos faltaba, por ejemplo, 0:12:56.154,0:13:01.112 una forma estándar para rastrear[br]que las herramientas se usaban. 0:13:01.113,0:13:03.154 Y hay algunas herramientas[br]que ya están haciendo eso 0:13:03.155,0:13:05.230 como PetScan y muchas otras, 0:13:05.230,0:13:07.720 pero tal vez deberíamos en la comunidad 0:13:07.721,0:13:13.531 discutir más sobre cómo grabarlas[br]para una procedencia detallada. 0:13:14.169,0:13:15.321 Y más adelante, 0:13:15.322,0:13:20.801 creemos que necesitamos pensar sobre[br]dimensiones de calidad de datos 0:13:20.802,0:13:24.961 más concretas que se relacionen[br]con los datos del enlace 0:13:24.962,0:13:30.721 pero no todos los tipos de datos,[br]así que trabajamos en algunas medidas 0:13:30.722,0:13:33.751 para acceder a la ganancia de información[br]habilitada por los enlaces, 0:13:33.751,0:13:36.681 y lo que queremos decir es que cuando[br]enlazamos Wikidata a otros conjuntos 0:13:36.682,0:13:38.201 de datos, también deberíamos pensar 0:13:38.202,0:13:41.921 cuánto en realidad están ganando[br]las entidades en la clasificación, 0:13:41.922,0:13:45.601 también en la descripción,[br]pero también en los vocabularios que usan. 0:13:45.602,0:13:51.041 Solo para dar un ejemplo muy simple[br]de lo que quiero decir con esto 0:13:51.042,0:13:54.269 es que podemos pensar en...[br]en este caso, que sería Wikidata 0:13:54.270,0:13:57.771 o el conjunto de datos externos[br]que se vincula a Wikidata, 0:13:57.772,0:14:00.487 tenemos la entidad para una persona[br]que se llama Natasha Noy, 0:14:00.487,0:14:02.601 tenemos la afiliación y otras cosas, 0:14:02.602,0:14:05.239 y luego decimos que sí,[br]nos vinculamos a un lugar externo, 0:14:05.240,0:14:08.919 y esa entidad también tiene ese nombre,[br]pero en realidad tenemos el mismo valor. 0:14:08.920,0:14:12.889 Lo que sería mejor es que lo vinculemos[br]a algo que tenga un nombre distinto, 0:14:12.889,0:14:16.881 eso aún es válido, porque esta persona[br]tiene dos formas de escribir el nombre, 0:14:16.882,0:14:19.714 y también otra información[br]que no tenemos en Wikidata 0:14:19.715,0:14:21.760 o que no tenemos[br]en el otro conjunto de datos. 0:14:22.390,0:14:24.652 Pero además, lo que es aún mejor 0:14:24.653,0:14:27.770 es que en realidad estamos mirando[br]en el conjunto de datos de destino 0:14:27.770,0:14:31.392 que también tienen nuevas formas[br]de clasificar la información. 0:14:31.393,0:14:35.354 Entonces no solo es una persona,[br]sino que en el otro conjunto de datos, 0:14:35.355,0:14:39.525 también dicen que es una mujer o cualquier[br]otra cosa con que la clasifiquen. 0:14:39.526,0:14:43.401 Y si en el otro conjunto de datos,[br]están usando muchos otros vocabularios 0:14:43.402,0:14:46.588 que también ayuda en todo el asunto[br]de recuperación de información. 0:14:47.371,0:14:51.233 Entonces con eso,[br]también me gustaría decir 0:14:51.234,0:14:55.809 que creemos que podemos[br]mostrar mejor las consultas federadas 0:14:55.810,0:15:00.448 porque cuando miramos el registro[br]de consultas brindado por Malyshev et al., 0:15:01.285,0:15:04.301 vemos en realidad[br]que de las consultas orgánicas, 0:15:04.302,0:15:06.921 solo tenemos muy pocas[br]consultas federadas. 0:15:06.922,0:15:12.801 Y en realidad, la federación es una[br]de las ventajas clave de tener datos 0:15:12.802,0:15:16.903 de enlace, entonces quizás la comunidad[br]o las personas que usan Wikidata 0:15:16.903,0:15:18.898 también necesitan más ejemplos de esto. 0:15:18.898,0:15:22.666 Y si miramos la lista de puntos finales[br]que se están usando, 0:15:22.667,0:15:25.401 no es una lista completa[br]y tenemos muchos más. 0:15:25.402,0:15:30.479 Desde luego, estos datos fueron analizados[br]de consultas hasta marzo de 2018, 0:15:30.480,0:15:34.807 pero deberíamos mirar en la lista[br]de puntos finales federados que tenemos 0:15:34.808,0:15:37.048 y ver si realmente[br]los estamos usando o no. 0:15:37.813,0:15:40.441 Dos preguntas que tengo para la audiencia 0:15:40.442,0:15:43.001 que tal vez podamos usar[br]luego para la discusión son: 0:15:43.001,0:15:45.791 qué problemas de calidad de datos[br]debemos abordar en su opinión, 0:15:45.791,0:15:47.412 de acuerdo a las necesidades que tengan, 0:15:47.412,0:15:50.401 pero además, dónde necesitan[br]más automatización 0:15:50.402,0:15:52.943 que los ayude[br]con la edición o la vigilancia. 0:15:53.866,0:15:55.146 Eso es todo, muchas gracias. 0:15:55.779,0:15:57.527 (aplausos) 0:16:06.030,0:16:08.595 (Jose Emilio Labra) Bien,[br]entonces de lo que voy a hablar 0:16:08.595,0:16:14.715 es de algunas herramientas que estábamos[br]desarrollando sobre Shape Expressions. 0:16:15.536,0:16:19.371 Entonces de esto es de lo que quiero[br]hablar... Soy Jose Emilio Labra, 0:16:19.371,0:16:23.215 pero esto... todas estas herramientas[br]han sido hechas por diferentes personas, 0:16:23.920,0:16:28.480 relacionadas principalmente con W3C ShEx,[br]Grupo de Comunidad de Shape Expressions. 0:16:28.481,0:16:29.481 Grupo de Comunidad ShEx. 0:16:30.144,0:16:36.081 La primera herramienta que deseo mencionar[br]es RDFShape, es una herramienta general, 0:16:36.082,0:16:40.681 porque Shape Expressions[br]no es solo para Wikidata, 0:16:40.682,0:16:44.168 las expresiones de forma es un lenguaje[br]para validar RDF en general. 0:16:44.168,0:16:47.568 Entonces, esta herramienta fue[br]desarrollada principalmente por mí 0:16:47.568,0:16:50.880 y es una herramienta[br]para validar RDF en general. 0:16:50.881,0:16:55.139 Entonces, si quieres aprender sobre RDF[br]o quieres validar RDF 0:16:55.140,0:16:58.621 o puntos finales SPARQL[br]no solo en Wikidata, 0:16:58.622,0:17:00.891 mi consejo es que puedes[br]usar esta herramienta. 0:17:00.891,0:17:03.255 También para enseñar. 0:17:03.255,0:17:05.640 Soy profesor en la universidad 0:17:05.641,0:17:09.151 y la uso en mi curso semántico web[br]para enseñar RDF. 0:17:09.161,0:17:12.121 Entonces, si quieres aprender RDF,[br]creo que es una buena herramienta. 0:17:13.033,0:17:17.598 Por ejemplo, esta es una visualización[br]de un gráfico RDF con la herramienta. 0:17:18.587,0:17:22.643 Pero antes de venir aquí,[br]en el último mes, 0:17:22.643,0:17:28.441 empecé una bifurcación de rdfshape[br]específicamente para Wikidata, 0:17:28.443,0:17:33.082 porque pensé... se llama WikiShape y ayer[br]lo presenté como un regalo para Wikidata. 0:17:33.082,0:17:34.441 Entonces lo que tomé es... 0:17:34.442,0:17:39.898 lo que hice fue eliminar todas las cosas[br]que no estaban relacionadas con Wikidata 0:17:39.898,0:17:44.801 y poner varias cosas, codificadas,[br]por ejemplo, el punto final de Wikidata 0:17:44.802,0:17:49.041 SPARQL, pero ahora, alguien me preguntó[br]si pudiera hacerlo también para Wikibase. 0:17:49.042,0:17:52.000 Y también es muy fácil[br]hacerlo para Wikibase. 0:17:52.760,0:17:56.280 Entonces, esta herramienta,[br]WikiShape, es bastante nueva. 0:17:57.015,0:17:59.843 Creo que funciona,[br]la mayoría de las características, 0:17:59.844,0:18:02.468 pero hay algunas características[br]que tal vez no funcionen, 0:18:02.469,0:18:06.281 y si lo intentas y quieres[br]mejorarla, por favor dímelo. 0:18:06.281,0:18:12.680 Estas son capturas [inaudible],[br]pero creo que puedo intentar, veámos. 0:18:15.385,0:18:16.945 Entonces, veamos si funciona. 0:18:16.953,0:18:20.070 Primero, tengo que salir de... 0:18:22.453,0:18:23.453 Aquí. 0:18:24.226,0:18:28.124 De acuerdo, sí. Esta es la herramienta. 0:18:28.124,0:18:29.844 Cosas que puedes hacer con la herramienta, 0:18:29.845,0:18:35.275 por ejemplo, es que puedes[br]comprobar esquemas, esquemas de entidad. 0:18:35.276,0:18:38.611 Sabes que hay un nuevo espacio[br]de nombres que es "E lo que sea", 0:18:38.612,0:18:44.805 así que si comienzas, por ejemplo,[br]escribe por ejemplo "humano"... 0:18:44.806,0:18:48.812 Mientras escribes, su autocompletado[br]te permite verificar, 0:18:48.812,0:18:52.001 por ejemplo, estas son[br]las Shape Expressions de un humano, 0:18:52.790,0:18:55.937 y estas son las Shape Expressions aquí. 0:18:55.938,0:18:59.841 Y como puedes ver,[br]este editor tiene resaltado de sintaxis, 0:18:59.842,0:19:04.559 esto es... bueno,[br]tal vez es muy pequeña, la pantalla. 0:19:05.676,0:19:07.590 Puedo intentar hacerla más grande. 0:19:09.194,0:19:10.973 Quizás lo veas mejor ahora. 0:19:10.973,0:19:14.241 Y este es el editor con resaltado[br]de sintaxis y también tiene... 0:19:14.241,0:19:17.851 Quiero decir, este editor[br]proviene del mismo código fuente 0:19:17.851,0:19:19.641 del servicio de consulta de Wikidata. 0:19:19.642,0:19:23.960 Así que por ejemplo,[br]si pasas el ratón por aquí, 0:19:23.961,0:19:27.961 te muestra las etiquetas[br]de las diferentes propiedades. 0:19:27.962,0:19:31.298 Entonces creo que es muy útil[br]porque ahora los esquemas de entidad 0:19:32.588,0:19:38.601 que están en Wikidata[br]son solo una idea de texto plano, 0:19:38.602,0:19:42.493 y creo que este editor es mucho mejor[br]porque tiene autocompletado 0:19:42.494,0:19:43.743 y también tiene... 0:19:43.744,0:19:48.241 Quiero decir, si tú, por ejemplo,[br]querías agregar una restricción, 0:19:48.241,0:19:51.570 dices "wdt:" 0:19:51.570,0:19:56.884 Empiezas a escribir "autor"[br]y luego haces clic en Ctrl + Espacio 0:19:56.884,0:19:58.922 y te sugiere las diferentes cosas. 0:19:58.922,0:20:02.388 Entonces esto es similar[br]al servicio de consulta de Wikidata 0:20:02.389,0:20:06.445 pero específicamente[br]para Shape Expressions 0:20:06.445,0:20:11.975 porque lo que siento es que crear[br]Shape Expressions 0:20:11.976,0:20:15.841 no es más difícil[br]que escribir consultas SPARQL. 0:20:15.842,0:20:21.255 Entonces algunas personas piensan[br]que está al mismo nivel, 0:20:22.278,0:20:26.296 Probablemente sea más fácil, creo,[br]porque Shape Expressions era, 0:20:26.296,0:20:31.241 cuando lo diseñamos, lo hicimos[br]para que fuera más fácil de trabajar. 0:20:31.242,0:20:35.001 Bien, esta es una de las primeras cosas,[br]que tienes este editor 0:20:35.001,0:20:36.620 para Shape Expressions. 0:20:37.371,0:20:41.467 Y luego también tienes la posibilidad,[br]por ejemplo, de visualizar. 0:20:41.468,0:20:44.801 Si tienes un Shape Expression,[br]usar por ejemplo... 0:20:44.802,0:20:49.386 Creo, "trabajo escrito" es[br]un buen Shape Expression 0:20:49.386,0:20:53.300 porque tiene algunas relaciones[br]entre diferentes cosas. 0:20:54.823,0:20:58.160 Y esta es la visualización UML[br]del trabajo escrito. 0:20:58.161,0:21:02.090 En un UML, es fácil ver[br]las diferentes propiedades. 0:21:02.790,0:21:06.794 Cuando haces esto, me di cuenta[br]cuando intenté con varias personas, 0:21:06.795,0:21:09.216 que encuentran algunos errores[br]en sus Shape Expressions 0:21:09.217,0:21:12.988 porque es fácil detectar cuáles son[br]las propiedades faltantes o lo que sea. 0:21:13.588,0:21:15.771 Entonces hay otra posibilidad aquí 0:21:15.772,0:21:19.520 es que también puedes validar,[br]creo que lo tengo aquí, la validación. 0:21:20.496,0:21:25.285 Creo que lo tenía en alguna etiqueta,[br]tal vez lo cerré. 0:21:26.267,0:21:30.988 Bien, pero puedes, por ejemplo,[br]puedes hacer clic aquí, Validar entidades. 0:21:32.308,0:21:34.232 Tú, por ejemplo, 0:21:35.404,0:21:41.921 "q42" con "e42", que es el autor. 0:21:42.818,0:21:46.180 Con "humano", creo que podemos[br]hacerlo con "humanos". 0:21:49.050,0:21:50.050 Y luego es... 0:21:50.688,0:21:56.365 Y está tomando un poco de tiempo hacerlo[br]porque está haciendo las consultas SPARQL 0:21:56.365,0:21:59.134 y ahora, por ejemplo,[br]está fallando por la red pero... 0:21:59.657,0:22:01.580 Puedes probarlo. 0:22:02.759,0:22:07.026 Bien, continuemos con la presentación,[br]con otras herramientas. 0:22:07.026,0:22:12.353 Así que que si quieres probarlo[br]y quieres algún comentario, házmelo saber. 0:22:13.133,0:22:15.540 Entonces para continuar[br]con la presentación... 0:22:18.923,0:22:20.233 Entonces esto es WikiShape. 0:22:23.800,0:22:26.509 Bien, ya dije esto, 0:22:27.681,0:22:34.157 el editor de Shape Expressions[br]es un proyecto independiente en GitHub. 0:22:35.605,0:22:37.472 Puedes usarlo en tu propio proyecto. 0:22:37.472,0:22:41.036 Si quieres hacer una herramienta[br]de Shape Expressions, 0:22:41.036,0:22:45.635 puedes incrustarlo[br]en cualquier otro proyecto, 0:22:45.636,0:22:48.235 está en GitHub y puedes usarlo. 0:22:48.868,0:22:51.970 El mismo autor, es uno de mis alumnos, 0:22:52.684,0:22:55.534 él también creó[br]un editor para Shape Expressions, 0:22:55.534,0:22:57.799 también inspirado por el servicio[br]de consulta de Wikidata 0:22:57.800,0:23:00.681 donde, en una columna, 0:23:00.682,0:23:05.103 tienes este editor más visual[br]de consultas SPARQL 0:23:05.104,0:23:07.135 donde puedes poner este tipo de cosas. 0:23:07.136,0:23:09.123 Esta es una captura de pantalla. 0:23:09.123,0:23:12.662 Puedes ver que esas son[br]las Shape Expressions en el texto 0:23:12.662,0:23:17.822 pero es una forma de Shape Expressions[br]donde tal vez tome un poco más de tiempo 0:23:18.595,0:23:23.400 donde puedes poner las diferentes filas[br]en los diferentes campos. 0:23:23.401,0:23:25.800 Luego está ShExEr. 0:23:26.879,0:23:31.882 Tenemos que... Lo hizo un estudiante[br]de doctorado de la universidad de Oviedo 0:23:31.883,0:23:34.080 y él está aquí,[br]así que puedes presentar ShExEr. 0:23:38.147,0:23:40.024 (Danny) Hola, soy Danny Fernández, 0:23:40.025,0:23:43.340 Soy un estudiante de doctorado[br]de la Universidad de Oviedo 0:23:43.340,0:23:44.710 y trabajo con Labra. 0:23:44.710,0:23:47.725 Ya que hay poco tiempo,[br]hagamos esto rápido, 0:23:47.726,0:23:52.641 no tomemos ninguna demostración real,[br]solo con algunas capturas de pantalla. 0:23:52.642,0:23:57.897 La forma habitual de trabajar[br]con Shape Expressions o cualquier lenguaje 0:23:57.897,0:23:59.521 es que tienes un experto en dominios 0:23:59.522,0:24:02.313 que define a priori[br]cómo debería verse el gráfico, 0:24:02.314,0:24:03.555 define algunas estructuras, 0:24:03.556,0:24:06.983 y luego usas estas estructuras[br]para validar los datos reales con él. 0:24:08.124,0:24:11.641 Esta herramienta, que es tan buena como[br]la que Labra ha estado presentando, 0:24:11.642,0:24:14.441 es una herramienta de uso general[br]para cualquier fuente RDF, 0:24:14.442,0:24:17.375 está diseñada para hacer lo contrario. 0:24:17.376,0:24:18.758 Ya tienes algunos datos, 0:24:18.759,0:24:23.165 selecciona de qué nodos[br]quieres tener la forma 0:24:23.165,0:24:26.718 y luego automáticamente[br]extrae o infiere la forma. 0:24:26.719,0:24:29.791 Aunque esta es una herramienta[br]de propósito general, 0:24:29.791,0:24:34.063 lo que hicimos para esta WikidataCon[br]es este botón elegante 0:24:34.884,0:24:37.081 que si haces clic en él,[br]esencialmente lo que pasa 0:24:37.081,0:24:42.079 es que hay tantos[br]parámetros de configuraciones 0:24:42.080,0:24:46.251 y lo configura para funcionar[br]con el punto final de Wikidata 0:24:46.251,0:24:47.971 y terminará pronto, lo siento. 0:24:48.733,0:24:52.883 Una vez que presionas este botón[br]lo que obtienes es esencialmente esto. 0:24:52.884,0:24:55.126 Después de haber seleccionado[br]qué tipo de nodos, 0:24:55.127,0:24:59.360 qué tipo de instancias de nuestra clase,[br]lo que sea que estés buscando, 0:24:59.361,0:25:01.321 obtienes un esquema automático. 0:25:02.319,0:25:07.111 Todas las restricciones están ordenadas[br]por cuántos nodos se ajusten a él, 0:25:07.112,0:25:09.772 puedes filtrar los menos comunes, etc. 0:25:09.772,0:25:12.126 Hay un cartel abajo de estas cosas 0:25:12.127,0:25:14.595 y bueno, estaré abajo y arriba 0:25:14.596,0:25:16.454 y por todo el lugar todo el día, 0:25:16.455,0:25:19.081 así que si tienes más interés[br]en esta herramienta, 0:25:19.082,0:25:21.476 solo háblame durante este viaje. 0:25:21.477,0:25:24.624 Y ahora, le devolveré[br]el micrófono a Labra, gracias. 0:25:24.625,0:25:29.265 (aplausos) 0:25:29.812,0:25:32.578 (Jose) Bien, continuemos[br]con las otras herramientas. 0:25:32.579,0:25:34.984 La otra herramienta es ShapeDesigner. 0:25:34.984,0:25:37.241 Andra, ¿quieres hacer[br]el ShapeDesigner ahora 0:25:37.242,0:25:39.287 o tal vez más tarde o en el taller? 0:25:39.287,0:25:40.603 Hay un taller... 0:25:40.603,0:25:44.437 Esta tarde hay un taller específicamente[br]para Shape Expressions, y... 0:25:45.265,0:25:47.939 La idea es que iba a practicarse más, 0:25:47.940,0:25:52.324 y si quieres practicar[br]un poco de ShEx, puedes hacerlo allí. 0:25:52.875,0:25:55.720 Esta herramienta es ShEx...[br]y ahí está Eric, 0:25:55.721,0:25:56.890 así que puedes presentarla. 0:25:57.969,0:26:00.687 (Eric) Así que rápidamente,[br]lo que quiero decir 0:26:00.687,0:26:05.711 es que probablemente[br]ya has visto la interfaz de ShEx 0:26:05.711,0:26:07.601 está hecho para Wikidata. 0:26:07.602,0:26:12.930 Está efectivamente despojado[br]y diseñado específicamente para Wikidata, 0:26:12.930,0:26:17.667 el genérico tiene más características[br]pero pensé que ya lo había mencionado 0:26:17.667,0:26:19.977 porque una de esas características[br]es particularmente útil 0:26:19.978,0:26:23.201 para depurar esquemas de Wikidata, 0:26:23.201,0:26:29.224 la cual es que si vas[br]y seleccionas el modo de sorber, 0:26:29.225,0:26:31.444 lo que hace es decir[br]mientras estoy validando, 0:26:31.445,0:26:34.694 quiero derribar todos los triples[br]y eso significa 0:26:34.695,0:26:36.274 que si tengo un montón de fallas, 0:26:36.275,0:26:39.586 puedo pasar y empezar a buscar[br]esas fallas y decir, 0:26:39.587,0:26:41.800 cuáles son los triples que están aquí, 0:26:41.801,0:26:44.120 lo siento, los triples están aquí abajo, 0:26:44.121,0:26:45.757 esto es solo un registro de lo que pasó. 0:26:46.327,0:26:49.180 Luego puedes sentarte allí[br]y jugar con él en tiempo real 0:26:49.181,0:26:51.033 como si jugaras con algo que cambia. 0:26:51.033,0:26:54.160 Es una versión más rápida[br]para hacer todo eso. 0:26:55.201,0:26:56.481 Este es un formulario de ShExC, 0:26:56.482,0:26:59.455 esto es algo que [Joachim] había sugerido 0:27:00.035,0:27:04.631 podría ser útil para poblar[br]documentos de Wikidata 0:27:04.631,0:27:07.338 basados en una Shape Expression[br]para ese documento. 0:27:08.095,0:27:11.681 Esto no está diseñado para Wikidata, 0:27:11.682,0:27:13.981 pero es solo para decir[br]que puedes tener un esquema 0:27:13.981,0:27:15.402 y puedes tener algunas anotaciones 0:27:15.403,0:27:17.518 y decir específicamente cómo quiero[br]hacer ese esquema 0:27:17.519,0:27:19.031 y luego se construye un formulario, 0:27:19.031,0:27:21.191 y si tienes datos,[br]se puede llenar el formulario. 0:27:24.517,0:27:26.164 PyShEx [inaudible]. 0:27:28.025,0:27:31.080 (Jose) Creo que este es el último. 0:27:31.821,0:27:34.080 Sí, el último es PyShEx. 0:27:34.675,0:27:38.151 PyShEx es una implementación Python[br]de Shape Expressions, 0:27:39.193,0:27:42.680 puedes jugar también con Jupyter Notebooks[br]si quieres ese tipo de cosas. 0:27:42.680,0:27:44.432 Bien, eso es todo de esto. 0:27:44.433,0:27:47.170 (aplausos) 0:27:52.916,0:27:57.073 (Andra) Voy a hablar sobre un proyecto[br]específico en el que estoy involucrado 0:27:57.074,0:27:58.074 llamado Gene Wiki, 0:27:58.075,0:28:04.596 y donde también estamos[br]lidiando con problemas de calidad. 0:28:04.597,0:28:06.684 Pero antes de entrar en la calidad, 0:28:06.685,0:28:09.229 una introducción rápida[br]sobre qué es Gene Wiki, 0:28:09.855,0:28:15.175 y recientemente lanzamos una preimpresión[br]de un artículo que acabamos de escribir 0:28:15.175,0:28:18.160 que explica los detalles del proyecto. 0:28:19.821,0:28:23.839 Veo gente tomando fotos,[br]pero básicamente, lo que hace Gene Wiki, 0:28:23.846,0:28:28.027 es tratar de obtener datos biomédicos,[br]datos públicos en Wikidata, 0:28:28.028,0:28:32.200 y seguimos un patrón específico[br]para obtener esos datos en Wikidata. 0:28:33.130,0:28:36.809 Y cuando tenemos un nuevo repositorio[br]o un nuevo conjunto de datos 0:28:36.810,0:28:39.390 que puede ser incluido en Wikidata, 0:28:39.390,0:28:41.403 el primer paso es la participación[br]de la comunidad. 0:28:41.403,0:28:43.784 No es necesario dirigirse[br]a una comunidad de Wikidata 0:28:43.785,0:28:46.120 sino a una comunidad[br]de investigación local, 0:28:46.121,0:28:50.286 y nos encontramos en persona[br]o en línea o en cualquier plataforma 0:28:50.286,0:28:52.881 e intentar crear un modelo de datos 0:28:52.882,0:28:56.197 que unan sus datos[br]con el modelo de Wikidata. 0:28:56.197,0:28:59.944 Aquí tengo una foto de un taller[br]que se hizo aquí el año pasado 0:28:59.945,0:29:02.663 donde se trataba de ver[br]un conjunto de datos específico 0:29:02.663,0:29:05.280 y, bueno, ves muchas discusiones, 0:29:05.281,0:29:09.780 luego alineándolo con schema.org[br]y otras ontologías que hay por ahí. 0:29:10.320,0:29:15.508 Luego, al final del primer paso, tenemos[br]un dibujo en pizarra del esquema 0:29:15.509,0:29:17.336 que queremos implementar en Wikidata. 0:29:17.337,0:29:20.440 Lo que ves allí, es claro, 0:29:20.441,0:29:21.766 lo tenemos al fondo, 0:29:21.767,0:29:25.240 incluso hoy podemos hacer[br]algunos esquemas dentro de este panel. 0:29:26.560,0:29:28.399 Una vez que tengamos[br]el esquema en su lugar, 0:29:28.400,0:29:31.320 lo siguiente es intentar hacer[br]ese esquema legible por la máquina 0:29:32.358,0:29:36.841 porque quieres tener modelos accionables[br]para unir los datos que traes 0:29:36.842,0:29:39.690 de cualquier base de datos[br]biomédica en Wikidata. 0:29:40.393,0:29:45.182 Y aquí estamos aplicando[br]Shape Expressions. 0:29:46.471,0:29:52.518 Y usamos eso porque Shape Expressions[br]te permite probar 0:29:52.518,0:29:57.040 si el conjunto de datos en realidad...[br]no, para ver primero 0:29:57.041,0:30:01.782 si los datos ya existentes en Wikidata[br]siguen el mismo modelo de datos 0:30:01.783,0:30:04.718 que se logró en el proceso anterior. 0:30:04.719,0:30:06.641 Entonces, con Shape Expression[br]podemos verificar: 0:30:06.642,0:30:10.926 los datos que están en este tema[br]en Wikidata, ¿necesitan algo de limpieza 0:30:10.926,0:30:15.013 o necesitamos adaptar nuestro modelo[br]al modelo de Wikidata o viceversa? 0:30:15.937,0:30:19.867 Una vez que esté en su lugar[br]y comenzamos a escribir robots, 0:30:20.670,0:30:23.801 y los robots están sembrando[br]la información 0:30:23.802,0:30:27.308 que está en las fuentes primarias[br]de Wikidata. 0:30:27.846,0:30:29.303 Y cuando los robots estén listos, 0:30:29.304,0:30:33.001 escribimos estos robots[br]con una plataforma llamada... 0:30:33.002,0:30:36.201 con una biblioteca de Python[br]llamada integrador de Wikidata 0:30:36.202,0:30:38.167 que salió de nuestro proyecto. 0:30:38.698,0:30:42.921 Una vez que tengamos nuestros robots,[br]usamos una plataforma llamada Jenkins 0:30:42.921,0:30:44.540 para una integración continua. 0:30:44.540,0:30:45.762 Y con Jenkins, 0:30:45.762,0:30:51.160 actualizamos continuamente[br]las fuentes primarias con Wikidata. 0:30:52.178,0:30:55.889 Este es un diagrama para el artículo[br]que mencioné previamente. 0:30:55.890,0:30:57.241 Este es nuestro panorama actual. 0:30:57.242,0:31:02.059 Cada caja naranja de ahí[br]es una fuente primaria de drogas, 0:31:02.060,0:31:07.827 proteínas, genes, enfermedades,[br]compuestos químicos con interacción, 0:31:07.827,0:31:10.870 y este modelo es[br]demasiado pequeño para leer 0:31:10.870,0:31:17.472 pero esta es la base de datos,[br]las fuentes que gestionamos en Wikidata 0:31:17.473,0:31:20.560 y se unen con las fuentes primarias. 0:31:20.561,0:31:22.355 Este es el flujo de trabajo. 0:31:22.870,0:31:25.312 Uno de nuestros socios[br]es la ontología de la enfermedad 0:31:25.312,0:31:27.672 la ontología de la enfermedad[br]es una ontología CC0, 0:31:28.179,0:31:31.990 y la ontología CC0[br]tiene un ciclo propio de curación, 0:31:32.756,0:31:35.736 ellos continuamente actualizan[br]la ontología de la enfermedad 0:31:35.737,0:31:39.687 para reflejar el espacio de la enfermedad[br]o la interpretación de enfermedades. 0:31:40.336,0:31:44.361 Ahí está también el ciclo de curación[br]de Wikidata en enfermedades 0:31:44.362,0:31:49.844 donde la comunidad de Wikidata[br]monitorea lo que ocurre en Wikidata. 0:31:50.406,0:31:51.601 Y luego tenemos dos roles, 0:31:51.602,0:31:55.477 los llamamos coloquialmente[br]el portero guardián, 0:31:56.009,0:31:59.561 este éramos un colega y yo hace cinco años 0:31:59.562,0:32:03.414 y nos sentábamos en nuestras computadoras[br]a monitorear Wikipedia y Wikidata, 0:32:03.415,0:32:08.601 si había un problema que fuera[br]reportado a la comunidad primaria, 0:32:08.602,0:32:11.765 las fuentes primarias, miraban[br]la implementación y decidían: 0:32:11.765,0:32:14.240 ¿confiamos en la entrada de Wikidata? 0:32:14.850,0:32:18.555 Sí... entonces se considera,[br]y entra en el ciclo, 0:32:18.555,0:32:22.686 y la próxima iteración es parte[br]de la ontología de la enfermedad 0:32:22.687,0:32:25.411 y se retroalimentaba a Wikidata. 0:32:27.419,0:32:31.480 Estamos haciendo lo mismo en WikiPathways. 0:32:31.481,0:32:36.601 WikiPathways es una ruta inspirada[br]en MediaWiki y un repositorio de la ruta. 0:32:36.602,0:32:40.901 La misma historia, ya hay diferentes[br]recursos de ruta en Wikidata. 0:32:41.463,0:32:44.713 Puede haber conflictos[br]entre esos recursos de ruta 0:32:44.722,0:32:46.701 y estos conflictos se reportan de nuevo 0:32:46.702,0:32:49.521 por los porteros guardianes[br]a esa comunidad, 0:32:49.522,0:32:53.715 y tú mantienes[br]los ciclos de curación individual. 0:32:53.715,0:32:57.068 Pero si recuerdas el ciclo anterior, 0:32:57.069,0:33:03.041 aquí solo mencioné dos ciclos,[br]dos recursos, 0:33:03.566,0:33:06.300 tenemos que hacer eso[br]para cada recurso que tenemos 0:33:06.300,0:33:08.061 y tenemos que gestionar lo que ocurre 0:33:08.062,0:33:09.185 porque cuando digo curación, 0:33:09.185,0:33:11.787 Realmente me refiero a ir[br]a las páginas principales de Wikipedia, 0:33:11.787,0:33:14.544 entrar en las páginas principales[br]de Wikidata y tratar de hacer eso. 0:33:14.545,0:33:19.316 Eso no pesa para los dos porteros[br]guardianes que tuvimos. 0:33:19.860,0:33:22.777 Cuando estaba en una conferencia en 2016 0:33:22.778,0:33:26.933 donde Eric hizo una presentación[br]de Shape Expressions, 0:33:26.934,0:33:29.277 salté al carro y dije bien, 0:33:29.278,0:33:34.240 Shape Expressions puede ayudarnos[br]a detectar qué diferencias hay en Wikidata 0:33:34.240,0:33:41.159 y eso permite que los porteros guardianes[br]tengan informes más eficazes que reportar. 0:33:42.275,0:33:46.019 Entonces este año, estaba encantado[br]con la entidad del esquema 0:33:46.020,0:33:50.765 porque ahora, podemos almacenar[br]esos esquemas de entidad en Wikidata, 0:33:50.765,0:33:53.183 en el mismo Wikidata,[br]mientras que antes estaban en GitHub, 0:33:53.860,0:33:56.815 y esto se alinea[br]con la interfaz de Wikidata, 0:33:56.816,0:33:59.350 entonces tienes cosas[br]como discusiones de documentos 0:33:59.350,0:34:00.762 pero también tienes revisiones. 0:34:00.763,0:34:05.261 Puedes aprovechar las páginas principales[br]y las revisiones en Wikidata 0:34:05.262,0:34:12.255 y usar eso para discutir[br]sobre lo que hay en Wikidata 0:34:12.255,0:34:14.060 y qué hay en las fuentes primarias. 0:34:14.966,0:34:19.686 Entonces, lo que Eric acaba de presentar,[br]ya es un gran beneficio. 0:34:19.686,0:34:24.335 Así que aquí, creamos una Shape Expression[br]para el gen humano, 0:34:24.336,0:34:30.225 y luego lo ejecutamos en ShEx simple,[br]tal como puedes ver, 0:34:30.225,0:34:32.428 ya tenemos... 0:34:32.429,0:34:34.641 Hay un problema que necesita[br]ser monitoreado 0:34:34.642,0:34:37.316 es que hay un elemento[br]que no encaja en ese esquema, 0:34:37.316,0:34:43.139 y entonces ya puedes crear informes[br]de curación de entidades de esquema 0:34:43.140,0:34:46.240 basados en... y enviar eso[br]a los diferentes informes de curación. 0:34:48.058,0:34:52.788 Pero ShEx.js es una interfaz integrada, 0:34:52.788,0:34:55.860 y si puedo mostrar aquí, solo hago diez, 0:34:55.860,0:35:00.362 pero tenemos decenas de miles,[br]y eso nuevamente no pesa. 0:35:00.362,0:35:04.654 Entonces, ahora el integrador de Wikidata[br]también es compatible con ShEx, 0:35:05.168,0:35:07.431 y luego podemos enlazar[br]bucles de elementos 0:35:07.431,0:35:11.494 donde decimos sí-no, sí-no,[br]verdadero-falso, verdadero-falso. 0:35:11.495,0:35:12.495 Así que de nuevo, 0:35:13.065,0:35:16.514 aumentamos un poco la eficiencia[br]de lidiar con los informes. 0:35:17.256,0:35:22.662 Pero ahora, recientemente, se construye[br]en el servicio de consultas de Wikidata, 0:35:23.181,0:35:24.998 y bueno, recientemente[br]hemos ido acelerando 0:35:24.999,0:35:26.560 así que de nuevo, eso no pesa. 0:35:26.561,0:35:31.391 Aún es un proceso continuo,[br]el cómo lidiar con modelos en Wikidata. 0:35:32.202,0:35:36.682 Y de nuevo, ShEx no solo es intimidante 0:35:36.683,0:35:40.356 sino que también la escala es[br]demasiado grande para tratarla. 0:35:41.068,0:35:46.081 Así que empecé a trabajar, esta es[br]mi primera prueba de concepto o ejercicio 0:35:46.082,0:35:47.680 donde usé una herramienta llamada yED, 0:35:48.184,0:35:52.590 y empecé a dibujar[br]esas Shape Expressions porque... 0:35:52.591,0:35:58.098 y luego regenero este esquema 0:35:58.099,0:36:01.279 en este formato adyacente[br]de Shape Expressions, 0:36:01.280,0:36:04.520 así que eso ya se abriría a la audiencia 0:36:04.521,0:36:07.432 que está intimidada[br]por los lenguajes de Shape Expressions. 0:36:07.961,0:36:12.308 Pero en realidad, hay un problema[br]con esas descripciones visuales 0:36:12.309,0:36:18.229 porque también es un esquema[br]que fue dibujado en yEd por alguien. 0:36:18.230,0:36:23.838 Y aquí hay otro que es hermoso. 0:36:23.838,0:36:29.414 Me encantaría tenerlo en mi pared,[br]pero aún no es interoperable. 0:36:30.281,0:36:32.131 Así que quiero terminar mi charla con, 0:36:32.131,0:36:35.732 y la primera vez, me he estado robando[br]esta diapositiva, usando esta diapositiva. 0:36:35.732,0:36:37.594 Es un honor tenerlo en la audiencia 0:36:37.595,0:36:39.423 y realmente me gusta esto: 0:36:39.424,0:36:42.362 "La gente piensa que RDF es una molestia[br]porque es complicado. 0:36:42.362,0:36:43.985 La verdad es aún peor, es tan simple, 0:36:45.581,0:36:48.133 porque tienes que trabajar[br]con problemas de datos del mundo real 0:36:48.134,0:36:50.031 que son terriblemente complicados. 0:36:50.031,0:36:51.451 Si bien puedes evitar RDF, 0:36:51.451,0:36:55.760 es más difícil evitar datos complicados[br]y problemas informáticos complicados". 0:36:55.761,0:36:59.535 Esto es sobre RDF, pero creo[br]que también aplica al modelado. 0:37:00.112,0:37:02.769 Entonces, mi punto de discusión[br]es si realmente... 0:37:03.387,0:37:05.882 ¿Cómo iniciamos el modelado? 0:37:05.882,0:37:10.826 ¿Deberíamos discutir sobre ShEx,[br]o modelos visuales o...? 0:37:11.426,0:37:13.271 ¿Cómo continuamos? 0:37:13.474,0:37:14.840 Muchas gracias por tu tiempo. 0:37:15.102,0:37:17.787 (aplausos) 0:37:20.001,0:37:21.188 (Lydia) Muchas gracias. 0:37:21.692,0:37:24.001 ¿Vendrían aquí delante 0:37:24.002,0:37:27.741 para que podamos iniciar[br]con las preguntas de la audiencia? 0:37:28.610,0:37:30.203 ¿Hay preguntas? 0:37:31.507,0:37:32.507 Sí. 0:37:34.253,0:37:36.890 Y creo que, para la cámara, necesitamos... 0:37:38.835,0:37:40.968 (Lydia riendo) Sí. 0:37:43.094,0:37:46.273 (persona 3) Una pregunta[br]para Cristina, creo. 0:37:47.366,0:37:51.641 Mencionaste el término[br]"ganancia de información" 0:37:51.642,0:37:53.689 y vincularse con otros sistemas. 0:37:53.690,0:37:55.460 Hay una medida teórica de la información 0:37:55.460,0:37:58.101 que usa estadística y probabilidad[br]llamada ganancia de información. 0:37:58.101,0:37:59.541 ¿Tienes el mismo... 0:37:59.542,0:38:01.736 Quiero decir, ¿querías decir[br]exactamente esa medida, 0:38:01.736,0:38:04.173 la ganancia de información[br]de la teoría de la probabilidad 0:38:04.174,0:38:05.420 de la teoría de la información 0:38:05.420,0:38:09.024 o simplemente usar esta cosa conceptual[br]para medir la ganancia de información? 0:38:09.025,0:38:13.016 No, definimos e implementamos medidas 0:38:13.695,0:38:20.161 que usan la entropía de Shannon,[br]así que se entiende así. 0:38:20.162,0:38:22.596 No quise entrar en detalles[br]de las fórmulas concretas... 0:38:22.596,0:38:24.977 (persona 3) No, no, por supuesto,[br]por eso hice la pregunta. 0:38:24.978,0:38:26.818 - (Cristina) Pero, sí...[br]- (persona 3) Gracias. 0:38:33.091,0:38:35.047 (persona 4) Más un comentario[br]que una pregunta. 0:38:35.048,0:38:36.241 (Lydia) Dilo. 0:38:36.242,0:38:39.840 (persona 4) Ha habido[br]mucho enfoque a nivel de elemento 0:38:39.840,0:38:42.547 sobre calidad e integridad, 0:38:42.547,0:38:47.374 una de las cosas que me preocupa es[br]que no aplicamos lo mismo a las jerarquías 0:38:47.374,0:38:51.480 y creo que tenemos un problema, es que,[br]nuestra jerarquía a veces no es buena. 0:38:51.481,0:38:53.463 Vemos que va a ser un problema real 0:38:53.464,0:38:55.774 con la búsqueda de Commons y otras cosas. 0:38:56.771,0:39:00.601 Una de las habilidades que podemos[br]hacer es importar externos... 0:39:00.602,0:39:04.842 La forma en que los tesauros externos[br]estructuran sus jerarquías, 0:39:04.842,0:39:10.291 utilizando el calificador P4900[br]de concepto más amplio. 0:39:11.037,0:39:16.167 Pero lo que creo sería muy útil,[br]serían mejores herramientas que hagan eso 0:39:16.168,0:39:21.212 que puedan importar una jerarquía[br]de tesauros externos 0:39:21.212,0:39:24.111 y que la mapee en nuestros[br]elementos de Wikidata. 0:39:24.111,0:39:28.199 Una vez que esté en su lugar[br]con esos calificadores P4900, 0:39:28.200,0:39:31.494 puedes hacer buenas consultas[br]a través de SPARQL 0:39:32.490,0:39:37.534 para ver dónde nuestra jerarquía[br]diverge de esa jerarquía externa. 0:39:37.534,0:39:41.346 Por ejemplo, [Paula Morma],[br]usuario de PKM, tal vez sepas, 0:39:41.346,0:39:43.533 ella trabaja mucho en la moda. 0:39:43.533,0:39:50.524 Así que lo usamos para atraer la jerarquía[br]de tesauros de la moda europea 0:39:50.524,0:39:53.812 y la jerarquía Getty AAT[br]de tesauros de la moda, 0:39:53.812,0:39:57.957 y luego ver dónde estaban los huecos[br]en nuestros elementos de nivel superior, 0:39:57.957,0:40:00.511 lo cual es un problema real[br]para nosotros porque a menudo, 0:40:00.511,0:40:04.355 estas son cosas que solo existen[br]en páginas de desambiguación en Wikipedia, 0:40:04.356,0:40:09.270 así que nos faltan muchos elementos[br]de nivel superior en nuestras jerarquías 0:40:09.271,0:40:14.480 y es algo que debemos abordar[br]en términos de calidad e integridad, 0:40:14.480,0:40:15.971 pero lo que realmente ayudaría 0:40:16.643,0:40:20.871 serían mejores herramientas que la jungla[br]de guiones de extracción que escribí... 0:40:20.872,0:40:26.010 Si alguien pudiera poner eso[br]en una libreta PAWS de Python 0:40:26.561,0:40:31.972 para poder tomar un tesauro externo,[br]tomar su jerarquía, 0:40:31.973,0:40:34.595 que bien puede estar disponible[br]como datos vinculados o no, 0:40:35.379,0:40:40.580 y luego ponerlos en QuickStatements[br]para ponerlos en valores P4900. 0:40:41.165,0:40:42.165 Y luego, 0:40:42.166,0:40:44.527 cuando nuestra representación[br]se vuelva más completa, 0:40:44.528,0:40:49.691 se actualicen esos P4900 porque a medida[br]que a nuestra representación 0:40:49.691,0:40:51.590 se le pone fecha, se vuelve más densa, 0:40:51.590,0:40:55.377 los valores de estos calificadores[br]necesitan cambiar 0:40:56.230,0:40:59.526 para representar que tenemos más[br]de su jerarquía en nuestro sistema. 0:40:59.526,0:41:03.728 Si alguien pudiera hacer eso,[br]creo que sería muy útil, 0:41:03.728,0:41:07.121 y necesitamos también mirar otros enfoques 0:41:07.122,0:41:10.762 para mejorar la calidad[br]y la integridad a nivel jerárquico 0:41:10.763,0:41:12.378 no solo a nivel de elemento. 0:41:13.308,0:41:14.840 (Andra) ¿Puedo agregar a eso? 0:41:16.362,0:41:19.901 Sí, y de hecho hacemos eso, 0:41:19.911,0:41:23.551 y puedo recomendar mirar[br]la Shape Expression que hizo Finn 0:41:23.552,0:41:27.330 con los datos léxicos[br]donde crea Shape Expressions 0:41:27.330,0:41:29.640 y luego construye[br]en otras Shape Expressions 0:41:29.641,0:41:32.608 entonces tienes este concepto de Shape[br]Expressions vinculados en Wikidata, 0:41:32.608,0:41:35.005 y específicamente, el caso de uso,[br]si entiendo correctamente, 0:41:35.006,0:41:37.183 es exactamente lo que estamos[br]haciendo en Gene Wiki. 0:41:37.184,0:41:40.841 Tienes la ontología de la enfermedad[br]que se pone en Wikidata 0:41:40.842,0:41:44.681 y luego entran los datos de la enfermedad[br]y aplicamos las Shape Expressions 0:41:44.682,0:41:47.247 para ver si encaja con este tesauro. 0:41:47.248,0:41:50.919 Y hay otros tesauros u otras[br]ontologías de vocabularios controlados 0:41:50.920,0:41:52.409 que aún necesitan entrar en Wikidata, 0:41:52.409,0:41:54.961 y eso es exactamente por qué[br]Shape Expression es tan interesante 0:41:54.961,0:41:57.963 porque puedes tener una Shape Expression[br]para la ontología de la enfermedad, 0:41:57.964,0:41:59.734 puedes tener una Shape[br]Expression para MeSH, 0:41:59.734,0:42:01.881 puedes decir: bien, ahora[br]quiero verificar la calidad. 0:42:01.881,0:42:04.059 Porque también tienes[br]en Wikidata el contexto 0:42:04.060,0:42:09.567 de cuando tienes un vocabulario controlado[br]dices que la calidad está acorde a esto, 0:42:09.568,0:42:11.636 pero podrías tener[br]una comunidad en desacuerdo. 0:42:11.636,0:42:16.081 Las herramientas están en su lugar,[br]pero ahora toca crear esos modelos 0:42:16.082,0:42:18.144 y aplicarlos en los diferentes[br]casos de uso. 0:42:18.811,0:42:20.921 (persona 4) La Shape Expression[br]es muy útil 0:42:20.922,0:42:25.928 una vez que tengas la ontología externa[br]mapeada en Wikidata, 0:42:25.929,0:42:29.474 pero mi problema es que está[br]llegando a esa etapa, 0:42:29.475,0:42:34.881 funciona para ver cuánto de la ontología[br]externa aún no está en Wikidata 0:42:34.882,0:42:36.256 y dónde están los huecos, 0:42:36.257,0:42:40.660 y ahí es donde creo que al tener[br]herramientas mucho más robustas 0:42:40.660,0:42:44.286 para ver lo que falta[br]de ontologías externas 0:42:44.286,0:42:45.537 sería muy útil. 0:42:47.518,0:42:48.952 El mayor problema allí 0:42:48.952,0:42:51.351 no es tanto las herramientas[br]sino que faltan más licencias. 0:42:51.803,0:42:55.249 Entonces, meter las ontologías[br]en Wikidata es en realidad muy fácil 0:42:55.250,0:42:59.295 pero la mayoría de las ontologías tienen,[br]¿cómo puedo decirlo cortésmente? 0:42:59.965,0:43:03.256 licencia restrictiva,[br]y no son compatibles con Wikidata. 0:43:04.068,0:43:06.678 (persona 4) Hay un gran número[br]de tesauros del sector público 0:43:06.678,0:43:08.099 en los campos culturales. 0:43:08.099,0:43:10.851 - (Andra) Entonces tenemos que hablar.[br]- (persona 4) No hay problema. 0:43:10.852,0:43:12.384 (Andra) Entonces tenemos que hablar. 0:43:13.624,0:43:19.192 (persona 5) El comentario que quiero hacer[br]en realidad es una respuesta a James, 0:43:19.192,0:43:22.401 entonces, la cosa es que,[br]las jerarquías hacen gráficos, 0:43:22.374,0:43:24.041 y cuando lo quieras... 0:43:24.579,0:43:28.888 Básicamente quiero hablar sobre...[br]un problema común en las jerarquías 0:43:28.889,0:43:30.820 es las jerarquías circulares, 0:43:30.821,0:43:33.796 ellas vuelven la una a la otra[br]cuando hay un problema, 0:43:33.796,0:43:35.920 lo cual, no deberías tener[br]eso en las jerarquías. 0:43:37.022,0:43:41.295 Esto, curiosamente, sucede mucho[br]en las categorías de Wikipedia 0:43:41.295,0:43:42.990 tenemos muchos círculos en las categorías, 0:43:43.898,0:43:46.612 pero la buena noticia es que esto es... 0:43:47.713,0:43:51.582 Técnicamente, es un problema completo[br]de P... NP, así que no puedes hallar esto, 0:43:51.583,0:43:53.414 y fácilmente si construiste[br]un gráfico de eso, 0:43:54.473,0:43:57.046 pero hay muchas maneras[br]que se han desarrollado 0:43:57.047,0:44:00.624 para encontrar problemas[br]en estos gráficos de jerarquía. 0:44:00.625,0:44:04.860 Hay un artículo llamado Buscando Ciclos... 0:44:04.861,0:44:07.955 Rompiendo Ciclos en Jerarquías Ruidosas, 0:44:07.956,0:44:12.671 y se ha usado para ayudar a categorizar[br]la Wikipedia en inglés. 0:44:12.672,0:44:17.141 Puedes tomar esto y aplicar[br]estas jerarquías en Wikidata, 0:44:17.142,0:44:19.540 y luego puedes encontrar[br]cosas que son problemáticas 0:44:19.541,0:44:22.481 y solo quitar las que están[br]causando problemas 0:44:22.482,0:44:24.593 y encontrar los problemas, en realidad. 0:44:24.594,0:44:26.960 Esto es solo una idea, solo para que tú... 0:44:28.690,0:44:29.930 (persona 4) Eso está muy bien, 0:44:29.931,0:44:34.402 pero creo que estás subestimando[br]el número de malas relaciones de subclase 0:44:34.402,0:44:35.402 que tenemos. 0:44:35.403,0:44:39.680 Es como tener una ciudad[br]en un país totalmente equivocado, 0:44:40.250,0:44:44.874 y hay herramientas de geografía[br]para identificar eso, 0:44:44.875,0:44:49.201 y necesitamos tener mejores[br]herramientas en las jerarquías 0:44:49.202,0:44:53.477 para identificar dónde está[br]el equivalente del elemento para el país 0:44:53.478,0:44:57.673 que falta, o donde realmente[br]ha sido subclasificado 0:44:57.674,0:45:01.804 a algo que no significa[br]algo completamente distinto. 0:45:02.804,0:45:07.165 (Lydia) Sí, creo que estás llegando a algo 0:45:07.166,0:45:12.024 que mi equipo y yo seguimos escuchando[br]de personas que reutilizan nuestros datos 0:45:12.025,0:45:13.991 bastante bien, cierto, 0:45:14.782,0:45:16.858 el punto de datos individuales[br]podría ser excelente, 0:45:16.858,0:45:20.163 pero si tienes que mirar[br]en la ontología y demás, 0:45:20.164,0:45:21.857 entonces se pone muy... 0:45:22.388,0:45:26.437 Y creo que uno de los grandes problemas[br]del por qué ocurre 0:45:26.437,0:45:30.736 es que mucha edición en Wikidata 0:45:30.736,0:45:34.544 sucede sobre la base[br]de un elemento individual, correcto, 0:45:34.545,0:45:36.201 haces una edición de ese elemento, 0:45:37.653,0:45:42.075 sin darte cuenta de que esto[br]podría tener consecuencias muy globales 0:45:42.075,0:45:44.245 en el resto del gráfico, por ejemplo. 0:45:44.245,0:45:50.040 Y si la gente tiene ideas de cómo[br]hacer esto más visible, 0:45:50.041,0:45:53.185 las consecuencias[br]de una edición local individual, 0:45:54.005,0:45:56.537 creo que valdría la pena explorar, 0:45:57.550,0:46:01.583 para mostrarles mejor a la gente[br]cuál es la consecuencia de su edición 0:46:01.584,0:46:03.434 para que lo hagan de muy buena fe, 0:46:04.481,0:46:05.481 qué es eso. 0:46:06.939,0:46:12.237 ¡Guao! Bien, comencemos con, sí, tú,[br]luego tú, luego tú, y luego tú. 0:46:12.237,0:46:13.921 (persona 5) Bueno,[br]después de la discusión, 0:46:13.922,0:46:18.262 solo deseo expresar mi acuerdo[br]con lo que James estaba diciendo. 0:46:18.263,0:46:22.467 Entonces, esencialmente, parece[br]que lo más peligroso es la jerarquía, 0:46:22.468,0:46:23.910 no la jerarquía, sino en general 0:46:23.911,0:46:28.022 la semántica de las relaciones de subclase[br]vistas en Wikidata, cierto. 0:46:28.022,0:46:32.561 Hace poco he estado estudiando lenguajes,[br]solo para los fines de esta conferencia, 0:46:32.562,0:46:35.257 y por ejemplo, encuentras muchos casos 0:46:35.257,0:46:39.463 donde un lenguaje es parte[br]de una subclase de la misma cosa, bien. 0:46:39.463,0:46:43.577 Entonces, sabes, puedes decir[br]que tenemos una ontología flexible. 0:46:43.577,0:46:46.256 Wikidata a veces te da[br]la libertad de expresar eso. 0:46:46.256,0:46:47.257 Porque, por ejemplo, 0:46:47.258,0:46:50.721 esa ontología de lenguajes también es[br]políticamente complicada, ¿verdad? 0:46:50.722,0:46:55.038 Incluso es bueno estar en una posición[br]para expresar un nivel de incertidumbre. 0:46:55.038,0:46:57.983 Pero imagina a cualquiera que quiera[br]hacer una lectura automática de eso. 0:46:57.984,0:46:59.468 Eso es realmente problemático. 0:46:59.468,0:47:00.468 Y luego de nuevo, 0:47:00.469,0:47:03.686 no creo que esa ontología[br]fuera importada de alguna parte, 0:47:03.687,0:47:05.490 es algo que es originalmente nuestro. 0:47:05.491,0:47:08.321 Se cosecha desde Wikipedia,[br]al principio lo diré. 0:47:08.322,0:47:11.324 Entonces, me pregunto...[br]esta cosa de Shape Expressions es genial, 0:47:11.325,0:47:15.575 y también validar y arreglar,[br]si quieres, la ontología de Wikidata 0:47:15.576,0:47:18.191 por recursos externos, hermosa idea. 0:47:19.026,0:47:20.026 En fin, 0:47:20.027,0:47:25.440 ¿terminaremos reflexionando sobre[br]las ontologías externas en Wikidata? 0:47:25.441,0:47:28.651 Y además, ¿qué hacemos con la parte[br]central de nuestra ontología 0:47:28.652,0:47:30.642 que nunca se cosecha de recursos externos, 0:47:30.643,0:47:31.978 cómo vamos a arreglar eso? 0:47:31.979,0:47:35.276 Y realmente pienso que eso será[br]un problema por sí solo. 0:47:35.277,0:47:39.010 Tendremos que centrarnos en eso[br]independientemente de la idea 0:47:39.010,0:47:41.046 de validar la ontología con algo externo. 0:47:49.353,0:47:53.379 (persona 6) Bien, y las limitantes[br]y las formas son muy impresionantes 0:47:53.380,0:47:54.605 lo que podemos hacer con eso, 0:47:55.205,0:47:58.481 pero el punto principal no está[br]siendo realmente aclarado... 0:47:58.482,0:48:03.229 es porque ahora se puede hacer más[br]explícito lo que esperamos de los datos. 0:48:03.229,0:48:06.893 Antes, cada uno tenía que escribir[br]sus propias herramientas y guiones 0:48:06.894,0:48:10.601 y así es más visible[br]y podemos discutir sobre eso. 0:48:10.602,0:48:13.641 Pero no se trata[br]de lo que está mal o bien, 0:48:13.642,0:48:15.870 se trata de una expectativa, 0:48:15.870,0:48:18.105 y tendrás diferentes[br]expectativas y discusiones 0:48:18.106,0:48:20.737 acerca de cómo queremos[br]modelar las cosas en Wikidata, 0:48:21.246,0:48:23.095 y esto... 0:48:23.096,0:48:26.280 El estado actual es solo[br]un paso en la dirección 0:48:26.281,0:48:28.041 porque ahora necesitas 0:48:28.042,0:48:31.041 mucha experiencia técnica[br]para entrar en esto, 0:48:31.042,0:48:35.721 y necesitamos mejores formas[br]para visualizar esta restricción, 0:48:35.722,0:48:39.995 para transformarlo tal vez en un lenguaje[br]natural y la gente lo pueda entender mejor 0:48:40.939,0:48:43.768 pero se trata menos de lo que está[br]mal o lo que está bien. 0:48:44.925,0:48:45.925 (Lydia) Sí. 0:48:50.986,0:48:53.893 (persona 7) Por cuestiones de calidad,[br]solo lo quiero repetir como... 0:48:53.894,0:48:57.010 Me he encontrado que muchos[br]de los problemas han sido 0:48:58.838,0:49:02.330 diferencias de opinión[br]entre instancia de y subclase. 0:49:02.331,0:49:05.963 Yo diría que los errores[br]en esas situaciones 0:49:05.963,0:49:11.521 que he tratado de encontrar[br]han sido un proceso muy lento. 0:49:11.522,0:49:14.840 Lo que he encontrado es algo así: "si[br]encuentro elementos de muy alta impresión 0:49:14.840,0:49:16.171 que son algo... y luego uso todas 0:49:16.171,0:49:21.628 las instancias de subclase y encuentro[br]las declaraciones derivadas de esto", 0:49:21.628,0:49:26.215 esta es una forma muy útil[br]de buscar estos errores. 0:49:26.215,0:49:28.067 Pero tenía curiosidad[br]si Shape Expressions, 0:49:29.841,0:49:31.582 si hay... 0:49:31.583,0:49:36.934 Si se puede usar como una herramienta que[br]ayude a resolver esos problemas, y sí... 0:49:40.514,0:49:42.555 (persona 8) Si tiene[br]una huella estructural... 0:49:45.910,0:49:49.310 Si tiene una huella estructural[br]donde puedas... eso es algo falsificable, 0:49:49.310,0:49:51.191 puedes ver eso[br]y decir, bueno, eso está mal, 0:49:51.192,0:49:52.670 entonces sí, puedes hacer eso. 0:49:52.671,0:49:56.791 Pero si solo se trata de mapear[br]con objetos del mundo real, 0:49:56.791,0:49:59.272 entonces solo vas a necesitar[br]montones y montones de cerebros. 0:50:05.768,0:50:08.631 (persona 9) Hola, Pablo Mendes[br]de Apple Siri Knowledge. 0:50:09.154,0:50:12.770 Estamos aquí para descubrir cómo ayudar[br]al proyecto y a la comunidad 0:50:12.770,0:50:15.645 pero Cristina cometió el error[br]de preguntar qué queremos. 0:50:16.471,0:50:20.052 (risas) Entonces, creo que[br]una cosa que me gustaría ver, 0:50:20.958,0:50:23.521 se trata mucho de verificabilidad, 0:50:23.522,0:50:26.372 que es uno de los principios básicos[br]del proyecto en la comunidad, 0:50:27.062,0:50:28.590 y confiabilidad. 0:50:28.590,0:50:31.992 No todas las declaraciones son iguales,[br]algunas de ellas están muy disputadas, 0:50:31.992,0:50:33.653 algunas de ellas son fáciles de adivinar, 0:50:33.654,0:50:36.021 como la fecha de nacimiento[br]de alguien puede ser verificada, 0:50:36.071,0:50:39.212 como viste hoy en la Keynote, los asuntos[br]de género son mucho más complicados. 0:50:40.205,0:50:42.130 ¿Puedes hablar un poco de lo que sabes 0:50:42.131,0:50:47.271 en esta área de calidad de datos[br]acerca de confiabilidad y verificabilidad? 0:50:55.442,0:50:58.138 Si no tienes mucho,[br]me encantaría ver mucho más. (risas) 0:51:00.646,0:51:01.646 (Lydia) Sí. 0:51:03.314,0:51:06.548 Aparentemente, no tenemos[br]mucho que decir sobre eso. (risas) 0:51:08.024,0:51:12.299 (Andra) Creo que podemos hacer mucho,[br]pero ayer tuve una discusión contigo. 0:51:12.300,0:51:15.774 Mi ejemplo favorito que aprendí ayer,[br]que ya está en desuso, 0:51:15.774,0:51:20.281 es que si vas a la Q2, que es la tierra, 0:51:20.282,0:51:23.343 hay una declaración[br]que afirma que la tierra es plana. 0:51:24.183,0:51:26.055 Y me encanta ese ejemplo 0:51:26.056,0:51:28.391 porque hay una comunidad[br]por ahí que lo afirma 0:51:28.392,0:51:30.417 y tienen recursos verificables. 0:51:30.418,0:51:32.254 Entonces, creo que es un caso genuino, 0:51:32.255,0:51:34.641 no debería estar en desuso,[br]debería estar en Wikidata. 0:51:34.642,0:51:40.385 Y creo que Shape Expressions[br]puede ser realmente instrumental allí, 0:51:40.386,0:51:41.832 debido a lo que puedes decir, 0:51:41.833,0:51:44.856 bien, estoy realmente interesado[br]en este caso de uso, 0:51:44.857,0:51:47.129 o este es un caso de uso[br]en el que no estás de acuerdo, 0:51:47.130,0:51:51.059 pero también puede haber un caso de uso[br]donde dices, bien, estoy interesado. 0:51:51.059,0:51:53.449 Entonces, hay un ejemplo,[br]que dices, tengo glucosa. 0:51:53.449,0:51:55.841 Y la glucosa, cuando eres biólogo, 0:51:55.842,0:52:00.176 no te importan las limitantes químicas[br]de la molécula de la glucosa, 0:52:00.177,0:52:03.201 tú simplemente...[br]Todo lo de glucosa es lo mismo. 0:52:03.202,0:52:05.973 Pero si eres químico,[br]te estremeces cuando escuchas eso, 0:52:05.973,0:52:08.191 tienes 200 algo... 0:52:08.191,0:52:10.343 Entonces, puedes tener[br]múltiples Shape Expressions, 0:52:10.343,0:52:12.721 bien, voy a poner que...[br]Estoy en un punto de vista químico, 0:52:12.722,0:52:13.887 estoy aplicando eso. 0:52:13.887,0:52:16.691 Y luego dices, estoy en un caso[br]de uso biológico, 0:52:16.691,0:52:18.524 Estoy aplicando esa Shape Expression. 0:52:18.524,0:52:20.358 Y luego, cuando quieres colaborar, 0:52:20.358,0:52:22.784 sí, bueno, deberías hablarle[br]a Eric sobre los mapas ShEx. 0:52:23.910,0:52:28.873 Y así... pero este viaje apenas comienza. 0:52:28.873,0:52:32.238 Pero yo personalmente creo[br]que es muy instrumental en esa área. 0:52:34.292,0:52:35.535 (Lydia) Bien. Por ahí. 0:52:37.949,0:52:39.168 (risas) 0:52:40.597,0:52:46.035 (persona 2) Tuve varias ideas[br]de algunos puntos en las discusiones, 0:52:46.035,0:52:50.902 así que intentaré no perderlas...[br]Tuve tres ideas, así que... 0:52:52.394,0:52:55.201 Según lo que dijo James hace un tiempo, 0:52:55.202,0:52:59.001 tenemos un problema muy, muy grande[br]en Wikidata desde el principio 0:52:59.002,0:53:01.574 para la ontología superior. 0:53:02.363,0:53:05.339 Lo hablamos hace dos años en WikidataCon, 0:53:05.340,0:53:07.432 y hablamos de eso en Wikimania. 0:53:07.432,0:53:09.818 Bueno, siempre que tenemos[br]una reunión de Wikidata 0:53:09.818,0:53:11.656 hablamos de eso, 0:53:11.656,0:53:15.782 porque es un gran problema[br]a un nivel muy, muy visual 0:53:15.783,0:53:23.118 qué entidad es, con qué trabajo es,[br]qué género es, arte, 0:53:23.118,0:53:25.461 son realmente el concepto más grande. 0:53:26.195,0:53:33.117 Y eso es realmente un punto[br]muy débil en la ontología global 0:53:33.118,0:53:37.453 porque la gente trata[br]de limpiar regularmente 0:53:38.017,0:53:41.047 y lo descompone todo, 0:53:42.516,0:53:48.649 porque sí, creo que algunos de ustedes[br]recuerdan al tipo que de buena fe 0:53:48.649,0:53:51.785 rompió absolutamente[br]todas las ciudades del mundo. 0:53:51.785,0:53:57.537 Ya no eran elementos geográficos, habían[br]restricciones de violación en todas partes 0:53:58.720,0:54:00.278 Y fue de buena fe, 0:54:00.278,0:54:03.623 porque realmente estaba[br]corrigiendo un error en un elemento, 0:54:04.170,0:54:05.732 pero todo se vino abajo. 0:54:06.349,0:54:09.373 Y no estoy segura de cómo[br]podemos resolver eso 0:54:10.216,0:54:15.709 porque en realidad no hay ninguna[br]institución externa a la que copiar 0:54:15.710,0:54:18.490 porque todos trabajan... 0:54:19.154,0:54:22.041 Bueno, si estoy realizando[br]una base de datos de arte, 0:54:22.042,0:54:24.601 solo iré al nivel de arte escénico, 0:54:24.601,0:54:29.361 pero no voy al concepto filosófico[br]de lo que es una entidad, 0:54:29.362,0:54:31.201 y eso es en realidad... 0:54:31.202,0:54:34.561 No conozco ninguna base de datos[br]que esté trabajando a este nivel, 0:54:34.562,0:54:36.827 pero ese es el punto[br]más débil de Wikidata. 0:54:37.936,0:54:40.812 Y probablemente, cuando hablamos[br]de calidad de datos, 0:54:40.812,0:54:44.034 tiene en realidad[br]una gran parte, así que... 0:54:44.034,0:54:48.569 Y creo que es lo mismo[br]que hemos expresado... 0:54:48.569,0:54:50.452 Lo siento, estoy cambiando de tema, 0:54:51.401,0:54:55.774 pero hemos expresado[br]en diferentes sesiones sobre cualidades, 0:54:55.774,0:54:59.398 que en realidad algunos de nosotros[br]hacemos un buen trabajo de modelado, 0:54:59.399,0:55:01.240 hacemos ShEx, hacemos cosas así. 0:55:01.967,0:55:07.655 La gente no lo ve en Wikidata,[br]no ven el ShEx, 0:55:07.655,0:55:10.392 no ven el WikiProject[br]en la página de discusión, 0:55:10.393,0:55:11.393 y a veces, 0:55:11.394,0:55:14.958 ni siquiera ven las páginas[br]de discusión de propiedades, 0:55:14.958,0:55:19.628 que declara explícitamente[br]a), esta propiedad se utiliza para eso. 0:55:19.628,0:55:23.887 La semana pasada, agregué[br]restricciones a una propiedad. 0:55:23.888,0:55:26.324 La restricción fue escrita explícitamente 0:55:26.325,0:55:28.690 en la discusión de la creación[br]de la propiedad. 0:55:28.690,0:55:34.548 Acabo de crear la parte técnica[br]de agregar la restricción, y alguien: 0:55:34.548,0:55:37.182 "¡Qué! ¡Estropeaste todas mis ediciones!" 0:55:37.183,0:55:41.542 Y él estaba usando incorrectamente[br]la propiedad durante los últimos dos años. 0:55:41.542,0:55:46.868 Y la propiedad era realmente muy clara,[br]pero no hubo advertencias, 0:55:46.869,0:55:49.922 y entonces, es lo mismo en el Pink Pony,[br]que dijimos en Wikimania 0:55:49.922,0:55:54.719 para hacer que WikiProject sea más visible[br]o para que ShEx sea más visible, pero... 0:55:54.719,0:55:56.917 Y eso es lo que dijo Cristina. 0:55:56.917,0:56:02.368 Tenemos un problema de visibilidad[br]de cuáles son las soluciones existentes. 0:56:02.368,0:56:04.242 Y en esta sesión, 0:56:04.242,0:56:06.862 todos estamos hablando[br]de cómo crear más ShEx, 0:56:06.863,0:56:10.727 o de facilitar los trabajos[br]para las personas que hacen la limpieza. 0:56:11.605,0:56:15.835 Pero estamos limpiando[br]desde el primer día de Wikidata, 0:56:15.836,0:56:20.921 y globalmente, estamos perdiendo,[br]y estamos perdiendo porque, bueno, 0:56:20.922,0:56:22.960 si supiera, los nombres son complicados, 0:56:22.961,0:56:26.162 pero yo soy el único[br]que hace el trabajo de limpieza, 0:56:26.662,0:56:29.671 el chico que agregó[br]el nombre de la escritura latina 0:56:29.672,0:56:31.584 a todos los investigadores chinos, 0:56:32.088,0:56:35.616 me llevará meses limpiar eso[br]y no puedo hacerlo solo, 0:56:35.616,0:56:38.777 y él hizo un lote masivo. 0:56:38.777,0:56:40.241 Entonces, realmente necesitamos... 0:56:40.242,0:56:44.158 Tenemos un problema de visibilidad[br]más que un problema de herramienta, creo, 0:56:44.158,0:56:45.733 porque tenemos muchas herramientas. 0:56:45.733,0:56:50.255 (Lydia) Correcto, desafortunadamente,[br]me han mostrado una señal (risas) 0:56:50.256,0:56:52.121 así que, tenemos que terminar esto. 0:56:52.122,0:56:53.563 Muchas gracias por sus comentarios, 0:56:53.563,0:56:56.611 espero que sigan discutiendo[br]durante el resto del día, 0:56:56.611,0:56:57.840 y gracias por su aporte. 0:56:58.359,0:56:59.944 (aplausos)