Вдохновляющая панельная дискуссия,
посвящённая Викибазе.
Дженс Олиг
Willkommen, Bienvenue...
Добро пожаловать.
Всегда хотел сказать это со сцены.
(смех)
Будьте готовы вдохновиться,
ведь вы находитесь на официальной
вдохновляющей дискуссии о Викибазе
на WikidataCon 2019.
Наша задача -- вдохновиться тем,
что люди в разных странах,
в разных областях специализации
делают с помощью Викибазы,
программным обеспечением Викиданных.
Я был очень удивлён, когда сегодня
ко мне подошёл кто-то и сказал:
«Сегодня я впервые услышал о Викибазе».
Викибаза -- это программное обеспечение,
поддерживающее работу Викиданных.
Если вы хотите организовать данные так,
как они организованы в Викиданных,
но вам не подходят элементы,
которые в них имеются,
вам нужна более высокая степень дробления
или вы не хотите начинать с Q1,
обозначающей Вселенную,
потому что для вас, Q1 может быть книгой,
если вы работаете в библиотеке,
или каким-либо животным, если вы биолог,
или исторической личностью,
если вы работаете в гуманитарной сфере,
но при этом вам нужна
такая же упорядоченная система,
Викибаза -- то, что вам нужно.
За последние пару лет
мы установили связи
с потрясающими людьми,
первопроходцами в своих областях,
которые занимаются
оценкой работы Викибазы
и добиваются выдающихся результатов.
Наше обсуждение
будет проходить быстро.
Каждый из участников заслуживает
целого часа для своей презентации,
но у нас очень плотный график.
Так что пристегните ремни,
вас ждёт скоростная поездка
по вдохновляющему миру Викибазы.
Первый проект
разработали две организации,
что само по себе удивительно.
Bibliothèque nationale de France,
Национальная библиотека Франции,
и Abes -- организация,
известная в сфере высшего образования.
Но я думаю, что вы подробнее расскажете
об этом в вашей презентации.
Давайте поприветствуем
Алину Анджели и Бенджамина Бобера,
они подарят нам
первые десять минут вдохновения.
(аплодисменты)
Всем привет.
Я Бенджамин Бобэр,
я работаю в Abes,
Агентстве высшего образования,
Библиографическом агентстве
высшего образования.
Мы работаем со всеми
университетскими библиотеками Франции,
организуем общий каталог,
а также нормативные файлы библиотек.
Я здесь вместе
с Алиной Анджели из BnF,
Национальной библиотеки Франции.
Мы расскажем о нашем общем проекте,
о создании нового инструмента
для работы с нормативными данными:
люди, корпорации,
концепции и так далее.
Последние несколько месяцев
мы использовали
Викибазу как раз для этого.
Я быстро введу вас в курс дела,
для нас важно, для библиотек...
В последние годы произошёл
технологический сдвиг
в поддержку движения открытых данных,
и мы, как библиографическое агентство,
хотели стать частью этого движения.
Уже много лет
мы экспериментируем
со связанными открытыми данными,
с RDF, SPARQL и так далее.
Мы считаем,
что пришло время двигаться дальше.
Сейчас для этого самое время,
потому что произошёл... не сдвиг,
а смена парадигмы
в нашем понимании
библиографических данных.
Мы раньше хранили,
и до сих пор храним
данные в архивах,
так называемых MARC архивах
в библиотеках.
Мы используем формат,
который называется MARC.
Но недавно появилась возможность
взглянуть на эту систему
под другим углом
и перейти от системы архивных данных
к системе на основе данных-сущностей,
взаимосвязывая людей, книги
и другие сущности.
В этом контексте мы решили
запустить наш общий проект.
Но наша цель выходит
далеко за рамки библиотек.
Мы хотели бы также включить
в наш проект
и другие французские учреждения
культуры, GLAMS,
так как считаем,
что можем быть им полезны.
Наш проект называется
Fichier National d'Entités, FNE,
«Национальные файлы сущностей».
Он задумывался как платформа
для совместного создания
и поддержки базы данных
ссылок на сущности.
Как я уже сказал, люди,
компании, места, концепции
и произведения искусства.
Мы многое включили в наш проект.
Это очень непросто,
потому что BnF и Abes
впервые взаимодействуют
на таком уровне.
Мы вам расскажем, в общих чертах,
о положении дел в настоящее время,
с чего мы начинали и где мы сейчас.
Мы работаем
над этим проектом с 2017 года.
Мы изучили похожие проекты
и в прошлом году пришли к выводу,
что есть огромная заинтересованность
в Викибазе, как основе FNE.
Мы посчитали хорошим решением
использование Викибазы
как основы, но у нас
ещё оставались сомнения,
потому что у нас особые требования.
Мы решили запустить проект,
уделить целый год
построению прототипа,
используя реальные данные
из каталога BnF, нормативного каталога
и наших каталогов.
Мы попробовали объединить
эти данные в Викибазе
и посмотреть
как они будут взаимодействовать
и сможет ли Викибаза
удовлетворить наши требования.
В построении прототипа нам помогли
Максим и Винсент из Inventaire.io,
они помогли нам лучше понять,
как Викибаза может нам помочь.
Алина расскажет о наших
предварительных выводах.
Мы решили выбрать
Викибазу для этого эксперимента
в качестве технической основы,
базового уровня FNE,
потому что переход с одной системы
на другую -- непростая задача,
и идея использовать Викибазу
как техническую основу
для наших данных
было одновременно...
означала, что мы переходим
от классической
информационной системы
или библиотечной информационной
системы к чему-то совсем другому.
Поэтому нам нужно было сначала
поэкспериментировать
и посмотреть,
есть ли все необходимые функции
для работы и осуществления
поставленных задач в нашей среде,
профессиональной среде.
Я имею в виду создание и обслуживание,
а не публикацию,
они существенно отличаются.
Вы слышали на предыдущем семинаре
презентацию:
«Стратегии ввода материалов
учреждений культуры на Викисклад».
Tам говорилось о публикации
и о творческом процессе как таковом.
Нам нужно действовать постепенно,
поэтому мы решили провести
этот эксперимент, создать прототип.
Мы были приятно удивлены:
никаких серьёзных препятствий
для ввода библиотечных данных
в соответствии с онтологией...
Я уже упоминала, что мы поместили
их данные в два разных типа MARC,
потом мы определили
некоторые [важные] свойства,
чтобы экспериментировать
с объединением данных,
и мы не столкнулись с препятствиями
с технической стороны.
Конечно, мы убедились,
что в Викибазе есть
встроенные компоненты,
которые могут составить основу
технической инфраструктуры FNE.
Ещё раз замечу,
что решение ещё не принято,
эксперимент всё ещё...
скажем так, разработка уже закончена.
Сейчас мы на стадии подведения итогов,
и со стратегической точки зрения
окончательное решение ещё не принято,
так что это предварительные выводы,
которыми мы готовы поделиться.
Похоже, что Викибаза
может быть хорошим
операционным решением
для управления этим проектом,
который совместно, сообща
создаёт эти сущности, эти вещи,
напомню вам о разнице
между вещами и строками.
Однако, мы заметили некоторые пробелы
между конкретными потребностями
наших своеобразных организаций --
там существуют сложившиеся сообщества
со своей культурой, своими привычками,
в общем, есть определённые особенности,
свойственные библиотекам --
и решениями, которые предлагает
Викибаза, например, поиск.
Я имею в виду,
с профессиональной точки зрения,
не только с точки зрения
конечного пользователя,
нам нужны определённые указатели
для обеспечения качества данных,
курирования данных --
и это очень важно для работников
в нашей области --
но CirrusSearch и Elasticsearch
как части Викибазы
не могут обеспечить нас этим.
Этот вопрос нужно
исследовать дополнительно.
Роли... как распределяются роли?
Бюрократ, патрулирование...
в нашей сфере
всё устроено несколько иначе.
Хотя есть уровень,
который мы можем использовать,
на основе которого мы можем
создавать роли, которые соответствуют
нашему способу работы с данными.
Или, например, разные ограничения,
связанные с публикацией данных,
или... здесь ошибка,
которую нужно исправить...
с принципами работы с данными...
хорошо, спасибо.
Есть аспекты, которые нужно...
дополнительные слои, кирпичики,
которыми нужно надстроить Викибазу.
И конечно, одна из причин,
основная причина,
почему мы здесь с вами,
в том, что мы готовы,
мы чувствуем потребность
быть частью сообщества, занимающегося
решением аналогичных проблем.
И мы все заметили,
учитывая темы докладов в программе,
что библиотеки и учреждения культуры
широко представлены на этой конференции.
Так что, я думаю...
мы думаем, что возможно
в ближайшие пару недель
или в следующем году
мы сможем открыто объявить
о нашем решении относительно
использования Викибазы.
Спасибо.
Большое спасибо.
(аплодисменты)
Итак, сначала мы прослушаем
небольшие презентации,
затем все вернутся на сцену
для ответов на вопросы,
если на это останется время.
Мы прослушали выступление из Франции.
Есть другой проект.
Это не Fichier National d'Entités...
(шутя, затрудняется произнести название)
это Gemeinsame Normdatei --
универсальный нормативный файл
для немецкоязычного мира.
Я очень рад поприветствовать друзей
из движения Викимедиа.
Барбара Фишер и Сара Хартманн.
Спасибо, что пригласили нас
представить наш проект,
который называется
«GND встречается с Викибазой».
Это общий проект
Викимедиа Германия
и GND.
Мы хотим вкратце рассказать
-- как уже говорил Дженс,
у нас всего 10 минут --
чем вызван наш подход
к оценке работы Викибазы,
и отвечает ли она требованиям
организации нормативных данных
на уровне совместной работы.
Итак, в чём наш интерес,
и что это такое -- нормативный контроль
и GND, что означает
Gemeinsame Normdatei,
что за этим стоит?
Да, в чём наш интерес,
как я уже сказала.
Наш проект похож на то,
о чём говорили Анила и Бен,
только что.
GND используется для описания ресурсов,
таких как публикации и объекты.
В поддержку точности поиска данных,
я бы сказала, GND предоставляет
недвусмысленные и определённые
сущности для такого поиска.
Как вам хорошо известно,
существуют постоянные идентификаторы
для идентификации
и ссылок на эти сущности.
Нормативный файл
используется в основном в библиотеках,
в немецкоязычных странах,
но и другие организации,
из сферы культурного наследия,
уже используют нормативный файл.
В общем, существует
уже более 60 миллионов записей,
в Викибазе они называются «элементами»,
это люди, имена,
компании, географические названия,
разного рода работы.
GND управляется совместно
так называемыми GND-агентствами,
и на данный момент,
около 1 000 организаций
активно используют GND --
они создали архив
и постоянно добавляют
новые записи или элементы.
Самое главное, по моему мнению,
что данные GND предоставляются бесплатно
в открытом доступе, без копирайта,
и API и документация
также находятся в открытом доступе.
К слову об открытости --
это очень важный момент --
в настоящее время мы добиваемся
того, чтобы GND стал доступен
для других учреждений культуры
и научных организаций.
В настоящее время он в основном
используется библиотечным сектором.
Это значит, что удобный библиотечный
инструмент должен превратиться
в инструмент, принятый
и применяемый в других сферах.
Для этого нужно провести
большую организационную работу,
развивать сообщество, обсудить
текущую модель хранения данных,
инфраструктуру и технические вопросы.
И да.
Если говорить о проблемах
инфраструктуры --
мы решили объединить
усилия с Викибазой,
так как у нас, примерно, общие цели --
сделать данные в сфере культуры
более доступными и совместимыми.
Поэтому мы сейчас проводим
оценку этого программного обеспечения,
первоначально созданного
исключительно для Викиданных,
подходит ли оно
для работы с нормативными данными.
Хорошо, привет всем.
В нашем проекте
совместно с Викимедиа Германия
мы сосредоточились на оценке.
Прежде всего,
соответствует ли Викибаза требованиям
учреждений культуры: галерей,
библиотек, архивов и музеев
для совместной работы
с нормативным файлом --
это наш главный вопрос.
Мы бы также хотели, чтобы Викибаза
повысила удобство её использования,
так как программа,
которую мы используем сейчас,
скажем так, довольно сложная
и не настолько удобная,
как нам бы хотелось.
И также мы хотим знать,
упростит ли Викибаза
процесс связывания данных
а также будет ли участвовать
в развитии разнообразного сообщества.
Как уже заметила Сара,
сейчас мы только начинаем
сотрудничать с различными
учреждениями культуры
и научными учреждениями.
И понятно, что они работают
со своим программным обеспечением,
и мы хотели бы знать,
упростит ли Викибаза
их взаимодействие с нами.
Зачем мы это делаем?
Мы считаем, что Викибаза
может стать
зоной активного взаимодействия,
что значит -- мне пришлось записать --
во-первых, Викибаза более доступна,
чем какое-либо другое патентованное ПО,
которое используют
для каталогизации в учреждениях культуры.
Также мы знаем, что сообщество Викибазы
предано своему делу
и мы хотели бы
стать частью этого сообщества,
мы верим, что делиться значит заботиться.
Мы хотим делиться знаниями,
передавать их друг другу,
чтобы избежать
дублирования информации,
не редактировать одни и те же данные
снова и снова,
а использовать данные повторно,
связывая их ссылками,
цитатами, обогащая их.
Здесь вы можете
увидеть один из инструментов,
часто используемых в Викиданных --
Histropedia,
потому что мы уверены, что если
мы внесём наши данные в Викибазу,
мы сможем делиться инструментами,
совершенствовать код,
и таким образом,
стать активными участниками сообщества.
Спасибо.
Я хотела бы обсудить это позже.
Большое вам спасибо.
(аплодисменты)
Большое вам спасибо.
В какой-то момент задаёшься вопросом:
мы случайно написали ПО для библиотек?
Ведь Викибаза очень широко
применяется в библиотечной среде.
Но это далеко не всё.
И, конечно, мы создали
библиотечную систему не случайно.
Её можно использовать и в других сферах.
Например, в биологии.
Дэвид Фишмюллер расскажет
об использовании Викибазы
в сфере изучения биоразнообразия.
- Похоже это стало серым.
- Да.
Во весь экран? Хорошо.
Да. Всем привет.
Меня зовут Дэвид,
я работаю в Ботаническом саду,
в Ботаническом музее, здесь в Берлине.
Моя профессия информатик.
У нас есть целый отдел под названием
Информатика биоразнообразия.
В общем, мы пишем программы,
которые биологи
используют в своей работе.
Кроме этого, как частное лицо
я вношу свой вклад в Википедию
уже 15 лет
и в Викиданные почти 5 лет.
Также, как часть моей работы,
я администрирую MediaWikiFarm
с более чем 80 вики,
посвящёнными биологии.
Пару лет назад мне поручили проект,
в рамках которого нужно было
работать со стандартом.
В частности,
стандарт под названием ABCD
требовал работы.
Я предполагаю,
что мало кто из вас слышал об ABCD,
в этом нет ничего страшного.
Это очень специфический стандарт.
Он расшифровывается как
Доступ к собранию биологических данных.
Это XML схема.
XML может выразить
биологические данные,
специфические данные,
например, о гербариях,
коллекциях, например,
заспиртованных рыб или...
а также о наблюдениях
учёных в поле, которые
наблюдают определённые растения,
видят определённых животных.
Весьма разнообразная информация,
поэтому это очень большой стандарт.
В нём 1 800 различных концепций.
В это число входят разные XPaths
внутри файла.
Наша задача состояла в переводе
этих данных
в современный семантический стандарт.
Мы хотели использовать онтологию OWL,
способную выразить такую же информацию,
какая раньше выражалась в XML файлах,
а также сохранить существующую
документацию,
ограничения по использованию
и все связи
между элементами
и иметь платформу для совместной работы,
где другие учёные могли бы давать совет
в рамках своей специализации --
работает ли наша модель,
не упустили ли мы чего-нибудь?
Учитывая всё это, мы начали искать
и нашли решение --
думаю это никого не удивит --
Викибаза, иначе меня бы здесь не было.
Итак, мы решили использовать Викибазу.
Мы начали её установку без Docker image.
Большая ошибка. Не делайте так.
(смех)
В своё оправдание скажу,
что мы начали этот проект 2,5 года назад,
а 2 года назад на WikidataCon
Docker image представили публике.
Нам пришлось разбираться самим.
Когда мы всё запустили,
мы не хотели
всё испортить, внося изменения.
Мы установили Docker
для службы запросов,
и теперь у нас странная смесь
кастомизированных установок
и установки Docker
и изменённые скрипты,
связывающие эти два экземпляра.
Потом мы установили QuickStatements,
опять же, вручную,
тогда этот инструмент не был частью
службы запросов,
мы внесли изменения,
чтобы всё заработало.
Я знаю, что теперь
он входит в Docker image.
Но у нас всё работало,
и мы решили ничего не менять.
Обратите внимание на этот момент.
Прежде чем я продолжу свой рассказ,
во избежание недопонимания, замечу,
что мы говорим о стандартах данных,
и когда мы выражаем данные семантически,
мы переводим концепции из XML
в классы и свойства.
То есть теперь это свойства объектов,
связывающие разные классы,
и свойства данных, содержащие
сам контент,
включая текст, цифры и так далее.
Всё это мы выражаем внутри Викибазы,
и всё это элементы Викибазы.
И теперь они описаны,
используя свойства в Викибазе.
Итак, у нас есть свойства ABCD,
являющиеся элементами,
описанными как свойства в Викибазе.
Я постараюсь использовать
правильные названия,
чтобы вам было понятно
о каких свойствах я говорю.
Итак, поговорим о свойствах,
в частности о свойствах в Викибазе.
Мы сели и начали думать:
«Что нам нужно
для описания концепций,
которые мы хотим смоделировать»?
В итоге мы использовали около 25 свойств,
в дополнение к «название»,
«описание», «алиас».
Я не буду перечислять их все,
просто посмотрите на это разнообразие.
Это то, что нам было нужно.
Да, здесь есть некоторые ограничения,
а другие...
Большая часть из них необязательны.
Только несколько обязательны.
Дальше мы приступили
к импорту всей этой информации.
Мы написали анализатор схемы, который
позволил извлечь разные концепции.
Всё у чего был XPath в XML схеме
и всю документацию внутри XML схемы,
мы поместили в CSV файл,
и дальше мы смогли работать с этим
и импортировать это,
используя QuickStatements.
Сработало достаточно хорошо.
Но, как я уже сказал, у нас было
более 1 800 концепций
в нашей Викибазе.
Кроме того, когда мы имели дело
с такими вещами, как человек --
его имя, адрес электронной почты --
они появлялись несколько раз в схеме
как обозначение владельца,
автора изображения и так далее.
И конечно, нам нужно было их сократить
и собрать их
в повторно применяемые классы.
Так что многое
пришлось редактировать вручную
для сокращения количества концепций,
в итоге у нас получилось чуть больше 500.
Итак, у нас есть классы,
свойства объектов, свойства данных,
кое-что я пропускаю,
чтобы не усложнять для вас картину.
Для внесения масштабных изменений
мы опять использовали QuickStatements.
Мы всё отредактировали
и решили проверить,
как наши данные согласуются.
Мы использовали то, что мы называем
«запросы техобслуживания»,
мы использовали интерфейс запросов
с запросами SPARQL,
чтобы проверить наличие
недостающих свойств,
неверных ссылок между концепциями,
в общем, всё то, что не вписывается
в нашу концепцию, нашу структуру.
В конце мы также
вручную просмотрели все концепции,
чтобы убедиться,
что мы ничего не упустили.
Работы было много,
потому что, даже если уделить
каждому элементу пять минут,
умножьте это на 550 --
и это будет больше недели
интенсивной работы.
Но, конечно, нужно больше пяти минут,
иногда полчаса уходит на одно исправление,
когда возникают проблемы с моделированием.
Итак, мы собрали все данные.
Пришло время извлечь данные из Викибазы.
Мы написали скрипт экспорта на Python,
который использует службу запросов,
чтобы получить информацию
о концепциях
и поместить их в шаблоны,
заранее подготовленные шаблоны.
В итоге мы получили
полноценный OWL файл,
содержащий всё, что нам нужно.
Это основа нашего стандарта.
В новых версия,
когда мы будем вносить изменения,
Викибаза будет нашей
рабочей платформой.
Когда мы всё экспортируем,
у нас будет новая версия стандарта.
Держать их нужно отдельно,
что позволит нам
перемещать сервер в другой экземпляр
или, как я уже сказал,
менять установку.
Мы экспортировали JSON
для документации веб-сайта.
Мы также экспортировали данные
во второй экземпляр Викибазы.
Сейчас это всё в стадии эксперимента.
Мы ещё не использовали это в работе...
когда концепции используются
для описания реальных данных.
Так что, мы разбиваем эти...
мы отступаем на шаг назад от свойств
как элементов Викибазы
и превращаем их
в реальные свойства Викибазы.
Получается довольно много запросов,
много шагов
для обеспечения согласованности
данных и связей,
но это работает.
В итоге, мы добились успеха.
Существует многочисленное сообщество...
сообщество, посвящённое
информационному стандарту
в биоразнообразии,
и у них на днях состоялось
ежегодное собрание.
Похоже, существует огромный интерес
в использовании этого подхода
для других стандартов.
Так что в будущем
мы хотим попробовать
Shape Expressions --
как я уже сказал, есть
некоторые ограничения по их экспорту --
и построить более удобный
рабочий процесс для разных версий.
Пока мы этого ещё не сделали.
Также нужно поменять экземпляр Docker.
В завершении,
у меня есть несколько пожеланий --
что можно улучшить.
Многие инструменты,
написанные для Викиданных,
могли бы быть
более платформенно-независимыми,
в частности, QuickStatements.
Как я уже говорил,
я внёс некоторые изменения вручную.
Многие проблемы, с которыми
я столкнулся, наверное, уже разрешены,
но я думаю, что не все.
Также мы хотим импортировать
существующие шаблоны,
шаблон SPARQL, шаблоны Q и P.
Они очень полезны
при работе с Викибазой.
И это должно быть
сделано автоматически.
Как я уже сказал,
мы многое редактировали вручную.
Было бы полезно, просто идеально,
если бы был инструмент
как в таблице Excel,
когда вы загружаете несколько элементов
и несколько свойств,
потом переходите от ячейки к ячейке,
быстро редактируя большие объёмы
полу-автоматическим способом.
Спасибо. Это всё.
Большое спасибо.
(аплодисменты)
Тут есть, что обсудить.
Итак, не только... как отсюда выйти.
Это касается не только науки,
не только библиотек.
С помощью Викибазы можно
создавать красоту и искусство.
И кто лучше Стюарта Прайора
может об этом рассказать.
Мне немного неловко,
мы говорим о красоте и искусстве,
а это на редкость уродливая презентация.
(смех)
Начнём -- зал полон викимедистами --
с поездов, люди любят поезда.
Они здесь не просто так.
Это станция Хакни Даунс
на северо-востоке Лондона.
Речь пойдёт о Banner Repeater и Викибазе,
я объясню позже.
Это ужасное фото.
Здесь находится
Архив публикаций художников,
прямо на железнодорожной платформе.
Там находятся несколько сотен копий
разных публикаций художников.
Это достаточно популярное место.
Они активно работают
с широкой публикой.
Вы садитесь в поезд
и можете увидеть
малоизвестное произведение искусства.
Это очень интересный проект,
часть более широкого сообщества.
Так что же это такое --
«публикации художников»?
Что такое «книги художников»?
Да, я тоже не знал.
Согласно Википедии, книги художников --
это произведения,
использующие формат книги.
Вы можете прочитать
определение на слайде.
Но это отдельные произведения искусства
или коллекции произведений,
которые используют публикацию
как средство художественного выражения.
Разнообразие здесь весьма велико,
это очень интересно.
Это похоже...
Всё началось в 20-х и 30-х,
в 60-х и 70-х произошло
своего рода возрождение формы,
и это продолжает развиваться и сейчас.
Это международное,
многоязычное сообщество,
существующее отдельно
от крупных художественных организаций.
Такие коллекции можно увидеть,
например, в Музее Виктории и Альберта.
Там находятся подобные произведения.
Это просто статья, не лучший пример.
Это весьма интересная,
но нишевая форма искусства.
Она плохо представлена в Викиданных.
Опять же, крайне неудачное фото --
не я снимал --
того, что храниться в архиве
Banner Repeater.
В центре, как вы видите,
книга розового цвета, «Blast»,
весьма известный пример книги художника
20-х годов.
Как это выглядит в Викиданных?
Не очень хорошо.
Их часто путают с обычными книгами
и другими публикациями.
Обычная статья в Викиданных
об известной книге художника
мало что о ней говорит.
Вот всё, что мы здесь видим.
И идентификационных номеров
тоже очень мало.
Явно многого не хватает
в информации о книгах художников,
особенно в сравнении с более
традиционными формами искусства,
картинами, скульптурами и прочим.
В сообществе есть огромное стремление
начать кодификацию таких произведений
и сделать их реальными.
Я покажу вам, что доступно сейчас.
Вы видите, что не так с этим запросом?
И это всё, что здесь есть.
Это все книги художников в Викиданных.
Как видите, очень мало информации.
У некоторых произведений
даже нет меток.
Здесь требуется ещё много работы.
И информация такого рода
обладает потенциалом расширения.
Кто-нибудь уже заметил,
что не так с этим запросом?
Посмотрите на метки,
на них написано «колбаса»,
потому что я взял чужой запрос
и изменил номер ключа.
(смех)
Это запрос о колбасах.
Двигаемся дальше.
Да, эта тема представлена очень слабо.
Banner Repeater связались с нами.
Я работаю с Викимедиа Великобритания.
Banner Repeater
обратились к нам за помощью
в установке Викибазы,
включая финансирование, получение
дополнительного финансирования,
а также привлечение сообщества
и присоединение их к процессу.
Процесс заключается в том,
чтобы собрать сообщество
художников, архивистов
и экспертов по связанным данным
и разработать схему, решить
что должно входить в модель данных
о публикациях художников.
Это узкоспециализированная область.
Эта тема не вписывается идеально
в схему Викиданных.
Похоже, в ней слишком много деталей.
Другой проблемой стала её гибкость.
Возможно она не подходит для Викиданых.
Возможно Викиданным не хватает гибкости.
Викибаза находится в процессе разработки,
так что мне нечего вам показать,
но презентация, в целом, о процессе.
И процесс состоит в продолжительных
обсуждениях в сообществе,
в обсуждениях на нескольких уровнях.
Это нельзя сделать за один раз.
Нельзя всё решить сразу.
Этот процесс идёт очень долго.
Воздействие этого проекта
может быть весьма значительным,
потому что больше никто
над этим не работает.
Во многих крупных организациях
хранятся книги художников,
где-то в закромах.
И они не знают как их
классифицировать.
У них это не очень хорошо получается.
Они в этом не заинтересованы.
Но существует сообщество
заинтересованное в этом.
Так что это то, чем мы занимаемся
в данный момент.
Первый семинар уже состоялся.
Это был семинар с участием экспертов
хорошо разбирающихся
в сфере публикаций художников --
архивисты, владельцы
коллекций и так далее --
для определения базовых предпосылок,
и понимания, что уже существует.
Изначальный статус
был отражён в Викиданных,
обсуждалось, что можно расширить
и улучшить.
Всё это было задокументировано,
была обозначена основная структура.
Следующий шаг --
привлечение более широкой публики.
Нужны не только специалисты
по данным, но и авторы.
Здесь будут описательные элементы,
и много качественных характеристик.
Опять же, то, чем
не занимаются в Викиданных.
Но вовлечение архивистов,
экспертов по связанным данным
и так далее,
надеюсь, объединит это всё,
для создания ресурса, имеющего
доступный интерфейс,
а также сообщества,
людей, готовых внести свой вклад
и обслуживать эти данные.
Я покажу, что у нас уже есть.
Это не финальная версия.
Это то, чего мы более
или менее добились
с экспертами.
Здесь вы можете увидеть
как разрабатываются P-числа
и их эквиваленты в Викиданных.
И ясно, что наши данные более детальны,
чем информация
в Викиданных в данный момент.
Здесь очень много деталей,
разных качеств,
таких как высота, ширина,
толщина и тому подобное,
которых не так много
в других группах
публикаций художников в Викиданных.
Есть и другие детали, как, например,
«заказано таким-то» и «участники»,
и многие из этих работ созданы
несколькими авторами.
Также существуют разные издания
одной и той же работы и прочее.
Очень много детальной информации,
связанной с этими работами.
И много описаний,
так как со временем многое изменилось,
многое было переосмыслено.
Это то, что у нас получилось.
Опять же, у большей части
есть эквиваленты в Викиданных,
но пока не у всего.
Что у нас здесь?
«Другие издания» и прочее.
Всё весьма узкоспециализированно.
Это первая стадия.
Дальше процесс перейдёт
в следующую стадию,
что-то будет убрано, что-то добавлено.
Здесь очень важна гибкость.
Мы уходим от старых стандартов,
двигаемся к более современной системе,
где сообщество может вносить
существенные изменения,
а не следовать указаниям...
и я начну говорить быстрее.
Итак, расстановка сил в данный момент
и почему Викибаза.
На сегодняшний день это --
мир искусства.
Он выглядит именно так.
Большой оранжевый овал.
В нём есть крупные организации,
а также группы публикаций художникив.
Они могут быть в Дели, Мексико-сити,
Лондоне и так далее.
Мы не хотим,
чтобы крупные организации
и эксперты определяли
как будет выглядеть онтология,
и как всё должно быть устроенно.
Работа по созданию Викибазы
в художественной среде
может помочь им понять,
что они хотят сделать,
и дальше они смогут противодействовать
крупным организациям,
представив более гибкую модель данных,
более современную,
модель, исходящую из низов,
а не из крупных организаций.
Я вижу ценность в этом подходе,
в создании своего рода
параллельной инфраструктуры
для сообществ, владеющих контентом,
также, как это работает в Викимедии,
и её продвижении в организации,
а не наоборот.
У меня есть ещё один слайд?
Что дальше?
Я всегда добавляю этот слайд,
потому что он самый худший,
это такое клише.
Что дальше? Мы переходим
к консультациям с сообществом,
мы расширим наш охват,
всё станет интереснее.
Наша база данных
будет взаимодействовать с Викиданными,
но мы ещё не знаем на каких условиях.
Возможно это будет очень,
очень специфический пример
публикаций художников,
из которого Викиданные
могут многое почерпнуть, и наоборот.
И я заканчиваю опять этой фотографией,
потому что она мне очень нравится.
Это всё, что я хотел сказать.
Спасибо.
(из зала) Большое спасибо.
(аплодисменты)
Мы приближаемся к концу нашей
скоростной поездки,
и что ещё сказать?
Мы приберегли самое лучшее напоследок?
Нет, но последнюю презентацию
мы доверили настоящему первопроходцу
Викибазы
в области цифровых гуманитарных наук.
Да, Олаф Симонс.
У вас нет слайдов,
вы будете работать вживую.
Именно так.
Я участвую в создании
Википедии с 2004 года.
Уже 15 лет.
Что я хочу показать?
Меня за это похвалили.
Я покажу вам экземпляр Викибазы,
который мы создали.
Это не Docker Image.
Я согласен, что это не лучший вариант
с Docker Image...
вариант с независимой установкой
не самый лучший.
Это сложно,
нам было очень трудно,
и мы признательны Викимедиа Германия
за сотрудничество и помощь
с её установкой.
У нас здесь несколько проектов.
Она больше ориентирована на проекты,
чем Викиданные.
Моя презентация должна быть здесь.
Открою здесь...
нужно было сделать это раньше.
Вот она.
История иллюминатов...
Начнём отсюда.
Это небольшой фильм,
созданный Полом-Оливье Дэйем,
с которым я познакомился на Twitter,
когда он попросил рассказать об опыте
создания нашей Викибазы,
и он экспериментировал со свей.
Мы с ним говорили о том,
что можно сделать
и чего сделать нельзя.
Я сказал, что я бы хотел иметь
возможность создать фильм.
Он сказал:«Это проще простого.
Я могу запустить SPARQL поиск,
получить информацию,
загрузить её в программу
и получить визуализацию».
Вы видите 20 лет исследований
иллюминатов,
краткая история организации
и всей их корреспонденции.
Это инструмент не проекта Викимедиа.
Это инструмент не Викибазы.
Но это можно сделать.
Мне нравится, что это пока не инструмент.
Это должно стать инструментом.
Мне нравится, как это демонстрирует,
что наши данные действительно открыты.
Любой может скачать данные,
преобразовать их,
чего мы не ожидали,
и это можно сделать за пару часов,
если вы достаточно умны,
а он, конечно же, умён.
Он сделал для нас этот фильм.
Я вернусь к презентации.
Почему с помощью Викибазы?
Этот вопрос был задан, когда мы
обратились к Викимедиа.
Я знал о Викиданных с 2010 года,
в 2017 мы были готовы использовать
эту базу знаний.
Люди из Викимедиа заинтересовались
проектом и сказали нам:
«Начинайте работу. Мы вас поддержим».
Почему наша собственная база?
В основном, для проведения
первоначальных исследований.
Сама установка -- это инструмент,
используемый для исследований.
Не только для того,
чтобы увидеть, что мы делаем
и для презентаций,
я каждый день использую её
для исследовательской работы.
Я меняю даты в документах
и смотрю, к чему приводят эти изменения.
Я разрабатываю гипотезы.
Мы просим авторов проектов
поделиться своими данными,
внести их в базу,
и они могут поставить метку,
включить элемент в свои данные,
упомянув, что элемент принадлежит
определённому проекту.
Следующий проект может его использовать.
Но отметка уже есть,
что эти данные
получены определённым проектом.
Если вы работаете над проектом,
финансируемым DFG --
Немецкий исследовательский фонд --
если у вас есть проект,
вы хотите показать,
что вы произвели.
Теперь вы можете провести SPARQL поиск
и показать все свои данные
в итоговом документе вашей работы.
Итак, у нас есть исходное исследование,
мы идентифицируем его
и ставим рабочую гипотезу.
Это рабочий инструмент,
и весьма полезно с этого начинать,
а не представлять как результат.
Вы с этим работаете с первого дня,
с тем, что вы считаете
правильным ответом.
Вы вносите его в Викибазу, а потом
вы собираете информацию,
пока не подтвердите, что
это правильная идентификация
человека или правильная дата,
которую раньше нельзя было определить.
Так что, вы нарабатываете материал,
работая с данными,
и используя Викибазу
в качестве инструмента,
который приближает вас
к желаемому результату.
Первое собрание состоялось
1 декабря 2017 года.
Я помню, что я поставил задачу
найти дату смерти конкретной личности...
и я хотел, чтобы определённый человек
показал мне источник информации,
это оказалось очень сложно,
потому что ему
нужно было создать источник
до того, как можно было построить связи.
Тогда мы...
мы ясно поняли, что чтобы сделать это,
мы должны использовать источники,
уже добавленные в нашу Викибазу.
И если источники уже там,
то есть все ранее опубликованные книги --
это было бы идеально.
Если нам нужны эти данные,
нам нужен GND.
И когда мы узнали, что GND
собираются тестировать ПО,
я связался с ними и сказал:
«Не хотели бы вы делать это
в сотрудничестве с нами,
чтобы мы получим нужные нам данные,
а вы увидели, как работает
ваше ПО на Викибазе».
И это как раз стадия, на которой
мы находимся в настоящее время.
Сейчас, похоже, мы не очень понимаем,
как происходят многие процессы,
по крайней мере, я не понимаю.
Как вносить данные,
как перейти от ресурса строк
к ресурсу на основе элементов,
очень много всего.
В целом, моё выступление --
это приглашение.
Присоединяйтесь к нам.
Мы пока ещё не стали частью
сообщества Викибазы.
Такого пока нет.
У нас есть сообщество Викиданных.
Многое происходит в Викиданных,
но если я попрошу помощи с Викибазой,
которая не является частью Викиданных,
возникнут сложности.
Во-первых, хочу сказать, что
работать с нами очень здорово,
вы можете взять данные для Викиданных
в любое время, без копирайта.
Вы можете использовать нашу базу как
своего рода инкубатор в вашей работе,
просто перенести их в Викиданные.
Также мы будем работать
с большими данными вместе с GND,
это будет весьма интересно.
Если вы не боитесь испытаний,
наша платформа их предоставит.
У нас очень интересные сообщества.
В общем, мы отличаемся тем,
что у нас есть доступ к открытым
учётным записям и организациям.
Это значит, что на нашей платформе
можно сделать то,
что нельзя сделать в Викиданных.
У нас вы можете составить
генеалогическое древо.
Мы не против.
Интересно, когда люди работают
с такими данными.
Можете провести исторические
исследования своего города
на нашей платформе, мы не против.
Любая исследовательская работа
приветствуется.
Ещё многое предстоит сделать.
У нас серьёзные проблемы
в работе базы данных.
Она была запущена
с помощью Викимедиа,
но теперь, мы видим,
что многое в ней не работает.
Мы не можем это исправить.
Очень сложно получить техпомощь
в обеспечении работы базы данных,
её обновлении,
в решении небольших
технические проблем,
с которыми мы сталкиваемся, как только
запускаем экземпляр вне Викиданных.
Сложно получить прямую ссылку
на GND.
Она работает в Викиданных,
но не работает в нашем экземпляре.
Получить изображения с Викисклада
для нашей Викибазы очень непросто.
Остаётся ещё много
нерешённых вопросов.
Так что это приглашение.
Если хотите присоединиться к нам в ходе
массового ввода данных -- пожалуйста.
Свяжитесь с нами.
Если хотите помочь в решении
технических проблем,
мы будем очень рады.
Нам также нужны инструменты.
Вы видели наш инструмент
в начале презентации.
На самом деле, получить
инструменты не так уж сложно.
Я знаю, что нужно искать, чтобы
создать такую визуализацию,
когда у вас уже есть инструмент,
его легко модифицировать.
Такие инструменты очень высоко ценятся
в сообществе цифровых
гуманитарных наук.
И небольшие компании,
создающие эти инструменты,
продают их снова и снова.
Я бы очень хотел, чтобы эти инструменты
стали бесплатными раз и навсегда,
доступными, работающими
с экземпляром Викибазы.
Если вы заинтересованы
в разработке инструментов,
свяжитесь с нами, у нас множество идей
насчёт визуализаций,
которые нужны историкам,
будем работать вместе.
Многое ещё предстоит сделать.
У меня ещё минута.
Мне не нужна эта минута.
Не давите на меня.
(голос из зала) Отдайте её зрителям.
Я отдаю минуту зрителям.
Да. Большое спасибо.
(аплодисменты)
Присаживайтесь,
я прошу всех подняться на сцену.
Сейчас мы ответим на вопросы.
Я очень рад,
что мы закончили приглашением,
сейчас самое время его принять.
Пожалуйста, задавайте вопросы.
Мы также приглашаем вас всех
на встречу Викибазы завтра.
Если у вас есть идеи
относительно замечательной
установки Викибазы,
для вашего учреждения, или просто хобби,
чтобы изменить мир к лучшему...
пожалуйста, присоединяйтесь к нам,
мы встретимся и...
Похоже, со стульями какая-то проблема.
Хорошо, давайте постоим.
Я думаю, там есть ещё один микрофон.
(голос из зала) Микрофон у меня.
Хорошо. Итак...
Спасибо за презентации.
Увидимся на встрече Викибазы,
а теперь ваши вопросы выступающим.
(голос из зала) Кто первый?
(голос из зала) Привет. Я буду
выступать на Сверхскоростной дискуссии
о науках о Земле, и о том,
что существует множество хранилищ
данных по этой теме, собранных
и распространяемых сообществом,
на протяжении многих лет,
иногда даже десятилетий.
Они курируют данные,
их схемы постоянно развиваются,
они получают отзывы от сообщества.
Всё чего они хотят,
это объединить сообщество
и обеспечить развитие этих хранилищ.
Скорее всего, они не хотят
помещать свои данные в Викиданные
и потерять контроль над ними.
Они выполняют очень важную роль,
курируя эти данные.
Я просто хочу заметить,
что некоторые требования
и потребности, озвученные выступающими,
существуют и в моём сообществе.
Я хочу спросить, как вы разделяете
или сохраняете контроль
над схемами, над стандартами,
в то же время позволяя
сообществу высказывать своё мнение
и участвовать в работе
в духе краудсорсинга Викиданных?
Я думаю, что все могут ответить,
но, может, Дэвид начнёт?
Я не уверен, что у меня есть
хороший ответ на этот вопрос,
потому что в нашем случае...
в вопросе моделирования данных,
мы работаем в узком кругу.
Мы обращаемся к экспертам
относительно определённых сегментов,
некоторые из них вносят свой вклад,
но над текущей версией
работали только я и двое моих коллег.
Мы хотим иметь возможность
привлекать экспертов,
но работать всегда
в тесном сотрудничестве с нами,
так что нас не коснулась
проблема краудсорсинга.
Будучи частью сообщества Викимедиа,
могу сказать, что волноваться не сто́ит.
95% правок -- хорошие правки,
приносящие пользу, даже больше.
Когда мы работаем
с закрытым экземпляром...
мы предлагаем создать
профили под настоящими именами,
это препятствие, которое ни один
дурак не возьмётся преодолеть.
В нашем экземпляре мы требуем
от людей внести адрес на странице,
не для меня, но на странице,
Это, как правило,
делают только организации,
или люди, которые говорят:
«Я частное лицо.
Мне нравится это исследование.
Это моя специальность.
Я даю вам свой адрес».
И этого достаточно, чтобы отвадить
любых хулиганов, стремящихся
уничтожить Викиданные.
Вы можете закрыть систему,
но тогда вы не будете частью сообщества.
Опять же, если вы остановитесь
на открытом доступе, без копирайта,
то вы сможете открыться,
стать инкубатором,
где люди занимаются исследованиями,
и их результаты
приносят пользу сообществу.
Это просто предложение --
используйте закрытые системы,
а экземпляр используйте для работы
с теми, с кем вам приятно.
Я думаю, что...
Я думаю, что это не только моё мнение.
Существуют разные подходы,
и их трудно согласовать
между собой и сказать:
«Викиданные -- универсальное решение».
Я не хочу сказать,
что Викиданные не решение,
но существуют разные точки зрения
и разные потребности.
В мире... очень много разных потребностей,
профессиональных взглядов,
которые невозможно разрешить
в рамках одной всемирной базы данных.
Я думаю, что и то, и другое...
Сложнее всего примирить
и найти общий язык
этим группам людей,
совместить их потребности
и взгляды.
Есть ли ещё вопросы,
по-моему, лучше ответить
на другие вопросы.
Кто-нибудь ещё?
Если нет, пока вы формулируете вопросы...
Я хочу сказать, что одна из причин,
того, что мы взвешиваем
возможности именно Викибазы,
в том, что мы считаем, что добавление
и редактирование информации
в экземпляре Викибазы,
где есть права и роли,
как и в Викиданных,
обеспечивает более удобный
и простой способ взаимодействия
данных Викибазы
с информацией Викиданных,
чем построение мостов
между нашим нормативным файлом
и Викиданными в данный момент.
(голос из зала) Я рад слышать
о том, как вам удаётся
зарядить энергией сообщества,
находить собственные способы
моделирования данных,
и использовать Викибазу.
Сможете ли вы --
я обращаюсь к Стюарту Прайору
и к некоторым другим --
сможете ли вы представить приёмы,
отработанные в вашем сообществе,
Викиданным,
и сказать: «Мы работали
с книгами художников,
у нас было несколько версий,
вот что сработало,
вот свойства, которые вам нужны,
и изменения, которые вам нужно внести
в модель данных Викиданных»?
Хороший вопрос. Нужен короткий ответ.
Интересный вопрос.
Я не уверен, что наша модель
сработает в других областях.
Я надеюсь, что сработает.
Трудно сказать
примет ли сообщество Викиданных
такое влияние
со стороны другого сообщества,
работающего отдельно.
Но я, конечно, надеюсь,
что это может помочь людям
включиться в этот процесс,
без необходимости осваивать Викиданные.
Я считаю, попробуйте.
Если это удобно, попробуйте
и посмотрите, как это работает
в другом экземпляре.
И если вы решите,
что это хорошее свойство
для определённых поисков,
оно найдёт применение,
всё пойдёт как по маслу.
Не думаю, что это будет делаться
администрацией.
(голос из зала) Я пользователь Викиданных
и я очень ценю, что вы показали,
что у вас есть код,
который работает.
Вы создали модель,
которую можно увидеть в работе.
В открытом сообществе,
как известно, -- «покажите нам код».
Вы это можете.
Я думаю, что это замечательно,
увидеть отдельные ветки,
которые сводятся в модель.
Да, спасибо.
Я думаю, это самое главное.
Мне понравились слова,
«зарядить энергией».
Именно это мы и хотим сделать.
Зарядить энергией, как в Стартреке.
Наша дискуссия подошла к концу.
Если у вас остались вопросы
по проектам Викибазы, спрашивайте.
- Приходите завтра.
- Общайтесь.
В этом смысл всей конференции.
Большое вам спасибо.
(аплодисменты)
WikidataCon 2019
Викиданные и языки