-
Учреждения культуры
Панельная дискуссия
-
Сюзанна Онас, Майк Дикисон,
Йохим Нойберт, Беат Эстерманн
-
Всем добрый день.
-
Приветствуем вас на нашей
панельной дискуссии.
-
Прежде чем мы начнём,
я сделаю два объявления.
-
Прежде всего, пожалуйста, используйте
Etherpad для заметок.
-
Второе объявление для тех,
кто смотрит нас из дома
-
или из любого другого места.
-
Если у вас есть вопросы,
-
вы также можете писать их в Etherpad,
-
и наши ассистенты будут их отслеживать.
-
Итак, мы решили, что в этом году,
-
после того как мы увидим
все представленные материалы,
-
мы сосредоточимся на роли
Викиданных в экосистемах данных,
-
которая выходит за рамки
проектов Викимедиа,
-
что полностью
соответствует новой стратегии
-
Фонда Викимедиа.
-
Сегодня у нас четыре участника дискуссии.
-
Три плюс один.
-
Я попрошу вас выйти на сцену,
-
чтобы мы могли вас представить.
-
Сюзанна Онас.
-
Она долгое время является
активисткой движения за свободные знания
-
и участвует во многих Вики-проектах.
-
Сегодня она выступит с докладом
о совместном проекте
-
с Национальной библиотекой Финляндии.
-
Рядом со мной Майк Дикисон,
-
он выступит вторым.
-
Он куратор музея из Новой Зеландии.
-
Он зоолог и редактор Википедии.
-
Он стал первым «Свободным
википедистом» Новой Зеландии
-
в 2018 и 2019 годах.
-
Он расскажет нам о своём опыте,
-
а также о том, какова роль
Викиданных в этом контексте.
-
Затем выступит Йохим Нойберт
-
из Информационного центра по экономике
имени Лейбница в Киле и Гамбурге.
-
Он работает над тем, чтобы сделать
крупнейший международный архив прессы
-
общедоступным,
-
для этого он использует Викиданные.
-
Я выступлю последним.
Меня зовут Беат Эстерманн.
-
Я работаю в Бернском университете
прикладных наук, в Швейцарии.
-
Я долгое время был организатором
OpenGLAM в Швейцарии и Австрии.
-
Сегодня я расскажу о своей деятельности
-
в связи с разрешением, выданным мне
-
Канадской ассоциацией
представления искусств,
-
и более подробно остановлюсь
на исполнительском искусстве.
-
Не в Викиданных,
-
но вы увидите, что здесь
они тоже играют свою роль.
-
Теперь мы займём свои места,
-
и я предоставлю слово Сюзанне.
-
Здравствуйте.
Меня зовут Сюзанна Онас,
-
я работаю по совместительству
в Викимедиа Финляндия
-
координатором проектов для
учреждений культуры,
-
я также консультирую
по теме открытых знаний.
-
Это обсуждение больше
относится к последнему.
-
Итак, я работала с группой,
-
которая занималась
географическими данными...
-
я уточнила название,
но оно не на английском языке,
-
это инициатива правительства
Финляндии в сфере культурного наследия.
-
Итак, речь пойдёт
о географических названиях
-
и о том, как они представлены
-
в различных хранилищах
данных в Финляндии,
-
как они собирают воедино
разные источники,
-
и как они составляются
-
путём моделирования
в Викиданных и в других местах.
-
Здесь мы видим три основных
источника для проекта YSO-места,
-
которые являются частью
национальной онтологии.
-
AHAA для финских архивов,
-
Melinda для финских библиотек,
-
и KOOKOS для финских музеев.
-
Также существуют
три системы управления контентом,
-
которые объединяются
в проекте YSO-места.
-
Уже происходит обмен между Викиданными,
-
реализуется проект по названиям
для Национальной земельной службы.
-
Третий проект -- Архив финских названий,
-
который пока не вносит свой вклад,
-
но на этот счёт уже есть планы.
-
Таким образом, один из ключевых вопросов
моделирования в этой проблемной области --
-
в названиях мест,
представленных в этом проекте,
-
присутствуют три типа элементов.
-
Один из них -- само место,
которое имеет определённое местоположение.
-
Другой элемент это название места,
топоним, к примеру.
-
И ещё источники, документы,
-
из которых оба элемента
могут быть извлечены,
-
или подтверждены.
-
YSO-места... здесь,
в верхнем правом углу,
-
вы снова увидите ту же самую диаграмму.
-
Она в основном касается мест.
-
Основные источники:
Национальная библиотека Финляндии
-
и её проект Finto.
-
В настоящее время
насчитывается более 7 000 мест
-
на финском и шведском языках
-
и более 3 000 мест на английском языке,
-
и они имеют лицензию CC0.
-
Здесь вы видите сервис Finto
-
и место, я выбрала Севеттиярви.
-
Оно также связано
с нашим языковым проектом
-
совместно со сколтами.
-
Это место на самом севере Финляндии,
-
населённое этим народом, сколтами.
-
Здесь вы видите место,
которое принадлежит...
-
вы видите данные об этом месте.
-
Здесь видно, что эти данные
связаны с Викиданными,
-
так же, как и с данными
Национальной земельной службы.
-
Здесь видно более детально.
-
Они также иерархически упорядочены
-
внутри этого хранилища данных.
-
На самом деле, само место не видно,
-
но оно находится в этом муниципалитете,
-
регионе,
-
в Финляндии, как в стране,
-
и скандинавских странах,
более обширном регионе.
-
Здесь видно, что многие из них
-
были сопоставлены с Викиданными ранее
-
с помощью Mix'n'Match,
но некоторые ещё остались.
-
Самих названий не так много.
-
Всего менее 5 000.
-
Есть ещё одно хранилище данных
-
в рамках проекта Финской
геопространственной платформы.
-
Карточки с названиями мест,
-
к ним относятся все названия мест
на финских картах.
-
И у них есть связанные данные,
имеющие лицензию CC BY 4.0.
-
800 000 меток на картах на финском,
шведском, на всех трёх саамских языках
-
Финляндии.
-
У них два разных типа сущностей:
-
места
и географические названия, топонимы.
-
У обоих типов есть постоянные URI.
-
Например, тот же Севеттиярви
сначала на финском языке,
-
и затем на трёх саамских языках,
как и географические данные,
-
затем идёт информация
об этом месте, его тип и так далее.
-
Вот карточка для названия места,
топонима с своим собственным URI.
-
Извините, похоже,
она не переведена на английский.
-
Многоязычность не охватывает весь проект.
-
Теперь перейдём
к Архиву финских названий.
-
Это проект Института
исконных языков Финляндии,
-
и в нём представлены не места,
не географические названия,
-
а их источники.
-
Три миллиона полевых заметок
с географическими названиями,
-
это проект Викибазы.
-
Они в Викибазе в основном
на финском языке, некоторые на шведском.
-
Замечательная коллекция саамских названий,
которая нас очень интересует.
-
Они имеют лицензию CC BY.
-
Это своего рода испытание
с точки зрения Викиданных.
-
Но если бы была локальная
финская Викибаза,
-
мы могли бы сначала поработать с ней
в рамках этого проекта.
-
На этом скриншоте видно,
-
что здесь есть информация о месте,
-
старые карты, которыми изначально
пользовались составители,
-
и карточка, которую они создали
на основе собранной информации.
-
Вот одна из таких карточек,
-
разбитая на данные,
-
которые в неё включены.
-
Затем нам прислали проект,
посвящённый связанным данным,
-
выполненный Хельсинкской лабораторией
цифровых гуманитарных наук
-
и группой исследований
семантических вычислений
-
Университета Аалто
-
совместно с Институтом
исконных языков Финляндии,
-
проект Names Sampo.
-
Получается объединённый
исследовательский интерфейс
-
для нескольких источников
географических названий.
-
Здесь видно, что источники
находятся слева,
-
а затем, эти данные
можно наглядно представить.
-
Да.
-
Я предложила идею моделирования
для местной Викибазы,
-
которую мы могли бы сделать
с этими данными.
-
Но когда возникает вопрос моделирования.
-
Как моделировать?
-
Существуют разные способы,
разные подходы для каждого проекта.
-
Можно так же поступить
и с языками этнических меньшинств
-
без особых усилий.
-
У нас есть два основных варианта:
-
модель SAPO, Финская
пространственно-временная онтология
-
и модель Викиданных.
-
Здесь видно, что элементы Викиданных
стремятся к нулю.
-
В идеале, они остаются неизменными
при изменении свойств.
-
В то время как в модели SAPO
эти элементы обновляются
-
в случае изменений, как, например,
при изменении региона или названия.
-
Вернёмся к разделению
-
между тремя разными
измерениями названий мест.
-
Следует ли нам сделать
эти географические названия
-
сущностями или свойствами?
-
Викиданные используют свойства,
-
а в проекте Национальной
земельной службы используются сущности.
-
Или мы должны сделать их лексемами?
-
Викиданные работают со свойствами,
-
текстовыми свойствами
для топонимов вместо лексем.
-
Простите, наоборот.
-
Топонимы -- это...
-
свойства, а не лексемы.
-
Верно.
-
Возможно, недостаток Викибазы в том,
-
что в ней нет географических форм,
-
в базовой настройке,
-
поэтому для использования
локальных географических форм
-
в стек пришлось бы добавить
больше технологий.
-
И объединение действительно нужно,
-
чтобы иметь возможность пользоваться
всеми преимуществами Викиданных.
-
Я закончила. Спасибо.
-
(аплодисменты)
-
(смеётся)
-
Хорошо.
-
(говорит на маори)
-
Приветствую всех. Меня зовут Майк Дикисон.
-
На протяжении года
-
я был «Свободным википедистом»
Новой Зеландии.
-
Возможно, вам интересно,
кто такой «Свободный википедист».
-
Если вы будете искать,
то не найдёте определения.
-
Это термин, который я придумал
в своей заявке на грант,
-
и он, похоже, очень понравился фонду.
-
На нём и остановились.
-
За год я посетил 35 различных
учреждений, местных жителей
-
и для большинства из них
я проводил тренинги,
-
организовывал общественные
мероприятия и пытался развивать
-
стратегию Викимедиа для каждого из них.
-
Это был очень интересный опыт.
-
Я столкнулся с широким кругом
различных проектов и людей.
-
И я хочу рассказать
о различных проектах,
-
связанных с Викиданными,
-
в интересном или, возможно,
познавательном ключе,
-
что может быть полезным для обсуждения.
-
Изначально проект был
проектом Википедии,
-
просто потому,
что название было знакомо людям,
-
поэтому мы организовали
множество различных мероприятий
-
на традиционных Вики-марафонах,
посвящённым гендерному неравенству
-
и так далее.
-
И как вы видите, [неразборчиво]
-
мы набрали много новых
успешных редакторов, и так далее.
-
Мы делали массовые выгрузки в Викисклад.
-
В данном случае была собрана коллекция
из более чем 1 000 оригинальных работ
-
художника-иллюстратора
насекомых Деса Хелмора
-
которая ждала своего часа
на жёстком диске,
-
без изучения на протяжении 10 лет,
-
и мы смогли получить разрешение
на их публикацию в открытом доступе
-
под лицензией CC BY.
-
Лёгкие победы,
которые можно показать всем.
-
Каждый может ознакомиться
с изображениями жуков.
-
Каждый может ознакомиться с семинарами,
-
посвящёнными устранению
гендерного неравенства.
-
Но Викиданные гораздо сложнее «продать»
-
людям из учреждений культуры
-
или тем, кто не входит в наше движение.
-
Я начал осознавать, что Викиданные
-
будут всё более и более важной частью
-
проектов «Cвободного википедиста».
-
По мере продвижения проектов,
Викиданные становились
-
всё более существенным
компонентом моей работы.
-
Я начал пытаться
больше узнать о Викиданных,
-
потому что начал понимать,
насколько это важно.
-
Итак, сам проект.
-
Какапо -- нелетающий попугай,
эндемик Новой Зеландии.
-
Мы работали с Департаментом
охраны природы,
-
чья работа заключается
в спасении этого вида от вымирания,
-
и выдвинули следующую идею:
-
«Что, если мы поместим
в Викиданные каждого какапо?»
-
(смех в зале)
-
Это может показаться нелепым,
-
но на самом деле это вполне
выполнимый проект.
-
Некоторые попугаи уже там.
-
Главное, что нужно заметить,
что какапо не так уж много.
-
Так что задача выполнима.
-
Когда я начинал, их было 148,
а потом один умер.
-
И после прекрасного сезона
размножения их стало 213.
-
Это здорово. Это самая большая
популяция какапо за последние 50 лет.
-
Важное событие.
-
В Новой Зеландии об этом
каждый день говорили в новостях.
-
Каждый вылупившийся...
-
(голос из зала 1) В Нью-Йорк таймс.
-
Да? О, здорово.
-
Да, это были национальные новости.
Всем нравятся эти птицы.
-
Но самое интересное,
-
что в отличие от более
многочисленных видов,
-
у каждого какапо своё уникальное имя
-
и уникальный идентификационный номер.
-
И часто на каждого какапо
есть биографические данные
-
о том, где и когда они вылупились,
-
кем были их родители,
-
когда они умерли, если это случилось.
-
Существует база данных
Департамента охраны природы,
-
в которой есть вся эта информация.
-
Один из самых известных какапо,
конечно же, Сирокко,
-
который, как вы видите,
назван в честь ветра.
-
У Сирокко есть аккаунт в Twitter,
-
с которым у Викиданных
возникли некоторые проблемы,
-
потому что, видимо, у попугаев
не может быть аккаунтов в Twitter.
-
Я об этом не знаю.
-
Он даже попал на обложку альбома.
-
Существует множество свойств этой,
-
вероятно, одной из самых
известных особей какапо.
-
Итак, я обратился в Департамент
охраны природы с предложением:
-
«Почему бы нам не попробовать
сделать это с каждым из них?»
-
Им нужно было подумать,
сколько биографических данных
-
можно опубликовать.
-
Они предоставили короткий список.
-
И теперь у нас, 212...210 --
я думаю, пара особей умерли --
-
живых какапо, которые занесены в список.
-
Они получают имя
только после того, как оперятся.
-
Пока они птенцы, у них есть кодовый номер,
-
Как только они полностью оперятся,
-
мы создаём полноценные Викиданные,
-
весь вид будет в Викиданных.
-
Но нам нужно придумать
свойство для DOC ID,
-
я бы хотел поговорить с вами об этом.
-
Следует ли нам использовать
какой-то определённый ID
-
или придумать такой ID,
-
который будет применим
ко всем отдельным особям птиц,
-
растений или животных,
-
которые были отмечены в любом
научно-исследовательском проекте?
-
Вопрос хороший.
-
Второй проект:
Художественная галерея Крайстчерча.
-
У Колина Маккахона,
-
самого известного художника
Новой Зеландии, очень мало картин.
-
Это рисунок, который он сделал
для новозеландского школьного журнала,
-
который в то время
финансировался правительством.
-
Значит, авторские права на него
-
принадлежат архивам Новой Зеландии.
-
Это весьма необычная ситуация.
-
Я сотрудничал
с Художественной галереей Крайстчерча
-
которая вместе с Художественной
галереей Окленда
-
поддерживает сайт
«Найти новозеландских художников».
-
Работа сайта заключается
в отслеживании коллекций
-
каждого учреждения, в котором имеются
коллекции работ новозеландских художников.
-
В их базе данных
около 18 000 разных художников,
-
о большинстве из них
очень мало информации.
-
Мы сделали стандартную
выгрузку в Mix'n'Match.
-
Мы экспортировали тех,
у которых была хотя бы дата рождения,
-
или дата смерти, или место рождения,
или место смерти.
-
Не очень строгие ограничения.
-
Даже тогда нам не удалось
сопоставить нескольких из них,
-
но сейчас у нас около 1 500,
-
которые совпадают
с известными художниками в Викиданных,
-
и это хороший результат.
-
Но что нас больше всего привлекло...
-
Кстати, это их сайт,
-
который содержит ссылки на коллекции,
-
биографические данные,
которые они ввели вручную,
-
для каждого художника.
-
Благодаря экспорту и внесению
данных в Mix'n'Match
-
выявилось множество опечаток и ошибок,
-
которых они не заметили.
-
Когда начинаешь
прогонять данные через Excel,
-
выявляются подобные ошибки.
-
И они внезапно осознали
ценность Викиданных,
-
когда я сказал: «Вы можете просто брать
эту информацию из Викиданных».
-
Их это просто поразило.
-
Я думаю, это одно из преимуществ.
-
Когда у вас есть сайт,
старательно собранный вручную,
-
с 18 000 записей, в которых полно ошибок,
то сказать им, что есть другой способ,
-
что другие люди могут выполнить
проверку и исправить ошибки...
-
Это подкупает.
-
Я предложил идею
создания из Викиданных целой книги
-
по истории новозеландских художников
в Крайстчерче в 30-х годах
-
-- её только что опубликовали --
на основе данных
-
о художниках, связях,
местах, выставках и так далее.
-
Это вполне выполнимый проект,
и они очень им заинтересовались.
-
Третий проект:
Маорийские предметные указатели.
-
«Вака» на языке маори --
название определённого вида каноэ,
-
боевого каноэ.
-
В Национальной библиотеке Новой Зеландии
-
есть запись для слова «вака»,
у Национальной библиотеки
-
есть свой словарь
маорийских предметных указателей
-
на языке маори.
-
В словаре есть определение
слова «вака»
-
на маори и английском языках.
-
В нём много более узких терминов,
-
как вы видите здесь.
-
Типичный пример -- «таурапа».
-
Определение сначала на маори,
затем на английском.
-
Это резной штевень,
который вы видите на изображении.
-
А по-английски вы бы сказали sternpost,
-
но вы не можете назвать
таурапу этим словом,
-
потому что таупара используется
только в определённых видах боевых каноэ.
-
Значит, для этого слова
нет английского эквивалента.
-
И я вдруг понял,
что здесь целая онтология
-
терминов определённой культуры,
которая была тщательно проработана
-
и проверена Национальной библиотекой
совместно с маори,
-
и она постоянно пополняется
определениями
-
и описаниями на двух языках:
английском и маори.
-
Это впечатляет.
-
Я вдруг подумал, что мы могли бы
поместить всё это в Викиданные.
-
Сначала на маори, а затем, если нужно,
перевести на английский.
-
Это было бы здорово.
-
Но я столкнулся с авторским правом.
-
К сожалению, лицензия в этом случае
«Некоммерческая – Без производных»
-
Теперь я должен обсудить с ними,
-
почему они выбрали эту лицензию.
-
Возможно, это произошло потому,
что маори согласились поделиться
-
своими знаниями,
только в случае гарантии,
-
что эти сведения не будут использованы
в коммерческих целях.
-
Сталкиваться с подобными
ограничениями
-
всегда очень неприятно.
-
Рассказав об этих трёх проектах,
-
я хотел инициировать их обсуждение.
-
Внесение в Викиданные целого вида.
-
Что нужно сделать,
чтобы изменить мнение
-
куратора художественной галереи
о ценности Викиданных.
-
Что делать,
если перед вами целая онтология
-
на другом языке, которая,
к сожалению, ограничена
-
жёсткой лицензией.
-
Спасибо.
-
(аплодисменты)
-
Безвозмездная передача данных
в Викиданные:
-
Первый опыт из Архива прессы ХХ века
-
Здравствуйте.
Меня зовут Йохим Нойберт.
-
Я работаю в ZBW, Германской национальной
экономической библиотеке,
-
в Информационном центре
по экономике в Гамбурге,
-
я разрабатываю
научное программное обеспечение.
-
Одной из моих задач в прошлом году
-
была подготовка безвозмездной
передачи данных в Викиданные.
-
Я расскажу о нашем первом опыте
-
передачи метаданных
из Архива прессы ХХ века.
-
Насколько нам известно,
-
это крупнейший в мире архив прессы.
-
Он был собран в период
между 1908 и 2005 годами,
-
и был составлен
-
более чем из 1 500 газет
и периодических изданий
-
из Германии, а также из-за рубежа.
-
И он охватил всё,
что могло представлять интерес
-
для Гамбурга,
-
для гамбургских предпринимателей,
-
которые хотели выйти
на международный уровень.
-
Как видите, эти материалы
были вырезаны из газет
-
и помещены на бумагу,
-
а затем собраны в папки.
-
Здесь вы видите
небольшую часть Архива людей,
-
аналогичным образом
была собрана информация о компаниях,
-
общих вопросах, товарах,
-
обо всём, что могло представлять интерес.
-
Эти папки были отсканированы
-
-- примерно до 1949 года --
-
в рамках проекта, финансируемого Немецким
научно-исследовательским сообществом
-
в 2004-2007 годах.
-
В результате получилось
25 000 тематических досье того времени.
-
В этих папках более
двух миллионов страниц.
-
Их можно найти в интернете.
-
Это приложение было разработано
библиотекой ZBW
-
и сейчас выглядит немного устаревшим,
-
несовременным,
-
и ещё проблема в том,
-
что архитектура этого приложения
построена на Oracle,
-
оно построено на ColdFusion,
работает на серверах Windows,
-
поэтому оно не очень стабильно
в долгосрочной перспективе.
-
Мы обсудили возможность его переноса
-
в более подходящее для этого приложение
для работы со связанными данными,
-
или сделать смелый шаг
-
и разместить все эти данные
в открытом доступе.
-
Мы присвоили этим данным лицензию CC0,
-
и, в настоящее время,
мы перемещаем основной
-
уровень доступа, уровень обнаружения,
это первичный уровень доступа
-
к сети открытых связанных данных,
-
и на самом деле имеет смысл
-
поместить некоторые
метаданные в Викиданные,
-
и убедиться в том, что все папки собраний
-
связаны с Викиданными,
-
чтобы их можно было найти
-
и все метаданные этих папок
-
также перенесены в Викиданные.
-
Ими можно пользоваться и пополнять их.
-
В эти данные можно внести исправления.
-
ZBW, конечно, пока ещё поддерживает
хранилище изображений,
-
которые мы не можем опубликовать,
-
не можем присвоить им лицензию,
-
поскольку они принадлежат их создателям.
-
Но в будущем мы обеспечим доступ
-
к некоторым файлам метаданных
с помощью DFG Viewer
-
по манифестам IIIF.
-
Мы подготовим несколько
статических целевых страниц,
-
которые будут служить
точкой отсчёта для Викиданных,
-
а также по-прежнему будут
обеспечивать доступ к данным,
-
которые не вписываются
в формат Викиданных.
-
Для этой передачи данных в Викиданные
-
мы создали свою
пользовательскую инфраструктуру,
-
точку доступа SPARQL с этими данными,
-
мы в основном использовали
федеративные запросы
-
между этой точкой доступа
и сервисом запросов Викиданных
-
для создания соответствующих утверждений,
-
объединённых
-
в SPARQL-запросах
или преобразованных с помощью скрипта,
-
который также генерировал
ссылки на утверждения.
-
Затем мы загрузили всё в QuickStatements,
чтобы использовать в сети.
-
Вот что мы получили.
-
Это не только простые вещи,
как даты рождения, простите,
-
но и сложные утверждения
-
об уже существующих элементах,
-
например, то, что этот человек был членом
наблюдательного совета данной компании
-
в этот период времени,
-
и на него ссылались для использования
-
в научном контексте.
-
Первая часть передачи данных завершена.
-
Архив людей полностью
связан с Викиданными.
-
Это также информационный инструмент.
-
Многие элементы раньше
-
не имели никаких внешних ссылок.
-
У нас было около 6 000 утверждений,
-
которые сейчас находятся
в метаданных этого архива.
-
Это была самая простая часть,
-
поскольку людей легко
идентифицировать в Викиданных.
-
Более 90% уже были в базе,
-
так что мы смогли их связать.
-
Мы создали около 100 элементов
-
для тех, которые отсутствовали.
-
Но сейчас мы работаем
-
над остальной частью архива,
-
в частности, над архивом общих тем.
-
Это означает включение в Викиданные
исторической системы организации знаний
-
о мире в целом,
-
в виде газетных вырезок.
-
Чтобы дать вам представление,
архив по странам и темам
-
организован по принципу иерархии стран
-
и других географических сущностей
-
и переведён на английский язык,
что упрощает задачу.
-
На немецком языке присутствует
-
глубоко вложенная
тематическая классификация.
-
Эта комбинация определяет...
-
одну папку.
-
Теперь мы хотим соотнести это
-
как структуру с Викиданными
и ввести данные.
-
Я хочу пригласить вас
-
присоединиться к этому проекту,
-
замечательному
с точки зрения организации знаний.
-
Это Вики-проект,
где вся эта работа отслеживается,
-
вы можете наблюдать за его развитием
или принять в нём участие.
-
Большое спасибо.
-
(аплодисменты)
-
Мы вводим исполнительское
искусство в Викиданные.
-
Мы переносим его в облако
связанных открытых данных,
-
создавая экосистему
связанных открытых данных
-
для исполнительского искусства.
-
Вопрос, на который я пытаюсь ответить,
-
и надеюсь, вы поможете мне ответить:
-
какую роль во всём этом
играют Викиданные?
-
Я начну с опыта,
который я приобрёл в этом году.
-
Я имел удовольствие
-
поработать совместно с CAPACOA,
-
Ассоциацией представления
искусства Канады,
-
которая запустила проект
-
«Инициатива связанного
цифрового будущего»,
-
чтобы помочь всему
сектору искусства Канады
-
научиться пользоваться
связанными открытыми данными.
-
Они это сделали,
основываясь на наблюдении,
-
что в течение последних пяти лет
-
очень важной темой
в исполнительском искусстве
-
стали недостаточно качественные
метаданные,
-
без взаимосвязи и совместимости.
-
Поэтому некоторые выступления
и события нелегко найти
-
с помощью Google
и автоматизированных систем.
-
Наше совместное видение
-
заключалось в том,
что мы хотим иметь базу знаний
-
для всех заинтересованных сторон.
-
Мы изучили всю структурную модель
исполнительского искусства,
-
определили в ней ключевых
заинтересованных лиц,
-
посмотрели на сценарии использования,
которым мы хотели бы следовать
-
и отразили их во всей архитектуре
базы знаний, или разных платформ,
-
и это, очевидно,
распределённая архитектура,
-
а не один монолит.
-
Я быстро пробегусь по ней,
-
поскольку у нас всего 10 минут.
-
Думаю, у нас будет достаточно времени
сегодня или завтра, чтобы углубиться,
-
если кто-то заинтересуется деталями.
-
Итак, мы начали с со структурной модели
исполнительского искусства,
-
которая была опубликована в прошлом году.
-
Нам повезло, что мы могли опереться
на уже проделанную работу.
-
Основная цепь создания ценности
посередине,
-
а заинтересованные стороны вокруг неё.
-
Всего мы определили 20 групп
заинтересованных сторон,
-
которые затем сократили
до семи более крупных категорий
-
для каждой группы.
-
Мы сформулировали их потребности
-
в рамках инфраструктуры,
-
и чего они смогут достичь,
если всё будет взаимосвязано,
-
а данные общедоступны.
-
Здесь вы видите типы данных:
-
«Создание», «Презентация и продвижение»,
-
«Распространение
и Повторное использование»,
-
«Живая аудитория»,
-
«Интернет-потребление», «Наследие»,
-
«Наука и образование».
-
После того, как мы составили
большую таблицу
-
-- вы видите здесь только первую часть --
-
посмотрели, какой тип данных
-
использовался повсеместно
-
различными группами
заинтересованных сторон.
-
Это довольно большая база данных,
общая для всех.
-
Это та область,
-
где имеет смысл сотрудничество
-
и совместное хранение данных.
-
Несколько слов об архитектуре платформы:
-
вы видите, что в ней четыре уровня.
-
Внизу отображается уровень данных.
-
Викиданные играют в нём свою роль,
-
но и другие базы данных,
распределённые базы данных
-
могут публиковать данные
с помощью SPARQL-точек доступа.
-
Жёлтая часть посередине --
семантический уровень.
-
Это наш общий язык для описания объектов,
-
для создания утверждений об этих объектах,
-
связанных с исполнительским
искусством, онтология.
-
Затем у нас есть прикладной уровень,
-
состоящий из различных модулей,
например, анализа данных,
-
извлечения данных...
-
Как перевести
неструктурированные данные
-
в структурированные данные?
-
Как это сделать
с помощью различных инструментов?
-
Конечно, есть визуализация данных.
-
Если объём данных большой,
-
то их нужно как-то визуализировать.
-
Сверху уровень представления данных,
-
с которым ежедневно
взаимодействуют обычные люди:
-
поисковые системы, энциклопедии,
культурные программы
-
и целый ряд других сервисов.
-
Мы не начинаем с нуля.
-
В этой области уже проделана
определённая работа.
-
Я просто приведу
несколько примеров из проекта,
-
в котором я участвовал.
-
И ещё кое-что.
-
Я начал в этой области
-
со Швейцарского архива
исполнительских искусств.
-
До создания базы данных
швейцарских исполнительских искусств
-
мы создали онтологию
исполнительского искусства,
-
которая в настоящее время
внедряется в RDF.
-
В нашей базе хранятся данные
по истории выступлений в Швейцарии
-
за последние 60-70 лет.
-
Это то, что можно развить,
-
то, что можно преобразовывать в RDF.
-
Также у нас была платформа для сборки,
-
где можно получить
доступ к этим данным.
-
Затем мы сделали
несколько вводов в Викиданные,
-
частично из Швейцарии,
-
частично из учреждений
исполнительского искусства,
-
например, Барт Магнус участвовал в этом.
-
Он был движущей силой.
-
Ещё был материал из Викисклада,
-
но не очень хорошо связанный
со всеми остальными нашими метаданными.
-
И, очевидно, что этим вводом
-
мы начали внедрять
части швейцарской модели данных
-
в Викиданные.
-
Один из канадских партнёров
по этому проекту -- Culture Creates.
-
Они запустили платформу, которая собирает
информацию с театральных сайтов
-
и вставляет её в граф знаний,
-
чтобы затем представить её
поисковым системам
-
и другим поисковым устройствам.
-
Опять же, мы должны были внедрить
и расширить это в онтологии.
-
Как видно из слайда,
здесь ещё много пустых мест,
-
но есть и пересечения,
-
самым важным,
очевидно, является общий язык,
-
который поможет нам связать
различные наборы данных.
-
Также важно,
-
что мы используем одни и те же
базовые регистры и нормативные файлы.
-
Здесь Викиданные играют важную роль,
-
соединяя всё между собой.
-
Теперь я хотел бы поделиться
рекомендациями
-
Консультативного комитета
по инициативе будущего связанных данных.
-
По крайней мере,
двумя первыми рекомендациями.
-
Для канадцев сейчас крайне важно
-
заполнить граф знаний
об исполнительском искусстве Канады,
-
потому что в отличие от Швейцарского
архива исполнительских искусств,
-
у них нет уже существующей базы данных,
-
они создают её с нуля.
-
И очень важно, чтобы там были данные.
-
А во-вторых, как видите,
уже появляются Викиданные.
-
Викиданные, по мнению
Консультативного комитета,
-
рассматриваются как дополнение
к Artsdata.ca, этому графу знаний,
-
и поэтому следует способствовать
-
её пополнению данными, относящимися
к исполнительским видам искусства.
-
Именно над этим мы будем работать
в ближайшие месяцы и годы,
-
поэтому я ищу людей,
-
готовых присоединиться к этому проекту.
-
Сейчас мы считаем,
что они дополняют друг друга.
-
Мы должны подумать о плюсах и минусах
-
каждого подхода.
-
Здесь вы видите сравнение
-
между Викиданными и классическим подходом
к связанным открытым данным.
-
Я буду рад обсудить это с вами,
-
услышать о вашем опыте.
-
Но, как мне кажется,
Викиданные это огромный плюс,
-
потому что это краудсорсинговая платформа,
-
и легко пригласить
другие стороны внести свой вклад.
-
Потеря контроля -- отрицательная сторона.
-
Владельцы данных вынуждены отказываться
от контроля над своими графами,
-
качеством и полнотой данных.
-
Отслеживать данные в Викиданных сложнее,
чем в базах под вашим контролем.
-
Ещё одна сильная сторона Викиданных --
-
немедленная интеграция во всемирный граф.
-
И вы просто делаете
-
пошаговую сверку с другими базами данных,
-
что некоторые также рассматривают
как преимущество,
-
но, конечно, если вам нужна
интеграция и совместимость,
-
Викиданные заставляют вас
идти на это с самого начала.
-
Согласование практик
моделирования данных --
-
проблема в обоих случаях.
-
Но сначала может показаться,
-
что проще сделать это только
в своём собственном хранилище,
-
потому что в какой-то момент
вы завершите эту задачу,
-
а в Викиданных она будет постоянной.
-
Когда дело доходит до расстановки
приоритетов при публикации данных...
-
Это правила,
которым я следую в данный момент.
-
Прежде всего,
мы хотели бы публиковать такие данные,
-
для которых неясно, кто ими управляет.
-
Поэтому эти данные
будут управляться совместно.
-
И мы хотели бы публиковать такие данные,
-
в которых есть высокий потенциал
для краудсорсинга.
-
Мы бы хотели публиковать такие данные,
-
которые скорее всего будут использованы
повторно в контексте Википедии.
-
Есть надежда, что часть
международной координации
-
в отношении всего процесса
моделирования данных, стандартизации,
-
может происходить
непосредственно в Викиданных,
-
если это не происходит
в каком-то другом месте,
-
потому что благодаря этому
люди начинают взаимодействовать,
-
если они публикуют данные в одной области.
-
Сейчас мы хотели бы уделить внимание
базовым регистрам и нормативным файлам,
-
они помогают нам создавать связи
-
между различными данными
и ненормализованной лексикой
-
как расширением существующей онтологии.
-
Ещё два слайда.
-
Сейчас мы рассмотрим подход
«Сумма всех учреждений культуры»
-
к проекту «Вики любит
исполнительское искусство».
-
Мы описываем места и организации
-
и пытаемся перенести данные в Википедию
-
в виде карточек и шаблонов.
-
Ещё один проект, в котором
я буду участвовать, COST Action.
-
Мы представим его в следующем году.
-
Он посвящён экосистеме
связанных открытых данных
-
для исполнительских искусств.
-
COST -- европейская программа,
поддерживающая активность в сети.
-
Здесь вы видите список тем,
охваченных в этом проекте.
-
Я выделил две темы.
-
Первая: вопрос объединения Викиданных
-
с классическим подходом
к связанным открытым данным.
-
Вторая -- я думаю, тоже очень важна,
-
у неё есть огромный потенциал --
-
реализация международных кампаниий
по добавлению данных в Викиданные.
-
Вот и всё. Спасибо за внимание.
-
Теперь я хотел бы пригласить
моих коллег на сцену.
-
Возможно, вы дадите им микрофоны.
-
А потом я хотел бы...
-
дать вам возможность задать вопросы.
-
Также я хочу спросить моих коллег,
-
есть ли у них вопросы друг к другу?
-
(смех)
-
Итак, у нас есть вопрос от аудитории?
-
(голос из зала 2) [неразборчиво]
-
Я хотел бы спросить у каждого из вас,
-
где бы вы провели черту,
-
как вы определяете,
-
когда нужно запускать
собственную Викибазу,
-
и что вы хотите поместить в Викиданные?
-
Это чёткое разграничение
-
или [неразборчиво]?
-
Я могу ответить первой,
потому что микрофон у меня.
-
Я думаю, что одна из проблем --
значимость данных.
-
Я рассматриваю это в другом проекте.
-
И я думаю, что лицензирование
может быть одним из решений,
-
потому что вы можете применить
свои условия в своей базе данных,
-
и, я думаю, где это возможно.
-
И в-третьих, можно просто
использовать её как песочницу,
-
подготавливая в ней данные
к вводу в Викиданные.
-
Вот три главные вещи,
которые я сейчас вспомнила,
-
но я могу назвать ещё несколько.
-
Для меня авторские права
всегда будут проблемой.
-
Если Национальная Библиотека
захотела бы перейти на Викибазу,
-
они смогли бы продолжать
контролировать лицензирование
-
той работы, которую они уже провели
в отношении терминов на языке маори.
-
База данных попугаев какапо
содержит только те данные,
-
которые могут быть опубликованы
по мнению Департамента охраны природы,
-
но я подозреваю,
что если они увидят, что она работает,
-
у них может возникнуть соблазн
использовать закрытую Викибазу
-
для ведения собственной базы данных,
-
просто потому, что некоторые
инструменты визуализации,
-
которые могут быть применены, будут лучше,
-
чем таблицы Excel,
которыми они пользуются сейчас.
-
Я думаю, это сильно зависит
от вида данных.
-
Нам, конечно, с архивом прессы
очень повезло в том,
-
что эти материалы уже были опубликованы
-
в то время,
-
но их публикация была дорогостоящей.
-
Так что, это довольно просто.
-
Я думаю, также, проекты...
-
Это типичный проект,
-
его финансировали
некоторое время, а потом прекратили.
-
Что же произойдёт с данными,
которые помещены в какое-то хранилище
-
с каким-то программным обеспечением,
которое не будет работать вечно?
-
На мой взгляд это имеет смысл.
-
В то время Викиданных не было,
но теперь они есть,
-
и для нашего проекта имеет
смысл на ранней стадии
-
обсуждать устойчивость в контексте
перемещения данных
-
в более крупную экосистему,
такую как Викиданные,
-
и обсудить это
с сообществом Викиданных,
-
что имеет смысл добавлять в Викиданные,
-
а что сохранить в проприетарной форме.
-
Возможно, в более простой форме,
не в виде сложного приложения,
-
сделать их доступными для обнаружения
и связать с большим облаком данных
-
вместо того, чтобы вкладывать кучу денег
-
в какое-то хранилище,
которое не будет поддерживаться.
-
Да, как я уже говорил,
в проекте, который я представил,
-
есть различие между подходом
к хранению в Викиданных
-
и классическими подходом
к связанным открытым данным.
-
Дело не только в создании
закрытой Викибазы.
-
Одна из сложностей, с которой
мы столкнулись в Викиданных:
-
когда вы публикуете свои данные,
-
вы должны поддерживать порядок,
-
следить за другими людьми.
-
Это может отпугнуть людей,
значит, мы будем работать с этим
-
пошагово.
-
Итак, в настоящее время будет существовать
база данных, находящаяся...
-
в классических связанных открытых данных,
-
мы начинаем связывать её с Викиданными,
-
и это непрерывный процесс,
позволяющий понять,
-
для каких областей в Викиданных
-
в конечном итоге
будет больше всего данных,
-
а для каких областей больше данных
будет в других базах данных.
-
Очевидно, у нас будут проблемы
с синхронизацией,
-
как, возможно, у всех нас,
-
из-за поля связанных данных,
-
где мы должны решить, кому доверять,
-
кому доверить управления.
-
(ассистент) Ещё вопросы?
-
(голос из зала 3) Спасибо.
-
Я полностью согласна с вопросом о том,
-
где провести границу,
публиковать ли данные в Викиданных
-
или хранить их, а также создавать,
управлять и обслуживать
-
в локальных базах данных
и с какой целью.
-
Я думаю, что это большая дискуссия,
-
которая выходит за рамки восторга
-
от размещения данных в Викиданных,
потому что они будут общедоступны,
-
они служат человечеству, потому что...
-
Это такой крутой инструмент,
-
а в реальной жизни всё сложнее, я думаю.
-
Несмотря на это,
дискуссия довольно интересная.
-
Ещё один вопрос,
или другая проблема, которая обсуждается
-
на этом мероприятии в разных группах.
-
С одной стороны,
иметь свою базу данных,
-
независимо от технологии,
-
и публиковать что-то в Викиданных,
-
или строить собственную систему
-
создания информации и работы с ней
-
на основе технологии Викибазы.
-
Синхронизировать или...
объединять или что-то ещё,
-
в зависимости от технологии,
которая используется,
-
и то, что вы используете Викиданные
только для публикации,
-
или инфраструктуры,
которая находится под Викиданными,
-
для создания данных и управления ими.
-
Я имею в виду, у нас была дискуссия
-
по поводу Викибазы,
-
и здесь будут и другие обсуждения,
-
но это всё на разных уровнях, как я думаю.
-
Можно я отвечу на ваш вопрос
о дискуссиях о Викибазе или Викиданных?
-
(голос из зала 3) Хорошо.
-
Я думаю, проблема в том,
что мы слишком много внимания уделяем
-
инфраструктуре Викибазы,
поскольку существуют
-
другие инфраструктуры,
-
например, в области
исполнительских искусств.
-
У нас есть ещё одно
сообщество MusicBrainz,
-
которое работает на собственной платформе,
предоставляющей связанные открытые данные,
-
и, как я понимаю,
-
в сообществе Викиданных
есть договорённость о том,
-
что мы не собираемся
дублировать все их данные,
-
мы не копируем все их данные,
-
но принимаем тот факт,
что они дополняют друг друга.
-
Что произойдёт, когда вы начнёте
интегрировать эти данные в Википедию?
-
Карточки, например.
-
Сможем ли мы получить эти данные
непосредственно из точки доступа SPARQL?
-
Или же мы должны копировать все данные,
-
и какие процессы в этом задействованы?
-
(голос из зала 3) Дискуссии
открыты, как я думаю,
-
в рамках этого мероприятия есть
-
и те, кто интересуется Викибазой,
-
и те, кто интересуется Викиданными,
-
так и те, кто интересуется
и тем, и другим.
-
Да, но мы не обязываем их
переходить на Викибазу.
-
- (голос из зала 3) Необязательно.
- MusicBrainz работает не на Викибазе.
-
(голос из зала 3) Нет, я просто
хотела сказать, что у вас разные проблемы,
-
иногда взаимосвязанные,
иногда не полностью разделённые.
-
У меня есть ещё один вопрос
или комментарий
-
относительно управления иерархиями
в нормализованной лексике,
-
как в тезаурусе, как у вас в Finto.
-
У вас есть названия мест,
-
маорийские...
-
предметные указатели.
-
Им приходится иметь дело
с управлением концепциями в иерархии.
-
Как вы считаете,
-
можно ли управлять
этими контролируемыми системами
-
организации данных в Викиданных?
-
Я думаю,
что в случае Finto и YSO-местами
-
хранилище будет представлять собой
собрание из нескольких источников
-
в конечном итоге.
-
Оно в постоянном движении.
-
Так что, нам необязательно...
-
я не представляю
Национальную библиотеку,
-
но в этом возможном проекте
-
нам необязательно поддерживать
существующую структуру
-
или бороться с ней.
-
Так что, в этом плане,
эта область открыта для изучения.
-
Маорийские предметные указатели
идеально подходят
-
для структуры Викиданных,
-
но лицензирование,
конечно, запрещает это.
-
Я полагаю, что если бы
лицензирование было другим,
-
и их поместили в Викиданные,
-
как только кто-то бы решил,
что ему не нравится иерархия,
-
и начал что-то менять,
-
это бы вызвало протест у тех людей,
которые усердно работали
-
над созданием этой структуры
-
и получали разрешение
от различных народов маори
-
на текущую иерархию.
-
Это вопрос, который нужно решить.
-
Я думаю, если говорить
о системах организации знаний,
-
все они отличаются.
-
И я не уверен, будет ли хорошей идеей
-
представлять различные
иерархии в Викиданных,
-
но, возможно, имеет смысл подумать
-
о наложениях данных.
-
Делать сопоставления на уровне содержания.
-
Например, ZBW опубликовала
экономический тезаурус.
-
У этого тезауруса
своя собственная иерархия,
-
и, конечно же, можно было бы
ввести иерархию этого тезауруса
-
в концепцию Викиданных
-
без фактического хранения
такого рода структуры
-
в качестве альтернативной
в Викиданных,
-
что создало бы путаницу.
-
Но я думаю, мы должны думать
о Викиданных как о совокупности концепций,
-
которые могут подключаться к уровням,
находящимся вовне,
-
которые дают другой взгляд на мир
-
и которые необязательно
должны быть в Викиданных.
-
(ассистент) Хорошо. Ещё вопросы?
-
Хорошо.
-
(голос из зала 4) Йохим,
я хотел уточнить последний пункт.
-
Эти уровни, как вы их представляете,
-
будут поддерживаться извне
-
и каким-то образом интегрироваться
-
в Викиданные с их стороны,
-
или вы уже задумывались над тем,
-
как этим можно было бы управлять?
-
Вообще-то, нет...
-
Я экспериментировал с ZBW и Викиданными.
-
Я был [неразборчиво] в Викиданных.
-
Но я думаю, что это
совершенно новая, сложная вещь,
-
и поэтому это открыто для обсуждения,
будет ли у нас достаточно контроля,
-
чтобы делать такие вещи.
-
Но это нужно выяснить.
-
Ещё один вопрос?
-
(голос из зала 5) Отлично.
-
Я хотел узнать о проекте какапо.
-
Хм.
-
(голос из зала 5) Получали ли вы
какое-нибудь предупреждение
-
от сообщества Викиданных о том,
-
что вы внесли каждую особь?
-
Пока нет.
-
(голос из зала 5) Кто-нибудь
слышал об этом раньше?
-
«Пока нет», потому что никто
ещё об этом не слышал?
-
Довольно долгое время
шла небольшая дискуссия.
-
Те люди, которые интересуются
подобными вещами в Викиданных,
-
и мы все, похоже, думаем,
что это естественное продолжение
-
предоставления отдельного
элемента Викиданных
-
для знаменитой скаковой лошади
-
или чьего-то кота,
это хорошо смоделировано.
-
Наверное, мы проявили дерзость,
поместив туда целый вид.
-
Но я думаю, управлять этим легко.
-
Если не пробовать на кошках и собаках.
-
(смех)
-
(ассистент) Хорошо.
Думаю, время подходит к концу.
-
Большое спасибо, что пришли.
-
Я думаю, докладчики ответят
на ваши вопросы во время перерыва.
-
Желаю вам хорошо провести время.
-
Большое вам спасибо.
-
(аплодисменты)
-
WikidataCon 2019
Викиданные и языки