Учреждения культуры Панельная дискуссия Сюзанна Онас, Майк Дикисон, Йохим Нойберт, Беат Эстерманн Всем добрый день. Приветствуем вас на нашей панельной дискуссии. Прежде чем мы начнём, я сделаю два объявления. Прежде всего, пожалуйста, используйте Etherpad для заметок. Второе объявление для тех, кто смотрит нас из дома или из любого другого места. Если у вас есть вопросы, вы также можете писать их в Etherpad, и наши ассистенты будут их отслеживать. Итак, мы решили, что в этом году, после того как мы увидим все представленные материалы, мы сосредоточимся на роли Викиданных в экосистемах данных, которая выходит за рамки проектов Викимедиа, что полностью соответствует новой стратегии Фонда Викимедиа. Сегодня у нас четыре участника дискуссии. Три плюс один. Я попрошу вас выйти на сцену, чтобы мы могли вас представить. Сюзанна Онас. Она долгое время является активисткой движения за свободные знания и участвует во многих Вики-проектах. Сегодня она выступит с докладом о совместном проекте с Национальной библиотекой Финляндии. Рядом со мной Майк Дикисон, он выступит вторым. Он куратор музея из Новой Зеландии. Он зоолог и редактор Википедии. Он стал первым «Свободным википедистом» Новой Зеландии в 2018 и 2019 годах. Он расскажет нам о своём опыте, а также о том, какова роль Викиданных в этом контексте. Затем выступит Йохим Нойберт из Информационного центра по экономике имени Лейбница в Киле и Гамбурге. Он работает над тем, чтобы сделать крупнейший международный архив прессы общедоступным, для этого он использует Викиданные. Я выступлю последним. Меня зовут Беат Эстерманн. Я работаю в Бернском университете прикладных наук, в Швейцарии. Я долгое время был организатором OpenGLAM в Швейцарии и Австрии. Сегодня я расскажу о своей деятельности в связи с разрешением, выданным мне Канадской ассоциацией представления искусств, и более подробно остановлюсь на исполнительском искусстве. Не в Викиданных, но вы увидите, что здесь они тоже играют свою роль. Теперь мы займём свои места, и я предоставлю слово Сюзанне. Здравствуйте. Меня зовут Сюзанна Онас, я работаю по совместительству в Викимедиа Финляндия координатором проектов для учреждений культуры, я также консультирую по теме открытых знаний. Это обсуждение больше относится к последнему. Итак, я работала с группой, которая занималась географическими данными... я уточнила название, но оно не на английском языке, это инициатива правительства Финляндии в сфере культурного наследия. Итак, речь пойдёт о географических названиях и о том, как они представлены в различных хранилищах данных в Финляндии, как они собирают воедино разные источники, и как они составляются путём моделирования в Викиданных и в других местах. Здесь мы видим три основных источника для проекта YSO-места, которые являются частью национальной онтологии. AHAA для финских архивов, Melinda для финских библиотек, и KOOKOS для финских музеев. Также существуют три системы управления контентом, которые объединяются в проекте YSO-места. Уже происходит обмен между Викиданными, реализуется проект по названиям для Национальной земельной службы. Третий проект -- Архив финских названий, который пока не вносит свой вклад, но на этот счёт уже есть планы. Таким образом, один из ключевых вопросов моделирования в этой проблемной области -- в названиях мест, представленных в этом проекте, присутствуют три типа элементов. Один из них -- само место, которое имеет определённое местоположение. Другой элемент это название места, топоним, к примеру. И ещё источники, документы, из которых оба элемента могут быть извлечены, или подтверждены. YSO-места... здесь, в верхнем правом углу, вы снова увидите ту же самую диаграмму. Она в основном касается мест. Основные источники: Национальная библиотека Финляндии и её проект Finto. В настоящее время насчитывается более 7 000 мест на финском и шведском языках и более 3 000 мест на английском языке, и они имеют лицензию CC0. Здесь вы видите сервис Finto и место, я выбрала Севеттиярви. Оно также связано с нашим языковым проектом совместно со сколтами. Это место на самом севере Финляндии, населённое этим народом, сколтами. Здесь вы видите место, которое принадлежит... вы видите данные об этом месте. Здесь видно, что эти данные связаны с Викиданными, так же, как и с данными Национальной земельной службы. Здесь видно более детально. Они также иерархически упорядочены внутри этого хранилища данных. На самом деле, само место не видно, но оно находится в этом муниципалитете, регионе, в Финляндии, как в стране, и скандинавских странах, более обширном регионе. Здесь видно, что многие из них были сопоставлены с Викиданными ранее с помощью Mix'n'Match, но некоторые ещё остались. Самих названий не так много. Всего менее 5 000. Есть ещё одно хранилище данных в рамках проекта Финской геопространственной платформы. Карточки с названиями мест, к ним относятся все названия мест на финских картах. И у них есть связанные данные, имеющие лицензию CC BY 4.0. 800 000 меток на картах на финском, шведском, на всех трёх саамских языках Финляндии. У них два разных типа сущностей: места и географические названия, топонимы. У обоих типов есть постоянные URI. Например, тот же Севеттиярви сначала на финском языке, и затем на трёх саамских языках, как и географические данные, затем идёт информация об этом месте, его тип и так далее. Вот карточка для названия места, топонима с своим собственным URI. Извините, похоже, она не переведена на английский. Многоязычность не охватывает весь проект. Теперь перейдём к Архиву финских названий. Это проект Института исконных языков Финляндии, и в нём представлены не места, не географические названия, а их источники. Три миллиона полевых заметок с географическими названиями, это проект Викибазы. Они в Викибазе в основном на финском языке, некоторые на шведском. Замечательная коллекция саамских названий, которая нас очень интересует. Они имеют лицензию CC BY. Это своего рода испытание с точки зрения Викиданных. Но если бы была локальная финская Викибаза, мы могли бы сначала поработать с ней в рамках этого проекта. На этом скриншоте видно, что здесь есть информация о месте, старые карты, которыми изначально пользовались составители, и карточка, которую они создали на основе собранной информации. Вот одна из таких карточек, разбитая на данные, которые в неё включены. Затем нам прислали проект, посвящённый связанным данным, выполненный Хельсинкской лабораторией цифровых гуманитарных наук и группой исследований семантических вычислений Университета Аалто совместно с Институтом исконных языков Финляндии, проект Names Sampo. Получается объединённый исследовательский интерфейс для нескольких источников географических названий. Здесь видно, что источники находятся слева, а затем, эти данные можно наглядно представить. Да. Я предложила идею моделирования для местной Викибазы, которую мы могли бы сделать с этими данными. Но когда возникает вопрос моделирования. Как моделировать? Существуют разные способы, разные подходы для каждого проекта. Можно так же поступить и с языками этнических меньшинств без особых усилий. У нас есть два основных варианта: модель SAPO, Финская пространственно-временная онтология и модель Викиданных. Здесь видно, что элементы Викиданных стремятся к нулю. В идеале, они остаются неизменными при изменении свойств. В то время как в модели SAPO эти элементы обновляются в случае изменений, как, например, при изменении региона или названия. Вернёмся к разделению между тремя разными измерениями названий мест. Следует ли нам сделать эти географические названия сущностями или свойствами? Викиданные используют свойства, а в проекте Национальной земельной службы используются сущности. Или мы должны сделать их лексемами? Викиданные работают со свойствами, текстовыми свойствами для топонимов вместо лексем. Простите, наоборот. Топонимы -- это... свойства, а не лексемы. Верно. Возможно, недостаток Викибазы в том, что в ней нет географических форм, в базовой настройке, поэтому для использования локальных географических форм в стек пришлось бы добавить больше технологий. И объединение действительно нужно, чтобы иметь возможность пользоваться всеми преимуществами Викиданных. Я закончила. Спасибо. (аплодисменты) (смеётся) Хорошо. (говорит на маори) Приветствую всех. Меня зовут Майк Дикисон. На протяжении года я был «Свободным википедистом» Новой Зеландии. Возможно, вам интересно, кто такой «Свободный википедист». Если вы будете искать, то не найдёте определения. Это термин, который я придумал в своей заявке на грант, и он, похоже, очень понравился фонду. На нём и остановились. За год я посетил 35 различных учреждений, местных жителей и для большинства из них я проводил тренинги, организовывал общественные мероприятия и пытался развивать стратегию Викимедиа для каждого из них. Это был очень интересный опыт. Я столкнулся с широким кругом различных проектов и людей. И я хочу рассказать о различных проектах, связанных с Викиданными, в интересном или, возможно, познавательном ключе, что может быть полезным для обсуждения. Изначально проект был проектом Википедии, просто потому, что название было знакомо людям, поэтому мы организовали множество различных мероприятий на традиционных Вики-марафонах, посвящённым гендерному неравенству и так далее. И как вы видите, [неразборчиво] мы набрали много новых успешных редакторов, и так далее. Мы делали массовые выгрузки в Викисклад. В данном случае была собрана коллекция из более чем 1 000 оригинальных работ художника-иллюстратора насекомых Деса Хелмора которая ждала своего часа на жёстком диске, без изучения на протяжении 10 лет, и мы смогли получить разрешение на их публикацию в открытом доступе под лицензией CC BY. Лёгкие победы, которые можно показать всем. Каждый может ознакомиться с изображениями жуков. Каждый может ознакомиться с семинарами, посвящёнными устранению гендерного неравенства. Но Викиданные гораздо сложнее «продать» людям из учреждений культуры или тем, кто не входит в наше движение. Я начал осознавать, что Викиданные будут всё более и более важной частью проектов «Cвободного википедиста». По мере продвижения проектов, Викиданные становились всё более существенным компонентом моей работы. Я начал пытаться больше узнать о Викиданных, потому что начал понимать, насколько это важно. Итак, сам проект. Какапо -- нелетающий попугай, эндемик Новой Зеландии. Мы работали с Департаментом охраны природы, чья работа заключается в спасении этого вида от вымирания, и выдвинули следующую идею: «Что, если мы поместим в Викиданные каждого какапо?» (смех в зале) Это может показаться нелепым, но на самом деле это вполне выполнимый проект. Некоторые попугаи уже там. Главное, что нужно заметить, что какапо не так уж много. Так что задача выполнима. Когда я начинал, их было 148, а потом один умер. И после прекрасного сезона размножения их стало 213. Это здорово. Это самая большая популяция какапо за последние 50 лет. Важное событие. В Новой Зеландии об этом каждый день говорили в новостях. Каждый вылупившийся... (голос из зала 1) В Нью-Йорк таймс. Да? О, здорово. Да, это были национальные новости. Всем нравятся эти птицы. Но самое интересное, что в отличие от более многочисленных видов, у каждого какапо своё уникальное имя и уникальный идентификационный номер. И часто на каждого какапо есть биографические данные о том, где и когда они вылупились, кем были их родители, когда они умерли, если это случилось. Существует база данных Департамента охраны природы, в которой есть вся эта информация. Один из самых известных какапо, конечно же, Сирокко, который, как вы видите, назван в честь ветра. У Сирокко есть аккаунт в Twitter, с которым у Викиданных возникли некоторые проблемы, потому что, видимо, у попугаев не может быть аккаунтов в Twitter. Я об этом не знаю. Он даже попал на обложку альбома. Существует множество свойств этой, вероятно, одной из самых известных особей какапо. Итак, я обратился в Департамент охраны природы с предложением: «Почему бы нам не попробовать сделать это с каждым из них?» Им нужно было подумать, сколько биографических данных можно опубликовать. Они предоставили короткий список. И теперь у нас, 212...210 -- я думаю, пара особей умерли -- живых какапо, которые занесены в список. Они получают имя только после того, как оперятся. Пока они птенцы, у них есть кодовый номер, Как только они полностью оперятся, мы создаём полноценные Викиданные, весь вид будет в Викиданных. Но нам нужно придумать свойство для DOC ID, я бы хотел поговорить с вами об этом. Следует ли нам использовать какой-то определённый ID или придумать такой ID, который будет применим ко всем отдельным особям птиц, растений или животных, которые были отмечены в любом научно-исследовательском проекте? Вопрос хороший. Второй проект: Художественная галерея Крайстчерча. У Колина Маккахона, самого известного художника Новой Зеландии, очень мало картин. Это рисунок, который он сделал для новозеландского школьного журнала, который в то время финансировался правительством. Значит, авторские права на него принадлежат архивам Новой Зеландии. Это весьма необычная ситуация. Я сотрудничал с Художественной галереей Крайстчерча которая вместе с Художественной галереей Окленда поддерживает сайт «Найти новозеландских художников». Работа сайта заключается в отслеживании коллекций каждого учреждения, в котором имеются коллекции работ новозеландских художников. В их базе данных около 18 000 разных художников, о большинстве из них очень мало информации. Мы сделали стандартную выгрузку в Mix'n'Match. Мы экспортировали тех, у которых была хотя бы дата рождения, или дата смерти, или место рождения, или место смерти. Не очень строгие ограничения. Даже тогда нам не удалось сопоставить нескольких из них, но сейчас у нас около 1 500, которые совпадают с известными художниками в Викиданных, и это хороший результат. Но что нас больше всего привлекло... Кстати, это их сайт, который содержит ссылки на коллекции, биографические данные, которые они ввели вручную, для каждого художника. Благодаря экспорту и внесению данных в Mix'n'Match выявилось множество опечаток и ошибок, которых они не заметили. Когда начинаешь прогонять данные через Excel, выявляются подобные ошибки. И они внезапно осознали ценность Викиданных, когда я сказал: «Вы можете просто брать эту информацию из Викиданных». Их это просто поразило. Я думаю, это одно из преимуществ. Когда у вас есть сайт, старательно собранный вручную, с 18 000 записей, в которых полно ошибок, то сказать им, что есть другой способ, что другие люди могут выполнить проверку и исправить ошибки... Это подкупает. Я предложил идею создания из Викиданных целой книги по истории новозеландских художников в Крайстчерче в 30-х годах -- её только что опубликовали -- на основе данных о художниках, связях, местах, выставках и так далее. Это вполне выполнимый проект, и они очень им заинтересовались. Третий проект: Маорийские предметные указатели. «Вака» на языке маори -- название определённого вида каноэ, боевого каноэ. В Национальной библиотеке Новой Зеландии есть запись для слова «вака», у Национальной библиотеки есть свой словарь маорийских предметных указателей на языке маори. В словаре есть определение слова «вака» на маори и английском языках. В нём много более узких терминов, как вы видите здесь. Типичный пример -- «таурапа». Определение сначала на маори, затем на английском. Это резной штевень, который вы видите на изображении. А по-английски вы бы сказали sternpost, но вы не можете назвать таурапу этим словом, потому что таупара используется только в определённых видах боевых каноэ. Значит, для этого слова нет английского эквивалента. И я вдруг понял, что здесь целая онтология терминов определённой культуры, которая была тщательно проработана и проверена Национальной библиотекой совместно с маори, и она постоянно пополняется определениями и описаниями на двух языках: английском и маори. Это впечатляет. Я вдруг подумал, что мы могли бы поместить всё это в Викиданные. Сначала на маори, а затем, если нужно, перевести на английский. Это было бы здорово. Но я столкнулся с авторским правом. К сожалению, лицензия в этом случае «Некоммерческая – Без производных» Теперь я должен обсудить с ними, почему они выбрали эту лицензию. Возможно, это произошло потому, что маори согласились поделиться своими знаниями, только в случае гарантии, что эти сведения не будут использованы в коммерческих целях. Сталкиваться с подобными ограничениями всегда очень неприятно. Рассказав об этих трёх проектах, я хотел инициировать их обсуждение. Внесение в Викиданные целого вида. Что нужно сделать, чтобы изменить мнение куратора художественной галереи о ценности Викиданных. Что делать, если перед вами целая онтология на другом языке, которая, к сожалению, ограничена жёсткой лицензией. Спасибо. (аплодисменты) Безвозмездная передача данных в Викиданные: Первый опыт из Архива прессы ХХ века Здравствуйте. Меня зовут Йохим Нойберт. Я работаю в ZBW, Германской национальной экономической библиотеке, в Информационном центре по экономике в Гамбурге, я разрабатываю научное программное обеспечение. Одной из моих задач в прошлом году была подготовка безвозмездной передачи данных в Викиданные. Я расскажу о нашем первом опыте передачи метаданных из Архива прессы ХХ века. Насколько нам известно, это крупнейший в мире архив прессы. Он был собран в период между 1908 и 2005 годами, и был составлен более чем из 1 500 газет и периодических изданий из Германии, а также из-за рубежа. И он охватил всё, что могло представлять интерес для Гамбурга, для гамбургских предпринимателей, которые хотели выйти на международный уровень. Как видите, эти материалы были вырезаны из газет и помещены на бумагу, а затем собраны в папки. Здесь вы видите небольшую часть Архива людей, аналогичным образом была собрана информация о компаниях, общих вопросах, товарах, обо всём, что могло представлять интерес. Эти папки были отсканированы -- примерно до 1949 года -- в рамках проекта, финансируемого Немецким научно-исследовательским сообществом в 2004-2007 годах. В результате получилось 25 000 тематических досье того времени. В этих папках более двух миллионов страниц. Их можно найти в интернете. Это приложение было разработано библиотекой ZBW и сейчас выглядит немного устаревшим, несовременным, и ещё проблема в том, что архитектура этого приложения построена на Oracle, оно построено на ColdFusion, работает на серверах Windows, поэтому оно не очень стабильно в долгосрочной перспективе. Мы обсудили возможность его переноса в более подходящее для этого приложение для работы со связанными данными, или сделать смелый шаг и разместить все эти данные в открытом доступе. Мы присвоили этим данным лицензию CC0, и, в настоящее время, мы перемещаем основной уровень доступа, уровень обнаружения, это первичный уровень доступа к сети открытых связанных данных, и на самом деле имеет смысл поместить некоторые метаданные в Викиданные, и убедиться в том, что все папки собраний связаны с Викиданными, чтобы их можно было найти и все метаданные этих папок также перенесены в Викиданные. Ими можно пользоваться и пополнять их. В эти данные можно внести исправления. ZBW, конечно, пока ещё поддерживает хранилище изображений, которые мы не можем опубликовать, не можем присвоить им лицензию, поскольку они принадлежат их создателям. Но в будущем мы обеспечим доступ к некоторым файлам метаданных с помощью DFG Viewer по манифестам IIIF. Мы подготовим несколько статических целевых страниц, которые будут служить точкой отсчёта для Викиданных, а также по-прежнему будут обеспечивать доступ к данным, которые не вписываются в формат Викиданных. Для этой передачи данных в Викиданные мы создали свою пользовательскую инфраструктуру, точку доступа SPARQL с этими данными, мы в основном использовали федеративные запросы между этой точкой доступа и сервисом запросов Викиданных для создания соответствующих утверждений, объединённых в SPARQL-запросах или преобразованных с помощью скрипта, который также генерировал ссылки на утверждения. Затем мы загрузили всё в QuickStatements, чтобы использовать в сети. Вот что мы получили. Это не только простые вещи, как даты рождения, простите, но и сложные утверждения об уже существующих элементах, например, то, что этот человек был членом наблюдательного совета данной компании в этот период времени, и на него ссылались для использования в научном контексте. Первая часть передачи данных завершена. Архив людей полностью связан с Викиданными. Это также информационный инструмент. Многие элементы раньше не имели никаких внешних ссылок. У нас было около 6 000 утверждений, которые сейчас находятся в метаданных этого архива. Это была самая простая часть, поскольку людей легко идентифицировать в Викиданных. Более 90% уже были в базе, так что мы смогли их связать. Мы создали около 100 элементов для тех, которые отсутствовали. Но сейчас мы работаем над остальной частью архива, в частности, над архивом общих тем. Это означает включение в Викиданные исторической системы организации знаний о мире в целом, в виде газетных вырезок. Чтобы дать вам представление, архив по странам и темам организован по принципу иерархии стран и других географических сущностей и переведён на английский язык, что упрощает задачу. На немецком языке присутствует глубоко вложенная тематическая классификация. Эта комбинация определяет... одну папку. Теперь мы хотим соотнести это как структуру с Викиданными и ввести данные. Я хочу пригласить вас присоединиться к этому проекту, замечательному с точки зрения организации знаний. Это Вики-проект, где вся эта работа отслеживается, вы можете наблюдать за его развитием или принять в нём участие. Большое спасибо. (аплодисменты) Мы вводим исполнительское искусство в Викиданные. Мы переносим его в облако связанных открытых данных, создавая экосистему связанных открытых данных для исполнительского искусства. Вопрос, на который я пытаюсь ответить, и надеюсь, вы поможете мне ответить: какую роль во всём этом играют Викиданные? Я начну с опыта, который я приобрёл в этом году. Я имел удовольствие поработать совместно с CAPACOA, Ассоциацией представления искусства Канады, которая запустила проект «Инициатива связанного цифрового будущего», чтобы помочь всему сектору искусства Канады научиться пользоваться связанными открытыми данными. Они это сделали, основываясь на наблюдении, что в течение последних пяти лет очень важной темой в исполнительском искусстве стали недостаточно качественные метаданные, без взаимосвязи и совместимости. Поэтому некоторые выступления и события нелегко найти с помощью Google и автоматизированных систем. Наше совместное видение заключалось в том, что мы хотим иметь базу знаний для всех заинтересованных сторон. Мы изучили всю структурную модель исполнительского искусства, определили в ней ключевых заинтересованных лиц, посмотрели на сценарии использования, которым мы хотели бы следовать и отразили их во всей архитектуре базы знаний, или разных платформ, и это, очевидно, распределённая архитектура, а не один монолит. Я быстро пробегусь по ней, поскольку у нас всего 10 минут. Думаю, у нас будет достаточно времени сегодня или завтра, чтобы углубиться, если кто-то заинтересуется деталями. Итак, мы начали с со структурной модели исполнительского искусства, которая была опубликована в прошлом году. Нам повезло, что мы могли опереться на уже проделанную работу. Основная цепь создания ценности посередине, а заинтересованные стороны вокруг неё. Всего мы определили 20 групп заинтересованных сторон, которые затем сократили до семи более крупных категорий для каждой группы. Мы сформулировали их потребности в рамках инфраструктуры, и чего они смогут достичь, если всё будет взаимосвязано, а данные общедоступны. Здесь вы видите типы данных: «Создание», «Презентация и продвижение», «Распространение и Повторное использование», «Живая аудитория», «Интернет-потребление», «Наследие», «Наука и образование». После того, как мы составили большую таблицу -- вы видите здесь только первую часть -- посмотрели, какой тип данных использовался повсеместно различными группами заинтересованных сторон. Это довольно большая база данных, общая для всех. Это та область, где имеет смысл сотрудничество и совместное хранение данных. Несколько слов об архитектуре платформы: вы видите, что в ней четыре уровня. Внизу отображается уровень данных. Викиданные играют в нём свою роль, но и другие базы данных, распределённые базы данных могут публиковать данные с помощью SPARQL-точек доступа. Жёлтая часть посередине -- семантический уровень. Это наш общий язык для описания объектов, для создания утверждений об этих объектах, связанных с исполнительским искусством, онтология. Затем у нас есть прикладной уровень, состоящий из различных модулей, например, анализа данных, извлечения данных... Как перевести неструктурированные данные в структурированные данные? Как это сделать с помощью различных инструментов? Конечно, есть визуализация данных. Если объём данных большой, то их нужно как-то визуализировать. Сверху уровень представления данных, с которым ежедневно взаимодействуют обычные люди: поисковые системы, энциклопедии, культурные программы и целый ряд других сервисов. Мы не начинаем с нуля. В этой области уже проделана определённая работа. Я просто приведу несколько примеров из проекта, в котором я участвовал. И ещё кое-что. Я начал в этой области со Швейцарского архива исполнительских искусств. До создания базы данных швейцарских исполнительских искусств мы создали онтологию исполнительского искусства, которая в настоящее время внедряется в RDF. В нашей базе хранятся данные по истории выступлений в Швейцарии за последние 60-70 лет. Это то, что можно развить, то, что можно преобразовывать в RDF. Также у нас была платформа для сборки, где можно получить доступ к этим данным. Затем мы сделали несколько вводов в Викиданные, частично из Швейцарии, частично из учреждений исполнительского искусства, например, Барт Магнус участвовал в этом. Он был движущей силой. Ещё был материал из Викисклада, но не очень хорошо связанный со всеми остальными нашими метаданными. И, очевидно, что этим вводом мы начали внедрять части швейцарской модели данных в Викиданные. Один из канадских партнёров по этому проекту -- Culture Creates. Они запустили платформу, которая собирает информацию с театральных сайтов и вставляет её в граф знаний, чтобы затем представить её поисковым системам и другим поисковым устройствам. Опять же, мы должны были внедрить и расширить это в онтологии. Как видно из слайда, здесь ещё много пустых мест, но есть и пересечения, самым важным, очевидно, является общий язык, который поможет нам связать различные наборы данных. Также важно, что мы используем одни и те же базовые регистры и нормативные файлы. Здесь Викиданные играют важную роль, соединяя всё между собой. Теперь я хотел бы поделиться рекомендациями Консультативного комитета по инициативе будущего связанных данных. По крайней мере, двумя первыми рекомендациями. Для канадцев сейчас крайне важно заполнить граф знаний об исполнительском искусстве Канады, потому что в отличие от Швейцарского архива исполнительских искусств, у них нет уже существующей базы данных, они создают её с нуля. И очень важно, чтобы там были данные. А во-вторых, как видите, уже появляются Викиданные. Викиданные, по мнению Консультативного комитета, рассматриваются как дополнение к Artsdata.ca, этому графу знаний, и поэтому следует способствовать её пополнению данными, относящимися к исполнительским видам искусства. Именно над этим мы будем работать в ближайшие месяцы и годы, поэтому я ищу людей, готовых присоединиться к этому проекту. Сейчас мы считаем, что они дополняют друг друга. Мы должны подумать о плюсах и минусах каждого подхода. Здесь вы видите сравнение между Викиданными и классическим подходом к связанным открытым данным. Я буду рад обсудить это с вами, услышать о вашем опыте. Но, как мне кажется, Викиданные это огромный плюс, потому что это краудсорсинговая платформа, и легко пригласить другие стороны внести свой вклад. Потеря контроля -- отрицательная сторона. Владельцы данных вынуждены отказываться от контроля над своими графами, качеством и полнотой данных. Отслеживать данные в Викиданных сложнее, чем в базах под вашим контролем. Ещё одна сильная сторона Викиданных -- немедленная интеграция во всемирный граф. И вы просто делаете пошаговую сверку с другими базами данных, что некоторые также рассматривают как преимущество, но, конечно, если вам нужна интеграция и совместимость, Викиданные заставляют вас идти на это с самого начала. Согласование практик моделирования данных -- проблема в обоих случаях. Но сначала может показаться, что проще сделать это только в своём собственном хранилище, потому что в какой-то момент вы завершите эту задачу, а в Викиданных она будет постоянной. Когда дело доходит до расстановки приоритетов при публикации данных... Это правила, которым я следую в данный момент. Прежде всего, мы хотели бы публиковать такие данные, для которых неясно, кто ими управляет. Поэтому эти данные будут управляться совместно. И мы хотели бы публиковать такие данные, в которых есть высокий потенциал для краудсорсинга. Мы бы хотели публиковать такие данные, которые скорее всего будут использованы повторно в контексте Википедии. Есть надежда, что часть международной координации в отношении всего процесса моделирования данных, стандартизации, может происходить непосредственно в Викиданных, если это не происходит в каком-то другом месте, потому что благодаря этому люди начинают взаимодействовать, если они публикуют данные в одной области. Сейчас мы хотели бы уделить внимание базовым регистрам и нормативным файлам, они помогают нам создавать связи между различными данными и ненормализованной лексикой как расширением существующей онтологии. Ещё два слайда. Сейчас мы рассмотрим подход «Сумма всех учреждений культуры» к проекту «Вики любит исполнительское искусство». Мы описываем места и организации и пытаемся перенести данные в Википедию в виде карточек и шаблонов. Ещё один проект, в котором я буду участвовать, COST Action. Мы представим его в следующем году. Он посвящён экосистеме связанных открытых данных для исполнительских искусств. COST -- европейская программа, поддерживающая активность в сети. Здесь вы видите список тем, охваченных в этом проекте. Я выделил две темы. Первая: вопрос объединения Викиданных с классическим подходом к связанным открытым данным. Вторая -- я думаю, тоже очень важна, у неё есть огромный потенциал -- реализация международных кампаниий по добавлению данных в Викиданные. Вот и всё. Спасибо за внимание. Теперь я хотел бы пригласить моих коллег на сцену. Возможно, вы дадите им микрофоны. А потом я хотел бы... дать вам возможность задать вопросы. Также я хочу спросить моих коллег, есть ли у них вопросы друг к другу? (смех) Итак, у нас есть вопрос от аудитории? (голос из зала 2) [неразборчиво] Я хотел бы спросить у каждого из вас, где бы вы провели черту, как вы определяете, когда нужно запускать собственную Викибазу, и что вы хотите поместить в Викиданные? Это чёткое разграничение или [неразборчиво]? Я могу ответить первой, потому что микрофон у меня. Я думаю, что одна из проблем -- значимость данных. Я рассматриваю это в другом проекте. И я думаю, что лицензирование может быть одним из решений, потому что вы можете применить свои условия в своей базе данных, и, я думаю, где это возможно. И в-третьих, можно просто использовать её как песочницу, подготавливая в ней данные к вводу в Викиданные. Вот три главные вещи, которые я сейчас вспомнила, но я могу назвать ещё несколько. Для меня авторские права всегда будут проблемой. Если Национальная Библиотека захотела бы перейти на Викибазу, они смогли бы продолжать контролировать лицензирование той работы, которую они уже провели в отношении терминов на языке маори. База данных попугаев какапо содержит только те данные, которые могут быть опубликованы по мнению Департамента охраны природы, но я подозреваю, что если они увидят, что она работает, у них может возникнуть соблазн использовать закрытую Викибазу для ведения собственной базы данных, просто потому, что некоторые инструменты визуализации, которые могут быть применены, будут лучше, чем таблицы Excel, которыми они пользуются сейчас. Я думаю, это сильно зависит от вида данных. Нам, конечно, с архивом прессы очень повезло в том, что эти материалы уже были опубликованы в то время, но их публикация была дорогостоящей. Так что, это довольно просто. Я думаю, также, проекты... Это типичный проект, его финансировали некоторое время, а потом прекратили. Что же произойдёт с данными, которые помещены в какое-то хранилище с каким-то программным обеспечением, которое не будет работать вечно? На мой взгляд это имеет смысл. В то время Викиданных не было, но теперь они есть, и для нашего проекта имеет смысл на ранней стадии обсуждать устойчивость в контексте перемещения данных в более крупную экосистему, такую как Викиданные, и обсудить это с сообществом Викиданных, что имеет смысл добавлять в Викиданные, а что сохранить в проприетарной форме. Возможно, в более простой форме, не в виде сложного приложения, сделать их доступными для обнаружения и связать с большим облаком данных вместо того, чтобы вкладывать кучу денег в какое-то хранилище, которое не будет поддерживаться. Да, как я уже говорил, в проекте, который я представил, есть различие между подходом к хранению в Викиданных и классическими подходом к связанным открытым данным. Дело не только в создании закрытой Викибазы. Одна из сложностей, с которой мы столкнулись в Викиданных: когда вы публикуете свои данные, вы должны поддерживать порядок, следить за другими людьми. Это может отпугнуть людей, значит, мы будем работать с этим пошагово. Итак, в настоящее время будет существовать база данных, находящаяся... в классических связанных открытых данных, мы начинаем связывать её с Викиданными, и это непрерывный процесс, позволяющий понять, для каких областей в Викиданных в конечном итоге будет больше всего данных, а для каких областей больше данных будет в других базах данных. Очевидно, у нас будут проблемы с синхронизацией, как, возможно, у всех нас, из-за поля связанных данных, где мы должны решить, кому доверять, кому доверить управления. (ассистент) Ещё вопросы? (голос из зала 3) Спасибо. Я полностью согласна с вопросом о том, где провести границу, публиковать ли данные в Викиданных или хранить их, а также создавать, управлять и обслуживать в локальных базах данных и с какой целью. Я думаю, что это большая дискуссия, которая выходит за рамки восторга от размещения данных в Викиданных, потому что они будут общедоступны, они служат человечеству, потому что... Это такой крутой инструмент, а в реальной жизни всё сложнее, я думаю. Несмотря на это, дискуссия довольно интересная. Ещё один вопрос, или другая проблема, которая обсуждается на этом мероприятии в разных группах. С одной стороны, иметь свою базу данных, независимо от технологии, и публиковать что-то в Викиданных, или строить собственную систему создания информации и работы с ней на основе технологии Викибазы. Синхронизировать или... объединять или что-то ещё, в зависимости от технологии, которая используется, и то, что вы используете Викиданные только для публикации, или инфраструктуры, которая находится под Викиданными, для создания данных и управления ими. Я имею в виду, у нас была дискуссия по поводу Викибазы, и здесь будут и другие обсуждения, но это всё на разных уровнях, как я думаю. Можно я отвечу на ваш вопрос о дискуссиях о Викибазе или Викиданных? (голос из зала 3) Хорошо. Я думаю, проблема в том, что мы слишком много внимания уделяем инфраструктуре Викибазы, поскольку существуют другие инфраструктуры, например, в области исполнительских искусств. У нас есть ещё одно сообщество MusicBrainz, которое работает на собственной платформе, предоставляющей связанные открытые данные, и, как я понимаю, в сообществе Викиданных есть договорённость о том, что мы не собираемся дублировать все их данные, мы не копируем все их данные, но принимаем тот факт, что они дополняют друг друга. Что произойдёт, когда вы начнёте интегрировать эти данные в Википедию? Карточки, например. Сможем ли мы получить эти данные непосредственно из точки доступа SPARQL? Или же мы должны копировать все данные, и какие процессы в этом задействованы? (голос из зала 3) Дискуссии открыты, как я думаю, в рамках этого мероприятия есть и те, кто интересуется Викибазой, и те, кто интересуется Викиданными, так и те, кто интересуется и тем, и другим. Да, но мы не обязываем их переходить на Викибазу. - (голос из зала 3) Необязательно. - MusicBrainz работает не на Викибазе. (голос из зала 3) Нет, я просто хотела сказать, что у вас разные проблемы, иногда взаимосвязанные, иногда не полностью разделённые. У меня есть ещё один вопрос или комментарий относительно управления иерархиями в нормализованной лексике, как в тезаурусе, как у вас в Finto. У вас есть названия мест, маорийские... предметные указатели. Им приходится иметь дело с управлением концепциями в иерархии. Как вы считаете, можно ли управлять этими контролируемыми системами организации данных в Викиданных? Я думаю, что в случае Finto и YSO-местами хранилище будет представлять собой собрание из нескольких источников в конечном итоге. Оно в постоянном движении. Так что, нам необязательно... я не представляю Национальную библиотеку, но в этом возможном проекте нам необязательно поддерживать существующую структуру или бороться с ней. Так что, в этом плане, эта область открыта для изучения. Маорийские предметные указатели идеально подходят для структуры Викиданных, но лицензирование, конечно, запрещает это. Я полагаю, что если бы лицензирование было другим, и их поместили в Викиданные, как только кто-то бы решил, что ему не нравится иерархия, и начал что-то менять, это бы вызвало протест у тех людей, которые усердно работали над созданием этой структуры и получали разрешение от различных народов маори на текущую иерархию. Это вопрос, который нужно решить. Я думаю, если говорить о системах организации знаний, все они отличаются. И я не уверен, будет ли хорошей идеей представлять различные иерархии в Викиданных, но, возможно, имеет смысл подумать о наложениях данных. Делать сопоставления на уровне содержания. Например, ZBW опубликовала экономический тезаурус. У этого тезауруса своя собственная иерархия, и, конечно же, можно было бы ввести иерархию этого тезауруса в концепцию Викиданных без фактического хранения такого рода структуры в качестве альтернативной в Викиданных, что создало бы путаницу. Но я думаю, мы должны думать о Викиданных как о совокупности концепций, которые могут подключаться к уровням, находящимся вовне, которые дают другой взгляд на мир и которые необязательно должны быть в Викиданных. (ассистент) Хорошо. Ещё вопросы? Хорошо. (голос из зала 4) Йохим, я хотел уточнить последний пункт. Эти уровни, как вы их представляете, будут поддерживаться извне и каким-то образом интегрироваться в Викиданные с их стороны, или вы уже задумывались над тем, как этим можно было бы управлять? Вообще-то, нет... Я экспериментировал с ZBW и Викиданными. Я был [неразборчиво] в Викиданных. Но я думаю, что это совершенно новая, сложная вещь, и поэтому это открыто для обсуждения, будет ли у нас достаточно контроля, чтобы делать такие вещи. Но это нужно выяснить. Ещё один вопрос? (голос из зала 5) Отлично. Я хотел узнать о проекте какапо. Хм. (голос из зала 5) Получали ли вы какое-нибудь предупреждение от сообщества Викиданных о том, что вы внесли каждую особь? Пока нет. (голос из зала 5) Кто-нибудь слышал об этом раньше? «Пока нет», потому что никто ещё об этом не слышал? Довольно долгое время шла небольшая дискуссия. Те люди, которые интересуются подобными вещами в Викиданных, и мы все, похоже, думаем, что это естественное продолжение предоставления отдельного элемента Викиданных для знаменитой скаковой лошади или чьего-то кота, это хорошо смоделировано. Наверное, мы проявили дерзость, поместив туда целый вид. Но я думаю, управлять этим легко. Если не пробовать на кошках и собаках. (смех) (ассистент) Хорошо. Думаю, время подходит к концу. Большое спасибо, что пришли. Я думаю, докладчики ответят на ваши вопросы во время перерыва. Желаю вам хорошо провести время. Большое вам спасибо. (аплодисменты) WikidataCon 2019 Викиданные и языки