WEBVTT 00:00:00.667 --> 00:00:02.422 Учреждения культуры Панельная дискуссия 00:00:02.422 --> 00:00:05.655 Сюзанна Онас, Майк Дикисон, Йохим Нойберт, Беат Эстерманн 00:00:06.254 --> 00:00:08.249 Всем добрый день. 00:00:08.929 --> 00:00:12.068 Приветствуем вас на нашей панельной дискуссии. 00:00:13.124 --> 00:00:17.009 Прежде чем мы начнём, я сделаю два объявления. 00:00:17.329 --> 00:00:23.049 Прежде всего, пожалуйста, используйте Etherpad для заметок. 00:00:23.781 --> 00:00:27.998 Второе объявление для тех, кто смотрит нас из дома 00:00:27.998 --> 00:00:29.819 или из любого другого места. 00:00:29.819 --> 00:00:30.958 Если у вас есть вопросы, 00:00:30.958 --> 00:00:34.028 вы также можете писать их в Etherpad, 00:00:34.028 --> 00:00:37.828 и наши ассистенты будут их отслеживать. 00:00:39.328 --> 00:00:44.348 Итак, мы решили, что в этом году, 00:00:45.388 --> 00:00:48.868 после того как мы увидим все представленные материалы, 00:00:49.128 --> 00:00:53.538 мы сосредоточимся на роли Викиданных в экосистемах данных, 00:00:53.551 --> 00:00:57.199 которая выходит за рамки проектов Викимедиа, 00:00:57.199 --> 00:01:01.467 что полностью соответствует новой стратегии 00:01:01.467 --> 00:01:03.677 Фонда Викимедиа. 00:01:04.652 --> 00:01:07.947 Сегодня у нас четыре участника дискуссии. 00:01:08.387 --> 00:01:09.876 Три плюс один. 00:01:09.876 --> 00:01:13.636 Я попрошу вас выйти на сцену, 00:01:13.636 --> 00:01:15.875 чтобы мы могли вас представить. 00:01:22.205 --> 00:01:24.706 Сюзанна Онас. 00:01:25.385 --> 00:01:29.296 Она долгое время является активисткой движения за свободные знания 00:01:29.296 --> 00:01:31.276 и участвует во многих Вики-проектах. 00:01:31.916 --> 00:01:35.526 Сегодня она выступит с докладом о совместном проекте 00:01:35.526 --> 00:01:38.396 с Национальной библиотекой Финляндии. 00:01:38.856 --> 00:01:43.435 Рядом со мной Майк Дикисон, 00:01:43.435 --> 00:01:46.325 он выступит вторым. 00:01:46.995 --> 00:01:50.283 Он куратор музея из Новой Зеландии. 00:01:50.283 --> 00:01:53.815 Он зоолог и редактор Википедии. 00:01:53.815 --> 00:01:58.788 Он стал первым «Свободным википедистом» Новой Зеландии 00:01:58.788 --> 00:02:02.565 в 2018 и 2019 годах. 00:02:02.565 --> 00:02:06.634 Он расскажет нам о своём опыте, 00:02:06.634 --> 00:02:13.105 а также о том, какова роль Викиданных в этом контексте. 00:02:15.784 --> 00:02:18.135 Затем выступит Йохим Нойберт 00:02:18.135 --> 00:02:23.461 из Информационного центра по экономике имени Лейбница в Киле и Гамбурге. 00:02:24.011 --> 00:02:29.061 Он работает над тем, чтобы сделать крупнейший международный архив прессы 00:02:29.061 --> 00:02:31.001 общедоступным, 00:02:31.001 --> 00:02:34.655 для этого он использует Викиданные. 00:02:35.890 --> 00:02:39.091 Я выступлю последним. Меня зовут Беат Эстерманн. 00:02:39.091 --> 00:02:43.080 Я работаю в Бернском университете прикладных наук, в Швейцарии. 00:02:43.640 --> 00:02:49.950 Я долгое время был организатором OpenGLAM в Швейцарии и Австрии. 00:02:50.335 --> 00:02:54.380 Сегодня я расскажу о своей деятельности 00:02:54.380 --> 00:02:56.240 в связи с разрешением, выданным мне 00:02:56.240 --> 00:02:59.100 Канадской ассоциацией представления искусств, 00:02:59.100 --> 00:03:01.960 и более подробно остановлюсь на исполнительском искусстве. 00:03:02.121 --> 00:03:04.440 Не в Викиданных, 00:03:04.440 --> 00:03:08.421 но вы увидите, что здесь они тоже играют свою роль. 00:03:08.970 --> 00:03:13.250 Теперь мы займём свои места, 00:03:13.250 --> 00:03:16.980 и я предоставлю слово Сюзанне. 00:03:18.300 --> 00:03:22.769 Здравствуйте. Меня зовут Сюзанна Онас, 00:03:22.769 --> 00:03:25.769 я работаю по совместительству в Викимедиа Финляндия 00:03:25.769 --> 00:03:27.619 координатором проектов для учреждений культуры, 00:03:27.619 --> 00:03:32.655 я также консультирую по теме открытых знаний. 00:03:32.655 --> 00:03:36.049 Это обсуждение больше относится к последнему. 00:03:36.049 --> 00:03:39.449 Итак, я работала с группой, 00:03:39.449 --> 00:03:45.642 которая занималась географическими данными... 00:03:48.439 --> 00:03:51.147 я уточнила название, но оно не на английском языке, 00:03:51.147 --> 00:03:54.497 это инициатива правительства Финляндии в сфере культурного наследия. 00:03:54.917 --> 00:03:59.775 Итак, речь пойдёт о географических названиях 00:03:59.775 --> 00:04:03.300 и о том, как они представлены 00:04:03.300 --> 00:04:07.466 в различных хранилищах данных в Финляндии, 00:04:07.466 --> 00:04:11.755 как они собирают воедино разные источники, 00:04:11.755 --> 00:04:14.176 и как они составляются 00:04:14.176 --> 00:04:17.906 путём моделирования в Викиданных и в других местах. 00:04:17.906 --> 00:04:23.315 Здесь мы видим три основных источника для проекта YSO-места, 00:04:23.315 --> 00:04:27.944 которые являются частью национальной онтологии. 00:04:27.944 --> 00:04:29.665 AHAA для финских архивов, 00:04:29.665 --> 00:04:31.645 Melinda для финских библиотек, 00:04:31.645 --> 00:04:33.750 и KOOKOS для финских музеев. 00:04:33.750 --> 00:04:37.585 Также существуют три системы управления контентом, 00:04:37.585 --> 00:04:40.290 которые объединяются в проекте YSO-места. 00:04:40.745 --> 00:04:47.365 Уже происходит обмен между Викиданными, 00:04:47.965 --> 00:04:53.065 реализуется проект по названиям для Национальной земельной службы. 00:04:53.065 --> 00:04:56.285 Третий проект -- Архив финских названий, 00:04:56.285 --> 00:05:00.391 который пока не вносит свой вклад, 00:05:00.391 --> 00:05:02.715 но на этот счёт уже есть планы. 00:05:02.715 --> 00:05:09.175 Таким образом, один из ключевых вопросов моделирования в этой проблемной области -- 00:05:09.175 --> 00:05:13.586 в названиях мест, представленных в этом проекте, 00:05:13.586 --> 00:05:18.195 присутствуют три типа элементов. 00:05:18.195 --> 00:05:21.236 Один из них -- само место, которое имеет определённое местоположение. 00:05:21.236 --> 00:05:24.766 Другой элемент это название места, топоним, к примеру. 00:05:25.006 --> 00:05:27.696 И ещё источники, документы, 00:05:27.696 --> 00:05:30.756 из которых оба элемента могут быть извлечены, 00:05:30.756 --> 00:05:32.565 или подтверждены. 00:05:32.565 --> 00:05:36.005 YSO-места... здесь, в верхнем правом углу, 00:05:36.005 --> 00:05:38.799 вы снова увидите ту же самую диаграмму. 00:05:38.799 --> 00:05:41.189 Она в основном касается мест. 00:05:42.619 --> 00:05:46.279 Основные источники: Национальная библиотека Финляндии 00:05:46.279 --> 00:05:49.159 и её проект Finto. 00:05:50.199 --> 00:05:53.708 В настоящее время насчитывается более 7 000 мест 00:05:53.708 --> 00:05:55.608 на финском и шведском языках 00:05:55.608 --> 00:05:59.438 и более 3 000 мест на английском языке, 00:05:59.438 --> 00:06:03.042 и они имеют лицензию CC0. 00:06:03.042 --> 00:06:06.008 Здесь вы видите сервис Finto 00:06:06.008 --> 00:06:09.883 и место, я выбрала Севеттиярви. 00:06:09.883 --> 00:06:13.908 Оно также связано с нашим языковым проектом 00:06:13.908 --> 00:06:15.268 совместно со сколтами. 00:06:15.268 --> 00:06:18.877 Это место на самом севере Финляндии, 00:06:18.877 --> 00:06:21.765 населённое этим народом, сколтами. 00:06:21.765 --> 00:06:27.264 Здесь вы видите место, которое принадлежит... 00:06:27.264 --> 00:06:32.724 вы видите данные об этом месте. 00:06:32.724 --> 00:06:37.952 Здесь видно, что эти данные связаны с Викиданными, 00:06:37.952 --> 00:06:42.344 так же, как и с данными Национальной земельной службы. 00:06:43.192 --> 00:06:47.406 Здесь видно более детально. 00:06:48.582 --> 00:06:52.360 Они также иерархически упорядочены 00:06:52.360 --> 00:06:56.310 внутри этого хранилища данных. 00:06:57.670 --> 00:07:00.460 На самом деле, само место не видно, 00:07:00.460 --> 00:07:05.880 но оно находится в этом муниципалитете, 00:07:05.880 --> 00:07:08.010 регионе, 00:07:08.010 --> 00:07:09.544 в Финляндии, как в стране, 00:07:09.544 --> 00:07:12.650 и скандинавских странах, более обширном регионе. 00:07:12.650 --> 00:07:14.400 Здесь видно, что многие из них 00:07:14.400 --> 00:07:17.891 были сопоставлены с Викиданными ранее 00:07:18.730 --> 00:07:22.230 с помощью Mix'n'Match, но некоторые ещё остались. 00:07:22.230 --> 00:07:27.900 Самих названий не так много. 00:07:28.411 --> 00:07:30.844 Всего менее 5 000. 00:07:31.570 --> 00:07:33.860 Есть ещё одно хранилище данных 00:07:33.860 --> 00:07:38.040 в рамках проекта Финской геопространственной платформы. 00:07:38.040 --> 00:07:39.199 Карточки с названиями мест, 00:07:39.199 --> 00:07:41.939 к ним относятся все названия мест на финских картах. 00:07:42.130 --> 00:07:48.308 И у них есть связанные данные, имеющие лицензию CC BY 4.0. 00:07:48.518 --> 00:07:54.478 800 000 меток на картах на финском, шведском, на всех трёх саамских языках 00:07:54.478 --> 00:07:55.778 Финляндии. 00:07:55.997 --> 00:07:58.877 У них два разных типа сущностей: 00:07:58.877 --> 00:08:02.588 места и географические названия, топонимы. 00:08:02.651 --> 00:08:05.271 У обоих типов есть постоянные URI. 00:08:06.001 --> 00:08:09.721 Например, тот же Севеттиярви сначала на финском языке, 00:08:09.721 --> 00:08:14.001 и затем на трёх саамских языках, как и географические данные, 00:08:14.001 --> 00:08:20.932 затем идёт информация об этом месте, его тип и так далее. 00:08:21.640 --> 00:08:28.411 Вот карточка для названия места, топонима с своим собственным URI. 00:08:29.943 --> 00:08:33.738 Извините, похоже, она не переведена на английский. 00:08:34.432 --> 00:08:39.151 Многоязычность не охватывает весь проект. 00:08:40.167 --> 00:08:42.523 Теперь перейдём к Архиву финских названий. 00:08:42.523 --> 00:08:46.234 Это проект Института исконных языков Финляндии, 00:08:46.234 --> 00:08:50.456 и в нём представлены не места, не географические названия, 00:08:50.456 --> 00:08:52.603 а их источники. 00:08:52.603 --> 00:08:57.123 Три миллиона полевых заметок с географическими названиями, 00:08:57.723 --> 00:08:59.529 это проект Викибазы. 00:08:59.529 --> 00:09:03.325 Они в Викибазе в основном на финском языке, некоторые на шведском. 00:09:03.325 --> 00:09:08.111 Замечательная коллекция саамских названий, которая нас очень интересует. 00:09:08.111 --> 00:09:10.141 Они имеют лицензию CC BY. 00:09:10.380 --> 00:09:14.850 Это своего рода испытание с точки зрения Викиданных. 00:09:14.850 --> 00:09:17.640 Но если бы была локальная финская Викибаза, 00:09:17.640 --> 00:09:22.632 мы могли бы сначала поработать с ней в рамках этого проекта. 00:09:23.034 --> 00:09:25.343 На этом скриншоте видно, 00:09:26.443 --> 00:09:31.323 что здесь есть информация о месте, NOTE Paragraph 00:09:31.323 --> 00:09:35.227 старые карты, которыми изначально пользовались составители, 00:09:35.227 --> 00:09:40.713 и карточка, которую они создали на основе собранной информации. 00:09:41.455 --> 00:09:46.416 Вот одна из таких карточек, 00:09:46.416 --> 00:09:48.736 разбитая на данные, 00:09:48.736 --> 00:09:50.676 которые в неё включены. 00:09:51.166 --> 00:09:53.751 Затем нам прислали проект, посвящённый связанным данным, 00:09:53.751 --> 00:09:56.745 выполненный Хельсинкской лабораторией цифровых гуманитарных наук 00:09:56.745 --> 00:09:59.856 и группой исследований семантических вычислений 00:09:59.856 --> 00:10:01.446 Университета Аалто 00:10:01.446 --> 00:10:06.525 совместно с Институтом исконных языков Финляндии, 00:10:06.525 --> 00:10:07.994 проект Names Sampo. 00:10:07.994 --> 00:10:11.024 Получается объединённый исследовательский интерфейс 00:10:11.024 --> 00:10:13.503 для нескольких источников географических названий. 00:10:13.503 --> 00:10:17.704 Здесь видно, что источники находятся слева, 00:10:17.704 --> 00:10:22.653 а затем, эти данные можно наглядно представить. 00:10:22.653 --> 00:10:24.438 Да. 00:10:25.289 --> 00:10:30.603 Я предложила идею моделирования для местной Викибазы, 00:10:30.603 --> 00:10:32.693 которую мы могли бы сделать с этими данными. 00:10:32.693 --> 00:10:36.580 Но когда возникает вопрос моделирования. 00:10:36.580 --> 00:10:37.770 Как моделировать? 00:10:37.770 --> 00:10:41.589 Существуют разные способы, разные подходы для каждого проекта. 00:10:45.682 --> 00:10:50.360 Можно так же поступить и с языками этнических меньшинств 00:10:50.360 --> 00:10:52.475 без особых усилий. 00:10:53.243 --> 00:10:57.179 У нас есть два основных варианта: 00:10:57.179 --> 00:11:02.282 модель SAPO, Финская пространственно-временная онтология 00:11:02.841 --> 00:11:04.421 и модель Викиданных. 00:11:04.421 --> 00:11:07.909 Здесь видно, что элементы Викиданных стремятся к нулю. 00:11:07.909 --> 00:11:12.871 В идеале, они остаются неизменными при изменении свойств. 00:11:12.871 --> 00:11:16.909 В то время как в модели SAPO эти элементы обновляются 00:11:16.909 --> 00:11:20.399 в случае изменений, как, например, при изменении региона или названия. 00:11:21.179 --> 00:11:26.219 Вернёмся к разделению 00:11:26.219 --> 00:11:31.719 между тремя разными измерениями названий мест. 00:11:32.099 --> 00:11:35.859 Следует ли нам сделать эти географические названия 00:11:35.859 --> 00:11:37.659 сущностями или свойствами? 00:11:37.659 --> 00:11:39.248 Викиданные используют свойства, 00:11:39.248 --> 00:11:43.098 а в проекте Национальной земельной службы используются сущности. 00:11:43.838 --> 00:11:46.177 Или мы должны сделать их лексемами? 00:11:46.177 --> 00:11:51.426 Викиданные работают со свойствами, 00:11:51.426 --> 00:11:54.956 текстовыми свойствами для топонимов вместо лексем. 00:11:55.567 --> 00:11:57.818 Простите, наоборот. 00:11:57.818 --> 00:11:59.631 Топонимы -- это... 00:12:03.056 --> 00:12:04.941 свойства, а не лексемы. 00:12:05.874 --> 00:12:06.877 Верно. 00:12:07.165 --> 00:12:11.132 Возможно, недостаток Викибазы в том, 00:12:11.132 --> 00:12:16.340 что в ней нет географических форм, 00:12:16.340 --> 00:12:20.958 в базовой настройке, 00:12:20.958 --> 00:12:24.748 поэтому для использования локальных географических форм 00:12:24.748 --> 00:12:29.688 в стек пришлось бы добавить больше технологий. 00:12:29.688 --> 00:12:31.823 И объединение действительно нужно, 00:12:31.823 --> 00:12:38.168 чтобы иметь возможность пользоваться всеми преимуществами Викиданных. 00:12:38.648 --> 00:12:43.052 Я закончила. Спасибо. 00:12:43.616 --> 00:12:45.827 (аплодисменты) 00:12:45.827 --> 00:12:47.127 (смеётся) 00:13:01.255 --> 00:13:02.514 Хорошо. 00:13:03.274 --> 00:13:05.011 (говорит на маори) 00:13:05.011 --> 00:13:07.655 Приветствую всех. Меня зовут Майк Дикисон. 00:13:08.375 --> 00:13:10.149 На протяжении года 00:13:10.149 --> 00:13:13.075 я был «Свободным википедистом» Новой Зеландии. 00:13:13.935 --> 00:13:16.935 Возможно, вам интересно, кто такой «Свободный википедист». 00:13:17.856 --> 00:13:21.875 Если вы будете искать, то не найдёте определения. 00:13:22.735 --> 00:13:25.855 Это термин, который я придумал в своей заявке на грант, 00:13:26.153 --> 00:13:29.003 и он, похоже, очень понравился фонду. 00:13:29.983 --> 00:13:31.533 На нём и остановились. 00:13:32.303 --> 00:13:37.743 За год я посетил 35 различных учреждений, местных жителей 00:13:37.743 --> 00:13:41.053 и для большинства из них я проводил тренинги, 00:13:41.493 --> 00:13:44.363 организовывал общественные мероприятия и пытался развивать 00:13:44.363 --> 00:13:47.230 стратегию Викимедиа для каждого из них. 00:13:47.998 --> 00:13:49.498 Это был очень интересный опыт. 00:13:49.498 --> 00:13:53.267 Я столкнулся с широким кругом различных проектов и людей. 00:13:53.267 --> 00:13:58.211 И я хочу рассказать о различных проектах, 00:13:58.211 --> 00:14:00.345 связанных с Викиданными, 00:14:00.872 --> 00:14:05.171 в интересном или, возможно, познавательном ключе, 00:14:05.171 --> 00:14:07.591 что может быть полезным для обсуждения. 00:14:08.561 --> 00:14:11.961 Изначально проект был проектом Википедии, 00:14:11.961 --> 00:14:14.651 просто потому, что название было знакомо людям, 00:14:15.281 --> 00:14:18.360 поэтому мы организовали множество различных мероприятий 00:14:18.360 --> 00:14:22.845 на традиционных Вики-марафонах, посвящённым гендерному неравенству 00:14:22.845 --> 00:14:24.371 и так далее. 00:14:24.607 --> 00:14:26.752 И как вы видите, [неразборчиво] 00:14:27.105 --> 00:14:30.812 мы набрали много новых успешных редакторов, и так далее. 00:14:31.754 --> 00:14:34.454 Мы делали массовые выгрузки в Викисклад. 00:14:35.454 --> 00:14:41.246 В данном случае была собрана коллекция из более чем 1 000 оригинальных работ 00:14:41.246 --> 00:14:46.047 художника-иллюстратора насекомых Деса Хелмора 00:14:46.047 --> 00:14:47.927 которая ждала своего часа на жёстком диске, 00:14:47.927 --> 00:14:50.357 без изучения на протяжении 10 лет, 00:14:50.357 --> 00:14:53.002 и мы смогли получить разрешение на их публикацию в открытом доступе 00:14:53.002 --> 00:14:54.245 под лицензией CC BY. 00:14:54.245 --> 00:14:57.963 Лёгкие победы, которые можно показать всем. 00:14:57.963 --> 00:15:01.095 Каждый может ознакомиться с изображениями жуков. 00:15:01.095 --> 00:15:03.750 Каждый может ознакомиться с семинарами, 00:15:03.750 --> 00:15:07.250 посвящёнными устранению гендерного неравенства. 00:15:07.250 --> 00:15:10.251 Но Викиданные гораздо сложнее «продать» 00:15:10.251 --> 00:15:12.280 людям из учреждений культуры 00:15:12.280 --> 00:15:15.095 или тем, кто не входит в наше движение. 00:15:16.107 --> 00:15:19.717 Я начал осознавать, что Викиданные 00:15:19.717 --> 00:15:22.634 будут всё более и более важной частью 00:15:22.634 --> 00:15:25.883 проектов «Cвободного википедиста». 00:15:25.883 --> 00:15:29.472 По мере продвижения проектов, Викиданные становились 00:15:29.472 --> 00:15:31.849 всё более существенным компонентом моей работы. 00:15:31.849 --> 00:15:36.350 Я начал пытаться больше узнать о Викиданных, 00:15:36.800 --> 00:15:39.515 потому что начал понимать, насколько это важно. 00:15:40.287 --> 00:15:41.989 Итак, сам проект. 00:15:41.989 --> 00:15:46.325 Какапо -- нелетающий попугай, эндемик Новой Зеландии. 00:15:48.096 --> 00:15:51.335 Мы работали с Департаментом охраны природы, 00:15:51.335 --> 00:15:54.299 чья работа заключается в спасении этого вида от вымирания, 00:15:54.299 --> 00:15:55.643 и выдвинули следующую идею: 00:15:55.643 --> 00:15:59.253 «Что, если мы поместим в Викиданные каждого какапо?» 00:15:59.737 --> 00:16:00.737 (смех в зале) 00:16:01.221 --> 00:16:02.701 Это может показаться нелепым, 00:16:02.701 --> 00:16:05.580 но на самом деле это вполне выполнимый проект. 00:16:06.621 --> 00:16:08.427 Некоторые попугаи уже там. 00:16:09.100 --> 00:16:11.601 Главное, что нужно заметить, что какапо не так уж много. 00:16:11.615 --> 00:16:13.245 Так что задача выполнима. 00:16:13.245 --> 00:16:16.656 Когда я начинал, их было 148, а потом один умер. 00:16:16.935 --> 00:16:20.995 И после прекрасного сезона размножения их стало 213. 00:16:21.765 --> 00:16:25.045 Это здорово. Это самая большая популяция какапо за последние 50 лет. 00:16:25.505 --> 00:16:28.260 Важное событие. 00:16:28.260 --> 00:16:30.725 В Новой Зеландии об этом каждый день говорили в новостях. 00:16:31.285 --> 00:16:32.954 Каждый вылупившийся... 00:16:32.954 --> 00:16:34.524 (голос из зала 1) В Нью-Йорк таймс. 00:16:34.524 --> 00:16:35.673 Да? О, здорово. 00:16:35.673 --> 00:16:38.522 Да, это были национальные новости. Всем нравятся эти птицы. 00:16:39.002 --> 00:16:40.663 Но самое интересное, 00:16:40.663 --> 00:16:43.932 что в отличие от более многочисленных видов, 00:16:43.932 --> 00:16:47.822 у каждого какапо своё уникальное имя 00:16:47.822 --> 00:16:49.817 и уникальный идентификационный номер. 00:16:49.817 --> 00:16:52.442 И часто на каждого какапо есть биографические данные 00:16:52.442 --> 00:16:54.672 о том, где и когда они вылупились, 00:16:54.672 --> 00:16:56.972 кем были их родители, 00:16:56.972 --> 00:16:58.713 когда они умерли, если это случилось. 00:16:58.713 --> 00:17:01.352 Существует база данных Департамента охраны природы, 00:17:01.352 --> 00:17:02.882 в которой есть вся эта информация. 00:17:02.882 --> 00:17:06.723 Один из самых известных какапо, конечно же, Сирокко, 00:17:06.723 --> 00:17:09.726 который, как вы видите, назван в честь ветра. 00:17:09.726 --> 00:17:13.225 У Сирокко есть аккаунт в Twitter, 00:17:13.705 --> 00:17:15.927 с которым у Викиданных возникли некоторые проблемы, 00:17:15.927 --> 00:17:18.562 потому что, видимо, у попугаев не может быть аккаунтов в Twitter. 00:17:18.562 --> 00:17:20.342 Я об этом не знаю. 00:17:21.121 --> 00:17:23.456 Он даже попал на обложку альбома. 00:17:23.456 --> 00:17:25.716 Существует множество свойств этой, 00:17:25.716 --> 00:17:28.258 вероятно, одной из самых известных особей какапо. 00:17:28.258 --> 00:17:30.817 Итак, я обратился в Департамент охраны природы с предложением: 00:17:30.817 --> 00:17:33.245 «Почему бы нам не попробовать сделать это с каждым из них?» 00:17:33.245 --> 00:17:37.665 Им нужно было подумать, сколько биографических данных 00:17:37.665 --> 00:17:39.365 можно опубликовать. 00:17:39.365 --> 00:17:41.225 Они предоставили короткий список. 00:17:41.225 --> 00:17:46.644 И теперь у нас, 212...210 -- я думаю, пара особей умерли -- 00:17:46.644 --> 00:17:50.703 живых какапо, которые занесены в список. 00:17:50.703 --> 00:17:52.933 Они получают имя только после того, как оперятся. 00:17:52.933 --> 00:17:56.172 Пока они птенцы, у них есть кодовый номер, 00:17:56.186 --> 00:17:58.227 Как только они полностью оперятся, 00:17:58.227 --> 00:18:01.806 мы создаём полноценные Викиданные, 00:18:01.806 --> 00:18:04.225 весь вид будет в Викиданных. 00:18:04.586 --> 00:18:06.605 Но нам нужно придумать свойство для DOC ID, 00:18:06.605 --> 00:18:08.875 я бы хотел поговорить с вами об этом. 00:18:08.875 --> 00:18:11.266 Следует ли нам использовать какой-то определённый ID 00:18:11.266 --> 00:18:13.136 или придумать такой ID, 00:18:13.136 --> 00:18:16.515 который будет применим ко всем отдельным особям птиц, 00:18:16.515 --> 00:18:17.665 растений или животных, 00:18:17.665 --> 00:18:21.965 которые были отмечены в любом научно-исследовательском проекте? 00:18:21.965 --> 00:18:23.795 Вопрос хороший. 00:18:25.105 --> 00:18:27.465 Второй проект: Художественная галерея Крайстчерча. 00:18:28.225 --> 00:18:31.080 У Колина Маккахона, 00:18:31.080 --> 00:18:33.963 самого известного художника Новой Зеландии, очень мало картин. 00:18:33.963 --> 00:18:36.774 Это рисунок, который он сделал для новозеландского школьного журнала, 00:18:36.774 --> 00:18:38.744 который в то время финансировался правительством. 00:18:38.744 --> 00:18:40.704 Значит, авторские права на него 00:18:40.704 --> 00:18:42.294 принадлежат архивам Новой Зеландии. 00:18:42.294 --> 00:18:44.333 Это весьма необычная ситуация. 00:18:45.014 --> 00:18:47.483 Я сотрудничал с Художественной галереей Крайстчерча 00:18:47.483 --> 00:18:49.713 которая вместе с Художественной галереей Окленда 00:18:49.713 --> 00:18:52.954 поддерживает сайт «Найти новозеландских художников». 00:18:52.954 --> 00:18:55.174 Работа сайта заключается в отслеживании коллекций 00:18:55.174 --> 00:18:58.703 каждого учреждения, в котором имеются коллекции работ новозеландских художников. 00:18:58.703 --> 00:19:03.163 В их базе данных около 18 000 разных художников, 00:19:03.163 --> 00:19:05.517 о большинстве из них очень мало информации. 00:19:06.233 --> 00:19:08.992 Мы сделали стандартную выгрузку в Mix'n'Match. 00:19:08.992 --> 00:19:13.673 Мы экспортировали тех, у которых была хотя бы дата рождения, 00:19:13.673 --> 00:19:17.545 или дата смерти, или место рождения, или место смерти. 00:19:17.545 --> 00:19:20.614 Не очень строгие ограничения. 00:19:20.614 --> 00:19:23.484 Даже тогда нам не удалось сопоставить нескольких из них, 00:19:23.484 --> 00:19:25.954 но сейчас у нас около 1 500, 00:19:25.954 --> 00:19:28.603 которые совпадают с известными художниками в Викиданных, 00:19:28.603 --> 00:19:30.123 и это хороший результат. 00:19:30.123 --> 00:19:31.783 Но что нас больше всего привлекло... 00:19:31.783 --> 00:19:33.523 Кстати, это их сайт, 00:19:33.523 --> 00:19:39.213 который содержит ссылки на коллекции, 00:19:39.213 --> 00:19:44.523 биографические данные, которые они ввели вручную, 00:19:44.523 --> 00:19:46.063 для каждого художника. 00:19:46.063 --> 00:19:48.803 Благодаря экспорту и внесению данных в Mix'n'Match 00:19:48.803 --> 00:19:52.363 выявилось множество опечаток и ошибок, 00:19:52.363 --> 00:19:53.723 которых они не заметили. 00:19:53.723 --> 00:19:56.123 Когда начинаешь прогонять данные через Excel, 00:19:56.123 --> 00:19:57.272 выявляются подобные ошибки. 00:19:57.272 --> 00:20:01.720 И они внезапно осознали ценность Викиданных, 00:20:01.720 --> 00:20:05.527 когда я сказал: «Вы можете просто брать эту информацию из Викиданных». 00:20:06.548 --> 00:20:09.507 Их это просто поразило. 00:20:09.507 --> 00:20:11.748 Я думаю, это одно из преимуществ. 00:20:11.748 --> 00:20:14.907 Когда у вас есть сайт, старательно собранный вручную, 00:20:14.907 --> 00:20:19.344 с 18 000 записей, в которых полно ошибок, то сказать им, что есть другой способ, 00:20:19.344 --> 00:20:23.037 что другие люди могут выполнить проверку и исправить ошибки... 00:20:23.192 --> 00:20:24.813 Это подкупает. 00:20:25.143 --> 00:20:30.283 Я предложил идею создания из Викиданных целой книги 00:20:30.283 --> 00:20:33.333 по истории новозеландских художников в Крайстчерче в 30-х годах 00:20:33.333 --> 00:20:36.383 -- её только что опубликовали -- на основе данных 00:20:36.383 --> 00:20:39.453 о художниках, связях, местах, выставках и так далее. 00:20:39.453 --> 00:20:43.103 Это вполне выполнимый проект, и они очень им заинтересовались. 00:20:44.303 --> 00:20:47.119 Третий проект: Маорийские предметные указатели. 00:20:47.119 --> 00:20:50.811 «Вака» на языке маори -- название определённого вида каноэ, 00:20:50.811 --> 00:20:52.732 боевого каноэ. 00:20:52.732 --> 00:20:55.952 В Национальной библиотеке Новой Зеландии 00:20:55.952 --> 00:20:58.860 есть запись для слова «вака», у Национальной библиотеки 00:20:58.860 --> 00:21:02.805 есть свой словарь маорийских предметных указателей 00:21:03.299 --> 00:21:04.474 на языке маори. 00:21:04.474 --> 00:21:06.885 В словаре есть определение слова «вака» 00:21:07.175 --> 00:21:09.512 на маори и английском языках. 00:21:10.182 --> 00:21:12.372 В нём много более узких терминов, 00:21:12.372 --> 00:21:14.222 как вы видите здесь. 00:21:14.222 --> 00:21:16.062 Типичный пример -- «таурапа». 00:21:16.237 --> 00:21:19.774 Определение сначала на маори, затем на английском. 00:21:19.774 --> 00:21:22.249 Это резной штевень, который вы видите на изображении. 00:21:22.695 --> 00:21:24.482 А по-английски вы бы сказали sternpost, 00:21:24.482 --> 00:21:26.959 но вы не можете назвать таурапу этим словом, 00:21:26.959 --> 00:21:31.054 потому что таупара используется только в определённых видах боевых каноэ. 00:21:31.420 --> 00:21:34.460 Значит, для этого слова нет английского эквивалента. 00:21:35.108 --> 00:21:37.909 И я вдруг понял, что здесь целая онтология 00:21:37.909 --> 00:21:42.177 терминов определённой культуры, которая была тщательно проработана 00:21:42.177 --> 00:21:45.043 и проверена Национальной библиотекой совместно с маори, 00:21:45.043 --> 00:21:49.093 и она постоянно пополняется определениями 00:21:49.093 --> 00:21:51.673 и описаниями на двух языках: английском и маори. 00:21:51.803 --> 00:21:52.956 Это впечатляет. 00:21:52.956 --> 00:21:56.228 Я вдруг подумал, что мы могли бы поместить всё это в Викиданные. 00:21:56.228 --> 00:22:00.596 Сначала на маори, а затем, если нужно, перевести на английский. 00:22:00.596 --> 00:22:02.291 Это было бы здорово. 00:22:03.081 --> 00:22:05.046 Но я столкнулся с авторским правом. 00:22:05.046 --> 00:22:08.726 К сожалению, лицензия в этом случае «Некоммерческая – Без производных» 00:22:10.346 --> 00:22:12.346 Теперь я должен обсудить с ними, 00:22:12.346 --> 00:22:14.524 почему они выбрали эту лицензию. 00:22:15.675 --> 00:22:19.970 Возможно, это произошло потому, что маори согласились поделиться 00:22:19.970 --> 00:22:23.319 своими знаниями, только в случае гарантии, 00:22:23.319 --> 00:22:27.339 что эти сведения не будут использованы в коммерческих целях. 00:22:27.920 --> 00:22:31.999 Сталкиваться с подобными ограничениями 00:22:31.999 --> 00:22:34.238 всегда очень неприятно. 00:22:34.238 --> 00:22:36.479 Рассказав об этих трёх проектах, 00:22:36.479 --> 00:22:38.379 я хотел инициировать их обсуждение. 00:22:38.379 --> 00:22:40.878 Внесение в Викиданные целого вида. 00:22:40.878 --> 00:22:43.137 Что нужно сделать, чтобы изменить мнение 00:22:43.137 --> 00:22:46.078 куратора художественной галереи о ценности Викиданных. 00:22:46.078 --> 00:22:49.838 Что делать, если перед вами целая онтология 00:22:49.838 --> 00:22:52.477 на другом языке, которая, к сожалению, ограничена 00:22:52.477 --> 00:22:55.697 жёсткой лицензией. 00:22:55.697 --> 00:22:56.997 Спасибо. 00:22:56.997 --> 00:22:58.737 (аплодисменты) 00:23:03.844 --> 00:23:07.540 Безвозмездная передача данных в Викиданные: 00:23:07.540 --> 00:23:11.131 Первый опыт из Архива прессы ХХ века 00:23:11.412 --> 00:23:14.077 Здравствуйте. Меня зовут Йохим Нойберт. 00:23:14.077 --> 00:23:17.392 Я работаю в ZBW, Германской национальной экономической библиотеке, 00:23:17.522 --> 00:23:20.947 в Информационном центре по экономике в Гамбурге, 00:23:21.407 --> 00:23:23.796 я разрабатываю научное программное обеспечение. 00:23:24.726 --> 00:23:27.358 Одной из моих задач в прошлом году 00:23:27.358 --> 00:23:31.878 была подготовка безвозмездной передачи данных в Викиданные. 00:23:31.878 --> 00:23:37.193 Я расскажу о нашем первом опыте 00:23:37.613 --> 00:23:43.259 передачи метаданных из Архива прессы ХХ века. 00:23:46.463 --> 00:23:48.299 Насколько нам известно, 00:23:48.299 --> 00:23:52.678 это крупнейший в мире архив прессы. 00:23:54.018 --> 00:23:59.158 Он был собран в период между 1908 и 2005 годами, 00:24:01.008 --> 00:24:04.244 и был составлен 00:24:05.174 --> 00:24:09.272 более чем из 1 500 газет и периодических изданий 00:24:09.272 --> 00:24:13.333 из Германии, а также из-за рубежа. 00:24:14.651 --> 00:24:18.841 И он охватил всё, что могло представлять интерес 00:24:18.841 --> 00:24:22.820 для Гамбурга, 00:24:25.870 --> 00:24:28.030 для гамбургских предпринимателей, 00:24:28.030 --> 00:24:32.410 которые хотели выйти на международный уровень. 00:24:34.611 --> 00:24:39.350 Как видите, эти материалы были вырезаны из газет 00:24:39.350 --> 00:24:41.790 и помещены на бумагу, 00:24:41.790 --> 00:24:44.731 а затем собраны в папки. 00:24:46.121 --> 00:24:50.451 Здесь вы видите небольшую часть Архива людей, 00:24:51.255 --> 00:24:56.182 аналогичным образом была собрана информация о компаниях, 00:24:56.182 --> 00:24:59.762 общих вопросах, товарах, 00:25:01.533 --> 00:25:05.557 обо всём, что могло представлять интерес. 00:25:06.978 --> 00:25:11.074 Эти папки были отсканированы 00:25:12.652 --> 00:25:15.868 -- примерно до 1949 года -- 00:25:17.076 --> 00:25:20.665 в рамках проекта, финансируемого Немецким научно-исследовательским сообществом 00:25:20.665 --> 00:25:23.515 в 2004-2007 годах. 00:25:24.268 --> 00:25:33.678 В результате получилось 25 000 тематических досье того времени. 00:25:33.771 --> 00:25:37.913 В этих папках более двух миллионов страниц. 00:25:38.845 --> 00:25:41.522 Их можно найти в интернете. 00:25:43.633 --> 00:25:48.461 Это приложение было разработано библиотекой ZBW 00:25:50.006 --> 00:25:54.341 и сейчас выглядит немного устаревшим, 00:25:55.031 --> 00:25:56.297 несовременным, 00:25:56.297 --> 00:25:58.597 и ещё проблема в том, 00:25:58.597 --> 00:26:04.350 что архитектура этого приложения построена на Oracle, 00:26:04.350 --> 00:26:08.662 оно построено на ColdFusion, работает на серверах Windows, 00:26:09.227 --> 00:26:14.992 поэтому оно не очень стабильно в долгосрочной перспективе. 00:26:16.008 --> 00:26:19.274 Мы обсудили возможность его переноса 00:26:19.274 --> 00:26:22.755 в более подходящее для этого приложение для работы со связанными данными, 00:26:23.931 --> 00:26:27.964 или сделать смелый шаг 00:26:27.964 --> 00:26:31.749 и разместить все эти данные в открытом доступе. 00:26:32.843 --> 00:26:37.416 Мы присвоили этим данным лицензию CC0, 00:26:37.416 --> 00:26:40.938 и, в настоящее время, мы перемещаем основной 00:26:41.726 --> 00:26:46.393 уровень доступа, уровень обнаружения, это первичный уровень доступа 00:26:47.233 --> 00:26:50.587 к сети открытых связанных данных, 00:26:51.315 --> 00:26:56.881 и на самом деле имеет смысл 00:26:56.881 --> 00:27:00.698 поместить некоторые метаданные в Викиданные, 00:27:02.367 --> 00:27:08.044 и убедиться в том, что все папки собраний 00:27:08.044 --> 00:27:10.633 связаны с Викиданными, 00:27:11.485 --> 00:27:13.308 чтобы их можно было найти 00:27:14.240 --> 00:27:17.795 и все метаданные этих папок 00:27:18.444 --> 00:27:22.977 также перенесены в Викиданные. 00:27:23.344 --> 00:27:27.886 Ими можно пользоваться и пополнять их. 00:27:28.780 --> 00:27:32.237 В эти данные можно внести исправления. 00:27:32.645 --> 00:27:38.894 ZBW, конечно, пока ещё поддерживает хранилище изображений, 00:27:39.947 --> 00:27:43.882 которые мы не можем опубликовать, 00:27:45.548 --> 00:27:47.326 не можем присвоить им лицензию, 00:27:47.326 --> 00:27:51.179 поскольку они принадлежат их создателям. 00:27:52.271 --> 00:27:54.954 Но в будущем мы обеспечим доступ 00:27:56.500 --> 00:28:02.203 к некоторым файлам метаданных с помощью DFG Viewer 00:28:03.108 --> 00:28:06.144 по манифестам IIIF. 00:28:06.849 --> 00:28:11.050 Мы подготовим несколько статических целевых страниц, 00:28:11.707 --> 00:28:18.333 которые будут служить точкой отсчёта для Викиданных, 00:28:18.333 --> 00:28:22.596 а также по-прежнему будут обеспечивать доступ к данным, 00:28:22.600 --> 00:28:26.174 которые не вписываются в формат Викиданных. 00:28:31.253 --> 00:28:36.815 Для этой передачи данных в Викиданные 00:28:37.165 --> 00:28:40.633 мы создали свою пользовательскую инфраструктуру, 00:28:40.633 --> 00:28:44.837 точку доступа SPARQL с этими данными, 00:28:45.887 --> 00:28:48.980 мы в основном использовали федеративные запросы 00:28:49.990 --> 00:28:53.834 между этой точкой доступа и сервисом запросов Викиданных 00:28:53.834 --> 00:28:57.633 для создания соответствующих утверждений, 00:28:59.207 --> 00:29:02.107 объединённых 00:29:02.107 --> 00:29:06.937 в SPARQL-запросах или преобразованных с помощью скрипта, 00:29:07.907 --> 00:29:12.254 который также генерировал ссылки на утверждения. 00:29:14.022 --> 00:29:19.767 Затем мы загрузили всё в QuickStatements, чтобы использовать в сети. 00:29:22.544 --> 00:29:24.088 Вот что мы получили. 00:29:24.493 --> 00:29:28.669 Это не только простые вещи, как даты рождения, простите, 00:29:29.835 --> 00:29:34.998 но и сложные утверждения 00:29:34.998 --> 00:29:39.787 об уже существующих элементах, 00:29:39.787 --> 00:29:44.790 например, то, что этот человек был членом наблюдательного совета данной компании 00:29:46.682 --> 00:29:48.905 в этот период времени, 00:29:49.663 --> 00:29:56.696 и на него ссылались для использования 00:29:58.463 --> 00:30:01.864 в научном контексте. 00:30:07.763 --> 00:30:10.939 Первая часть передачи данных завершена. 00:30:12.736 --> 00:30:17.201 Архив людей полностью связан с Викиданными. 00:30:18.333 --> 00:30:23.652 Это также информационный инструмент. 00:30:23.652 --> 00:30:27.360 Многие элементы раньше 00:30:27.360 --> 00:30:30.422 не имели никаких внешних ссылок. 00:30:31.278 --> 00:30:35.674 У нас было около 6 000 утверждений, 00:30:36.201 --> 00:30:41.924 которые сейчас находятся в метаданных этого архива. 00:30:45.288 --> 00:30:49.951 Это была самая простая часть, 00:30:50.880 --> 00:30:54.785 поскольку людей легко идентифицировать в Викиданных. 00:30:56.494 --> 00:31:00.443 Более 90% уже были в базе, 00:31:00.443 --> 00:31:02.412 так что мы смогли их связать. 00:31:02.412 --> 00:31:06.486 Мы создали около 100 элементов 00:31:06.486 --> 00:31:08.807 для тех, которые отсутствовали. 00:31:09.296 --> 00:31:13.626 Но сейчас мы работаем 00:31:13.626 --> 00:31:18.165 над остальной частью архива, 00:31:18.165 --> 00:31:20.432 в частности, над архивом общих тем. 00:31:21.243 --> 00:31:26.677 Это означает включение в Викиданные исторической системы организации знаний 00:31:26.677 --> 00:31:29.884 о мире в целом, 00:31:29.884 --> 00:31:34.147 в виде газетных вырезок. 00:31:36.305 --> 00:31:41.898 Чтобы дать вам представление, архив по странам и темам 00:31:42.668 --> 00:31:48.773 организован по принципу иерархии стран 00:31:48.773 --> 00:31:50.882 и других географических сущностей 00:31:52.499 --> 00:31:56.443 и переведён на английский язык, что упрощает задачу. 00:31:56.443 --> 00:32:01.861 На немецком языке присутствует 00:32:03.881 --> 00:32:08.064 глубоко вложенная тематическая классификация. 00:32:08.064 --> 00:32:11.593 Эта комбинация определяет... 00:32:13.032 --> 00:32:15.906 одну папку. 00:32:16.289 --> 00:32:21.128 Теперь мы хотим соотнести это 00:32:21.128 --> 00:32:24.575 как структуру с Викиданными и ввести данные. 00:32:24.575 --> 00:32:29.338 Я хочу пригласить вас 00:32:29.338 --> 00:32:33.668 присоединиться к этому проекту, 00:32:33.668 --> 00:32:36.463 замечательному с точки зрения организации знаний. 00:32:37.739 --> 00:32:40.713 Это Вики-проект, где вся эта работа отслеживается, 00:32:40.713 --> 00:32:46.288 вы можете наблюдать за его развитием или принять в нём участие. 00:32:46.591 --> 00:32:48.908 Большое спасибо. 00:32:49.639 --> 00:32:51.723 (аплодисменты) 00:33:03.999 --> 00:33:07.284 Мы вводим исполнительское искусство в Викиданные. 00:33:07.735 --> 00:33:11.930 Мы переносим его в облако связанных открытых данных, 00:33:11.930 --> 00:33:14.304 создавая экосистему связанных открытых данных 00:33:14.304 --> 00:33:16.164 для исполнительского искусства. 00:33:16.164 --> 00:33:21.068 Вопрос, на который я пытаюсь ответить, 00:33:21.068 --> 00:33:24.463 и надеюсь, вы поможете мне ответить: 00:33:24.463 --> 00:33:27.012 какую роль во всём этом играют Викиданные? 00:33:27.012 --> 00:33:34.442 Я начну с опыта, который я приобрёл в этом году. 00:33:34.723 --> 00:33:37.444 Я имел удовольствие 00:33:37.444 --> 00:33:39.350 поработать совместно с CAPACOA, 00:33:39.350 --> 00:33:42.074 Ассоциацией представления искусства Канады, 00:33:42.074 --> 00:33:44.591 которая запустила проект 00:33:44.591 --> 00:33:47.831 «Инициатива связанного цифрового будущего», 00:33:47.831 --> 00:33:51.271 чтобы помочь всему сектору искусства Канады 00:33:51.271 --> 00:33:53.441 научиться пользоваться связанными открытыми данными. 00:33:53.441 --> 00:33:56.887 Они это сделали, основываясь на наблюдении, 00:33:56.887 --> 00:33:59.042 что в течение последних пяти лет 00:33:59.731 --> 00:34:03.924 очень важной темой в исполнительском искусстве 00:34:03.924 --> 00:34:08.855 стали недостаточно качественные метаданные, 00:34:08.855 --> 00:34:11.780 без взаимосвязи и совместимости. 00:34:12.106 --> 00:34:19.244 Поэтому некоторые выступления и события нелегко найти 00:34:19.542 --> 00:34:24.777 с помощью Google и автоматизированных систем. 00:34:25.989 --> 00:34:29.757 Наше совместное видение 00:34:29.757 --> 00:34:32.997 заключалось в том, что мы хотим иметь базу знаний 00:34:34.013 --> 00:34:36.076 для всех заинтересованных сторон. 00:34:36.076 --> 00:34:39.636 Мы изучили всю структурную модель исполнительского искусства, 00:34:39.636 --> 00:34:42.073 определили в ней ключевых заинтересованных лиц, 00:34:42.073 --> 00:34:46.545 посмотрели на сценарии использования, которым мы хотели бы следовать 00:34:47.719 --> 00:34:56.818 и отразили их во всей архитектуре базы знаний, или разных платформ, 00:34:57.097 --> 00:34:59.535 и это, очевидно, распределённая архитектура, 00:34:59.535 --> 00:35:01.361 а не один монолит. 00:35:02.499 --> 00:35:05.664 Я быстро пробегусь по ней, 00:35:05.664 --> 00:35:07.980 поскольку у нас всего 10 минут. 00:35:09.035 --> 00:35:13.796 Думаю, у нас будет достаточно времени сегодня или завтра, чтобы углубиться, 00:35:13.796 --> 00:35:16.318 если кто-то заинтересуется деталями. 00:35:16.318 --> 00:35:19.116 Итак, мы начали с со структурной модели исполнительского искусства, 00:35:19.116 --> 00:35:23.263 которая была опубликована в прошлом году. 00:35:23.263 --> 00:35:27.451 Нам повезло, что мы могли опереться на уже проделанную работу. 00:35:27.451 --> 00:35:31.978 Основная цепь создания ценности посередине, 00:35:31.978 --> 00:35:34.177 а заинтересованные стороны вокруг неё. 00:35:34.177 --> 00:35:37.387 Всего мы определили 20 групп заинтересованных сторон, 00:35:37.387 --> 00:35:43.384 которые затем сократили до семи более крупных категорий 00:35:43.395 --> 00:35:45.464 для каждой группы. 00:35:45.464 --> 00:35:51.558 Мы сформулировали их потребности 00:35:51.558 --> 00:35:54.718 в рамках инфраструктуры, 00:35:54.718 --> 00:35:58.572 и чего они смогут достичь, если всё будет взаимосвязано, 00:35:58.572 --> 00:36:02.062 а данные общедоступны. 00:36:02.637 --> 00:36:04.990 Здесь вы видите типы данных: 00:36:04.990 --> 00:36:08.487 «Создание», «Презентация и продвижение», 00:36:08.487 --> 00:36:10.684 «Распространение и Повторное использование», 00:36:10.684 --> 00:36:12.064 «Живая аудитория», 00:36:12.064 --> 00:36:13.852 «Интернет-потребление», «Наследие», 00:36:13.852 --> 00:36:15.959 «Наука и образование». 00:36:15.959 --> 00:36:18.917 После того, как мы составили большую таблицу 00:36:18.917 --> 00:36:21.275 -- вы видите здесь только первую часть -- 00:36:21.275 --> 00:36:25.128 посмотрели, какой тип данных 00:36:25.128 --> 00:36:26.954 использовался повсеместно 00:36:26.954 --> 00:36:31.248 различными группами заинтересованных сторон. 00:36:31.248 --> 00:36:36.863 Это довольно большая база данных, общая для всех. 00:36:36.863 --> 00:36:38.414 Это та область, 00:36:38.414 --> 00:36:43.063 где имеет смысл сотрудничество 00:36:43.063 --> 00:36:46.408 и совместное хранение данных. 00:36:47.602 --> 00:36:50.651 Несколько слов об архитектуре платформы: 00:36:50.651 --> 00:36:53.648 вы видите, что в ней четыре уровня. 00:36:54.096 --> 00:36:56.448 Внизу отображается уровень данных. 00:36:56.448 --> 00:36:58.717 Викиданные играют в нём свою роль, 00:36:58.717 --> 00:37:02.733 но и другие базы данных, распределённые базы данных 00:37:02.733 --> 00:37:07.769 могут публиковать данные с помощью SPARQL-точек доступа. 00:37:09.204 --> 00:37:13.106 Жёлтая часть посередине -- семантический уровень. 00:37:13.106 --> 00:37:16.080 Это наш общий язык для описания объектов, 00:37:16.080 --> 00:37:19.800 для создания утверждений об этих объектах, 00:37:19.800 --> 00:37:22.400 связанных с исполнительским искусством, онтология. 00:37:22.400 --> 00:37:25.243 Затем у нас есть прикладной уровень, 00:37:25.243 --> 00:37:30.551 состоящий из различных модулей, например, анализа данных, 00:37:30.551 --> 00:37:32.451 извлечения данных... 00:37:32.451 --> 00:37:34.622 Как перевести неструктурированные данные 00:37:34.622 --> 00:37:36.029 в структурированные данные? 00:37:36.029 --> 00:37:38.749 Как это сделать с помощью различных инструментов? 00:37:39.436 --> 00:37:42.478 Конечно, есть визуализация данных. 00:37:42.478 --> 00:37:45.391 Если объём данных большой, 00:37:45.391 --> 00:37:47.801 то их нужно как-то визуализировать. 00:37:47.801 --> 00:37:50.155 Сверху уровень представления данных, 00:37:50.155 --> 00:37:55.862 с которым ежедневно взаимодействуют обычные люди: 00:37:56.199 --> 00:37:59.615 поисковые системы, энциклопедии, культурные программы 00:37:59.615 --> 00:38:02.097 и целый ряд других сервисов. 00:38:03.395 --> 00:38:05.386 Мы не начинаем с нуля. 00:38:05.386 --> 00:38:08.535 В этой области уже проделана определённая работа. 00:38:09.107 --> 00:38:13.043 Я просто приведу несколько примеров из проекта, 00:38:13.043 --> 00:38:15.245 в котором я участвовал. 00:38:15.245 --> 00:38:18.149 И ещё кое-что. 00:38:18.149 --> 00:38:21.195 Я начал в этой области 00:38:21.195 --> 00:38:24.476 со Швейцарского архива исполнительских искусств. 00:38:25.001 --> 00:38:27.795 До создания базы данных швейцарских исполнительских искусств 00:38:27.795 --> 00:38:31.046 мы создали онтологию исполнительского искусства, 00:38:31.046 --> 00:38:33.931 которая в настоящее время внедряется в RDF. 00:38:34.701 --> 00:38:40.052 В нашей базе хранятся данные по истории выступлений в Швейцарии 00:38:40.052 --> 00:38:43.313 за последние 60-70 лет. 00:38:43.313 --> 00:38:45.145 Это то, что можно развить, 00:38:45.145 --> 00:38:48.999 то, что можно преобразовывать в RDF. 00:38:49.968 --> 00:38:53.031 Также у нас была платформа для сборки, 00:38:53.031 --> 00:38:54.897 где можно получить доступ к этим данным. 00:38:56.073 --> 00:39:01.658 Затем мы сделали несколько вводов в Викиданные, 00:39:01.658 --> 00:39:02.877 частично из Швейцарии, 00:39:02.877 --> 00:39:08.990 частично из учреждений исполнительского искусства, 00:39:09.680 --> 00:39:12.357 например, Барт Магнус участвовал в этом. 00:39:12.883 --> 00:39:15.078 Он был движущей силой. 00:39:15.078 --> 00:39:17.223 Ещё был материал из Викисклада, 00:39:17.223 --> 00:39:21.361 но не очень хорошо связанный со всеми остальными нашими метаданными. 00:39:21.361 --> 00:39:25.097 И, очевидно, что этим вводом 00:39:25.097 --> 00:39:29.274 мы начали внедрять части швейцарской модели данных 00:39:29.274 --> 00:39:31.345 в Викиданные. 00:39:32.767 --> 00:39:38.822 Один из канадских партнёров по этому проекту -- Culture Creates. 00:39:39.013 --> 00:39:43.872 Они запустили платформу, которая собирает информацию с театральных сайтов 00:39:43.872 --> 00:39:46.873 и вставляет её в граф знаний, 00:39:48.293 --> 00:39:52.348 чтобы затем представить её поисковым системам 00:39:52.348 --> 00:39:54.641 и другим поисковым устройствам. 00:39:56.415 --> 00:40:03.027 Опять же, мы должны были внедрить и расширить это в онтологии. 00:40:03.261 --> 00:40:08.163 Как видно из слайда, здесь ещё много пустых мест, 00:40:08.163 --> 00:40:09.599 но есть и пересечения, 00:40:09.599 --> 00:40:13.456 самым важным, очевидно, является общий язык, 00:40:13.456 --> 00:40:18.693 который поможет нам связать различные наборы данных. 00:40:20.759 --> 00:40:22.587 Также важно, 00:40:22.587 --> 00:40:26.404 что мы используем одни и те же базовые регистры и нормативные файлы. 00:40:26.406 --> 00:40:31.368 Здесь Викиданные играют важную роль, 00:40:31.368 --> 00:40:33.967 соединяя всё между собой. 00:40:34.619 --> 00:40:37.799 Теперь я хотел бы поделиться рекомендациями 00:40:37.799 --> 00:40:41.882 Консультативного комитета по инициативе будущего связанных данных. 00:40:42.769 --> 00:40:45.169 По крайней мере, двумя первыми рекомендациями. 00:40:45.169 --> 00:40:47.930 Для канадцев сейчас крайне важно 00:40:47.930 --> 00:40:53.173 заполнить граф знаний об исполнительском искусстве Канады, 00:40:53.173 --> 00:40:56.361 потому что в отличие от Швейцарского архива исполнительских искусств, 00:40:56.361 --> 00:40:59.389 у них нет уже существующей базы данных, 00:40:59.389 --> 00:41:01.906 они создают её с нуля. 00:41:01.906 --> 00:41:04.468 И очень важно, чтобы там были данные. 00:41:04.468 --> 00:41:09.024 А во-вторых, как видите, уже появляются Викиданные. 00:41:09.024 --> 00:41:12.342 Викиданные, по мнению Консультативного комитета, 00:41:12.342 --> 00:41:17.859 рассматриваются как дополнение к Artsdata.ca, этому графу знаний, 00:41:18.347 --> 00:41:21.474 и поэтому следует способствовать 00:41:21.474 --> 00:41:24.878 её пополнению данными, относящимися к исполнительским видам искусства. 00:41:25.813 --> 00:41:30.775 Именно над этим мы будем работать в ближайшие месяцы и годы, 00:41:30.775 --> 00:41:34.748 поэтому я ищу людей, 00:41:34.748 --> 00:41:38.644 готовых присоединиться к этому проекту. 00:41:40.556 --> 00:41:44.942 Сейчас мы считаем, что они дополняют друг друга. 00:41:44.942 --> 00:41:48.341 Мы должны подумать о плюсах и минусах 00:41:48.341 --> 00:41:49.844 каждого подхода. 00:41:49.844 --> 00:41:52.073 Здесь вы видите сравнение 00:41:52.073 --> 00:41:56.120 между Викиданными и классическим подходом к связанным открытым данным. 00:41:56.887 --> 00:41:59.947 Я буду рад обсудить это с вами, 00:41:59.947 --> 00:42:02.549 услышать о вашем опыте. 00:42:02.814 --> 00:42:05.707 Но, как мне кажется, Викиданные это огромный плюс, 00:42:05.707 --> 00:42:07.727 потому что это краудсорсинговая платформа, 00:42:07.727 --> 00:42:11.671 и легко пригласить другие стороны внести свой вклад. 00:42:11.683 --> 00:42:17.482 Потеря контроля -- отрицательная сторона. 00:42:17.658 --> 00:42:22.264 Владельцы данных вынуждены отказываться от контроля над своими графами, 00:42:22.264 --> 00:42:24.382 качеством и полнотой данных. 00:42:26.554 --> 00:42:31.396 Отслеживать данные в Викиданных сложнее, чем в базах под вашим контролем. 00:42:31.493 --> 00:42:34.376 Ещё одна сильная сторона Викиданных -- 00:42:34.376 --> 00:42:39.617 немедленная интеграция во всемирный граф. 00:42:39.617 --> 00:42:41.734 И вы просто делаете 00:42:42.544 --> 00:42:46.768 пошаговую сверку с другими базами данных, 00:42:46.768 --> 00:42:49.528 что некоторые также рассматривают как преимущество, 00:42:49.528 --> 00:42:53.914 но, конечно, если вам нужна интеграция и совместимость, 00:42:53.914 --> 00:42:56.792 Викиданные заставляют вас идти на это с самого начала. 00:42:59.184 --> 00:43:03.157 Согласование практик моделирования данных -- 00:43:03.157 --> 00:43:05.552 проблема в обоих случаях. 00:43:06.039 --> 00:43:07.981 Но сначала может показаться, 00:43:07.981 --> 00:43:10.671 что проще сделать это только в своём собственном хранилище, 00:43:10.671 --> 00:43:13.356 потому что в какой-то момент вы завершите эту задачу, 00:43:13.356 --> 00:43:16.693 а в Викиданных она будет постоянной. 00:43:18.280 --> 00:43:22.883 Когда дело доходит до расстановки приоритетов при публикации данных... 00:43:23.535 --> 00:43:28.395 Это правила, которым я следую в данный момент. 00:43:30.055 --> 00:43:33.225 Прежде всего, мы хотели бы публиковать такие данные, 00:43:33.225 --> 00:43:36.191 для которых неясно, кто ими управляет. 00:43:36.191 --> 00:43:40.433 Поэтому эти данные будут управляться совместно. 00:43:40.902 --> 00:43:44.391 И мы хотели бы публиковать такие данные, 00:43:44.391 --> 00:43:47.149 в которых есть высокий потенциал для краудсорсинга. 00:43:47.149 --> 00:43:50.363 Мы бы хотели публиковать такие данные, 00:43:50.363 --> 00:43:53.965 которые скорее всего будут использованы повторно в контексте Википедии. 00:43:54.813 --> 00:44:00.262 Есть надежда, что часть международной координации 00:44:00.262 --> 00:44:04.364 в отношении всего процесса моделирования данных, стандартизации, 00:44:04.364 --> 00:44:07.531 может происходить непосредственно в Викиданных, 00:44:07.531 --> 00:44:09.484 если это не происходит в каком-то другом месте, 00:44:09.484 --> 00:44:12.075 потому что благодаря этому люди начинают взаимодействовать, 00:44:12.075 --> 00:44:14.816 если они публикуют данные в одной области. 00:44:15.963 --> 00:44:22.168 Сейчас мы хотели бы уделить внимание базовым регистрам и нормативным файлам, 00:44:22.181 --> 00:44:26.085 они помогают нам создавать связи 00:44:26.085 --> 00:44:29.010 между различными данными и ненормализованной лексикой 00:44:29.010 --> 00:44:32.833 как расширением существующей онтологии. 00:44:33.965 --> 00:44:35.994 Ещё два слайда. 00:44:36.480 --> 00:44:40.508 Сейчас мы рассмотрим подход «Сумма всех учреждений культуры» 00:44:40.508 --> 00:44:42.888 к проекту «Вики любит исполнительское искусство». 00:44:42.888 --> 00:44:47.524 Мы описываем места и организации 00:44:47.524 --> 00:44:51.106 и пытаемся перенести данные в Википедию 00:44:51.106 --> 00:44:54.414 в виде карточек и шаблонов. 00:44:54.414 --> 00:44:59.769 Ещё один проект, в котором я буду участвовать, COST Action. 00:45:00.336 --> 00:45:02.001 Мы представим его в следующем году. 00:45:03.140 --> 00:45:05.147 Он посвящён экосистеме связанных открытых данных 00:45:05.147 --> 00:45:06.397 для исполнительских искусств. 00:45:06.397 --> 00:45:10.347 COST -- европейская программа, поддерживающая активность в сети. 00:45:10.347 --> 00:45:13.929 Здесь вы видите список тем, охваченных в этом проекте. 00:45:13.929 --> 00:45:16.404 Я выделил две темы. 00:45:16.404 --> 00:45:20.702 Первая: вопрос объединения Викиданных 00:45:20.702 --> 00:45:23.717 с классическим подходом к связанным открытым данным. 00:45:24.368 --> 00:45:27.744 Вторая -- я думаю, тоже очень важна, 00:45:27.744 --> 00:45:30.528 у неё есть огромный потенциал -- 00:45:30.528 --> 00:45:35.683 реализация международных кампаниий по добавлению данных в Викиданные. 00:45:37.627 --> 00:45:41.365 Вот и всё. Спасибо за внимание. 00:45:41.365 --> 00:45:45.762 Теперь я хотел бы пригласить моих коллег на сцену. 00:45:47.086 --> 00:45:50.529 Возможно, вы дадите им микрофоны. 00:45:53.903 --> 00:45:55.682 А потом я хотел бы... 00:45:57.473 --> 00:45:59.940 дать вам возможность задать вопросы. 00:46:01.042 --> 00:46:05.185 Также я хочу спросить моих коллег, 00:46:05.753 --> 00:46:08.071 есть ли у них вопросы друг к другу? 00:46:10.040 --> 00:46:11.630 (смех) 00:46:12.049 --> 00:46:15.327 Итак, у нас есть вопрос от аудитории? 00:46:20.502 --> 00:46:22.758 (голос из зала 2) [неразборчиво] 00:46:23.587 --> 00:46:27.033 Я хотел бы спросить у каждого из вас, 00:46:27.033 --> 00:46:30.842 где бы вы провели черту, 00:46:30.842 --> 00:46:33.076 как вы определяете, 00:46:33.076 --> 00:46:35.956 когда нужно запускать собственную Викибазу, 00:46:35.956 --> 00:46:39.328 и что вы хотите поместить в Викиданные? 00:46:39.328 --> 00:46:43.677 Это чёткое разграничение 00:46:43.677 --> 00:46:45.981 или [неразборчиво]? 00:46:48.211 --> 00:46:51.484 Я могу ответить первой, потому что микрофон у меня. 00:46:51.484 --> 00:46:56.955 Я думаю, что одна из проблем -- значимость данных. 00:46:59.212 --> 00:47:02.084 Я рассматриваю это в другом проекте. 00:47:02.084 --> 00:47:05.898 И я думаю, что лицензирование может быть одним из решений, 00:47:05.898 --> 00:47:10.466 потому что вы можете применить свои условия в своей базе данных, 00:47:10.466 --> 00:47:13.758 и, я думаю, где это возможно. 00:47:14.284 --> 00:47:19.882 И в-третьих, можно просто использовать её как песочницу, 00:47:19.882 --> 00:47:23.078 подготавливая в ней данные к вводу в Викиданные. 00:47:23.078 --> 00:47:26.085 Вот три главные вещи, которые я сейчас вспомнила, 00:47:26.085 --> 00:47:28.554 но я могу назвать ещё несколько. 00:47:29.976 --> 00:47:32.369 Для меня авторские права всегда будут проблемой. 00:47:32.369 --> 00:47:36.686 Если Национальная Библиотека захотела бы перейти на Викибазу, 00:47:36.686 --> 00:47:39.740 они смогли бы продолжать контролировать лицензирование 00:47:39.740 --> 00:47:43.438 той работы, которую они уже провели в отношении терминов на языке маори. 00:47:43.438 --> 00:47:46.483 База данных попугаев какапо содержит только те данные, 00:47:46.483 --> 00:47:49.977 которые могут быть опубликованы по мнению Департамента охраны природы, 00:47:49.977 --> 00:47:52.739 но я подозреваю, что если они увидят, что она работает, 00:47:52.739 --> 00:47:55.980 у них может возникнуть соблазн использовать закрытую Викибазу 00:47:55.980 --> 00:47:58.128 для ведения собственной базы данных, 00:47:58.128 --> 00:48:01.214 просто потому, что некоторые инструменты визуализации, 00:48:01.214 --> 00:48:03.567 которые могут быть применены, будут лучше, 00:48:03.567 --> 00:48:07.417 чем таблицы Excel, которыми они пользуются сейчас. 00:48:12.337 --> 00:48:16.556 Я думаю, это сильно зависит от вида данных. 00:48:17.609 --> 00:48:22.359 Нам, конечно, с архивом прессы очень повезло в том, 00:48:22.359 --> 00:48:26.984 что эти материалы уже были опубликованы 00:48:26.984 --> 00:48:29.829 в то время, 00:48:30.153 --> 00:48:32.200 но их публикация была дорогостоящей. 00:48:33.082 --> 00:48:36.234 Так что, это довольно просто. 00:48:36.234 --> 00:48:39.449 Я думаю, также, проекты... 00:48:40.101 --> 00:48:42.476 Это типичный проект, 00:48:42.476 --> 00:48:45.726 его финансировали некоторое время, а потом прекратили. 00:48:46.466 --> 00:48:51.516 Что же произойдёт с данными, которые помещены в какое-то хранилище 00:48:52.136 --> 00:48:55.106 с каким-то программным обеспечением, которое не будет работать вечно? 00:48:55.846 --> 00:48:59.436 На мой взгляд это имеет смысл. 00:48:59.896 --> 00:49:02.776 В то время Викиданных не было, но теперь они есть, 00:49:03.376 --> 00:49:07.336 и для нашего проекта имеет смысл на ранней стадии 00:49:07.336 --> 00:49:12.732 обсуждать устойчивость в контексте перемещения данных 00:49:12.732 --> 00:49:16.617 в более крупную экосистему, такую как Викиданные, 00:49:18.717 --> 00:49:21.408 и обсудить это с сообществом Викиданных, 00:49:21.408 --> 00:49:26.844 что имеет смысл добавлять в Викиданные, 00:49:26.864 --> 00:49:32.093 а что сохранить в проприетарной форме. 00:49:32.103 --> 00:49:37.753 Возможно, в более простой форме, не в виде сложного приложения, 00:49:37.753 --> 00:49:43.055 сделать их доступными для обнаружения и связать с большим облаком данных 00:49:43.055 --> 00:49:46.032 вместо того, чтобы вкладывать кучу денег 00:49:46.032 --> 00:49:52.692 в какое-то хранилище, которое не будет поддерживаться. 00:49:55.201 --> 00:50:00.121 Да, как я уже говорил, в проекте, который я представил, 00:50:00.121 --> 00:50:02.606 есть различие между подходом к хранению в Викиданных 00:50:02.606 --> 00:50:04.926 и классическими подходом к связанным открытым данным. 00:50:04.926 --> 00:50:07.928 Дело не только в создании закрытой Викибазы. 00:50:11.147 --> 00:50:14.504 Одна из сложностей, с которой мы столкнулись в Викиданных: 00:50:14.504 --> 00:50:17.710 когда вы публикуете свои данные, 00:50:17.710 --> 00:50:20.341 вы должны поддерживать порядок, 00:50:20.744 --> 00:50:23.509 следить за другими людьми. 00:50:24.043 --> 00:50:28.258 Это может отпугнуть людей, значит, мы будем работать с этим 00:50:28.258 --> 00:50:29.888 пошагово. 00:50:30.375 --> 00:50:33.466 Итак, в настоящее время будет существовать база данных, находящаяся... 00:50:33.873 --> 00:50:35.581 в классических связанных открытых данных, 00:50:35.581 --> 00:50:38.395 мы начинаем связывать её с Викиданными, 00:50:38.395 --> 00:50:40.993 и это непрерывный процесс, позволяющий понять, 00:50:41.805 --> 00:50:45.418 для каких областей в Викиданных 00:50:45.418 --> 00:50:48.168 в конечном итоге будет больше всего данных, 00:50:48.168 --> 00:50:51.946 а для каких областей больше данных будет в других базах данных. 00:50:52.620 --> 00:50:56.645 Очевидно, у нас будут проблемы с синхронизацией, 00:50:57.135 --> 00:50:58.589 как, возможно, у всех нас, 00:50:58.589 --> 00:51:01.507 из-за поля связанных данных, 00:51:01.507 --> 00:51:04.826 где мы должны решить, кому доверять, 00:51:05.160 --> 00:51:08.720 кому доверить управления. 00:51:13.830 --> 00:51:15.820 (ассистент) Ещё вопросы? 00:51:23.981 --> 00:51:25.550 (голос из зала 3) Спасибо. 00:51:26.090 --> 00:51:31.030 Я полностью согласна с вопросом о том, 00:51:34.425 --> 00:51:41.410 где провести границу, публиковать ли данные в Викиданных 00:51:43.044 --> 00:51:49.144 или хранить их, а также создавать, управлять и обслуживать 00:51:49.144 --> 00:51:53.104 в локальных базах данных и с какой целью. 00:51:53.778 --> 00:51:57.213 Я думаю, что это большая дискуссия, 00:51:57.213 --> 00:52:02.383 которая выходит за рамки восторга 00:52:02.383 --> 00:52:07.423 от размещения данных в Викиданных, потому что они будут общедоступны, 00:52:07.432 --> 00:52:10.762 они служат человечеству, потому что... 00:52:11.031 --> 00:52:13.362 Это такой крутой инструмент, 00:52:13.362 --> 00:52:18.132 а в реальной жизни всё сложнее, я думаю. 00:52:19.162 --> 00:52:24.102 Несмотря на это, дискуссия довольно интересная. 00:52:24.435 --> 00:52:29.744 Ещё один вопрос, или другая проблема, которая обсуждается 00:52:29.744 --> 00:52:35.034 на этом мероприятии в разных группах. 00:52:35.775 --> 00:52:41.129 С одной стороны, иметь свою базу данных, 00:52:41.129 --> 00:52:43.194 независимо от технологии, 00:52:43.194 --> 00:52:46.763 и публиковать что-то в Викиданных, 00:52:47.233 --> 00:52:51.166 или строить собственную систему 00:52:51.166 --> 00:52:55.246 создания информации и работы с ней 00:52:55.246 --> 00:52:58.131 на основе технологии Викибазы. 00:52:58.591 --> 00:53:04.281 Синхронизировать или... объединять или что-то ещё, 00:53:04.281 --> 00:53:08.314 в зависимости от технологии, которая используется, 00:53:09.182 --> 00:53:14.796 и то, что вы используете Викиданные только для публикации, 00:53:14.978 --> 00:53:18.637 или инфраструктуры, которая находится под Викиданными, 00:53:18.637 --> 00:53:23.002 для создания данных и управления ими. 00:53:27.116 --> 00:53:30.914 Я имею в виду, у нас была дискуссия 00:53:30.914 --> 00:53:34.254 по поводу Викибазы, 00:53:34.254 --> 00:53:36.912 и здесь будут и другие обсуждения, 00:53:36.912 --> 00:53:40.815 но это всё на разных уровнях, как я думаю. 00:53:41.626 --> 00:53:46.466 Можно я отвечу на ваш вопрос о дискуссиях о Викибазе или Викиданных? 00:53:46.466 --> 00:53:47.773 (голос из зала 3) Хорошо. 00:53:48.930 --> 00:53:52.427 Я думаю, проблема в том, что мы слишком много внимания уделяем 00:53:52.427 --> 00:53:54.768 инфраструктуре Викибазы, поскольку существуют 00:53:54.768 --> 00:53:56.158 другие инфраструктуры, 00:53:56.158 --> 00:53:58.690 например, в области исполнительских искусств. 00:53:59.810 --> 00:54:04.054 У нас есть ещё одно сообщество MusicBrainz, 00:54:04.054 --> 00:54:08.954 которое работает на собственной платформе, предоставляющей связанные открытые данные, 00:54:09.614 --> 00:54:12.692 и, как я понимаю, 00:54:14.160 --> 00:54:17.232 в сообществе Викиданных есть договорённость о том, 00:54:17.232 --> 00:54:19.731 что мы не собираемся дублировать все их данные, 00:54:19.731 --> 00:54:21.298 мы не копируем все их данные, 00:54:21.298 --> 00:54:24.848 но принимаем тот факт, что они дополняют друг друга. 00:54:24.848 --> 00:54:29.678 Что произойдёт, когда вы начнёте интегрировать эти данные в Википедию? 00:54:30.246 --> 00:54:31.907 Карточки, например. 00:54:31.907 --> 00:54:35.952 Сможем ли мы получить эти данные непосредственно из точки доступа SPARQL? 00:54:36.764 --> 00:54:39.603 Или же мы должны копировать все данные, 00:54:39.603 --> 00:54:42.225 и какие процессы в этом задействованы? 00:54:42.225 --> 00:54:45.275 (голос из зала 3) Дискуссии открыты, как я думаю, 00:54:45.275 --> 00:54:49.615 в рамках этого мероприятия есть 00:54:49.615 --> 00:54:51.975 и те, кто интересуется Викибазой, 00:54:51.975 --> 00:54:54.002 и те, кто интересуется Викиданными, 00:54:54.002 --> 00:54:56.282 так и те, кто интересуется и тем, и другим. 00:54:56.282 --> 00:54:59.562 Да, но мы не обязываем их переходить на Викибазу. 00:55:00.162 --> 00:55:03.138 - (голос из зала 3) Необязательно. - MusicBrainz работает не на Викибазе. 00:55:03.138 --> 00:55:06.802 (голос из зала 3) Нет, я просто хотела сказать, что у вас разные проблемы, 00:55:06.802 --> 00:55:10.964 иногда взаимосвязанные, иногда не полностью разделённые. 00:55:12.479 --> 00:55:16.573 У меня есть ещё один вопрос или комментарий 00:55:16.573 --> 00:55:22.013 относительно управления иерархиями в нормализованной лексике, 00:55:22.013 --> 00:55:26.473 как в тезаурусе, как у вас в Finto. 00:55:27.703 --> 00:55:30.563 У вас есть названия мест, 00:55:31.503 --> 00:55:34.956 маорийские... 00:55:36.418 --> 00:55:40.554 предметные указатели. 00:55:42.262 --> 00:55:48.068 Им приходится иметь дело с управлением концепциями в иерархии. 00:55:48.360 --> 00:55:52.320 Как вы считаете, 00:55:52.320 --> 00:55:57.042 можно ли управлять этими контролируемыми системами 00:55:58.850 --> 00:56:02.364 организации данных в Викиданных? 00:56:07.166 --> 00:56:10.169 Я думаю, что в случае Finto и YSO-местами 00:56:11.499 --> 00:56:17.351 хранилище будет представлять собой собрание из нескольких источников 00:56:17.351 --> 00:56:18.936 в конечном итоге. 00:56:18.936 --> 00:56:21.613 Оно в постоянном движении. 00:56:21.613 --> 00:56:24.528 Так что, нам необязательно... 00:56:24.528 --> 00:56:28.383 я не представляю Национальную библиотеку, 00:56:28.383 --> 00:56:31.512 но в этом возможном проекте 00:56:31.512 --> 00:56:35.711 нам необязательно поддерживать существующую структуру 00:56:35.711 --> 00:56:38.540 или бороться с ней. 00:56:38.540 --> 00:56:45.164 Так что, в этом плане, эта область открыта для изучения. 00:56:48.912 --> 00:56:52.272 Маорийские предметные указатели идеально подходят 00:56:52.272 --> 00:56:54.392 для структуры Викиданных, 00:56:54.392 --> 00:56:56.961 но лицензирование, конечно, запрещает это. 00:56:56.961 --> 00:56:59.491 Я полагаю, что если бы лицензирование было другим, 00:56:59.491 --> 00:57:01.511 и их поместили в Викиданные, 00:57:01.511 --> 00:57:04.562 как только кто-то бы решил, что ему не нравится иерархия, 00:57:04.562 --> 00:57:06.162 и начал что-то менять, 00:57:06.162 --> 00:57:10.001 это бы вызвало протест у тех людей, которые усердно работали 00:57:10.001 --> 00:57:12.301 над созданием этой структуры 00:57:12.301 --> 00:57:15.641 и получали разрешение от различных народов маори 00:57:15.641 --> 00:57:17.942 на текущую иерархию. 00:57:18.382 --> 00:57:20.841 Это вопрос, который нужно решить. 00:57:23.812 --> 00:57:26.502 Я думаю, если говорить о системах организации знаний, 00:57:26.502 --> 00:57:28.116 все они отличаются. 00:57:28.116 --> 00:57:31.752 И я не уверен, будет ли хорошей идеей 00:57:31.752 --> 00:57:36.855 представлять различные иерархии в Викиданных, 00:57:37.650 --> 00:57:41.741 но, возможно, имеет смысл подумать 00:57:41.741 --> 00:57:45.022 о наложениях данных. 00:57:45.431 --> 00:57:48.371 Делать сопоставления на уровне содержания. 00:57:49.091 --> 00:57:54.021 Например, ZBW опубликовала экономический тезаурус. 00:57:55.420 --> 00:57:59.150 У этого тезауруса своя собственная иерархия, 00:57:59.680 --> 00:58:05.181 и, конечно же, можно было бы ввести иерархию этого тезауруса 00:58:05.181 --> 00:58:08.452 в концепцию Викиданных 00:58:08.452 --> 00:58:11.541 без фактического хранения такого рода структуры 00:58:12.180 --> 00:58:14.840 в качестве альтернативной в Викиданных, 00:58:14.840 --> 00:58:18.640 что создало бы путаницу. 00:58:18.640 --> 00:58:24.789 Но я думаю, мы должны думать о Викиданных как о совокупности концепций, 00:58:24.789 --> 00:58:29.651 которые могут подключаться к уровням, находящимся вовне, 00:58:30.264 --> 00:58:33.489 которые дают другой взгляд на мир 00:58:33.489 --> 00:58:39.080 и которые необязательно должны быть в Викиданных. 00:58:45.775 --> 00:58:48.203 (ассистент) Хорошо. Ещё вопросы? 00:58:49.096 --> 00:58:51.527 Хорошо. 00:58:54.769 --> 00:58:57.781 (голос из зала 4) Йохим, я хотел уточнить последний пункт. 00:58:57.781 --> 00:59:01.064 Эти уровни, как вы их представляете, 00:59:02.196 --> 00:59:04.143 будут поддерживаться извне 00:59:04.143 --> 00:59:07.404 и каким-то образом интегрироваться 00:59:08.964 --> 00:59:11.764 в Викиданные с их стороны, 00:59:11.764 --> 00:59:17.143 или вы уже задумывались над тем, 00:59:17.143 --> 00:59:19.463 как этим можно было бы управлять? 00:59:22.351 --> 00:59:24.931 Вообще-то, нет... 00:59:25.271 --> 00:59:30.361 Я экспериментировал с ZBW и Викиданными. 00:59:30.771 --> 00:59:33.132 Я был [неразборчиво] в Викиданных. 00:59:33.132 --> 00:59:38.837 Но я думаю, что это совершенно новая, сложная вещь, 00:59:39.591 --> 00:59:46.170 и поэтому это открыто для обсуждения, будет ли у нас достаточно контроля, 00:59:46.409 --> 00:59:47.908 чтобы делать такие вещи. 00:59:47.908 --> 00:59:50.178 Но это нужно выяснить. 00:59:56.638 --> 00:59:57.959 Ещё один вопрос? 00:59:57.959 --> 00:59:59.686 (голос из зала 5) Отлично. 00:59:59.686 --> 01:00:02.628 Я хотел узнать о проекте какапо. 01:00:03.875 --> 01:00:05.000 Хм. 01:00:05.000 --> 01:00:09.455 (голос из зала 5) Получали ли вы какое-нибудь предупреждение 01:00:09.455 --> 01:00:11.525 от сообщества Викиданных о том, 01:00:11.525 --> 01:00:14.636 что вы внесли каждую особь? 01:00:15.576 --> 01:00:16.836 Пока нет. 01:00:16.836 --> 01:00:19.045 (голос из зала 5) Кто-нибудь слышал об этом раньше? 01:00:19.045 --> 01:00:22.445 «Пока нет», потому что никто ещё об этом не слышал? 01:00:23.085 --> 01:00:26.095 Довольно долгое время шла небольшая дискуссия. 01:00:26.095 --> 01:00:29.235 Те люди, которые интересуются подобными вещами в Викиданных, 01:00:29.235 --> 01:00:32.215 и мы все, похоже, думаем, что это естественное продолжение 01:00:32.215 --> 01:00:34.185 предоставления отдельного элемента Викиданных 01:00:34.185 --> 01:00:35.855 для знаменитой скаковой лошади 01:00:35.855 --> 01:00:39.755 или чьего-то кота, это хорошо смоделировано. 01:00:39.764 --> 01:00:44.444 Наверное, мы проявили дерзость, поместив туда целый вид. 01:00:44.444 --> 01:00:48.113 Но я думаю, управлять этим легко. 01:00:48.113 --> 01:00:50.853 Если не пробовать на кошках и собаках. 01:00:50.853 --> 01:00:52.457 (смех) 01:00:52.457 --> 01:00:54.617 (ассистент) Хорошо. Думаю, время подходит к концу. 01:00:54.617 --> 01:00:55.767 Большое спасибо, что пришли. 01:00:55.767 --> 01:00:59.267 Я думаю, докладчики ответят на ваши вопросы во время перерыва. 01:00:59.267 --> 01:01:00.797 Желаю вам хорошо провести время. 01:01:00.797 --> 01:01:02.292 Большое вам спасибо. 01:01:02.292 --> 01:01:04.047 (аплодисменты) 01:01:06.312 --> 01:01:11.512 WikidataCon 2019 Викиданные и языки