Return to Video

cdn.media.ccc.de/.../wikidatacon2019-3-eng-Glimpse_over_Wikidata_hd.mp4

  • 0:00 - 0:03
    НЕМНОГО О ВИКИДАННЫХ
  • 0:03 - 0:06
    Докладчик -- Лидия Пинчер.
  • 0:06 - 0:08
    (Лидия Пинчер) Привет всем.
  • 0:08 - 0:12
    Просто замечательно,
    что вы здесь собрались и вас так много!
  • 0:12 - 0:13
    Это действительно здорово.
  • 0:14 - 0:20
    Леа уже многое рассказала об этом событии.
  • 0:20 - 0:23
    Я же расскажу немного
    о Викиданных как таковых,
  • 0:23 - 0:26
    что происходило с ними в прошлом году
  • 0:26 - 0:28
    и куда мы двигаемся.
  • 0:29 - 0:33
    Итак... Что это? Простите.
  • 0:40 - 0:44
    Где мы сейчас?
    Куда мы двигаемся?
  • 0:45 - 0:50
    В прошлом году было
    немало поводов для празднования,
  • 0:50 - 0:52
    и некоторые из них
    хотелось бы особо отметить,
  • 0:52 - 0:55
    чтобы они не остались незамеченными,
    как это иногда бывает.
  • 0:57 - 1:02
    Во-первых, хотелось бы
    привести небольшую статистику
  • 1:02 - 1:05
    по редакторам, по нашему контенту
  • 1:05 - 1:07
    и о том, как используются наши данные.
  • 1:10 - 1:15
    В прошлом году выросло
    число участников нашего сообщества,
  • 1:15 - 1:17
    и это потрясающе.
  • 1:17 - 1:21
    Около 3 000 новичков
  • 1:21 - 1:26
    занимаются редактированием
    один раз или чаще в течение месяца.
  • 1:26 - 1:30
    Стало быть, 3 000 новых викизнаек. Ура!
  • 1:32 - 1:35
    Если посмотреть на тех,
    кто редактирует чаще --
  • 1:35 - 1:37
    около пяти раз в течение месяца --
  • 1:37 - 1:41
    то прирост составляет
    примерно 1 200 человек.
  • 1:41 - 1:44
    Если посмотреть на тех,
    кто редактирует 100 раз и чаще --
  • 1:44 - 1:47
    надеюсь, это многие из присутствующих --
  • 1:47 - 1:49
    то у нас появилось 300 человек.
  • 1:49 - 1:51
    Поднимите руку,
    если вы из последней группы.
  • 1:53 - 1:56
    Ух ты! Вы молодцы!
  • 1:58 - 2:05
    И хотя количество правок -- это не то,
  • 2:05 - 2:09
    чему мы обычно уделяем много внимания,
  • 2:09 - 2:13
    в этом году мы пересекли-таки
    отметку в 1 миллиард правок.
  • 2:13 - 2:17
    (аплодисменты)
  • 2:21 - 2:23
    Хорошо, давайте взглянем на контент.
  • 2:28 - 2:31
    Сейчас у нас около 65 миллионов элементов,
  • 2:31 - 2:34
    то есть сущностей для описания мира,
  • 2:34 - 2:41
    и мы делаем его при помощи 6 700 свойств.
  • 2:44 - 2:48
    Из них около 4 300 являются
    внешними идентификаторами,
  • 2:48 - 2:51
    что позволяет ссылаться
  • 2:51 - 2:56
    на огромное количество каталогов,
    баз данных, сайтов и многого другого,
  • 2:56 - 2:59
    благодаря чему Викиданные занимают
    центральное место
  • 2:59 - 3:02
    в связанных открытых данных сети.
  • 3:02 - 3:07
    Благодаря этим свойствам и элементам
  • 3:07 - 3:12
    нами получено
    около 800 миллионов утверждений:
  • 3:12 - 3:16
    в сравнении с предыдущим годом
    на каждый элемент у нас приходится
  • 3:16 - 3:18
    на пол-утверждения больше.
  • 3:19 - 3:20
    (смех)
  • 3:23 - 3:25
    Викиданные становятся умнее.
  • 3:27 - 3:29
    Но у нас есть
    не только элементы и свойства,
  • 3:29 - 3:34
    в нашем арсенале появились лексемы --
  • 3:34 - 3:38
    сейчас у нас насчитывается
    около 204 000 лексем,
  • 3:38 - 3:42
    описывающих слова на самых разных языках.
  • 3:42 - 3:43
    Это очень круто.
  • 3:43 - 3:48
    Я расскажу об этом подробнее
    во время сегодняшнего заседания.
  • 3:49 - 3:53
    Последним добавлением
    стали таблицы локализации,
  • 3:53 - 3:55
    при помощи которых мы можем просчитать,
  • 3:55 - 3:59
    как последовательно моделировать данные
  • 3:59 - 4:01
    в заданной области.
  • 4:02 - 4:05
    Сейчас у нас около 140 таких таблиц.
  • 4:07 - 4:12
    Цифры не всё могут рассказать
    о контенте, объёме контента --
  • 4:12 - 4:15
    мы также заботимся и о его качестве.
  • 4:16 - 4:22
    И мы уже завершили тренировку
    системы машинного обучения
  • 4:22 - 4:25
    для качественной оценки каждого элемента.
  • 4:26 - 4:30
    Она всё ещё далека от совершенства,
    но позволяет получить о нём представление.
  • 4:30 - 4:35
    Каждому элементу Викиданных
    присваивается оценка от одного до пяти.
  • 4:35 - 4:38
    Один -- это довольно ужасно;
    пять -- замечательно.
  • 4:39 - 4:42
    Она анализирует количество утверждений,
  • 4:42 - 4:44
    внешних идентификаторов,
  • 4:44 - 4:46
    ссылок,
  • 4:46 - 4:49
    различных меток в разных языках
  • 4:49 - 4:51
    и так далее.
  • 4:51 - 4:55
    Мы проанализировали Викиданные в динамике,
  • 4:55 - 5:00
    и, как видите, судя по показателям,
  • 5:00 - 5:04
    будучи изначально ужасной,
    наша оценка значительно улучшилась.
  • 5:04 - 5:05
    (смех)
  • 5:06 - 5:07
    Это хорошо.
  • 5:08 - 5:13
    Но вы также можете видите,
    что до пятёрки ещё очень далеко.
  • 5:14 - 5:16
    Не думаю,
  • 5:16 - 5:20
    что мы до неё доберёмся, верно?
  • 5:20 - 5:23
    Не всякий элемент идеален,
  • 5:23 - 5:26
    судя по полученным нами показателям.
  • 5:26 - 5:28
    Но я так рада видеть,
  • 5:28 - 5:32
    что постепенно качество наших данных
    становится всё лучше и лучше.
  • 5:37 - 5:43
    Но создания данных явно недостаточно.
  • 5:44 - 5:47
    Мы делаем это не просто так.
  • 5:47 - 5:49
    Мы хотим, чтобы их использовали.
  • 5:49 - 5:53
    Мы установили,
  • 5:53 - 5:58
    сколько статей
    во всех других проектах Викимедии
  • 5:58 - 6:01
    используют данные Викиданных.
  • 6:02 - 6:07
    и подсчитали их процентное соотношение
    ко всем статьям тех проектов.
  • 6:07 - 6:10
    Если вы проанализируете всю Викимедию
  • 6:10 - 6:12
    и находящиеся в ней статьи,
  • 6:12 - 6:17
    то увидите, что сегодня 56,35% из них
    сегодня используют
  • 6:17 - 6:20
    данные Викиданных,
  • 6:20 - 6:22
    что, я думаю, довольно неплохо,
  • 6:22 - 6:28
    но, конечно же, это далеко не 100%.
  • 6:29 - 6:31
    Затем я проанализировала,
  • 6:31 - 6:36
    какие проекты наиболее активно
    используют Викиданные,
  • 6:36 - 6:39
    и я распределила их
    по языковым версиям и так далее.
  • 6:40 - 6:45
    Как вы думаете, пять топ-проектов --
  • 6:46 - 6:48
    что они собой представляют?
  • 6:48 - 6:51
    К какому родственному проекту принадлежат?
  • 6:51 - 6:53
    (несколько голосов в зале)
    Викисклад.
  • 6:53 - 6:57
    Хорошо, почти единодушно -- Викисклад.
  • 6:57 - 6:59
    В действительности вы ошибаетесь.
  • 6:59 - 7:02
    Все пять проектов -- это Викигид.
  • 7:02 - 7:04
    (в зале)
    Ах!
  • 7:04 - 7:05
    (смех)
  • 7:05 - 7:08
    Поаплодируем Викигиду.
  • 7:09 - 7:13
    (аплодисменты)
  • 7:17 - 7:19
    Если захотите проверить,
  • 7:19 - 7:22
    где на самом деле находится Викисклад
    и остальные ваши проекты,
  • 7:22 - 7:24
    есть информационная панель.
  • 7:24 - 7:25
    Подойдите ко мне, и мы вместе проверим.
  • 7:28 - 7:32
    Конечно же, наши данные используются
    не только внутри Викимедиа.
  • 7:32 - 7:35
    Они довольно часто используются
    и за её пределами.
  • 7:35 - 7:40
    Всех проектов не перечислить,
    но я упомяну некоторые:
  • 7:40 - 7:44
    наши данные приносят огромную пользу
    Метрополитен-музею, фонду Wellcome Trust,
  • 7:44 - 7:46
    Библиотеке Конгресса,
  • 7:46 - 7:48
    Gene Wiki и многим другим.
  • 7:48 - 7:51
    Если вы будете участвовать
    в заседаниях в рамках программы,
  • 7:51 - 7:53
    вы услышите о некоторых из них.
  • 7:57 - 8:00
    Хорошо, хватит статистики.
  • 8:00 - 8:02
    Давайте рассмотрим
    другие интересные моменты.
  • 8:03 - 8:07
    Мы уже говорили
    об улучшении качества данных.
  • 8:07 - 8:11
    Если взглянуть на качество данных,
    то вы увидите,
  • 8:11 - 8:13
    что его можно проанализировать
    по самым разным показателям;
  • 8:13 - 8:16
    мы улучшили некоторые из них,
  • 8:16 - 8:19
    такие как точность данных,
  • 8:19 - 8:21
    достоверность данных,
  • 8:21 - 8:23
    частота упоминаний,
  • 8:23 - 8:25
    последовательность моделирования,
  • 8:26 - 8:29
    степень полноты и так далее.
  • 8:31 - 8:36
    Взять, к примеру, такой параметр
    как последовательность моделирования:
  • 8:36 - 8:40
    мы сделали возможным
  • 8:40 - 8:42
    хранение таблиц локализации в Викиданных,
  • 8:42 - 8:47
    чтобы вы могли описывать,
    как моделировать те или иные домены.
  • 8:47 - 8:50
    Вы можете обнаружить...
  • 8:50 - 8:54
    Вы можете создать таблицу локализации,
    скажем, для голландских художников,
  • 8:54 - 8:56
    а затем проанализировать, как...
  • 8:56 - 9:00
    Какие элементы
    для голландских художников отсутствуют:
  • 9:00 - 9:02
    например, дата рождения,
    а она должна быть,
  • 9:02 - 9:05
    и всё в таком духе.
  • 9:06 - 9:10
    И, я надеюсь,
    гораздо больше вики-проектов
  • 9:10 - 9:12
    будут использовать таблицы локализации,
  • 9:12 - 9:14
    чтобы обеспечить
    надлежащую заботу о данных.
  • 9:14 - 9:16
    Если хотите научиться, как это делать,
  • 9:16 - 9:19
    позже в рамках программы
    заседание будут вести люди
  • 9:19 - 9:21
    которые всё об этом знают
  • 9:21 - 9:25
    и смогут дать вам
    большее об этом представление.
  • 9:28 - 9:29
    Хорошо.
  • 9:31 - 9:36
    В прошлом году мы серьёзно продвинулись
  • 9:36 - 9:38
    в вопросе среды поддержки Викибазы.
  • 9:38 - 9:42
    Суть в том, что не все открытые данные
  • 9:42 - 9:45
    необходимо относить к Викиданным:
  • 9:45 - 9:47
    вместо этого нам нужна
    эффективная опорная инфраструктура
  • 9:47 - 9:51
    для различных мест и структур,
  • 9:51 - 9:55
    таких как организации, компании,
    волонтёрские проекты,
  • 9:55 - 9:58
    которые откроют доступ к своим данным
    тем же образом, что и Викиданные,
  • 9:58 - 10:00
    объединятся в одну сеть
  • 10:00 - 10:03
    и будут обмениваться данными,
    связывая их между собой.
  • 10:04 - 10:09
    За прошедший год интерес к этому,
  • 10:09 - 10:11
    как и интерес к организациям и людям,
  • 10:11 - 10:15
    занимающимся схожими
    с Викибазой проектами, только возрос,
  • 10:15 - 10:20
    особенно к разделу библиотек.
  • 10:23 - 10:26
    Многое ещё предстоит
    протестировать и подсчитать,
  • 10:26 - 10:29
    и, если уж начистоту,
    многое сделать впервые:
  • 10:29 - 10:35
    сейчас предприимчивые организации
    сотрудничают с нами,
  • 10:35 - 10:39
    чтобы понять, как Викибаза
    может помочь в организации
  • 10:39 - 10:42
    их коллекций, каталогов и так далее.
  • 10:43 - 10:45
    Среди них:
    Немецкая национальная библиотека,
  • 10:45 - 10:46
    Национальная библиотека Франции,
  • 10:46 - 10:50
    OCLC -- и это впечатляет.
  • 10:55 - 10:57
    По-моему, одна из причин
    такого воодушевления --
  • 10:57 - 11:03
    это то, что мы помогаем организациям
    передать данные в открытый доступ,
  • 11:03 - 11:08
    мы не только выкладываем их на сайте,
    чтобы кто-то получил к ним доступ,
  • 11:08 - 11:12
    а ещё и думаем о том,
    каким будет наш следующий шаг.
  • 11:12 - 11:16
    Мы хотим позволить им вести базу данных,
    наращивать, дополнять её --
  • 11:16 - 11:20
    это действительно сдвиг,
  • 11:20 - 11:25
    который, я надеюсь,
    приведёт к чему-нибудь хорошему.
  • 11:26 - 11:28
    Ещё нам помогает то,
  • 11:28 - 11:32
    что у специалистов появляется
    возможность курировать данные,
  • 11:32 - 11:33
    не покидая свои места,
  • 11:33 - 11:37
    поддерживать их в надлежащем состоянии
  • 11:37 - 11:42
    для синхронизации процессов
    с Викиданными, например,
  • 11:42 - 11:46
    а нам больше не нужно
    постоянно заниматься этим вопросом.
  • 11:46 - 11:50
    Я надеюсь, в конце концов,
    это снимет часть нагрузки
  • 11:50 - 11:54
    с Викиданных как с ресурса,
    на котором всё происходит.
  • 11:58 - 12:00
    Лексикографические данные.
  • 12:02 - 12:07
    В прошлом году
    люди начали описывать слова
  • 12:07 - 12:09
    в Викиданных на своих языках,
  • 12:09 - 12:12
    чтобы мы смогли создать
  • 12:12 - 12:15
    инструменты автоматизированного перевода.
  • 12:16 - 12:21
    И на данный момент для некоторых языков
  • 12:21 - 12:25
    мы подбираемся всё ближе
    и ближе к такому объёму данных,
  • 12:25 - 12:29
    достигнув которого, вплотную займёмся
    созданием серьёзного приложения.
  • 12:30 - 12:33
    Для ряда языков
    это дело далёкого будущего,
  • 12:33 - 12:35
    но для некоторых мы уже начали
    разработку приложения,
  • 12:35 - 12:37
    и это очень здорово.
  • 12:38 - 12:40
    Если хотите больше об этом узнать,
  • 12:40 - 12:42
    приходите сегодня
    на заседание с моим участием.
  • 12:46 - 12:49
    И, конечно, не забывайте
  • 12:49 - 12:51
    о структурированных данных на Викискладе.
  • 12:51 - 12:52
    (свист в зале)
  • 12:52 - 12:54
    Да.
    (смеётся)
  • 12:54 - 12:56
    (аплодисменты)
  • 12:59 - 13:05
    Структурированные данные Викисклада,
    будучи его основой, помогли...
  • 13:07 - 13:11
    Помогли всё объединить
    и в прошлом году сделали возможным
  • 13:11 - 13:15
    добавление утверждений
    к файлам на Викискладе,
  • 13:15 - 13:19
    при этом люди начали добавлять
    утверждения к изображениям,
  • 13:19 - 13:23
    чтобы их было легче найти,
    а, значит, и сделать приложения лучше
  • 13:23 - 13:24
    и даже больше.
  • 13:24 - 13:27
    Это так захватывающе --
    видеть, как всё разрастается,
  • 13:27 - 13:30
    и, я думаю, важно,
  • 13:30 - 13:33
    чтобы сообщество Викиданных понимало:
  • 13:33 - 13:37
    когда видишь «изображённый объект»,
  • 13:37 - 13:42
    «домашний кот», «сидение»,
    «ящерица» и «стена» --
  • 13:42 - 13:45
    это всё ссылки
    на элементы и свойства Викиданных.
  • 13:45 - 13:50
    То есть когда мы создаём
    элементы и свойства,
  • 13:50 - 13:54
    мы не просто пополняем
    словарный запас Викиданных.
  • 13:54 - 13:58
    Также пополняется
    и словарный запас Викисклада.
  • 13:58 - 14:01
    И так будет происходить чаще и чаще:
  • 14:01 - 14:03
    придётся больше чем раньше
    уделять внимания вопросу,
  • 14:03 - 14:07
    как наши онтология и словарный запас
  • 14:07 - 14:10
    используются в других местах.
  • 14:13 - 14:17
    И последнее, о чём надо рассказать,
  • 14:17 - 14:20
    это о налаживании более тесных связей
  • 14:20 - 14:22
    с другими проектами Викимедиа.
  • 14:23 - 14:26
    Мы с командой работаем над проектом
    под названием «Wikidata Bridge»,
  • 14:26 - 14:29
    вам стоит подойти к стенду UX
  • 14:29 - 14:33
    и потестировать текущую версию:
  • 14:33 - 14:36
    например, в ней редакторы Википедии
  • 14:36 - 14:39
    смогут редактировать Викиданные
    непосредственно в своих проектах,
  • 14:39 - 14:41
    без необходимости заходить на Викиданные
  • 14:41 - 14:44
    и разбираться, как здесь всё устроено.
  • 14:44 - 14:49
    Я надеюсь, исчезнет ещё одна преграда,
  • 14:49 - 14:53
    мешавшая проектам Викимедиа использовать
  • 14:53 - 14:54
    больший объём данных с Викиданных.
  • 14:57 - 15:01
    Хорошо, теперь о стратегиях.
    Куда мы движемся?
  • 15:03 - 15:07
    С декабря команда Викиданных
    в Wikimedia Deutschland
  • 15:07 - 15:12
    и представители Фонда Викимедиа
    разрабатывали стратегии
  • 15:12 - 15:15
    и документы для Викиданных.
  • 15:15 - 15:16
    В них фактически изложено всё то,
  • 15:16 - 15:20
    о чём многие из нас говорили
  • 15:20 - 15:23
    на протяжении последних
    четырёх или пяти лет.
  • 15:24 - 15:29
    Не знаю, все ли из вас читали
    эти документы.
  • 15:29 - 15:34
    До конца месяца они появятся
    на служебном сайте Викисклада.
  • 15:34 - 15:36
    Хорошо бы, если вы их не читали,
  • 15:36 - 15:39
    прочитать их и оставить
    там комментарии и всё в таком духе.
  • 15:40 - 15:44
    Теперь беглый обзор:
  • 15:44 - 15:51
    в них изложено в трёх частях то,
    что мы думаем о Викиданных и Викибазе .
  • 15:52 - 15:55
    В первом речь идёт
    о Викиданных как о платформе.
  • 15:55 - 15:57
    Его можно увидеть в нижнем углу --
  • 15:57 - 16:01
    он о том,
  • 16:01 - 16:04
    что Викиданные позволяют всем и каждому
  • 16:04 - 16:06
    получить доступ к информации
    и делиться ей
  • 16:06 - 16:09
    вне зависимости от их языка и техники.
  • 16:09 - 16:14
    Для этого мы предоставляем
    данные общего назначения о мире.
  • 16:14 - 16:18
    То есть то, что вы делаете каждый день.
  • 16:21 - 16:25
    Вторая часть посвящена
    среде поддержки Викибазы,
  • 16:25 - 16:31
    где программное обеспечение Викибазы
    позволяет функционировать Викиданным
  • 16:31 - 16:34
    и распространять открытые данные в сети --
  • 16:34 - 16:37
    это опорная сеть для свободного
    и открытого распространения знаний.
  • 16:38 - 16:40
    И последняя, третья, часть рассказывает
  • 16:40 - 16:44
    о роли Викиданных
    в главных проектах Викимедиа,
  • 16:44 - 16:47
    где Викиданные помогают
  • 16:47 - 16:50
    проектам Викимедиа,
  • 16:51 - 16:54
    что они могли работать и в будущем.
  • 16:58 - 17:03
    К чему это приведёт
    в ближайшем или среднесрочном будущем?
  • 17:04 - 17:06
    Викиданные как платформа.
  • 17:07 - 17:09
    Нам нужно повысить качество данных,
  • 17:09 - 17:12
    так что мы продолжим разрабатывать
    более эффективные инструменты,
  • 17:12 - 17:14
    улучшать уже существующие и так далее.
  • 17:15 - 17:19
    Необходимо сделать
    наши данные более доступными,
  • 17:19 - 17:24
    улучшив интерфейс API и обеспечив
    более надёжную точку доступа SPARQL,
  • 17:24 - 17:27
    а также сделать моделирование данных
    более последовательным,
  • 17:27 - 17:31
    чтобы их было легко
    многократно использовать в приложениях.
  • 17:32 - 17:34
    И остаётся только сказать
  • 17:36 - 17:39
    о налаживании получения отзывов
    от наших партнёров.
  • 17:40 - 17:44
    В отличие от Википедии,
    Викиданные не являются тем,
  • 17:44 - 17:46
    что можно назвать
    «проект с конечным результатом», верно?
  • 17:46 - 17:49
    Люди заходят на Википедию и читают её,
  • 17:49 - 17:51
    тогда как с Викиданными всё не так:
  • 17:51 - 17:53
    на них не заходят и не читают.
  • 17:53 - 17:54
    Было бы замечательно,
  • 17:54 - 17:58
    но в реальности это не так, верно?
  • 17:58 - 18:01
    Многие пользователи наших данных
  • 18:01 - 18:03
    не заходят на Викиданные как таковые,
  • 18:03 - 18:07
    они просматривают их на Википедии
    и многих других ресурсах.
  • 18:08 - 18:12
    Но все эти ресурсы получают
    отзывы о данных, верно?
  • 18:12 - 18:15
    Их пользователи говорят им:
    «Эй, здесь что-то не так».
  • 18:17 - 18:21
    И мне бы хотелось того же --
    чтобы мы предоставляли отзывы тем,
  • 18:21 - 18:24
    кто на самом деле редактирует
    Викиданные, то есть вам.
  • 18:25 - 18:27
    Понять, как это сделать
    наиболее эффективно,
  • 18:27 - 18:29
    никого не перегружая --
  • 18:30 - 18:33
    это будет одна из наших задач
    в следующем году.
  • 18:35 - 18:37
    Среда поддержки Викибазы.
  • 18:37 - 18:41
    Мы продолжим работать с библиотеками,
  • 18:41 - 18:46
    но займёмся ещё и наукой
    и не только этим.
  • 18:46 - 18:50
    Сегодня состоится презентация Викибазы --
  • 18:50 - 18:53
    обязательно её посетите,
    чтобы увидеть, что уже в ней есть
  • 18:53 - 18:56
    и что люди уже делают с Викибазой.
  • 18:56 - 18:57
    Это того стоит.
  • 18:59 - 19:01
    Что нам нужно,
  • 19:01 - 19:04
    так это отладка процессов.
  • 19:04 - 19:08
    Нужно помочь людям понять,
    с кем и о чём говорить,
  • 19:08 - 19:10
    где им могут оказать помощь,
  • 19:10 - 19:12
    и всё в таком роде.
  • 19:13 - 19:18
    И, конечно, нужно облегчить установку
    и обеспечение функционирования Викибазы,
  • 19:18 - 19:20
    потому что у нас есть с этим проблемы.
  • 19:21 - 19:23
    И последнее, чего надо коснуться, --
    это федерация,
  • 19:23 - 19:27
    я уже говорила об этом,
    рассказывая о Викискладе:
  • 19:27 - 19:31
    когда Викисклад использует
    элементы и свойства Викиданных,
  • 19:31 - 19:34
    но уже применительно
    к экземплярам Викибазы,
  • 19:34 - 19:36
    чтобы они тоже могли использовать
    словарный запас Викиданных.
  • 19:38 - 19:41
    Как я говорила раньше,
  • 19:41 - 19:45
    это в очередной раз заставляет
    нас проявлять бдительность
  • 19:45 - 19:48
    в отношении внешнего использования
    нашего словарного запаса --
  • 19:48 - 19:51
    более, чем когда-либо ранее.
  • 19:54 - 19:57
    Викиданные для проектов Викимедиа --
  • 19:57 - 20:01
    нам нужна более тесная интеграция
    при помощи Wikidata Bridge,
  • 20:01 - 20:04
    и непосредственное редактирование
    прямо в других проектах,
  • 20:04 - 20:09
    и то, о чём, как мне кажется,
    нам надо всем вместе подумать --
  • 20:09 - 20:15
    как преодолеть языковой барьер.
  • 20:15 - 20:19
    Чем теснее Викиданные
    интегрируются в проекты Викимедиа,
  • 20:19 - 20:22
    тем большему количеству людей
    необходимо поговорить друг с другом
  • 20:22 - 20:26
    об этих данных на разных языках,
  • 20:26 - 20:29
    и нам надо обдумать,
  • 20:30 - 20:32
    как с этим быть.
  • 20:33 - 20:37
    Если у кого-то появятся хорошие идеи,
    я была бы рада обсудить их с вами.
  • 20:39 - 20:42
    На этом моя речь подходит к концу.
  • 20:42 - 20:44
    Спасибо всем, что даёте
    все большему количеству людей доступ
  • 20:44 - 20:46
    к ещё большему количеству знаний --
    каждый день.
  • 20:47 - 20:49
    (аплодисменты)
  • 20:58 - 21:00
    У нас осталось время для вопросов,
  • 21:00 - 21:01
    так что если они есть у присутствующих,
  • 21:01 - 21:05
    или если вы смотрите трансляцию
    в прямом эфире -- «Мама, привет!» --
  • 21:05 - 21:08
    вы можете задать вопрос в EtherPad
  • 21:08 - 21:11
    или на канале Telegram,
    и мы сделаем всё возможное.
  • 21:11 - 21:13
    Итак, есть вопросы?
  • 21:16 - 21:17
    Тут.
  • 21:21 - 21:25
    (голос из зала 1) Всем привет.
    Это больше мем, чем вопрос.
  • 21:25 - 21:32
    Когда в расширении времени можно будет
  • 21:32 - 21:35
    устанавливать часы, минуты, секунды,
  • 21:35 - 21:38
    так как сейчас
    можно выставить только дату.
  • 21:38 - 21:41
    - Я знаю... Это не мой вопрос...
    - (смеётся)
  • 21:41 - 21:44
    Вот почему я сказал, что это мем.
  • 21:44 - 21:46
    Всякий раз одно и то же,
  • 21:46 - 21:49
    но начинают всегда издалека, так что...
  • 21:50 - 21:53
    У меня нет чёткого ответа на этот вопрос.
  • 21:53 - 21:54
    Простите.
  • 21:56 - 21:58
    Но в качестве справки:
  • 21:58 - 22:01
    люди ещё сильнее нуждаются в этом
  • 22:01 - 22:04
    для описания изображений на Викискладе,
  • 22:04 - 22:08
    поэтому, возможно,
    этот вопрос переместится вверх списка дел,
  • 22:08 - 22:12
    которые надо выполнить чуточку быстрее.
  • 22:15 - 22:16
    Ещё вопросы?
  • 22:25 - 22:28
    (голос из зала 2) Линда,
    исследовательская группа Фонда Викимедиа.
  • 22:28 - 22:33
    Хотелось бы узнать ваше мнение
    о патрулировании,
  • 22:33 - 22:38
    ведь это имеет отношение
    к качеству контента Викиданных,
  • 22:38 - 22:39
    вы не могли бы рассказать,
  • 22:39 - 22:43
    как изменится патрулирование
    в среднесрочной перспективе,
  • 22:43 - 22:46
    особенно после проекта Bridge?
  • 22:46 - 22:48
    Я с нетерпением жду его реализации
    и мечтаю попробовать.
  • 22:48 - 22:49
    Да, спасибо.
  • 22:52 - 22:57
    Как вы сказали,
    после таких проектов, как Bridge,
  • 22:59 - 23:03
    для патрулирования придётся
    приложить значительно больше усилий.
  • 23:04 - 23:09
    Но мы достигли такого объёма данных,
    когда это будет практически неосуществимо
  • 23:09 - 23:11
    вручную, одними только людьми.
  • 23:11 - 23:15
    Нам придётся потрудиться,
    чтобы сделать его лучше --
  • 23:15 - 23:19
    например, нам в этом поможет
    ORES, система машинного обучения,
  • 23:19 - 23:21
    она поможет нам понять,
  • 23:21 - 23:25
    какие правки человеку
    действительно нужно проверить,
  • 23:25 - 23:26
    а какие, скорее всего, из серии:
  • 23:26 - 23:30
    «Ладно, всё как обычно,
    мне не надо это проверять».
  • 23:34 - 23:39
    На данный момент
    ORES не слишком хороша в оценке того,
  • 23:39 - 23:41
    хорошая или плохая правка
    появилась в Викиданных.
  • 23:42 - 23:45
    Сейчас продолжается кампания
  • 23:45 - 23:51
    по обучению системы машинного обучения,
  • 23:51 - 23:52
    чтобы с вашей помощью
  • 23:53 - 23:56
    научить её, по сути, какая правка хорошая,
  • 23:56 - 23:57
    а какая плохая.
  • 23:57 - 24:03
    Пока что не достигнут пороговый уровень
    достаточного для обучения числа людей,
  • 24:03 - 24:06
    чтобы действительно улучшить её,
  • 24:06 - 24:08
    но если у вас есть несколько минут,
  • 24:08 - 24:11
    было бы замечательно,
    если бы вы помогли обучить ORES
  • 24:11 - 24:14
    делать более правильные суждения
    о правках Викиданных.
  • 24:14 - 24:16
    Это на самом деле просто --
    она показывает правку,
  • 24:16 - 24:18
    а вы говорите, что это хорошая правка,
  • 24:18 - 24:20
    а вот эта плохая -- и всё.
  • 24:20 - 24:24
    Вы можете это делать вечером
    на диване перед телевизором.
  • 24:26 - 24:27
    (голос из зала 3) Дайте ссылку.
  • 24:28 - 24:31
    Да, мы дадим ссылку в группе Telegram.
  • 24:32 - 24:36
    Достигнув заданного порогового уровня --
  • 24:36 - 24:40
    а это около 7 000,
    но я могу и ошибаться --
  • 24:40 - 24:44
    мы сможем заново запустить процесс
    обучения для ORES,
  • 24:44 - 24:47
    и тогда она станет, надеюсь,
    значительно лучше делать суждения
  • 24:47 - 24:49
    о правках Викиданных.
  • 24:50 - 24:52
    Надеюсь, тогда многие из вас
    смогут её использовать
  • 24:52 - 24:56
    для фильтрации свежих правок
    или проверки списка наблюдения
  • 24:56 - 24:58
    на предмет правок,
    которым требуется внимание.
  • 24:59 - 25:00
    Да!
  • 25:02 - 25:04
    - (голос из зала 4) Привет!
    - Привет.
  • 25:05 - 25:07
    Микрофон!
  • 25:07 - 25:10
    (голос из зала 4)
    Мне хотелось узнать, и это не мой вопрос,
  • 25:10 - 25:13
    а партнёров, с которыми я работаю:
  • 25:13 - 25:16
    чем больше партнёров
    присоединится к Викиданным
  • 25:16 - 25:20
    и начнёт экспериментировать
    с поисковыми запросами,
  • 25:20 - 25:23
    тем больше проблем у нас появится
    с периодом ожидания их выполнения,
  • 25:23 - 25:26
    так как обстоят с этим дела?
  • 25:28 - 25:32
    Некоторые люди в Фонде Викимедии
    занимаются этим
  • 25:32 - 25:34
    и -- небольшой спойлер --
  • 25:34 - 25:37
    придут на заседание в честь дня рождения,
    где будут подарки дарить.
  • 25:37 - 25:39
    (смех)
  • 25:43 - 25:46
    (голос из зала 5) Здравствуйте,
    я Барт Магнус из Бельгии (PACKED).
  • 25:46 - 25:50
    Хотелось бы знать,
    что сейчас происходит с федерацией
  • 25:50 - 25:52
    и с увеличением числа свойств
  • 25:52 - 25:53
    в вашем экземпляре Викибазы --
  • 25:53 - 25:57
    есть ли что-то, о чём стоит упомянуть?
  • 25:57 - 26:01
    В прошлом году многие нам сказали,
  • 26:01 - 26:04
    что им нужна федерация.
  • 26:04 - 26:07
    Но проблема в том, что многие понимают
  • 26:07 - 26:09
    под «федерацией» совершенно разные вещи.
  • 26:11 - 26:13
    Некоторые из них очень легко выполнить,
  • 26:13 - 26:16
    а некоторые -- очень, очень трудно.
  • 26:17 - 26:21
    Мы с командой беседовали со многими,
  • 26:21 - 26:25
    например,с партнёрами,
    с которыми сотрудничаем в библиотеках,
  • 26:25 - 26:29
    чтобы понять,
    что же им действительно надо.
  • 26:30 - 26:33
    Мы уже закончили обсуждения,
  • 26:33 - 26:35
    но буду счастлива получить больше отзывов,
  • 26:35 - 26:38
    если вы хотите со мной об этом поговорить.
  • 26:38 - 26:41
    а сейчас я нахожусь на этапе,
    когда могу сказать:
  • 26:41 - 26:43
    «Хорошо, мы начинаем».
  • 26:45 - 26:48
    Это произойдет в течение
    следующих двух или трёх месяцев,
  • 26:48 - 26:51
    когда мы напишем первые строки кода,
  • 26:51 - 26:55
    а затем люди смогут его тестировать
  • 26:55 - 26:57
    в начале следующего года.
  • 27:00 - 27:01
    (модератор)
    Хорошо, последние вопросы.
  • 27:02 - 27:06
    (голос из зала 6) Финн Аруп Нильсен
    из Копенгагена, Дания.
  • 27:06 - 27:11
    Что касается других языков,
    в сообществе WikiCite обсуждалось,
  • 27:11 - 27:16
    должны ли мы продолжать
    добавлять научные работы --
  • 27:16 - 27:20
    это связано с тем, сколько данных
    мы можем добавить в Викиданные.
  • 27:20 - 27:22
    Период ожидания
    в Службе запросов Викиданных
  • 27:22 - 27:25
    стал проблемой, а ещё и хранение...
  • 27:25 - 27:31
    Что вы думаете об этом?..
  • 27:31 - 27:36
    Не становится ли объём
    Викиданных проблемой в целом?
  • 27:36 - 27:39
    Стоит ли нам перестать добавлять
    лексикографические данные?
  • 27:39 - 27:43
    Стоит ли нам перестать добавлять данные
    научного характера в Викиданные,
  • 27:43 - 27:46
    или исследование этой проблемы
  • 27:46 - 27:50
    и других технических проблем
    находится в самом разгаре?
  • 27:50 - 27:51
    Да...
  • 27:53 - 27:57
    Викиданные точно движутся в направлении...
  • 27:59 - 28:03
    Границ масштабируемости, скажем так,
  • 28:04 - 28:06
    и в техническом плане, и в плане людей.
  • 28:06 - 28:09
    И в обоих случаях
    нам нужны решения, верно?
  • 28:09 - 28:14
    В плане сообщества у нас появилось
    столько редакторов и свежих правок,
  • 28:14 - 28:18
    что людям стало невозможно патрулировать,
  • 28:18 - 28:20
    потому что правок слишком много.
  • 28:21 - 28:26
    Но в техническом плане
    нам удалось кое-что решить.
  • 28:26 - 28:30
    Например, изменить
    архитектуру базы данных
  • 28:30 - 28:34
    вокруг таблицы WB terms,
    если что-то кому-то это говорит.
  • 28:36 - 28:38
    Но это помогает только пока,
  • 28:38 - 28:41
    и в следующем году
    мы хотим проанализировать,
  • 28:41 - 28:45
    где ещё остались проблемы
  • 28:45 - 28:48
    и как их устранить в техническом плане.
  • 28:49 - 28:51
    Такова общая картина.
  • 28:51 - 28:55
    В то же время я не решаюсь
    кому-то говорить:
  • 28:55 - 28:58
    «Нет, нет, нет, прекратите выкладывать
    данные в Викиданные».
  • 28:58 - 29:02
    Это бы противоречило их цели.
  • 29:04 - 29:07
    Но, например, среда поддержки Викибазы --
  • 29:07 - 29:09
    один из способов с этим справиться,
  • 29:09 - 29:14
    она позволяет не хранить
    все данные на Викиданных.
  • 29:14 - 29:16
    В этом вся прелесть
    связанных открытых данных.
  • 29:16 - 29:18
    Вам не надо хранить всё в одном месте.
  • 29:18 - 29:20
    Можно связывать разные места.
  • 29:20 - 29:21
    И это замечательно.
  • 29:22 - 29:28
    Так что именно в случае WikiCite -- да!
  • 29:29 - 29:32
    Только в случае WikiCite!
  • 29:32 - 29:36
    Думаю, нам надо взглянуть на пропорции.
  • 29:36 - 29:38
    У меня нет точных данных,
  • 29:38 - 29:45
    какой процент всех элементов Викиданных
    имеет отношение к категориям WikiCite,
  • 29:45 - 29:46
    но этот процент очень велик.
  • 29:46 - 29:50
    Наверное, это то,
    о чём нам надо поговорить...
  • 29:50 - 29:52
    Во время перерыва.
  • 29:53 - 29:55
    Огромное всем спасибо.
  • 29:55 - 29:56
    (аплодисменты)
Title:
cdn.media.ccc.de/.../wikidatacon2019-3-eng-Glimpse_over_Wikidata_hd.mp4
Video Language:
English
Duration:
30:07

Russian subtitles

Revisions