< Return to Video

cdn.media.ccc.de/.../wikidatacon2019-3-eng-Glimpse_over_Wikidata_hd.mp4

  • 0:00 - 0:02
    [ウィキデータの概要]
  • 0:02 - 0:06
    [リディア・ピンチャー]
    [ウィキデータの概要]
  • 0:06 - 0:08
    皆さん こんにちは
  • 0:08 - 0:12
    こんなに多くの皆さんに
    ご参加いただいて
  • 0:12 - 0:14
    ありがとうございます
  • 0:15 - 0:20
    このイベントについては
    リーアがお話ししましたので
  • 0:20 - 0:23
    私は ウィキデータそのものについて
  • 0:23 - 0:26
    また 昨年に起きたことと
  • 0:26 - 0:28
    今後についてお話しします
  • 0:29 - 0:33
    さて...
    これは何でしょう 失礼
  • 0:40 - 0:44
    さて 現状と今後の展望は?
  • 0:46 - 0:50
    昨年は 祝うべきことが
    数多くありましたが
  • 0:50 - 0:52
    あまり目立たない場合もあったので
  • 0:52 - 0:55
    いくつかハイライトしたいと思います
  • 0:57 - 1:00
    まずご紹介したいのは
  • 1:00 - 1:04
    編集者に関する統計と
    [編集者]
  • 1:04 - 1:07
    コンテンツと
    データの利用度です
  • 1:10 - 1:15
    昨年の間に
    コミュニティは大きく成長しました
  • 1:15 - 1:17
    これは素晴らしいことです
  • 1:17 - 1:21
    新たに約3,000人が加わり
  • 1:21 - 1:26
    1か月に1回以上の編集を行いました
  • 1:26 - 1:30
    3,000人の新規ウィキデータンです!
  • 1:32 - 1:37
    1か月に5回以上の
    編集を行った人を見ると
  • 1:38 - 1:41
    約1,200人が加わっています
  • 1:41 - 1:44
    100回以上の
    編集を行った人は
  • 1:45 - 1:47
    この部屋に大勢いると思いますが
  • 1:47 - 1:49
    300人以上です
  • 1:49 - 1:52
    最後のグループに該当する人は
    手を挙げてください
  • 1:53 - 1:54
    すごいですね!
  • 1:55 - 1:56
    皆さん素晴らしい
  • 1:58 - 2:05
    いつもなら編集の回数に
    注目することは
  • 2:06 - 2:09
    あまりありませんが
  • 2:09 - 2:13
    今年は なんと
    記念すべき10億回を超えました
  • 2:21 - 2:24
    では コンテンツを見ていきましょう
  • 2:24 - 2:25
    [コンテンツ]
  • 2:28 - 2:31
    現在 6,500万もの項目があります
  • 2:31 - 2:34
    つまり このエンティティで
    世界が表わされていて
  • 2:34 - 2:41
    約6,700のプロパティで
    それが行われているのです
  • 2:44 - 2:48
    そのうち 約4,300が
    外部識別子です
  • 2:49 - 2:53
    それが 他の目録や
    データベースやウェブサイトなどに
  • 2:53 - 2:56
    多数リンクしており
  • 2:56 - 2:58
    このことにより ウィキデータが
  • 2:58 - 3:02
    オープンデータ ウェブにおける
    中心地となっています
  • 3:02 - 3:07
    これらのプロパティや項目を
    使用している文は
  • 3:07 - 3:12
    現在 ウィキデータに約8億あり
  • 3:12 - 3:16
    前年比では 各項目については
  • 3:16 - 3:18
    1.5倍に増加しました
  • 3:19 - 3:20
    (笑)
  • 3:23 - 3:25
    ウィキデータは賢くなったのです
  • 3:27 - 3:29
    項目やプロパティだけではなく
  • 3:30 - 3:34
    語彙素のような新しいものもあり
  • 3:34 - 3:39
    現在 たくさんの異なる言語で
    表されている語彙素が
  • 3:39 - 3:42
    20万4千もあります
  • 3:42 - 3:43
    とても良いことです
  • 3:44 - 3:48
    この詳細は
    後のセッションでご説明します
  • 3:49 - 3:53
    最も新しく追加したのは
    スキーマで
  • 3:53 - 3:56
    これにより 特定分野において
  • 3:56 - 4:01
    データを一貫してモデル化する方法が
    理解しやすくなります
  • 4:02 - 4:04
    これは 現在 約140あります
  • 4:08 - 4:11
    コンテンツについては
    数字が全てではありませんから
  • 4:11 - 4:15
    コンテンツの量だけでなく
    品質にも気を配りましょう
  • 4:16 - 4:22
    現在は 機械学習システムを訓練して
    [平均項目品質]
  • 4:22 - 4:25
    項目の品質を評価しています
  • 4:26 - 4:30
    完璧には まだ程遠いものの
    参考になります
  • 4:30 - 4:35
    ウィキデータの各項目が
    5段階で評価されています
  • 4:35 - 4:38
    1は極めてひどく
    5は優秀ということです
  • 4:38 - 4:42
    これは 例えば
    文の数や
  • 4:42 - 4:44
    外部識別子の数
  • 4:44 - 4:46
    出典の数
  • 4:46 - 4:50
    異なる言語によるラベルの数
    などを示します
  • 4:51 - 4:55
    ウィキデータの推移を見ると
  • 4:55 - 5:00
    ご覧のように
    これらのスコアによれば
  • 5:00 - 5:04
    極めてひどかった評価が
    かなり向上しています
  • 5:04 - 5:05
    (笑)
  • 5:06 - 5:07
    これは良いことです
  • 5:08 - 5:12
    でも 最高の評価までには
    まだたくさんの余地があります
  • 5:14 - 5:20
    これがゴールではありませんね
  • 5:20 - 5:23
    これらの評価によると
  • 5:23 - 5:26
    全ての項目が
    完璧なわけではありません
  • 5:26 - 5:32
    しかし データの品質が恒常的に
    向上していることをうれしく思います
  • 5:37 - 5:43
    しかし データを生み出すだけでは
    十分ではありません
  • 5:44 - 5:47
    私たちには 動機が必要です
    [利用]
  • 5:47 - 5:50
    データを利用してほしいのです
  • 5:51 - 5:55
    そこで ウィキデータのデータを
    使用している
  • 5:55 - 5:58
    ウィキメディアの
    各プロジェクトにある
  • 5:58 - 6:01
    記事の数を確認しました
  • 6:02 - 6:07
    そして これらのプロジェクトにある
    全ての記事の割合を見ました
  • 6:07 - 6:10
    ウィキメディア全体と
  • 6:10 - 6:12
    その記事全体を見ると
  • 6:12 - 6:19
    現在では 56.35%の記事が
    ウィキデータから利用されています
  • 6:20 - 6:22
    非常に良いと思いますが
  • 6:22 - 6:27
    100%の利用度に達するには
    まだ遠い状態です
  • 6:29 - 6:33
    次に どのプロジェクトが
  • 6:33 - 6:36
    ウィキデータのデータを
    最もよく利用しているかを
  • 6:36 - 6:39
    言語別などで 分類してみました
  • 6:40 - 6:45
    全体のうち
    どのプロジェクトが―
  • 6:46 - 6:48
    トップ5だと思いますか?
  • 6:48 - 6:51
    どのプロジェクト群でしょうか?
  • 6:51 - 6:53
    (何名かの聴衆)コモンズ
  • 6:53 - 6:57
    皆さん コモンズという回答ですね
  • 6:57 - 6:59
    違います
  • 6:59 - 7:02
    トップ5は 全てウィキボヤージュです
  • 7:02 - 7:04
    へえっ!
  • 7:05 - 7:08
    ウィキボヤージュに拍手をどうぞ
  • 7:08 - 7:10
    (拍手)
  • 7:17 - 7:19
    現在のコモンズの順位や
  • 7:19 - 7:22
    他のプロジェクトの順位を
    確認するには
  • 7:22 - 7:24
    ダッシュボードがあります
  • 7:24 - 7:25
    私に聞いてくだされば 確認します
  • 7:28 - 7:33
    もちろん データが使用されているのは
    ウィキメディア内だけでなく
  • 7:33 - 7:35
    その多くは外部です
  • 7:35 - 7:39
    全部は ご紹介できないので
    いくつか抜粋したいと思います
  • 7:40 - 7:44
    メトロポリタン美術館や
    ウェルカム・トラスト
  • 7:44 - 7:45
    アメリカ議会図書館
  • 7:45 - 7:48
    GeneWikiなどで
    よく利用されています
  • 7:48 - 7:51
    このプログラムの各セッションに
    後ほど参加いただければ
  • 7:51 - 7:53
    いくつか耳にするはずです
  • 7:55 - 7:57
    [1年のハイライト]
  • 7:57 - 7:59
    統計はこれぐらいにしましょう
  • 8:00 - 8:02
    他のハイライト部分を見ていきます
  • 8:03 - 8:06
    データ品質の向上については
    お話ししました
  • 8:07 - 8:11
    データ品質については
    多くの側面がありますので
  • 8:11 - 8:16
    それを見ていくと
    そのうちいくつかが向上しており
  • 8:16 - 8:19
    例えば データの正確性や
  • 8:19 - 8:21
    データの信頼性
  • 8:21 - 8:23
    出典の添付度
  • 8:23 - 8:25
    モデルの一貫性
  • 8:26 - 8:29
    完成度などがあります
  • 8:31 - 8:35
    その一例を挙げると
    例えば一貫性ですが
  • 8:36 - 8:42
    ウィキデータにスキーマを
    保存できるよう構築しましたので
  • 8:42 - 8:47
    特定のドメインの
    モデリング方法を表せます
  • 8:47 - 8:50
    ここで分かることは―
  • 8:50 - 8:53
    例えば オランダの画家のための
    スキーマを作成する場合
  • 8:54 - 8:59
    オランダの画家のための
    項目はどれかを確認できます
  • 8:59 - 9:03
    例えば 誕生日の項目はないが
    追加したほうがいい
  • 9:03 - 9:05
    というようなことです
  • 9:06 - 9:09
    より多くのウィキ プロジェクトが
  • 9:09 - 9:12
    スキーマを活用して
  • 9:12 - 9:14
    データ管理ができればよいと思います
  • 9:14 - 9:18
    その方法を知りたい方には
    この後のセッションで
  • 9:19 - 9:25
    皆さんの理解が進むよう
    詳しい者から説明します
  • 9:28 - 9:29
    さて
  • 9:29 - 9:31
    [ウィキベースのエコシステムの成長]
  • 9:31 - 9:38
    昨年 弾みがついたのは
    ウィキベースのエコシステムです
  • 9:38 - 9:42
    その基本概念として
    オープンデータは
  • 9:42 - 9:45
    ウィキデータの中だけで
    実現するものではありません
  • 9:45 - 9:51
    さまざまな場所や参加者により
    エコシステムが成長するのが理想です
  • 9:51 - 9:55
    例えば 機関や企業
    ボランティア プロジェクトが
  • 9:55 - 9:58
    ウィキデータと同様の方法で
    データを公開し
  • 9:58 - 10:00
    そのすべてを結び付けて
  • 10:00 - 10:04
    当事者の間でデータを交換し
    データを連携するようなことです
  • 10:04 - 10:09
    昨年は このことへの関心や
  • 10:09 - 10:11
    各機関による関心や
  • 10:11 - 10:14
    自身のウィキベース インスタンスを
    稼働する方々による関心が
  • 10:14 - 10:15
    爆発的に増加しました
  • 10:15 - 10:20
    特に図書館の分野において
    関心が増加しました
  • 10:23 - 10:26
    数多くのテストや評価を行い
  • 10:26 - 10:30
    また正直なところ
    草分けとも言うべきことを行っていて
  • 10:30 - 10:35
    先駆的な機関が
    ウィキデータと一緒になって
  • 10:35 - 10:38
    ウィキベースがどのように
  • 10:38 - 10:42
    自分たちのコレクションや目録に
    役立つかを調べていました
  • 10:43 - 10:45
    その中には
    ドイツ国立図書館や
  • 10:45 - 10:46
    フランス国立図書館
  • 10:46 - 10:50
    OCLCという
    著名な機関が含まれています
  • 10:55 - 10:58
    これが素晴らしい理由のひとつは
  • 10:58 - 11:03
    私たちはこれらの機関のデータを
    ただウェブに公開して
  • 11:03 - 11:08
    誰かがアクセスできるように
    するだけでなく
  • 11:08 - 11:12
    今後のステップも考えて
    手助けしているからです
  • 11:12 - 11:17
    人々の協力でデータの保持や
    蓄積や強化を行うという
  • 11:18 - 11:21
    大きな変革により
  • 11:21 - 11:25
    良いものがもたらされることを
    願っています
  • 11:26 - 11:28
    その他 私たちに役立つ事柄は
  • 11:28 - 11:33
    専門家に自身のスペースで
    データをキュレートしてもらい
  • 11:33 - 11:35
    良い状態を保つことです
  • 11:35 - 11:41
    そうすれば 自分たちだけで
    常にデータ処理を行う代わりに
  • 11:41 - 11:46
    ウィキデータに
    同期プロセスを設定できます
  • 11:47 - 11:51
    最終的には ウィキデータの
    プレッシャーが軽減され
  • 11:51 - 11:54
    全てがあるべき状態になればと思います
  • 11:56 - 11:58
    [辞書学データの今後]
  • 11:58 - 12:00
    辞書学データについてです
  • 12:02 - 12:09
    昨年は 利用者の言語による表記を
    ウィキデータで開始したことで
  • 12:09 - 12:15
    自動翻訳ツールなどの
    開発が可能になりました
  • 12:16 - 12:21
    また 言語によっては
  • 12:21 - 12:26
    私たちは 臨界量に
    近づき始めているため
  • 12:26 - 12:29
    本格的なアプリケーションの開発が
    必要とされています
  • 12:30 - 12:33
    多くの言語では
    まだまだこれからですが
  • 12:33 - 12:35
    いくつかの言語では
    そこに到達し始めています
  • 12:35 - 12:37
    素晴らしいことです
  • 12:39 - 12:42
    詳細については この後の
    私のセッションにご参加ください
  • 12:42 - 12:46
    [構造化データによるコモンズの改善]
  • 12:46 - 12:49
    そして もちろん忘れてはいけません
  • 12:49 - 12:51
    コモンズの構造化データです
  • 12:52 - 12:54
    やった!(笑)
  • 12:54 - 12:56
    (拍手)
  • 12:59 - 13:02
    基盤で見られる
    コモンズの構造化データは
  • 13:02 - 13:06
    本当に改善されてきています
  • 13:07 - 13:09
    全てが統合されることで
  • 13:10 - 13:15
    昨年コモンズのファイルに
    文を追加することが可能になり
  • 13:16 - 13:19
    皆さんが画像に文を追加し始めて
  • 13:19 - 13:24
    何よりも より良いアプリケーションを
    開発しやすくなりました
  • 13:24 - 13:27
    この成長を目の当たりにするのは
    素晴らしいことです
  • 13:27 - 13:33
    ウィキデータのコミュニティが
    ここで理解すべき重要点は
  • 13:33 - 13:36
    ここでご覧の「表示」
  • 13:36 - 13:42
    「イエネコ」「座っている」
    「トカゲ」「壁」は
  • 13:42 - 13:45
    ウィキデータの項目やプロパティに
    リンクされている点です
  • 13:45 - 13:50
    つまり 項目やプロパティを作成すると
  • 13:50 - 13:54
    ウィキデータ自身に
    語彙が提供されるだけでなく
  • 13:54 - 13:58
    コモンズにも
    語彙が提供されているのです
  • 13:58 - 14:01
    これは増え続けているので
  • 14:01 - 14:07
    他の場所での
    オントロジーや語彙の使用法に
  • 14:07 - 14:10
    以前にも増して
    注意を払う必要があります
  • 14:11 - 14:15
    [ウィキペディア プロジェクトへの橋渡し]
  • 14:15 - 14:19
    最後に 私たちは他のウィキメディアの
    プロジェクトに対して
  • 14:19 - 14:22
    より強固な関係を築き始めました
  • 14:23 - 14:26
    Wikidata Bridgeという
    プロジェクトに
  • 14:26 - 14:28
    私たちのチームは取り組んでいます
  • 14:28 - 14:32
    ぜひ UXブースで
    現状をお試しください
  • 14:33 - 14:36
    例えば ウィキペディアの編集者が
  • 14:36 - 14:39
    自身のプロジェクトから
    ウィキデータを直接編集できます
  • 14:39 - 14:41
    ウィキデータで編集しなくても
  • 14:41 - 14:44
    その周囲を全て理解できるのです
  • 14:44 - 14:48
    これで またひとつ
    ハードルが取り除かれ
  • 14:48 - 14:51
    ウィキメディアのプロジェクトにとって
  • 14:51 - 14:54
    ウィキデータから
    データを導入しやすくなるはずです
  • 14:57 - 15:01
    さて 戦略と今後の展望についてです
    [戦略と今後の展望]
  • 15:03 - 15:07
    12月から ウィキメディア ドイツの
    ウィキデータチームと
  • 15:07 - 15:10
    ウィキメディア財団が
  • 15:10 - 15:15
    ウィキデータ関連の
    戦略や論文に取り組んでいます
  • 15:15 - 15:19
    これは基本的に この5年間で
    すでにお話ししてきたことを
  • 15:20 - 15:23
    文書にまとめるものです
  • 15:24 - 15:29
    これらの論文を読まれたかどうか
    分かりませんが
  • 15:29 - 15:34
    Meta Commonsで
    今月末まで公開されていますので
  • 15:34 - 15:36
    まだの方は
    ぜひ読んでみてください
  • 15:36 - 15:39
    読んでコメント等をお願いします
  • 15:40 - 15:44
    さて その簡単な概要ですが
  • 15:44 - 15:51
    ウィキデータとウィキベースは
    3つに分けることができます
  • 15:52 - 15:55
    1つ目は プラットフォームとしての
    ウィキデータです
  • 15:55 - 15:57
    画面下隅でご覧になれます
  • 15:57 - 15:59
    つまり―
  • 16:01 - 16:03
    ウィキデータは
  • 16:03 - 16:06
    あらゆる人が
    その言語や技術を問わず
  • 16:06 - 16:09
    情報にアクセスし共有できるよう
  • 16:09 - 16:14
    世界に関する汎用データを
    提供しています
  • 16:14 - 16:18
    これは基本的に 皆さんが
    毎日行っていることですね
  • 16:21 - 16:25
    2つ目は ウィキベースの
    エコシステムです
  • 16:25 - 16:28
    そこでソフトウェアのウィキベースは
  • 16:28 - 16:32
    ウィキデータを
    稼働しているだけでなく
  • 16:32 - 16:35
    無料のオープン ナレッジを支える
    オープンデータ ウェブの成長を
  • 16:35 - 16:37
    推進する力となっています
  • 16:38 - 16:43
    3つ目は ウィキメディアの
    プロジェクトのための ウィキデータで
  • 16:43 - 16:45
    ウィキデータは
  • 16:46 - 16:50
    ウィキメディアのプロジェクトに
    役立つ上に
  • 16:51 - 16:54
    その今後の備えにも役立っています
  • 16:58 - 17:03
    では 具体的な短中期の計画は?
    [プラットフォームとしてのウィキデータ]
  • 17:04 - 17:07
    プラットフォームとしての
    ウィキデータについては
  • 17:07 - 17:11
    データ品質の向上が必要なので
    私たちは引き続き
  • 17:11 - 17:14
    より良いツールのために
    ツールの改良などを行います
  • 17:15 - 17:18
    データにアクセスしやすくする
    必要もあります
  • 17:19 - 17:23
    APIの改善や
    SPARQLエンドポイントの強化
  • 17:23 - 17:27
    また アプリケーションで
    再利用しやすくなるよう
  • 17:27 - 17:31
    データを着実にモデリングすること
    などが含まれます
  • 17:32 - 17:38
    最後は パートナーからの
    フィードバック プロセスの設定です
  • 17:40 - 17:43
    ウィキペディアと異なり
    ウィキデータは
  • 17:43 - 17:46
    目的指向型プロジェクトではありません
  • 17:46 - 17:49
    ウィキペディアを訪れて
    読む人はいても
  • 17:49 - 17:53
    通常は ウィキデータを訪れて
    読む人はいません
  • 17:53 - 17:58
    そうだと良いですが
    現実は違いますね
  • 17:58 - 18:01
    私たちのデータの
    公開先の多くは
  • 18:01 - 18:03
    ウィキデータ自体には
    ありません
  • 18:03 - 18:07
    ウィキペディアや
    他の場所を通じて見ることになります
  • 18:08 - 18:12
    それらの場所が データに関する
    フィードバックを得るわけです
  • 18:12 - 18:15
    ユーザーはそこに
    誤りなどを知らせますからね
  • 18:17 - 18:19
    ウィキデータが
    それを得られるようにして
  • 18:19 - 18:24
    実際にウィキデータの編集を行う
    皆さんに公開したいのです
  • 18:24 - 18:27
    そのための有益な方法を
  • 18:27 - 18:30
    皆さんの負担にならないようにしながら
  • 18:30 - 18:33
    来年追求していく予定です
  • 18:35 - 18:37
    さて ウィキベースのエコシステムです
  • 18:37 - 18:41
    私たちは 各図書館と
    引き続き協力するだけでなく
  • 18:41 - 18:46
    例えば 科学分野などにも
    目を向けていきます
  • 18:46 - 18:50
    この後 ウィキベースの
    ショーケースでご紹介しますので
  • 18:50 - 18:52
    ご参加ください
  • 18:52 - 18:53
    すでに実現したことや
  • 18:53 - 18:56
    実際に人々がウィキベースで
    行っていることをご紹介します
  • 18:56 - 18:57
    価値があります
  • 18:58 - 19:01
    ウィキベースのエコシステム周辺には
  • 19:01 - 19:04
    良いプロセスを設定することも必要です
  • 19:04 - 19:07
    誰に相談すればいいのか
  • 19:07 - 19:09
    どこに助けを求めればよいのかなどを
  • 19:09 - 19:12
    分かりやすくする必要があります
  • 19:13 - 19:18
    またウィキベースのインストールや
    メンテナンスを容易にする必要もあります
  • 19:18 - 19:20
    まだ 少し大変ですから
  • 19:21 - 19:23
    最後は フェデレーションです
  • 19:23 - 19:27
    これはコモンズ関連で
    先ほどもお話したことですが
  • 19:27 - 19:31
    コモンズが ウィキデータの
    項目やプロパティを使用する際に
  • 19:31 - 19:34
    他のウィキベースのインスタンスでも
  • 19:34 - 19:36
    ウィキデータの語彙を
    使用できます
  • 19:38 - 19:42
    先述の通り
    ここでもまた増加しているため
  • 19:42 - 19:48
    ウィキデータの語彙を
    外の場所でどう使用するかについては
  • 19:48 - 19:51
    以前にも増して
    注意を払う必要があります
  • 19:54 - 19:57
    ウィキメディアのプロジェクトのための
    ウィキデータとしては
  • 19:57 - 20:01
    Wikidata Bridgeを介した
    より強い統合や
  • 20:01 - 20:04
    プロジェクトからの直接編集のための
    支援があります
  • 20:04 - 20:10
    それと同時に
    皆で一緒に考えるべきことは
  • 20:10 - 20:15
    言語の障壁を下げる方法を
    見つけることだと思います
  • 20:15 - 20:19
    ウィキメディアのプロジェクトで
    ウィキデータの統合がさらに進めば
  • 20:19 - 20:21
    同じ言語を話さなくても
  • 20:21 - 20:26
    より多くの人がそのデータについて
    話し合う必要が出てきます
  • 20:26 - 20:32
    それをどのように行うかを
    明らかにしなければなりません
  • 20:33 - 20:37
    優れたアイデアを持つ方がいれば
    お話しできればと思います
  • 20:39 - 20:41
    私の講演も終わりに近づきました
  • 20:42 - 20:45
    日々 より多くの人により豊富な知識を
    利用できるようにしている
  • 20:45 - 20:47
    皆さんに感謝しています
  • 20:47 - 20:48
    (拍手)
  • 20:58 - 21:00
    (司会者)質問の時間を設けます
  • 21:00 - 21:02
    会場で質問がある方や
  • 21:02 - 21:05
    ライブストリームで
    ご覧の方…私の母とか
  • 21:05 - 21:08
    質問は EtherPadか
  • 21:08 - 21:11
    テレグラム チャンネルでどうぞ
    ベストを尽くします
  • 21:12 - 21:13
    ご質問は?
  • 21:16 - 21:17
    どうぞ
  • 21:21 - 21:25
    (聴衆1)こんにちは
    質問というよりミームなんですが
  • 21:25 - 21:32
    時間拡張機能は
    いつ利用できるようになって
  • 21:32 - 21:35
    時間、分、秒単位で
    設定できる予定ですか
  • 21:35 - 21:38
    現在は日付単位しかありません
  • 21:38 - 21:42
    - 自分の質問ではないので
    - (笑)
  • 21:42 - 21:44
    ミームだと言ったんです
  • 21:44 - 21:46
    いつもこんな具合ですが
  • 21:46 - 21:48
    そう伝わってくるので...
  • 21:50 - 21:53
    これにはあまり
    良い回答ができません
  • 21:54 - 21:55
    ごめんなさい
  • 21:56 - 21:58
    でも 恐らくその背景としては
  • 21:58 - 22:04
    コモンズ上でますます画像表示が
    必要とされてきているので
  • 22:04 - 22:06
    時間拡張機能を通じて
  • 22:06 - 22:11
    早く終わらせる必要がある作業が
    たくさん出てきているのかもれません
  • 22:15 - 22:16
    他にご質問は?
  • 22:25 - 22:28
    (聴衆2)ウィキメディア財団
    リサーチチームのリンダです
  • 22:28 - 22:32
    パトロールについて
    お考えを聞かせてください
  • 22:32 - 22:38
    ウィキデータの品質に関わると思いますが
  • 22:38 - 22:40
    それについて
    お話しいただければ
  • 22:40 - 22:44
    短中期的なパトロールの
    取り組みの改善だとか
  • 22:44 - 22:46
    特に Bridgeプロジェクトに関して
  • 22:46 - 22:48
    期待していて
    試してみたいのです
  • 22:48 - 22:49
    お願いします
  • 22:52 - 22:57
    おっしゃるとおり
    Bridgeで行っていることについて
  • 22:59 - 23:03
    パトロールの取り組みは
    さらに必要だと思います
  • 23:04 - 23:11
    しかし 手動や人力で行える規模では
    なくなっています
  • 23:11 - 23:15
    ですから 改善には
    もっと努力が必要です
  • 23:15 - 23:18
    例えばORESなど
    機械学習システムを使用すれば
  • 23:18 - 23:25
    どの編集で
    人間が確認する必要があるか
  • 23:25 - 23:30
    通常のことで確認の必要はないかが
    分かりやすくなります
  • 23:34 - 23:39
    現在 ORESは
    ウィキデータの編集の優劣を
  • 23:39 - 23:41
    判断できるほど
    優秀だとは言えません
  • 23:41 - 23:47
    現在 機械学習システムを訓練するため
  • 23:48 - 23:52
    皆さんの協力を大募集中です
  • 23:53 - 23:57
    良い編集と悪い編集を教えていますが
  • 23:57 - 24:03
    まだ十分な数の人間が教えたと言える
    閾値までは達していません
  • 24:03 - 24:08
    これを目覚ましく向上させるために
    もしお時間があれば
  • 24:08 - 24:11
    ORESへの訓練を手伝ってください
  • 24:11 - 24:14
    ウィキデータ編集の
    評価を向上させるためです
  • 24:14 - 24:15
    本当に簡単です
  • 24:15 - 24:17
    表示された編集を見て
  • 24:17 - 24:20
    あなたはその優劣を
    答えるだけです
  • 24:20 - 24:23
    ソファーでTVを見ながらでもできます
  • 24:26 - 24:27
    (聴衆3)リンクを共有してください
  • 24:28 - 24:31
    テレグラムのグループに
    リンクを共有します
  • 24:32 - 24:36
    必要な閾値に達したら―
  • 24:36 - 24:39
    約7,000だと思いますが
  • 24:40 - 24:44
    ORESの再訓練を行うことで
  • 24:44 - 24:48
    ウィキデータの編集の
    評価成績を改善できればと思います
  • 24:50 - 24:52
    それを皆さんが活用すれば
  • 24:52 - 24:55
    例えば 最新の変更を
    フィルタリングしたり
  • 24:55 - 24:58
    監視が必要な編集を
    把握したりできます
  • 24:59 - 25:00
    はい
  • 25:03 - 25:04
    こんにちは
  • 25:07 - 25:10
    (聴衆4)好奇心からお聞きします
    私の質問ではないですが
  • 25:10 - 25:13
    協働パートナーからの質問ですが
  • 25:13 - 25:16
    ウィキデータに参加するパートナーが
    増えれば増えるほど
  • 25:16 - 25:19
    またクエリで
    いろいろ試せば試すほど
  • 25:20 - 25:23
    クエリのタイムアウトという
    問題も増えています
  • 25:23 - 25:26
    この件にはどう対処しますか?
  • 25:28 - 25:31
    ウィキメディア財団のメンバーの一部が
    その調査をしており
  • 25:32 - 25:34
    少しネタをばらしますと
  • 25:34 - 25:37
    誕生日プレゼントとして
    セッションを行う予定です
  • 25:37 - 25:38
    (笑)
  • 25:43 - 25:46
    (聴衆5)ベルギーから来た
    バート・マグナスです
  • 25:46 - 25:50
    私が知りたいことは
    フェデレーションの現状です
  • 25:50 - 25:54
    ウィキベースのインスタンス内に
    プロパティを提案していますが
  • 25:54 - 25:57
    それについて
    お話しいただけますか?
  • 25:57 - 26:00
    昨年は 数多くの人から
  • 26:00 - 26:03
    フェデレーションを
    要望されました
  • 26:04 - 26:07
    しかし 問題は
    フェデレーションについての理解が
  • 26:07 - 26:09
    人によって異なることです
  • 26:11 - 26:13
    簡単にできることもありましたが
  • 26:13 - 26:16
    非常に難しい事柄もあります
  • 26:17 - 26:21
    私のチームは数多くの人たちと
    議論をしてきました
  • 26:21 - 26:25
    例えば 図書館における
    協働パートナーは
  • 26:25 - 26:29
    何を実際に必要としているかなどです
  • 26:30 - 26:33
    議論はもう終了したとはいえ
  • 26:33 - 26:37
    もちろん ご意見はいつでも歓迎です
  • 26:38 - 26:40
    現在の状況は
  • 26:40 - 26:43
    基礎はできたと
    安心して言える段階です
  • 26:45 - 26:48
    今後2、3か月で
  • 26:48 - 26:51
    コード記述に着手しますので
  • 26:51 - 26:54
    来年の初め頃には
  • 26:54 - 26:57
    皆さんがテストできればと思います
  • 27:00 - 27:01
    (司会者)最後の質問をどうぞ
  • 27:02 - 27:06
    (聴衆6)コペンハーゲンから来た
    ニールセンです
  • 27:06 - 27:10
    他の言語に関して討論がありました
  • 27:10 - 27:14
    WikiCiteコミュニティでは
    引き続き科学論文を
  • 27:14 - 27:16
    増やすべきかどうかを
    検討してきたのですが
  • 27:16 - 27:20
    これはウィキデータの容量に左右されます
  • 27:20 - 27:23
    ウィキデータのクエリサービスの
    タイムアウトも課題の1つですが
  • 27:23 - 27:25
    メンテナンスも課題です
  • 27:25 - 27:30
    これについて
    どのようにお考えですか
  • 27:31 - 27:34
    ウィキデータの規模が
  • 27:34 - 27:36
    全体の問題の
    原因になっているのですか?
  • 27:36 - 27:39
    語彙素データを入れるのを
    やめるべきでしょうか?
  • 27:39 - 27:43
    ウィキデータに科学データを
    入れるのをやめるか
  • 27:43 - 27:46
    調査をすべきでしょうか
  • 27:46 - 27:50
    技術的な問題が増えているのでしょうか?
  • 27:50 - 27:51
    はい
  • 27:53 - 27:57
    ウィキデータは間違いなく
  • 27:59 - 28:03
    技術的にも 社会的にもですが
  • 28:03 - 28:06
    スケーラビリティの限界が来ています
  • 28:06 - 28:09
    双方に解決策が必要ですね?
  • 28:09 - 28:13
    社会的には 編集者が増え
  • 28:13 - 28:16
    最近は人間がパトロールするには
  • 28:16 - 28:20
    あまりにも多すぎる状態に達しています
  • 28:21 - 28:26
    しかし 技術的には
    対処していることもあります
  • 28:26 - 28:32
    データベースのビュー変換テーブル周辺を
    再構築するなどして
  • 28:32 - 28:34
    いくらか改善できています
  • 28:36 - 28:38
    しかし 今のところ
  • 28:39 - 28:42
    私たちが来年の課題としたいのは
  • 28:42 - 28:45
    他に問題となる個所はどこかを
    明らかにして
  • 28:45 - 28:48
    それを技術面で
    どう対処するかです
  • 28:49 - 28:51
    これが 全体像です
  • 28:51 - 28:54
    そして それと同時に
  • 28:54 - 28:58
    「データを入れるのは中止」とは
    私は言いたくないのです
  • 28:58 - 29:02
    これでは 本来の目的に合いません
  • 29:04 - 29:07
    しかし例えば
    ウィキベースのエコシステムは
  • 29:07 - 29:09
    その対応策のひとつだと思います
  • 29:09 - 29:14
    ウィキデータに全部は必要ありません
  • 29:14 - 29:16
    リンクされたオープンデータの
    美点だと思います
  • 29:16 - 29:18
    全部を同じ場所に
    納めなくてもよいのです
  • 29:18 - 29:20
    別の場所を繋ぎ合わせられます
  • 29:20 - 29:21
    素晴らしいです
  • 29:22 - 29:25
    WikiCitesの周辺では特に
  • 29:30 - 29:31
    WikiCitesについては特に
  • 29:32 - 29:36
    割合で見る必要があると思います
  • 29:36 - 29:42
    WikiCiteトピック周辺で
    ウィキデータの項目が占める
  • 29:42 - 29:45
    具体的な割合は分かりませんが
  • 29:45 - 29:47
    かなりの割合だと思います
  • 29:47 - 29:52
    これは後で休憩時間に
    お話ししましょう
  • 29:53 - 29:55
    ありがとうございました
Title:
cdn.media.ccc.de/.../wikidatacon2019-3-eng-Glimpse_over_Wikidata_hd.mp4
Video Language:
English
Duration:
30:07

Japanese subtitles

Revisions