WEBVTT 00:00:00.035 --> 00:00:02.260 [ウィキデータの概要] 00:00:02.260 --> 00:00:06.001 [リディア・ピンチャー] [ウィキデータの概要] 00:00:06.370 --> 00:00:07.599 皆さん こんにちは 00:00:08.338 --> 00:00:11.691 こんなに多くの皆さんに ご参加いただいて 00:00:11.691 --> 00:00:13.800 ありがとうございます 00:00:14.659 --> 00:00:19.541 このイベントについては リーアがお話ししましたので 00:00:19.541 --> 00:00:22.875 私は ウィキデータそのものについて 00:00:22.875 --> 00:00:25.796 また 昨年に起きたことと 00:00:26.246 --> 00:00:28.151 今後についてお話しします 00:00:29.023 --> 00:00:32.974 さて... これは何でしょう 失礼 00:00:40.118 --> 00:00:44.243 さて 現状と今後の展望は? 00:00:45.500 --> 00:00:49.510 昨年は 祝うべきことが 数多くありましたが 00:00:49.510 --> 00:00:52.329 あまり目立たない場合もあったので 00:00:52.329 --> 00:00:55.125 いくつかハイライトしたいと思います 00:00:56.855 --> 00:01:00.270 まずご紹介したいのは 00:01:00.270 --> 00:01:03.985 編集者に関する統計と [編集者] 00:01:03.985 --> 00:01:07.119 コンテンツと データの利用度です 00:01:10.376 --> 00:01:14.976 昨年の間に コミュニティは大きく成長しました 00:01:14.976 --> 00:01:16.720 これは素晴らしいことです 00:01:17.371 --> 00:01:21.248 新たに約3,000人が加わり 00:01:21.248 --> 00:01:25.963 1か月に1回以上の編集を行いました 00:01:26.133 --> 00:01:30.276 3,000人の新規ウィキデータンです! 00:01:31.617 --> 00:01:36.764 1か月に5回以上の 編集を行った人を見ると 00:01:37.924 --> 00:01:40.727 約1,200人が加わっています 00:01:40.995 --> 00:01:44.497 100回以上の 編集を行った人は 00:01:44.667 --> 00:01:46.766 この部屋に大勢いると思いますが 00:01:47.366 --> 00:01:48.996 300人以上です 00:01:49.177 --> 00:01:51.520 最後のグループに該当する人は 手を挙げてください 00:01:52.513 --> 00:01:54.289 すごいですね! 00:01:54.509 --> 00:01:55.798 皆さん素晴らしい 00:01:58.059 --> 00:02:04.761 いつもなら編集の回数に 注目することは 00:02:05.751 --> 00:02:08.502 あまりありませんが 00:02:08.592 --> 00:02:12.773 今年は なんと 記念すべき10億回を超えました 00:02:21.497 --> 00:02:23.506 では コンテンツを見ていきましょう 00:02:23.565 --> 00:02:24.795 [コンテンツ] 00:02:27.610 --> 00:02:31.222 現在 6,500万もの項目があります 00:02:31.462 --> 00:02:33.991 つまり このエンティティで 世界が表わされていて 00:02:34.093 --> 00:02:40.541 約6,700のプロパティで それが行われているのです 00:02:43.667 --> 00:02:48.079 そのうち 約4,300が 外部識別子です 00:02:48.759 --> 00:02:53.280 それが 他の目録や データベースやウェブサイトなどに 00:02:53.280 --> 00:02:55.528 多数リンクしており 00:02:55.927 --> 00:02:58.265 このことにより ウィキデータが 00:02:58.265 --> 00:03:01.594 オープンデータ ウェブにおける 中心地となっています 00:03:02.453 --> 00:03:07.241 これらのプロパティや項目を 使用している文は 00:03:07.241 --> 00:03:11.990 現在 ウィキデータに約8億あり 00:03:11.990 --> 00:03:15.892 前年比では 各項目については 00:03:15.892 --> 00:03:18.365 1.5倍に増加しました 00:03:18.550 --> 00:03:19.870 (笑) 00:03:22.595 --> 00:03:24.970 ウィキデータは賢くなったのです 00:03:26.914 --> 00:03:29.482 項目やプロパティだけではなく 00:03:29.562 --> 00:03:33.704 語彙素のような新しいものもあり 00:03:33.746 --> 00:03:39.133 現在 たくさんの異なる言語で 表されている語彙素が 00:03:39.133 --> 00:03:41.860 20万4千もあります 00:03:41.939 --> 00:03:43.241 とても良いことです 00:03:43.668 --> 00:03:47.539 この詳細は 後のセッションでご説明します 00:03:48.860 --> 00:03:52.690 最も新しく追加したのは スキーマで 00:03:52.690 --> 00:03:55.678 これにより 特定分野において 00:03:56.259 --> 00:04:00.971 データを一貫してモデル化する方法が 理解しやすくなります 00:04:02.171 --> 00:04:04.462 これは 現在 約140あります 00:04:07.571 --> 00:04:11.492 コンテンツについては 数字が全てではありませんから 00:04:11.492 --> 00:04:14.697 コンテンツの量だけでなく 品質にも気を配りましょう 00:04:15.613 --> 00:04:21.976 現在は 機械学習システムを訓練して [平均項目品質] 00:04:21.976 --> 00:04:24.649 項目の品質を評価しています 00:04:25.752 --> 00:04:29.531 完璧には まだ程遠いものの 参考になります 00:04:29.776 --> 00:04:35.011 ウィキデータの各項目が 5段階で評価されています 00:04:35.011 --> 00:04:37.895 1は極めてひどく 5は優秀ということです 00:04:38.446 --> 00:04:41.901 これは 例えば 文の数や 00:04:41.901 --> 00:04:44.031 外部識別子の数 00:04:44.031 --> 00:04:45.922 出典の数 00:04:45.922 --> 00:04:50.242 異なる言語によるラベルの数 などを示します 00:04:50.727 --> 00:04:54.904 ウィキデータの推移を見ると 00:04:55.118 --> 00:04:59.751 ご覧のように これらのスコアによれば 00:04:59.751 --> 00:05:03.753 極めてひどかった評価が かなり向上しています 00:05:03.923 --> 00:05:05.233 (笑) 00:05:05.649 --> 00:05:07.068 これは良いことです 00:05:07.971 --> 00:05:12.260 でも 最高の評価までには まだたくさんの余地があります 00:05:13.664 --> 00:05:20.171 これがゴールではありませんね 00:05:20.250 --> 00:05:23.072 これらの評価によると 00:05:23.072 --> 00:05:26.087 全ての項目が 完璧なわけではありません 00:05:26.144 --> 00:05:32.442 しかし データの品質が恒常的に 向上していることをうれしく思います 00:05:36.709 --> 00:05:43.111 しかし データを生み出すだけでは 十分ではありません 00:05:44.268 --> 00:05:46.734 私たちには 動機が必要です [利用] 00:05:46.734 --> 00:05:49.616 データを利用してほしいのです 00:05:50.736 --> 00:05:54.530 そこで ウィキデータのデータを 使用している 00:05:54.530 --> 00:05:57.973 ウィキメディアの 各プロジェクトにある 00:05:57.973 --> 00:06:00.770 記事の数を確認しました 00:06:02.040 --> 00:06:06.762 そして これらのプロジェクトにある 全ての記事の割合を見ました 00:06:07.395 --> 00:06:09.554 ウィキメディア全体と 00:06:09.554 --> 00:06:11.552 その記事全体を見ると 00:06:11.989 --> 00:06:18.768 現在では 56.35%の記事が ウィキデータから利用されています 00:06:20.054 --> 00:06:21.815 非常に良いと思いますが 00:06:21.815 --> 00:06:27.378 100%の利用度に達するには まだ遠い状態です 00:06:29.085 --> 00:06:32.690 次に どのプロジェクトが 00:06:32.690 --> 00:06:35.977 ウィキデータのデータを 最もよく利用しているかを 00:06:36.188 --> 00:06:39.223 言語別などで 分類してみました 00:06:39.606 --> 00:06:44.537 全体のうち どのプロジェクトが― 00:06:45.577 --> 00:06:48.254 トップ5だと思いますか? 00:06:48.254 --> 00:06:50.834 どのプロジェクト群でしょうか? 00:06:51.036 --> 00:06:53.467 (何名かの聴衆)コモンズ 00:06:53.488 --> 00:06:56.607 皆さん コモンズという回答ですね 00:06:57.216 --> 00:06:58.505 違います 00:06:58.922 --> 00:07:01.684 トップ5は 全てウィキボヤージュです 00:07:02.084 --> 00:07:03.650 へえっ! 00:07:05.439 --> 00:07:08.345 ウィキボヤージュに拍手をどうぞ 00:07:08.437 --> 00:07:10.280 (拍手) 00:07:16.900 --> 00:07:19.259 現在のコモンズの順位や 00:07:19.259 --> 00:07:21.863 他のプロジェクトの順位を 確認するには 00:07:21.863 --> 00:07:23.521 ダッシュボードがあります 00:07:23.521 --> 00:07:25.443 私に聞いてくだされば 確認します 00:07:28.049 --> 00:07:32.619 もちろん データが使用されているのは ウィキメディア内だけでなく 00:07:32.619 --> 00:07:34.756 その多くは外部です 00:07:34.966 --> 00:07:39.256 全部は ご紹介できないので いくつか抜粋したいと思います 00:07:39.518 --> 00:07:43.796 メトロポリタン美術館や ウェルカム・トラスト 00:07:43.796 --> 00:07:45.257 アメリカ議会図書館 00:07:45.257 --> 00:07:47.748 GeneWikiなどで よく利用されています 00:07:47.951 --> 00:07:51.296 このプログラムの各セッションに 後ほど参加いただければ 00:07:51.296 --> 00:07:53.292 いくつか耳にするはずです 00:07:54.523 --> 00:07:56.543 [1年のハイライト] 00:07:56.635 --> 00:07:59.287 統計はこれぐらいにしましょう 00:07:59.855 --> 00:08:02.171 他のハイライト部分を見ていきます 00:08:02.644 --> 00:08:06.249 データ品質の向上については お話ししました 00:08:06.897 --> 00:08:10.756 データ品質については 多くの側面がありますので 00:08:10.756 --> 00:08:16.426 それを見ていくと そのうちいくつかが向上しており 00:08:16.482 --> 00:08:18.980 例えば データの正確性や 00:08:18.980 --> 00:08:20.751 データの信頼性 00:08:20.751 --> 00:08:22.515 出典の添付度 00:08:22.515 --> 00:08:24.865 モデルの一貫性 00:08:26.351 --> 00:08:28.992 完成度などがあります 00:08:31.263 --> 00:08:35.256 その一例を挙げると 例えば一貫性ですが 00:08:35.746 --> 00:08:42.245 ウィキデータにスキーマを 保存できるよう構築しましたので 00:08:42.355 --> 00:08:46.553 特定のドメインの モデリング方法を表せます 00:08:46.806 --> 00:08:49.971 ここで分かることは― 00:08:49.971 --> 00:08:53.497 例えば オランダの画家のための スキーマを作成する場合 00:08:53.952 --> 00:08:59.332 オランダの画家のための 項目はどれかを確認できます 00:08:59.359 --> 00:09:02.828 例えば 誕生日の項目はないが 追加したほうがいい 00:09:02.828 --> 00:09:04.520 というようなことです 00:09:05.557 --> 00:09:08.781 より多くのウィキ プロジェクトが 00:09:08.781 --> 00:09:11.534 スキーマを活用して 00:09:11.534 --> 00:09:14.238 データ管理ができればよいと思います 00:09:14.378 --> 00:09:18.096 その方法を知りたい方には この後のセッションで 00:09:18.666 --> 00:09:24.512 皆さんの理解が進むよう 詳しい者から説明します 00:09:27.575 --> 00:09:28.745 さて 00:09:29.022 --> 00:09:30.929 [ウィキベースのエコシステムの成長] 00:09:30.929 --> 00:09:37.781 昨年 弾みがついたのは ウィキベースのエコシステムです 00:09:37.956 --> 00:09:41.738 その基本概念として オープンデータは 00:09:41.738 --> 00:09:45.039 ウィキデータの中だけで 実現するものではありません 00:09:45.039 --> 00:09:50.950 さまざまな場所や参加者により エコシステムが成長するのが理想です 00:09:51.151 --> 00:09:54.623 例えば 機関や企業 ボランティア プロジェクトが 00:09:54.623 --> 00:09:58.325 ウィキデータと同様の方法で データを公開し 00:09:58.325 --> 00:10:00.267 そのすべてを結び付けて 00:10:00.267 --> 00:10:04.282 当事者の間でデータを交換し データを連携するようなことです 00:10:04.282 --> 00:10:08.846 昨年は このことへの関心や 00:10:08.846 --> 00:10:10.833 各機関による関心や 00:10:10.833 --> 00:10:13.734 自身のウィキベース インスタンスを 稼働する方々による関心が 00:10:13.734 --> 00:10:15.265 爆発的に増加しました 00:10:15.265 --> 00:10:20.296 特に図書館の分野において 関心が増加しました 00:10:23.009 --> 00:10:26.210 数多くのテストや評価を行い 00:10:26.226 --> 00:10:29.971 また正直なところ 草分けとも言うべきことを行っていて 00:10:29.971 --> 00:10:34.970 先駆的な機関が ウィキデータと一緒になって 00:10:35.250 --> 00:10:37.752 ウィキベースがどのように 00:10:37.752 --> 00:10:42.243 自分たちのコレクションや目録に 役立つかを調べていました 00:10:42.539 --> 00:10:45.024 その中には ドイツ国立図書館や 00:10:45.024 --> 00:10:46.419 フランス国立図書館 00:10:46.419 --> 00:10:49.699 OCLCという 著名な機関が含まれています 00:10:55.278 --> 00:10:57.880 これが素晴らしい理由のひとつは 00:10:57.880 --> 00:11:02.868 私たちはこれらの機関のデータを ただウェブに公開して 00:11:02.868 --> 00:11:07.914 誰かがアクセスできるように するだけでなく 00:11:07.926 --> 00:11:11.747 今後のステップも考えて 手助けしているからです 00:11:11.747 --> 00:11:16.963 人々の協力でデータの保持や 蓄積や強化を行うという 00:11:17.758 --> 00:11:20.769 大きな変革により 00:11:20.769 --> 00:11:24.526 良いものがもたらされることを 願っています 00:11:26.041 --> 00:11:28.239 その他 私たちに役立つ事柄は 00:11:28.239 --> 00:11:32.621 専門家に自身のスペースで データをキュレートしてもらい 00:11:32.621 --> 00:11:34.572 良い状態を保つことです 00:11:34.572 --> 00:11:40.714 そうすれば 自分たちだけで 常にデータ処理を行う代わりに 00:11:40.714 --> 00:11:45.772 ウィキデータに 同期プロセスを設定できます 00:11:46.519 --> 00:11:51.178 最終的には ウィキデータの プレッシャーが軽減され 00:11:51.178 --> 00:11:53.959 全てがあるべき状態になればと思います 00:11:55.858 --> 00:11:57.618 [辞書学データの今後] 00:11:57.620 --> 00:11:59.742 辞書学データについてです 00:12:01.962 --> 00:12:09.363 昨年は 利用者の言語による表記を ウィキデータで開始したことで 00:12:09.363 --> 00:12:14.534 自動翻訳ツールなどの 開発が可能になりました 00:12:16.413 --> 00:12:21.253 また 言語によっては 00:12:21.253 --> 00:12:25.500 私たちは 臨界量に 近づき始めているため 00:12:25.500 --> 00:12:29.175 本格的なアプリケーションの開発が 必要とされています 00:12:29.527 --> 00:12:32.614 多くの言語では まだまだこれからですが 00:12:32.614 --> 00:12:35.491 いくつかの言語では そこに到達し始めています 00:12:35.491 --> 00:12:37.086 素晴らしいことです 00:12:38.621 --> 00:12:41.510 詳細については この後の 私のセッションにご参加ください 00:12:41.737 --> 00:12:45.907 [構造化データによるコモンズの改善] 00:12:46.064 --> 00:12:48.954 そして もちろん忘れてはいけません 00:12:48.954 --> 00:12:50.955 コモンズの構造化データです 00:12:52.220 --> 00:12:53.832 やった!(笑) 00:12:54.218 --> 00:12:56.228 (拍手) 00:12:59.324 --> 00:13:02.258 基盤で見られる コモンズの構造化データは 00:13:02.258 --> 00:13:05.571 本当に改善されてきています 00:13:07.121 --> 00:13:08.927 全てが統合されることで 00:13:10.205 --> 00:13:15.479 昨年コモンズのファイルに 文を追加することが可能になり 00:13:15.526 --> 00:13:18.830 皆さんが画像に文を追加し始めて 00:13:18.830 --> 00:13:24.230 何よりも より良いアプリケーションを 開発しやすくなりました 00:13:24.292 --> 00:13:26.852 この成長を目の当たりにするのは 素晴らしいことです 00:13:27.082 --> 00:13:33.039 ウィキデータのコミュニティが ここで理解すべき重要点は 00:13:33.051 --> 00:13:36.457 ここでご覧の「表示」 00:13:36.491 --> 00:13:41.577 「イエネコ」「座っている」 「トカゲ」「壁」は 00:13:41.577 --> 00:13:44.867 ウィキデータの項目やプロパティに リンクされている点です 00:13:45.425 --> 00:13:49.620 つまり 項目やプロパティを作成すると 00:13:49.620 --> 00:13:54.031 ウィキデータ自身に 語彙が提供されるだけでなく 00:13:54.031 --> 00:13:57.749 コモンズにも 語彙が提供されているのです 00:13:57.904 --> 00:14:00.695 これは増え続けているので 00:14:00.765 --> 00:14:06.686 他の場所での オントロジーや語彙の使用法に 00:14:06.686 --> 00:14:09.777 以前にも増して 注意を払う必要があります 00:14:11.329 --> 00:14:15.479 [ウィキペディア プロジェクトへの橋渡し] 00:14:15.497 --> 00:14:19.228 最後に 私たちは他のウィキメディアの プロジェクトに対して 00:14:19.228 --> 00:14:21.902 より強固な関係を築き始めました 00:14:23.281 --> 00:14:26.159 Wikidata Bridgeという プロジェクトに 00:14:26.159 --> 00:14:28.239 私たちのチームは取り組んでいます 00:14:28.239 --> 00:14:32.294 ぜひ UXブースで 現状をお試しください 00:14:32.904 --> 00:14:36.240 例えば ウィキペディアの編集者が 00:14:36.240 --> 00:14:38.970 自身のプロジェクトから ウィキデータを直接編集できます 00:14:38.976 --> 00:14:40.988 ウィキデータで編集しなくても 00:14:40.988 --> 00:14:43.958 その周囲を全て理解できるのです 00:14:43.958 --> 00:14:47.503 これで またひとつ ハードルが取り除かれ 00:14:47.503 --> 00:14:50.755 ウィキメディアのプロジェクトにとって 00:14:50.755 --> 00:14:54.492 ウィキデータから データを導入しやすくなるはずです 00:14:57.165 --> 00:15:00.924 さて 戦略と今後の展望についてです [戦略と今後の展望] 00:15:03.005 --> 00:15:07.179 12月から ウィキメディア ドイツの ウィキデータチームと 00:15:07.179 --> 00:15:09.829 ウィキメディア財団が 00:15:09.829 --> 00:15:14.573 ウィキデータ関連の 戦略や論文に取り組んでいます 00:15:14.573 --> 00:15:19.491 これは基本的に この5年間で すでにお話ししてきたことを 00:15:19.526 --> 00:15:22.958 文書にまとめるものです 00:15:23.995 --> 00:15:29.492 これらの論文を読まれたかどうか 分かりませんが 00:15:29.492 --> 00:15:33.757 Meta Commonsで 今月末まで公開されていますので 00:15:33.757 --> 00:15:35.806 まだの方は ぜひ読んでみてください 00:15:35.806 --> 00:15:39.019 読んでコメント等をお願いします 00:15:40.062 --> 00:15:43.768 さて その簡単な概要ですが 00:15:44.338 --> 00:15:50.991 ウィキデータとウィキベースは 3つに分けることができます 00:15:51.506 --> 00:15:55.442 1つ目は プラットフォームとしての ウィキデータです 00:15:55.442 --> 00:15:57.198 画面下隅でご覧になれます 00:15:57.481 --> 00:15:59.266 つまり― 00:16:01.193 --> 00:16:03.028 ウィキデータは 00:16:03.028 --> 00:16:06.033 あらゆる人が その言語や技術を問わず 00:16:06.033 --> 00:16:09.038 情報にアクセスし共有できるよう 00:16:09.038 --> 00:16:13.893 世界に関する汎用データを 提供しています 00:16:14.479 --> 00:16:18.161 これは基本的に 皆さんが 毎日行っていることですね 00:16:21.282 --> 00:16:25.497 2つ目は ウィキベースの エコシステムです 00:16:25.497 --> 00:16:27.757 そこでソフトウェアのウィキベースは 00:16:27.757 --> 00:16:31.513 ウィキデータを 稼働しているだけでなく 00:16:31.513 --> 00:16:35.007 無料のオープン ナレッジを支える オープンデータ ウェブの成長を 00:16:35.007 --> 00:16:36.761 推進する力となっています 00:16:38.126 --> 00:16:43.165 3つ目は ウィキメディアの プロジェクトのための ウィキデータで 00:16:43.255 --> 00:16:45.242 ウィキデータは 00:16:45.522 --> 00:16:49.754 ウィキメディアのプロジェクトに 役立つ上に 00:16:50.750 --> 00:16:53.759 その今後の備えにも役立っています 00:16:57.597 --> 00:17:02.973 では 具体的な短中期の計画は? [プラットフォームとしてのウィキデータ] 00:17:04.248 --> 00:17:06.595 プラットフォームとしての ウィキデータについては 00:17:06.669 --> 00:17:10.700 データ品質の向上が必要なので 私たちは引き続き 00:17:10.700 --> 00:17:14.195 より良いツールのために ツールの改良などを行います 00:17:15.193 --> 00:17:18.102 データにアクセスしやすくする 必要もあります 00:17:18.899 --> 00:17:23.470 APIの改善や SPARQLエンドポイントの強化 00:17:23.470 --> 00:17:27.315 また アプリケーションで 再利用しやすくなるよう 00:17:27.315 --> 00:17:31.235 データを着実にモデリングすること などが含まれます 00:17:31.867 --> 00:17:38.492 最後は パートナーからの フィードバック プロセスの設定です 00:17:40.399 --> 00:17:43.259 ウィキペディアと異なり ウィキデータは 00:17:43.259 --> 00:17:46.142 目的指向型プロジェクトではありません 00:17:46.142 --> 00:17:48.526 ウィキペディアを訪れて 読む人はいても 00:17:48.526 --> 00:17:52.981 通常は ウィキデータを訪れて 読む人はいません 00:17:52.981 --> 00:17:57.594 そうだと良いですが 現実は違いますね 00:17:57.882 --> 00:18:00.520 私たちのデータの 公開先の多くは 00:18:00.520 --> 00:18:02.719 ウィキデータ自体には ありません 00:18:02.770 --> 00:18:06.838 ウィキペディアや 他の場所を通じて見ることになります 00:18:07.847 --> 00:18:11.967 それらの場所が データに関する フィードバックを得るわけです 00:18:11.967 --> 00:18:14.635 ユーザーはそこに 誤りなどを知らせますからね 00:18:16.775 --> 00:18:19.254 ウィキデータが それを得られるようにして 00:18:19.254 --> 00:18:23.902 実際にウィキデータの編集を行う 皆さんに公開したいのです 00:18:24.374 --> 00:18:27.212 そのための有益な方法を 00:18:27.212 --> 00:18:30.041 皆さんの負担にならないようにしながら 00:18:30.041 --> 00:18:32.802 来年追求していく予定です 00:18:34.623 --> 00:18:37.127 さて ウィキベースのエコシステムです 00:18:37.127 --> 00:18:40.925 私たちは 各図書館と 引き続き協力するだけでなく 00:18:41.055 --> 00:18:46.192 例えば 科学分野などにも 目を向けていきます 00:18:46.278 --> 00:18:49.771 この後 ウィキベースの ショーケースでご紹介しますので 00:18:49.771 --> 00:18:51.751 ご参加ください 00:18:51.751 --> 00:18:52.951 すでに実現したことや 00:18:52.951 --> 00:18:55.852 実際に人々がウィキベースで 行っていることをご紹介します 00:18:55.875 --> 00:18:57.281 価値があります 00:18:57.682 --> 00:19:00.832 ウィキベースのエコシステム周辺には 00:19:00.832 --> 00:19:03.528 良いプロセスを設定することも必要です 00:19:04.384 --> 00:19:06.748 誰に相談すればいいのか 00:19:06.748 --> 00:19:09.494 どこに助けを求めればよいのかなどを 00:19:09.494 --> 00:19:11.831 分かりやすくする必要があります 00:19:13.474 --> 00:19:18.265 またウィキベースのインストールや メンテナンスを容易にする必要もあります 00:19:18.265 --> 00:19:20.228 まだ 少し大変ですから 00:19:21.144 --> 00:19:23.008 最後は フェデレーションです 00:19:23.008 --> 00:19:27.015 これはコモンズ関連で 先ほどもお話したことですが 00:19:27.015 --> 00:19:30.704 コモンズが ウィキデータの 項目やプロパティを使用する際に 00:19:30.704 --> 00:19:33.514 他のウィキベースのインスタンスでも 00:19:33.514 --> 00:19:36.488 ウィキデータの語彙を 使用できます 00:19:37.742 --> 00:19:42.237 先述の通り ここでもまた増加しているため 00:19:42.237 --> 00:19:47.748 ウィキデータの語彙を 外の場所でどう使用するかについては 00:19:47.748 --> 00:19:51.245 以前にも増して 注意を払う必要があります 00:19:53.792 --> 00:19:57.016 ウィキメディアのプロジェクトのための ウィキデータとしては 00:19:57.022 --> 00:20:00.580 Wikidata Bridgeを介した より強い統合や 00:20:00.580 --> 00:20:04.154 プロジェクトからの直接編集のための 支援があります 00:20:04.154 --> 00:20:09.549 それと同時に 皆で一緒に考えるべきことは 00:20:09.549 --> 00:20:14.684 言語の障壁を下げる方法を 見つけることだと思います 00:20:15.484 --> 00:20:19.096 ウィキメディアのプロジェクトで ウィキデータの統合がさらに進めば 00:20:19.096 --> 00:20:21.247 同じ言語を話さなくても 00:20:21.247 --> 00:20:25.705 より多くの人がそのデータについて 話し合う必要が出てきます 00:20:25.705 --> 00:20:31.680 それをどのように行うかを 明らかにしなければなりません 00:20:33.276 --> 00:20:36.634 優れたアイデアを持つ方がいれば お話しできればと思います 00:20:38.790 --> 00:20:41.492 私の講演も終わりに近づきました 00:20:41.618 --> 00:20:44.933 日々 より多くの人により豊富な知識を 利用できるようにしている 00:20:44.933 --> 00:20:46.505 皆さんに感謝しています 00:20:46.510 --> 00:20:48.055 (拍手) 00:20:58.015 --> 00:20:59.902 (司会者)質問の時間を設けます 00:20:59.902 --> 00:21:01.774 会場で質問がある方や 00:21:01.774 --> 00:21:04.975 ライブストリームで ご覧の方…私の母とか 00:21:04.992 --> 00:21:08.072 質問は EtherPadか 00:21:08.072 --> 00:21:11.387 テレグラム チャンネルでどうぞ ベストを尽くします 00:21:11.767 --> 00:21:13.233 ご質問は? 00:21:15.516 --> 00:21:16.655 どうぞ 00:21:21.133 --> 00:21:25.208 (聴衆1)こんにちは 質問というよりミームなんですが 00:21:25.243 --> 00:21:31.751 時間拡張機能は いつ利用できるようになって 00:21:31.751 --> 00:21:35.249 時間、分、秒単位で 設定できる予定ですか 00:21:35.499 --> 00:21:38.078 現在は日付単位しかありません 00:21:38.376 --> 00:21:41.610 - 自分の質問ではないので - (笑) 00:21:41.610 --> 00:21:43.530 ミームだと言ったんです 00:21:44.230 --> 00:21:45.949 いつもこんな具合ですが 00:21:45.949 --> 00:21:48.248 そう伝わってくるので... 00:21:50.001 --> 00:21:52.649 これにはあまり 良い回答ができません 00:21:53.502 --> 00:21:54.685 ごめんなさい 00:21:55.678 --> 00:21:57.986 でも 恐らくその背景としては 00:21:57.986 --> 00:22:03.526 コモンズ上でますます画像表示が 必要とされてきているので 00:22:03.526 --> 00:22:05.758 時間拡張機能を通じて 00:22:05.758 --> 00:22:11.281 早く終わらせる必要がある作業が たくさん出てきているのかもれません 00:22:14.713 --> 00:22:15.975 他にご質問は? 00:22:24.686 --> 00:22:27.655 (聴衆2)ウィキメディア財団 リサーチチームのリンダです 00:22:27.655 --> 00:22:32.500 パトロールについて お考えを聞かせてください 00:22:32.500 --> 00:22:37.763 ウィキデータの品質に関わると思いますが 00:22:37.803 --> 00:22:39.756 それについて お話しいただければ 00:22:39.756 --> 00:22:43.542 短中期的なパトロールの 取り組みの改善だとか 00:22:43.542 --> 00:22:45.557 特に Bridgeプロジェクトに関して 00:22:45.559 --> 00:22:48.147 期待していて 試してみたいのです 00:22:48.147 --> 00:22:49.433 お願いします 00:22:52.298 --> 00:22:56.812 おっしゃるとおり Bridgeで行っていることについて 00:22:58.812 --> 00:23:03.287 パトロールの取り組みは さらに必要だと思います 00:23:04.482 --> 00:23:10.514 しかし 手動や人力で行える規模では なくなっています 00:23:10.922 --> 00:23:14.510 ですから 改善には もっと努力が必要です 00:23:14.510 --> 00:23:18.387 例えばORESなど 機械学習システムを使用すれば 00:23:18.407 --> 00:23:24.588 どの編集で 人間が確認する必要があるか 00:23:24.588 --> 00:23:29.949 通常のことで確認の必要はないかが 分かりやすくなります 00:23:33.777 --> 00:23:38.878 現在 ORESは ウィキデータの編集の優劣を 00:23:38.878 --> 00:23:41.459 判断できるほど 優秀だとは言えません 00:23:41.459 --> 00:23:47.128 現在 機械学習システムを訓練するため 00:23:47.781 --> 00:23:52.260 皆さんの協力を大募集中です 00:23:53.141 --> 00:23:57.040 良い編集と悪い編集を教えていますが 00:23:57.109 --> 00:24:02.998 まだ十分な数の人間が教えたと言える 閾値までは達していません 00:24:02.998 --> 00:24:08.025 これを目覚ましく向上させるために もしお時間があれば 00:24:08.025 --> 00:24:11.098 ORESへの訓練を手伝ってください 00:24:11.098 --> 00:24:13.586 ウィキデータ編集の 評価を向上させるためです 00:24:13.628 --> 00:24:14.702 本当に簡単です 00:24:14.732 --> 00:24:16.568 表示された編集を見て 00:24:16.568 --> 00:24:19.994 あなたはその優劣を 答えるだけです 00:24:20.041 --> 00:24:23.193 ソファーでTVを見ながらでもできます 00:24:25.588 --> 00:24:27.361 (聴衆3)リンクを共有してください 00:24:28.000 --> 00:24:31.059 テレグラムのグループに リンクを共有します 00:24:32.239 --> 00:24:36.239 必要な閾値に達したら― 00:24:36.239 --> 00:24:39.269 約7,000だと思いますが 00:24:40.223 --> 00:24:44.359 ORESの再訓練を行うことで 00:24:44.374 --> 00:24:48.484 ウィキデータの編集の 評価成績を改善できればと思います 00:24:49.909 --> 00:24:52.063 それを皆さんが活用すれば 00:24:52.063 --> 00:24:55.269 例えば 最新の変更を フィルタリングしたり 00:24:55.269 --> 00:24:58.229 監視が必要な編集を 把握したりできます 00:24:59.093 --> 00:25:00.227 はい 00:25:02.739 --> 00:25:03.844 こんにちは 00:25:06.971 --> 00:25:09.876 (聴衆4)好奇心からお聞きします 私の質問ではないですが 00:25:09.884 --> 00:25:12.729 協働パートナーからの質問ですが 00:25:12.729 --> 00:25:16.190 ウィキデータに参加するパートナーが 増えれば増えるほど 00:25:16.190 --> 00:25:19.499 またクエリで いろいろ試せば試すほど 00:25:19.709 --> 00:25:23.119 クエリのタイムアウトという 問題も増えています 00:25:23.147 --> 00:25:25.766 この件にはどう対処しますか? 00:25:27.732 --> 00:25:31.383 ウィキメディア財団のメンバーの一部が その調査をしており 00:25:31.783 --> 00:25:34.023 少しネタをばらしますと 00:25:34.023 --> 00:25:36.988 誕生日プレゼントとして セッションを行う予定です 00:25:37.016 --> 00:25:38.476 (笑) 00:25:43.384 --> 00:25:46.201 (聴衆5)ベルギーから来た バート・マグナスです 00:25:46.201 --> 00:25:49.898 私が知りたいことは フェデレーションの現状です 00:25:49.898 --> 00:25:53.745 ウィキベースのインスタンス内に プロパティを提案していますが 00:25:53.752 --> 00:25:56.887 それについて お話しいただけますか? 00:25:56.898 --> 00:26:00.255 昨年は 数多くの人から 00:26:00.255 --> 00:26:03.091 フェデレーションを 要望されました 00:26:03.996 --> 00:26:06.866 しかし 問題は フェデレーションについての理解が 00:26:06.866 --> 00:26:09.044 人によって異なることです 00:26:10.566 --> 00:26:13.254 簡単にできることもありましたが 00:26:13.254 --> 00:26:15.664 非常に難しい事柄もあります 00:26:16.934 --> 00:26:21.088 私のチームは数多くの人たちと 議論をしてきました 00:26:21.088 --> 00:26:24.775 例えば 図書館における 協働パートナーは 00:26:24.775 --> 00:26:28.776 何を実際に必要としているかなどです 00:26:30.111 --> 00:26:32.743 議論はもう終了したとはいえ 00:26:32.743 --> 00:26:36.866 もちろん ご意見はいつでも歓迎です 00:26:37.850 --> 00:26:40.032 現在の状況は 00:26:40.032 --> 00:26:43.260 基礎はできたと 安心して言える段階です 00:26:44.606 --> 00:26:48.197 今後2、3か月で 00:26:48.197 --> 00:26:51.243 コード記述に着手しますので 00:26:51.243 --> 00:26:53.793 来年の初め頃には 00:26:53.793 --> 00:26:56.533 皆さんがテストできればと思います 00:26:59.661 --> 00:27:01.063 (司会者)最後の質問をどうぞ 00:27:02.457 --> 00:27:05.603 (聴衆6)コペンハーゲンから来た ニールセンです 00:27:05.973 --> 00:27:09.833 他の言語に関して討論がありました 00:27:09.833 --> 00:27:13.617 WikiCiteコミュニティでは 引き続き科学論文を 00:27:13.617 --> 00:27:15.765 増やすべきかどうかを 検討してきたのですが 00:27:15.768 --> 00:27:19.913 これはウィキデータの容量に左右されます 00:27:19.913 --> 00:27:23.032 ウィキデータのクエリサービスの タイムアウトも課題の1つですが 00:27:23.032 --> 00:27:24.746 メンテナンスも課題です 00:27:25.236 --> 00:27:30.300 これについて どのようにお考えですか 00:27:31.060 --> 00:27:33.753 ウィキデータの規模が 00:27:33.753 --> 00:27:36.237 全体の問題の 原因になっているのですか? 00:27:36.237 --> 00:27:38.666 語彙素データを入れるのを やめるべきでしょうか? 00:27:38.666 --> 00:27:42.796 ウィキデータに科学データを 入れるのをやめるか 00:27:42.796 --> 00:27:45.717 調査をすべきでしょうか 00:27:45.717 --> 00:27:50.053 技術的な問題が増えているのでしょうか? 00:27:50.292 --> 00:27:51.445 はい 00:27:53.266 --> 00:27:57.419 ウィキデータは間違いなく 00:27:58.906 --> 00:28:02.732 技術的にも 社会的にもですが 00:28:02.732 --> 00:28:05.975 スケーラビリティの限界が来ています 00:28:05.975 --> 00:28:08.917 双方に解決策が必要ですね? 00:28:09.197 --> 00:28:12.518 社会的には 編集者が増え 00:28:12.518 --> 00:28:15.689 最近は人間がパトロールするには 00:28:15.689 --> 00:28:19.623 あまりにも多すぎる状態に達しています 00:28:21.246 --> 00:28:26.133 しかし 技術的には 対処していることもあります 00:28:26.133 --> 00:28:31.560 データベースのビュー変換テーブル周辺を 再構築するなどして 00:28:31.560 --> 00:28:33.718 いくらか改善できています 00:28:35.900 --> 00:28:38.366 しかし 今のところ 00:28:38.516 --> 00:28:41.903 私たちが来年の課題としたいのは 00:28:41.903 --> 00:28:44.749 他に問題となる個所はどこかを 明らかにして 00:28:44.749 --> 00:28:47.585 それを技術面で どう対処するかです 00:28:49.085 --> 00:28:50.522 これが 全体像です 00:28:50.728 --> 00:28:54.455 そして それと同時に 00:28:54.455 --> 00:28:58.387 「データを入れるのは中止」とは 私は言いたくないのです 00:28:58.400 --> 00:29:02.408 これでは 本来の目的に合いません 00:29:04.311 --> 00:29:07.061 しかし例えば ウィキベースのエコシステムは 00:29:07.061 --> 00:29:09.220 その対応策のひとつだと思います 00:29:09.220 --> 00:29:13.952 ウィキデータに全部は必要ありません 00:29:13.952 --> 00:29:16.267 リンクされたオープンデータの 美点だと思います 00:29:16.267 --> 00:29:18.208 全部を同じ場所に 納めなくてもよいのです 00:29:18.208 --> 00:29:19.811 別の場所を繋ぎ合わせられます 00:29:19.811 --> 00:29:20.859 素晴らしいです 00:29:21.957 --> 00:29:25.338 WikiCitesの周辺では特に 00:29:29.644 --> 00:29:31.495 WikiCitesについては特に 00:29:32.425 --> 00:29:35.936 割合で見る必要があると思います 00:29:36.006 --> 00:29:41.748 WikiCiteトピック周辺で ウィキデータの項目が占める 00:29:41.748 --> 00:29:44.511 具体的な割合は分かりませんが 00:29:44.511 --> 00:29:46.696 かなりの割合だと思います 00:29:46.826 --> 00:29:52.066 これは後で休憩時間に お話ししましょう 00:29:53.191 --> 00:29:54.766 ありがとうございました