1 00:00:00,035 --> 00:00:02,260 [ウィキデータの概要] 2 00:00:02,260 --> 00:00:06,001 [リディア・ピンチャー] [ウィキデータの概要] 3 00:00:06,370 --> 00:00:07,599 皆さん こんにちは 4 00:00:08,338 --> 00:00:11,691 こんなに多くの皆さんに ご参加いただいて 5 00:00:11,691 --> 00:00:13,800 ありがとうございます 6 00:00:14,659 --> 00:00:19,541 このイベントについては リーアがお話ししましたので 7 00:00:19,541 --> 00:00:22,875 私は ウィキデータそのものについて 8 00:00:22,875 --> 00:00:25,796 また 昨年に起きたことと 9 00:00:26,246 --> 00:00:28,151 今後についてお話しします 10 00:00:29,023 --> 00:00:32,974 さて... これは何でしょう 失礼 11 00:00:40,118 --> 00:00:44,243 さて 現状と今後の展望は? 12 00:00:45,500 --> 00:00:49,510 昨年は 祝うべきことが 数多くありましたが 13 00:00:49,510 --> 00:00:52,329 あまり目立たない場合もあったので 14 00:00:52,329 --> 00:00:55,125 いくつかハイライトしたいと思います 15 00:00:56,855 --> 00:01:00,270 まずご紹介したいのは 16 00:01:00,270 --> 00:01:03,985 編集者に関する統計と [編集者] 17 00:01:03,985 --> 00:01:07,119 コンテンツと データの利用度です 18 00:01:10,376 --> 00:01:14,976 昨年の間に コミュニティは大きく成長しました 19 00:01:14,976 --> 00:01:16,720 これは素晴らしいことです 20 00:01:17,371 --> 00:01:21,248 新たに約3,000人が加わり 21 00:01:21,248 --> 00:01:25,963 1か月に1回以上の編集を行いました 22 00:01:26,133 --> 00:01:30,276 3,000人の新規ウィキデータンです! 23 00:01:31,617 --> 00:01:36,764 1か月に5回以上の 編集を行った人を見ると 24 00:01:37,924 --> 00:01:40,727 約1,200人が加わっています 25 00:01:40,995 --> 00:01:44,497 100回以上の 編集を行った人は 26 00:01:44,667 --> 00:01:46,766 この部屋に大勢いると思いますが 27 00:01:47,366 --> 00:01:48,996 300人以上です 28 00:01:49,177 --> 00:01:51,520 最後のグループに該当する人は 手を挙げてください 29 00:01:52,513 --> 00:01:54,289 すごいですね! 30 00:01:54,509 --> 00:01:55,798 皆さん素晴らしい 31 00:01:58,059 --> 00:02:04,761 いつもなら編集の回数に 注目することは 32 00:02:05,751 --> 00:02:08,502 あまりありませんが 33 00:02:08,592 --> 00:02:12,773 今年は なんと 記念すべき10億回を超えました 34 00:02:21,497 --> 00:02:23,506 では コンテンツを見ていきましょう 35 00:02:23,565 --> 00:02:24,795 [コンテンツ] 36 00:02:27,610 --> 00:02:31,222 現在 6,500万もの項目があります 37 00:02:31,462 --> 00:02:33,991 つまり このエンティティで 世界が表わされていて 38 00:02:34,093 --> 00:02:40,541 約6,700のプロパティで それが行われているのです 39 00:02:43,667 --> 00:02:48,079 そのうち 約4,300が 外部識別子です 40 00:02:48,759 --> 00:02:53,280 それが 他の目録や データベースやウェブサイトなどに 41 00:02:53,280 --> 00:02:55,528 多数リンクしており 42 00:02:55,927 --> 00:02:58,265 このことにより ウィキデータが 43 00:02:58,265 --> 00:03:01,594 オープンデータ ウェブにおける 中心地となっています 44 00:03:02,453 --> 00:03:07,241 これらのプロパティや項目を 使用している文は 45 00:03:07,241 --> 00:03:11,990 現在 ウィキデータに約8億あり 46 00:03:11,990 --> 00:03:15,892 前年比では 各項目については 47 00:03:15,892 --> 00:03:18,365 1.5倍に増加しました 48 00:03:18,550 --> 00:03:19,870 (笑) 49 00:03:22,595 --> 00:03:24,970 ウィキデータは賢くなったのです 50 00:03:26,914 --> 00:03:29,482 項目やプロパティだけではなく 51 00:03:29,562 --> 00:03:33,704 語彙素のような新しいものもあり 52 00:03:33,746 --> 00:03:39,133 現在 たくさんの異なる言語で 表されている語彙素が 53 00:03:39,133 --> 00:03:41,860 20万4千もあります 54 00:03:41,939 --> 00:03:43,241 とても良いことです 55 00:03:43,668 --> 00:03:47,539 この詳細は 後のセッションでご説明します 56 00:03:48,860 --> 00:03:52,690 最も新しく追加したのは スキーマで 57 00:03:52,690 --> 00:03:55,678 これにより 特定分野において 58 00:03:56,259 --> 00:04:00,971 データを一貫してモデル化する方法が 理解しやすくなります 59 00:04:02,171 --> 00:04:04,462 これは 現在 約140あります 60 00:04:07,571 --> 00:04:11,492 コンテンツについては 数字が全てではありませんから 61 00:04:11,492 --> 00:04:14,697 コンテンツの量だけでなく 品質にも気を配りましょう 62 00:04:15,613 --> 00:04:21,976 現在は 機械学習システムを訓練して [平均項目品質] 63 00:04:21,976 --> 00:04:24,649 項目の品質を評価しています 64 00:04:25,752 --> 00:04:29,531 完璧には まだ程遠いものの 参考になります 65 00:04:29,776 --> 00:04:35,011 ウィキデータの各項目が 5段階で評価されています 66 00:04:35,011 --> 00:04:37,895 1は極めてひどく 5は優秀ということです 67 00:04:38,446 --> 00:04:41,901 これは 例えば 文の数や 68 00:04:41,901 --> 00:04:44,031 外部識別子の数 69 00:04:44,031 --> 00:04:45,922 出典の数 70 00:04:45,922 --> 00:04:50,242 異なる言語によるラベルの数 などを示します 71 00:04:50,727 --> 00:04:54,904 ウィキデータの推移を見ると 72 00:04:55,118 --> 00:04:59,751 ご覧のように これらのスコアによれば 73 00:04:59,751 --> 00:05:03,753 極めてひどかった評価が かなり向上しています 74 00:05:03,923 --> 00:05:05,233 (笑) 75 00:05:05,649 --> 00:05:07,068 これは良いことです 76 00:05:07,971 --> 00:05:12,260 でも 最高の評価までには まだたくさんの余地があります 77 00:05:13,664 --> 00:05:20,171 これがゴールではありませんね 78 00:05:20,250 --> 00:05:23,072 これらの評価によると 79 00:05:23,072 --> 00:05:26,087 全ての項目が 完璧なわけではありません 80 00:05:26,144 --> 00:05:32,442 しかし データの品質が恒常的に 向上していることをうれしく思います 81 00:05:36,709 --> 00:05:43,111 しかし データを生み出すだけでは 十分ではありません 82 00:05:44,268 --> 00:05:46,734 私たちには 動機が必要です [利用] 83 00:05:46,734 --> 00:05:49,616 データを利用してほしいのです 84 00:05:50,736 --> 00:05:54,530 そこで ウィキデータのデータを 使用している 85 00:05:54,530 --> 00:05:57,973 ウィキメディアの 各プロジェクトにある 86 00:05:57,973 --> 00:06:00,770 記事の数を確認しました 87 00:06:02,040 --> 00:06:06,762 そして これらのプロジェクトにある 全ての記事の割合を見ました 88 00:06:07,395 --> 00:06:09,554 ウィキメディア全体と 89 00:06:09,554 --> 00:06:11,552 その記事全体を見ると 90 00:06:11,989 --> 00:06:18,768 現在では 56.35%の記事が ウィキデータから利用されています 91 00:06:20,054 --> 00:06:21,815 非常に良いと思いますが 92 00:06:21,815 --> 00:06:27,378 100%の利用度に達するには まだ遠い状態です 93 00:06:29,085 --> 00:06:32,690 次に どのプロジェクトが 94 00:06:32,690 --> 00:06:35,977 ウィキデータのデータを 最もよく利用しているかを 95 00:06:36,188 --> 00:06:39,223 言語別などで 分類してみました 96 00:06:39,606 --> 00:06:44,537 全体のうち どのプロジェクトが― 97 00:06:45,577 --> 00:06:48,254 トップ5だと思いますか? 98 00:06:48,254 --> 00:06:50,834 どのプロジェクト群でしょうか? 99 00:06:51,036 --> 00:06:53,467 (何名かの聴衆)コモンズ 100 00:06:53,488 --> 00:06:56,607 皆さん コモンズという回答ですね 101 00:06:57,216 --> 00:06:58,505 違います 102 00:06:58,922 --> 00:07:01,684 トップ5は 全てウィキボヤージュです 103 00:07:02,084 --> 00:07:03,650 へえっ! 104 00:07:05,439 --> 00:07:08,345 ウィキボヤージュに拍手をどうぞ 105 00:07:08,437 --> 00:07:10,280 (拍手) 106 00:07:16,900 --> 00:07:19,259 現在のコモンズの順位や 107 00:07:19,259 --> 00:07:21,863 他のプロジェクトの順位を 確認するには 108 00:07:21,863 --> 00:07:23,521 ダッシュボードがあります 109 00:07:23,521 --> 00:07:25,443 私に聞いてくだされば 確認します 110 00:07:28,049 --> 00:07:32,619 もちろん データが使用されているのは ウィキメディア内だけでなく 111 00:07:32,619 --> 00:07:34,756 その多くは外部です 112 00:07:34,966 --> 00:07:39,256 全部は ご紹介できないので いくつか抜粋したいと思います 113 00:07:39,518 --> 00:07:43,796 メトロポリタン美術館や ウェルカム・トラスト 114 00:07:43,796 --> 00:07:45,257 アメリカ議会図書館 115 00:07:45,257 --> 00:07:47,748 GeneWikiなどで よく利用されています 116 00:07:47,951 --> 00:07:51,296 このプログラムの各セッションに 後ほど参加いただければ 117 00:07:51,296 --> 00:07:53,292 いくつか耳にするはずです 118 00:07:54,523 --> 00:07:56,543 [1年のハイライト] 119 00:07:56,635 --> 00:07:59,287 統計はこれぐらいにしましょう 120 00:07:59,855 --> 00:08:02,171 他のハイライト部分を見ていきます 121 00:08:02,644 --> 00:08:06,249 データ品質の向上については お話ししました 122 00:08:06,897 --> 00:08:10,756 データ品質については 多くの側面がありますので 123 00:08:10,756 --> 00:08:16,426 それを見ていくと そのうちいくつかが向上しており 124 00:08:16,482 --> 00:08:18,980 例えば データの正確性や 125 00:08:18,980 --> 00:08:20,751 データの信頼性 126 00:08:20,751 --> 00:08:22,515 出典の添付度 127 00:08:22,515 --> 00:08:24,865 モデルの一貫性 128 00:08:26,351 --> 00:08:28,992 完成度などがあります 129 00:08:31,263 --> 00:08:35,256 その一例を挙げると 例えば一貫性ですが 130 00:08:35,746 --> 00:08:42,245 ウィキデータにスキーマを 保存できるよう構築しましたので 131 00:08:42,355 --> 00:08:46,553 特定のドメインの モデリング方法を表せます 132 00:08:46,806 --> 00:08:49,971 ここで分かることは― 133 00:08:49,971 --> 00:08:53,497 例えば オランダの画家のための スキーマを作成する場合 134 00:08:53,952 --> 00:08:59,332 オランダの画家のための 項目はどれかを確認できます 135 00:08:59,359 --> 00:09:02,828 例えば 誕生日の項目はないが 追加したほうがいい 136 00:09:02,828 --> 00:09:04,520 というようなことです 137 00:09:05,557 --> 00:09:08,781 より多くのウィキ プロジェクトが 138 00:09:08,781 --> 00:09:11,534 スキーマを活用して 139 00:09:11,534 --> 00:09:14,238 データ管理ができればよいと思います 140 00:09:14,378 --> 00:09:18,096 その方法を知りたい方には この後のセッションで 141 00:09:18,666 --> 00:09:24,512 皆さんの理解が進むよう 詳しい者から説明します 142 00:09:27,575 --> 00:09:28,745 さて 143 00:09:29,022 --> 00:09:30,929 [ウィキベースのエコシステムの成長] 144 00:09:30,929 --> 00:09:37,781 昨年 弾みがついたのは ウィキベースのエコシステムです 145 00:09:37,956 --> 00:09:41,738 その基本概念として オープンデータは 146 00:09:41,738 --> 00:09:45,039 ウィキデータの中だけで 実現するものではありません 147 00:09:45,039 --> 00:09:50,950 さまざまな場所や参加者により エコシステムが成長するのが理想です 148 00:09:51,151 --> 00:09:54,623 例えば 機関や企業 ボランティア プロジェクトが 149 00:09:54,623 --> 00:09:58,325 ウィキデータと同様の方法で データを公開し 150 00:09:58,325 --> 00:10:00,267 そのすべてを結び付けて 151 00:10:00,267 --> 00:10:04,282 当事者の間でデータを交換し データを連携するようなことです 152 00:10:04,282 --> 00:10:08,846 昨年は このことへの関心や 153 00:10:08,846 --> 00:10:10,833 各機関による関心や 154 00:10:10,833 --> 00:10:13,734 自身のウィキベース インスタンスを 稼働する方々による関心が 155 00:10:13,734 --> 00:10:15,265 爆発的に増加しました 156 00:10:15,265 --> 00:10:20,296 特に図書館の分野において 関心が増加しました 157 00:10:23,009 --> 00:10:26,210 数多くのテストや評価を行い 158 00:10:26,226 --> 00:10:29,971 また正直なところ 草分けとも言うべきことを行っていて 159 00:10:29,971 --> 00:10:34,970 先駆的な機関が ウィキデータと一緒になって 160 00:10:35,250 --> 00:10:37,752 ウィキベースがどのように 161 00:10:37,752 --> 00:10:42,243 自分たちのコレクションや目録に 役立つかを調べていました 162 00:10:42,539 --> 00:10:45,024 その中には ドイツ国立図書館や 163 00:10:45,024 --> 00:10:46,419 フランス国立図書館 164 00:10:46,419 --> 00:10:49,699 OCLCという 著名な機関が含まれています 165 00:10:55,278 --> 00:10:57,880 これが素晴らしい理由のひとつは 166 00:10:57,880 --> 00:11:02,868 私たちはこれらの機関のデータを ただウェブに公開して 167 00:11:02,868 --> 00:11:07,914 誰かがアクセスできるように するだけでなく 168 00:11:07,926 --> 00:11:11,747 今後のステップも考えて 手助けしているからです 169 00:11:11,747 --> 00:11:16,963 人々の協力でデータの保持や 蓄積や強化を行うという 170 00:11:17,758 --> 00:11:20,769 大きな変革により 171 00:11:20,769 --> 00:11:24,526 良いものがもたらされることを 願っています 172 00:11:26,041 --> 00:11:28,239 その他 私たちに役立つ事柄は 173 00:11:28,239 --> 00:11:32,621 専門家に自身のスペースで データをキュレートしてもらい 174 00:11:32,621 --> 00:11:34,572 良い状態を保つことです 175 00:11:34,572 --> 00:11:40,714 そうすれば 自分たちだけで 常にデータ処理を行う代わりに 176 00:11:40,714 --> 00:11:45,772 ウィキデータに 同期プロセスを設定できます 177 00:11:46,519 --> 00:11:51,178 最終的には ウィキデータの プレッシャーが軽減され 178 00:11:51,178 --> 00:11:53,959 全てがあるべき状態になればと思います 179 00:11:55,858 --> 00:11:57,618 [辞書学データの今後] 180 00:11:57,620 --> 00:11:59,742 辞書学データについてです 181 00:12:01,962 --> 00:12:09,363 昨年は 利用者の言語による表記を ウィキデータで開始したことで 182 00:12:09,363 --> 00:12:14,534 自動翻訳ツールなどの 開発が可能になりました 183 00:12:16,413 --> 00:12:21,253 また 言語によっては 184 00:12:21,253 --> 00:12:25,500 私たちは 臨界量に 近づき始めているため 185 00:12:25,500 --> 00:12:29,175 本格的なアプリケーションの開発が 必要とされています 186 00:12:29,527 --> 00:12:32,614 多くの言語では まだまだこれからですが 187 00:12:32,614 --> 00:12:35,491 いくつかの言語では そこに到達し始めています 188 00:12:35,491 --> 00:12:37,086 素晴らしいことです 189 00:12:38,621 --> 00:12:41,510 詳細については この後の 私のセッションにご参加ください 190 00:12:41,737 --> 00:12:45,907 [構造化データによるコモンズの改善] 191 00:12:46,064 --> 00:12:48,954 そして もちろん忘れてはいけません 192 00:12:48,954 --> 00:12:50,955 コモンズの構造化データです 193 00:12:52,220 --> 00:12:53,832 やった!(笑) 194 00:12:54,218 --> 00:12:56,228 (拍手) 195 00:12:59,324 --> 00:13:02,258 基盤で見られる コモンズの構造化データは 196 00:13:02,258 --> 00:13:05,571 本当に改善されてきています 197 00:13:07,121 --> 00:13:08,927 全てが統合されることで 198 00:13:10,205 --> 00:13:15,479 昨年コモンズのファイルに 文を追加することが可能になり 199 00:13:15,526 --> 00:13:18,830 皆さんが画像に文を追加し始めて 200 00:13:18,830 --> 00:13:24,230 何よりも より良いアプリケーションを 開発しやすくなりました 201 00:13:24,292 --> 00:13:26,852 この成長を目の当たりにするのは 素晴らしいことです 202 00:13:27,082 --> 00:13:33,039 ウィキデータのコミュニティが ここで理解すべき重要点は 203 00:13:33,051 --> 00:13:36,457 ここでご覧の「表示」 204 00:13:36,491 --> 00:13:41,577 「イエネコ」「座っている」 「トカゲ」「壁」は 205 00:13:41,577 --> 00:13:44,867 ウィキデータの項目やプロパティに リンクされている点です 206 00:13:45,425 --> 00:13:49,620 つまり 項目やプロパティを作成すると 207 00:13:49,620 --> 00:13:54,031 ウィキデータ自身に 語彙が提供されるだけでなく 208 00:13:54,031 --> 00:13:57,749 コモンズにも 語彙が提供されているのです 209 00:13:57,904 --> 00:14:00,695 これは増え続けているので 210 00:14:00,765 --> 00:14:06,686 他の場所での オントロジーや語彙の使用法に 211 00:14:06,686 --> 00:14:09,777 以前にも増して 注意を払う必要があります 212 00:14:11,329 --> 00:14:15,479 [ウィキペディア プロジェクトへの橋渡し] 213 00:14:15,497 --> 00:14:19,228 最後に 私たちは他のウィキメディアの プロジェクトに対して 214 00:14:19,228 --> 00:14:21,902 より強固な関係を築き始めました 215 00:14:23,281 --> 00:14:26,159 Wikidata Bridgeという プロジェクトに 216 00:14:26,159 --> 00:14:28,239 私たちのチームは取り組んでいます 217 00:14:28,239 --> 00:14:32,294 ぜひ UXブースで 現状をお試しください 218 00:14:32,904 --> 00:14:36,240 例えば ウィキペディアの編集者が 219 00:14:36,240 --> 00:14:38,970 自身のプロジェクトから ウィキデータを直接編集できます 220 00:14:38,976 --> 00:14:40,988 ウィキデータで編集しなくても 221 00:14:40,988 --> 00:14:43,958 その周囲を全て理解できるのです 222 00:14:43,958 --> 00:14:47,503 これで またひとつ ハードルが取り除かれ 223 00:14:47,503 --> 00:14:50,755 ウィキメディアのプロジェクトにとって 224 00:14:50,755 --> 00:14:54,492 ウィキデータから データを導入しやすくなるはずです 225 00:14:57,165 --> 00:15:00,924 さて 戦略と今後の展望についてです [戦略と今後の展望] 226 00:15:03,005 --> 00:15:07,179 12月から ウィキメディア ドイツの ウィキデータチームと 227 00:15:07,179 --> 00:15:09,829 ウィキメディア財団が 228 00:15:09,829 --> 00:15:14,573 ウィキデータ関連の 戦略や論文に取り組んでいます 229 00:15:14,573 --> 00:15:19,491 これは基本的に この5年間で すでにお話ししてきたことを 230 00:15:19,526 --> 00:15:22,958 文書にまとめるものです 231 00:15:23,995 --> 00:15:29,492 これらの論文を読まれたかどうか 分かりませんが 232 00:15:29,492 --> 00:15:33,757 Meta Commonsで 今月末まで公開されていますので 233 00:15:33,757 --> 00:15:35,806 まだの方は ぜひ読んでみてください 234 00:15:35,806 --> 00:15:39,019 読んでコメント等をお願いします 235 00:15:40,062 --> 00:15:43,768 さて その簡単な概要ですが 236 00:15:44,338 --> 00:15:50,991 ウィキデータとウィキベースは 3つに分けることができます 237 00:15:51,506 --> 00:15:55,442 1つ目は プラットフォームとしての ウィキデータです 238 00:15:55,442 --> 00:15:57,198 画面下隅でご覧になれます 239 00:15:57,481 --> 00:15:59,266 つまり― 240 00:16:01,193 --> 00:16:03,028 ウィキデータは 241 00:16:03,028 --> 00:16:06,033 あらゆる人が その言語や技術を問わず 242 00:16:06,033 --> 00:16:09,038 情報にアクセスし共有できるよう 243 00:16:09,038 --> 00:16:13,893 世界に関する汎用データを 提供しています 244 00:16:14,479 --> 00:16:18,161 これは基本的に 皆さんが 毎日行っていることですね 245 00:16:21,282 --> 00:16:25,497 2つ目は ウィキベースの エコシステムです 246 00:16:25,497 --> 00:16:27,757 そこでソフトウェアのウィキベースは 247 00:16:27,757 --> 00:16:31,513 ウィキデータを 稼働しているだけでなく 248 00:16:31,513 --> 00:16:35,007 無料のオープン ナレッジを支える オープンデータ ウェブの成長を 249 00:16:35,007 --> 00:16:36,761 推進する力となっています 250 00:16:38,126 --> 00:16:43,165 3つ目は ウィキメディアの プロジェクトのための ウィキデータで 251 00:16:43,255 --> 00:16:45,242 ウィキデータは 252 00:16:45,522 --> 00:16:49,754 ウィキメディアのプロジェクトに 役立つ上に 253 00:16:50,750 --> 00:16:53,759 その今後の備えにも役立っています 254 00:16:57,597 --> 00:17:02,973 では 具体的な短中期の計画は? [プラットフォームとしてのウィキデータ] 255 00:17:04,248 --> 00:17:06,595 プラットフォームとしての ウィキデータについては 256 00:17:06,669 --> 00:17:10,700 データ品質の向上が必要なので 私たちは引き続き 257 00:17:10,700 --> 00:17:14,195 より良いツールのために ツールの改良などを行います 258 00:17:15,193 --> 00:17:18,102 データにアクセスしやすくする 必要もあります 259 00:17:18,899 --> 00:17:23,470 APIの改善や SPARQLエンドポイントの強化 260 00:17:23,470 --> 00:17:27,315 また アプリケーションで 再利用しやすくなるよう 261 00:17:27,315 --> 00:17:31,235 データを着実にモデリングすること などが含まれます 262 00:17:31,867 --> 00:17:38,492 最後は パートナーからの フィードバック プロセスの設定です 263 00:17:40,399 --> 00:17:43,259 ウィキペディアと異なり ウィキデータは 264 00:17:43,259 --> 00:17:46,142 目的指向型プロジェクトではありません 265 00:17:46,142 --> 00:17:48,526 ウィキペディアを訪れて 読む人はいても 266 00:17:48,526 --> 00:17:52,981 通常は ウィキデータを訪れて 読む人はいません 267 00:17:52,981 --> 00:17:57,594 そうだと良いですが 現実は違いますね 268 00:17:57,882 --> 00:18:00,520 私たちのデータの 公開先の多くは 269 00:18:00,520 --> 00:18:02,719 ウィキデータ自体には ありません 270 00:18:02,770 --> 00:18:06,838 ウィキペディアや 他の場所を通じて見ることになります 271 00:18:07,847 --> 00:18:11,967 それらの場所が データに関する フィードバックを得るわけです 272 00:18:11,967 --> 00:18:14,635 ユーザーはそこに 誤りなどを知らせますからね 273 00:18:16,775 --> 00:18:19,254 ウィキデータが それを得られるようにして 274 00:18:19,254 --> 00:18:23,902 実際にウィキデータの編集を行う 皆さんに公開したいのです 275 00:18:24,374 --> 00:18:27,212 そのための有益な方法を 276 00:18:27,212 --> 00:18:30,041 皆さんの負担にならないようにしながら 277 00:18:30,041 --> 00:18:32,802 来年追求していく予定です 278 00:18:34,623 --> 00:18:37,127 さて ウィキベースのエコシステムです 279 00:18:37,127 --> 00:18:40,925 私たちは 各図書館と 引き続き協力するだけでなく 280 00:18:41,055 --> 00:18:46,192 例えば 科学分野などにも 目を向けていきます 281 00:18:46,278 --> 00:18:49,771 この後 ウィキベースの ショーケースでご紹介しますので 282 00:18:49,771 --> 00:18:51,751 ご参加ください 283 00:18:51,751 --> 00:18:52,951 すでに実現したことや 284 00:18:52,951 --> 00:18:55,852 実際に人々がウィキベースで 行っていることをご紹介します 285 00:18:55,875 --> 00:18:57,281 価値があります 286 00:18:57,682 --> 00:19:00,832 ウィキベースのエコシステム周辺には 287 00:19:00,832 --> 00:19:03,528 良いプロセスを設定することも必要です 288 00:19:04,384 --> 00:19:06,748 誰に相談すればいいのか 289 00:19:06,748 --> 00:19:09,494 どこに助けを求めればよいのかなどを 290 00:19:09,494 --> 00:19:11,831 分かりやすくする必要があります 291 00:19:13,474 --> 00:19:18,265 またウィキベースのインストールや メンテナンスを容易にする必要もあります 292 00:19:18,265 --> 00:19:20,228 まだ 少し大変ですから 293 00:19:21,144 --> 00:19:23,008 最後は フェデレーションです 294 00:19:23,008 --> 00:19:27,015 これはコモンズ関連で 先ほどもお話したことですが 295 00:19:27,015 --> 00:19:30,704 コモンズが ウィキデータの 項目やプロパティを使用する際に 296 00:19:30,704 --> 00:19:33,514 他のウィキベースのインスタンスでも 297 00:19:33,514 --> 00:19:36,488 ウィキデータの語彙を 使用できます 298 00:19:37,742 --> 00:19:42,237 先述の通り ここでもまた増加しているため 299 00:19:42,237 --> 00:19:47,748 ウィキデータの語彙を 外の場所でどう使用するかについては 300 00:19:47,748 --> 00:19:51,245 以前にも増して 注意を払う必要があります 301 00:19:53,792 --> 00:19:57,016 ウィキメディアのプロジェクトのための ウィキデータとしては 302 00:19:57,022 --> 00:20:00,580 Wikidata Bridgeを介した より強い統合や 303 00:20:00,580 --> 00:20:04,154 プロジェクトからの直接編集のための 支援があります 304 00:20:04,154 --> 00:20:09,549 それと同時に 皆で一緒に考えるべきことは 305 00:20:09,549 --> 00:20:14,684 言語の障壁を下げる方法を 見つけることだと思います 306 00:20:15,484 --> 00:20:19,096 ウィキメディアのプロジェクトで ウィキデータの統合がさらに進めば 307 00:20:19,096 --> 00:20:21,247 同じ言語を話さなくても 308 00:20:21,247 --> 00:20:25,705 より多くの人がそのデータについて 話し合う必要が出てきます 309 00:20:25,705 --> 00:20:31,680 それをどのように行うかを 明らかにしなければなりません 310 00:20:33,276 --> 00:20:36,634 優れたアイデアを持つ方がいれば お話しできればと思います 311 00:20:38,790 --> 00:20:41,492 私の講演も終わりに近づきました 312 00:20:41,618 --> 00:20:44,933 日々 より多くの人により豊富な知識を 利用できるようにしている 313 00:20:44,933 --> 00:20:46,505 皆さんに感謝しています 314 00:20:46,510 --> 00:20:48,055 (拍手) 315 00:20:58,015 --> 00:20:59,902 (司会者)質問の時間を設けます 316 00:20:59,902 --> 00:21:01,774 会場で質問がある方や 317 00:21:01,774 --> 00:21:04,975 ライブストリームで ご覧の方…私の母とか 318 00:21:04,992 --> 00:21:08,072 質問は EtherPadか 319 00:21:08,072 --> 00:21:11,387 テレグラム チャンネルでどうぞ ベストを尽くします 320 00:21:11,767 --> 00:21:13,233 ご質問は? 321 00:21:15,516 --> 00:21:16,655 どうぞ 322 00:21:21,133 --> 00:21:25,208 (聴衆1)こんにちは 質問というよりミームなんですが 323 00:21:25,243 --> 00:21:31,751 時間拡張機能は いつ利用できるようになって 324 00:21:31,751 --> 00:21:35,249 時間、分、秒単位で 設定できる予定ですか 325 00:21:35,499 --> 00:21:38,078 現在は日付単位しかありません 326 00:21:38,376 --> 00:21:41,610 - 自分の質問ではないので - (笑) 327 00:21:41,610 --> 00:21:43,530 ミームだと言ったんです 328 00:21:44,230 --> 00:21:45,949 いつもこんな具合ですが 329 00:21:45,949 --> 00:21:48,248 そう伝わってくるので... 330 00:21:50,001 --> 00:21:52,649 これにはあまり 良い回答ができません 331 00:21:53,502 --> 00:21:54,685 ごめんなさい 332 00:21:55,678 --> 00:21:57,986 でも 恐らくその背景としては 333 00:21:57,986 --> 00:22:03,526 コモンズ上でますます画像表示が 必要とされてきているので 334 00:22:03,526 --> 00:22:05,758 時間拡張機能を通じて 335 00:22:05,758 --> 00:22:11,281 早く終わらせる必要がある作業が たくさん出てきているのかもれません 336 00:22:14,713 --> 00:22:15,975 他にご質問は? 337 00:22:24,686 --> 00:22:27,655 (聴衆2)ウィキメディア財団 リサーチチームのリンダです 338 00:22:27,655 --> 00:22:32,500 パトロールについて お考えを聞かせてください 339 00:22:32,500 --> 00:22:37,763 ウィキデータの品質に関わると思いますが 340 00:22:37,803 --> 00:22:39,756 それについて お話しいただければ 341 00:22:39,756 --> 00:22:43,542 短中期的なパトロールの 取り組みの改善だとか 342 00:22:43,542 --> 00:22:45,557 特に Bridgeプロジェクトに関して 343 00:22:45,559 --> 00:22:48,147 期待していて 試してみたいのです 344 00:22:48,147 --> 00:22:49,433 お願いします 345 00:22:52,298 --> 00:22:56,812 おっしゃるとおり Bridgeで行っていることについて 346 00:22:58,812 --> 00:23:03,287 パトロールの取り組みは さらに必要だと思います 347 00:23:04,482 --> 00:23:10,514 しかし 手動や人力で行える規模では なくなっています 348 00:23:10,922 --> 00:23:14,510 ですから 改善には もっと努力が必要です 349 00:23:14,510 --> 00:23:18,387 例えばORESなど 機械学習システムを使用すれば 350 00:23:18,407 --> 00:23:24,588 どの編集で 人間が確認する必要があるか 351 00:23:24,588 --> 00:23:29,949 通常のことで確認の必要はないかが 分かりやすくなります 352 00:23:33,777 --> 00:23:38,878 現在 ORESは ウィキデータの編集の優劣を 353 00:23:38,878 --> 00:23:41,459 判断できるほど 優秀だとは言えません 354 00:23:41,459 --> 00:23:47,128 現在 機械学習システムを訓練するため 355 00:23:47,781 --> 00:23:52,260 皆さんの協力を大募集中です 356 00:23:53,141 --> 00:23:57,040 良い編集と悪い編集を教えていますが 357 00:23:57,109 --> 00:24:02,998 まだ十分な数の人間が教えたと言える 閾値までは達していません 358 00:24:02,998 --> 00:24:08,025 これを目覚ましく向上させるために もしお時間があれば 359 00:24:08,025 --> 00:24:11,098 ORESへの訓練を手伝ってください 360 00:24:11,098 --> 00:24:13,586 ウィキデータ編集の 評価を向上させるためです 361 00:24:13,628 --> 00:24:14,702 本当に簡単です 362 00:24:14,732 --> 00:24:16,568 表示された編集を見て 363 00:24:16,568 --> 00:24:19,994 あなたはその優劣を 答えるだけです 364 00:24:20,041 --> 00:24:23,193 ソファーでTVを見ながらでもできます 365 00:24:25,588 --> 00:24:27,361 (聴衆3)リンクを共有してください 366 00:24:28,000 --> 00:24:31,059 テレグラムのグループに リンクを共有します 367 00:24:32,239 --> 00:24:36,239 必要な閾値に達したら― 368 00:24:36,239 --> 00:24:39,269 約7,000だと思いますが 369 00:24:40,223 --> 00:24:44,359 ORESの再訓練を行うことで 370 00:24:44,374 --> 00:24:48,484 ウィキデータの編集の 評価成績を改善できればと思います 371 00:24:49,909 --> 00:24:52,063 それを皆さんが活用すれば 372 00:24:52,063 --> 00:24:55,269 例えば 最新の変更を フィルタリングしたり 373 00:24:55,269 --> 00:24:58,229 監視が必要な編集を 把握したりできます 374 00:24:59,093 --> 00:25:00,227 はい 375 00:25:02,739 --> 00:25:03,844 こんにちは 376 00:25:06,971 --> 00:25:09,876 (聴衆4)好奇心からお聞きします 私の質問ではないですが 377 00:25:09,884 --> 00:25:12,729 協働パートナーからの質問ですが 378 00:25:12,729 --> 00:25:16,190 ウィキデータに参加するパートナーが 増えれば増えるほど 379 00:25:16,190 --> 00:25:19,499 またクエリで いろいろ試せば試すほど 380 00:25:19,709 --> 00:25:23,119 クエリのタイムアウトという 問題も増えています 381 00:25:23,147 --> 00:25:25,766 この件にはどう対処しますか? 382 00:25:27,732 --> 00:25:31,383 ウィキメディア財団のメンバーの一部が その調査をしており 383 00:25:31,783 --> 00:25:34,023 少しネタをばらしますと 384 00:25:34,023 --> 00:25:36,988 誕生日プレゼントとして セッションを行う予定です 385 00:25:37,016 --> 00:25:38,476 (笑) 386 00:25:43,384 --> 00:25:46,201 (聴衆5)ベルギーから来た バート・マグナスです 387 00:25:46,201 --> 00:25:49,898 私が知りたいことは フェデレーションの現状です 388 00:25:49,898 --> 00:25:53,745 ウィキベースのインスタンス内に プロパティを提案していますが 389 00:25:53,752 --> 00:25:56,887 それについて お話しいただけますか? 390 00:25:56,898 --> 00:26:00,255 昨年は 数多くの人から 391 00:26:00,255 --> 00:26:03,091 フェデレーションを 要望されました 392 00:26:03,996 --> 00:26:06,866 しかし 問題は フェデレーションについての理解が 393 00:26:06,866 --> 00:26:09,044 人によって異なることです 394 00:26:10,566 --> 00:26:13,254 簡単にできることもありましたが 395 00:26:13,254 --> 00:26:15,664 非常に難しい事柄もあります 396 00:26:16,934 --> 00:26:21,088 私のチームは数多くの人たちと 議論をしてきました 397 00:26:21,088 --> 00:26:24,775 例えば 図書館における 協働パートナーは 398 00:26:24,775 --> 00:26:28,776 何を実際に必要としているかなどです 399 00:26:30,111 --> 00:26:32,743 議論はもう終了したとはいえ 400 00:26:32,743 --> 00:26:36,866 もちろん ご意見はいつでも歓迎です 401 00:26:37,850 --> 00:26:40,032 現在の状況は 402 00:26:40,032 --> 00:26:43,260 基礎はできたと 安心して言える段階です 403 00:26:44,606 --> 00:26:48,197 今後2、3か月で 404 00:26:48,197 --> 00:26:51,243 コード記述に着手しますので 405 00:26:51,243 --> 00:26:53,793 来年の初め頃には 406 00:26:53,793 --> 00:26:56,533 皆さんがテストできればと思います 407 00:26:59,661 --> 00:27:01,063 (司会者)最後の質問をどうぞ 408 00:27:02,457 --> 00:27:05,603 (聴衆6)コペンハーゲンから来た ニールセンです 409 00:27:05,973 --> 00:27:09,833 他の言語に関して討論がありました 410 00:27:09,833 --> 00:27:13,617 WikiCiteコミュニティでは 引き続き科学論文を 411 00:27:13,617 --> 00:27:15,765 増やすべきかどうかを 検討してきたのですが 412 00:27:15,768 --> 00:27:19,913 これはウィキデータの容量に左右されます 413 00:27:19,913 --> 00:27:23,032 ウィキデータのクエリサービスの タイムアウトも課題の1つですが 414 00:27:23,032 --> 00:27:24,746 メンテナンスも課題です 415 00:27:25,236 --> 00:27:30,300 これについて どのようにお考えですか 416 00:27:31,060 --> 00:27:33,753 ウィキデータの規模が 417 00:27:33,753 --> 00:27:36,237 全体の問題の 原因になっているのですか? 418 00:27:36,237 --> 00:27:38,666 語彙素データを入れるのを やめるべきでしょうか? 419 00:27:38,666 --> 00:27:42,796 ウィキデータに科学データを 入れるのをやめるか 420 00:27:42,796 --> 00:27:45,717 調査をすべきでしょうか 421 00:27:45,717 --> 00:27:50,053 技術的な問題が増えているのでしょうか? 422 00:27:50,292 --> 00:27:51,445 はい 423 00:27:53,266 --> 00:27:57,419 ウィキデータは間違いなく 424 00:27:58,906 --> 00:28:02,732 技術的にも 社会的にもですが 425 00:28:02,732 --> 00:28:05,975 スケーラビリティの限界が来ています 426 00:28:05,975 --> 00:28:08,917 双方に解決策が必要ですね? 427 00:28:09,197 --> 00:28:12,518 社会的には 編集者が増え 428 00:28:12,518 --> 00:28:15,689 最近は人間がパトロールするには 429 00:28:15,689 --> 00:28:19,623 あまりにも多すぎる状態に達しています 430 00:28:21,246 --> 00:28:26,133 しかし 技術的には 対処していることもあります 431 00:28:26,133 --> 00:28:31,560 データベースのビュー変換テーブル周辺を 再構築するなどして 432 00:28:31,560 --> 00:28:33,718 いくらか改善できています 433 00:28:35,900 --> 00:28:38,366 しかし 今のところ 434 00:28:38,516 --> 00:28:41,903 私たちが来年の課題としたいのは 435 00:28:41,903 --> 00:28:44,749 他に問題となる個所はどこかを 明らかにして 436 00:28:44,749 --> 00:28:47,585 それを技術面で どう対処するかです 437 00:28:49,085 --> 00:28:50,522 これが 全体像です 438 00:28:50,728 --> 00:28:54,455 そして それと同時に 439 00:28:54,455 --> 00:28:58,387 「データを入れるのは中止」とは 私は言いたくないのです 440 00:28:58,400 --> 00:29:02,408 これでは 本来の目的に合いません 441 00:29:04,311 --> 00:29:07,061 しかし例えば ウィキベースのエコシステムは 442 00:29:07,061 --> 00:29:09,220 その対応策のひとつだと思います 443 00:29:09,220 --> 00:29:13,952 ウィキデータに全部は必要ありません 444 00:29:13,952 --> 00:29:16,267 リンクされたオープンデータの 美点だと思います 445 00:29:16,267 --> 00:29:18,208 全部を同じ場所に 納めなくてもよいのです 446 00:29:18,208 --> 00:29:19,811 別の場所を繋ぎ合わせられます 447 00:29:19,811 --> 00:29:20,859 素晴らしいです 448 00:29:21,957 --> 00:29:25,338 WikiCitesの周辺では特に 449 00:29:29,644 --> 00:29:31,495 WikiCitesについては特に 450 00:29:32,425 --> 00:29:35,936 割合で見る必要があると思います 451 00:29:36,006 --> 00:29:41,748 WikiCiteトピック周辺で ウィキデータの項目が占める 452 00:29:41,748 --> 00:29:44,511 具体的な割合は分かりませんが 453 00:29:44,511 --> 00:29:46,696 かなりの割合だと思います 454 00:29:46,826 --> 00:29:52,066 これは後で休憩時間に お話ししましょう 455 00:29:53,191 --> 00:29:54,766 ありがとうございました