0:00:00.822,0:00:03.472 データクオリティパネル 0:00:03.748,0:00:05.098 クロディア・ミューラービン、[br]ルーカス・ウェアミニスター 0:00:05.098,0:00:06.671 ホゼ・エミリオ・ラビラ・ガヤ、[br]クリスティナ・サラスナ、アンドレア・ 0:00:06.671,0:00:09.476 データクオリティパネルの皆さん[br]こんにちは 0:00:09.658,0:00:15.761 多くの人が私たちのデータが正しいことを[br]頼るのでデータクオリティは重要です 0:00:15.761,0:00:19.289 だからデータクオリティについて[br]話し合いましょう 0:00:20.029,0:00:26.000 4人の講演者は[br]データクオリティについて短い紹介をし 0:00:26.000,0:00:29.539 その後で質疑を行います 0:00:30.130,0:00:32.234 ではまずルーカスから 0:00:34.385,0:00:35.385 ありがとう 0:00:35.901,0:00:39.899 ルーカスです[br]まずウィキデータに既にある 0:00:39.899,0:00:43.806 データクオリティツールと[br]開発されていて公開マジかなものについての 0:00:43.807,0:00:46.109 概要から始めます 0:00:46.932,0:00:50.623 いくつかのテーマの[br]グループに分けました 0:00:50.623,0:00:53.761 エラーを見つけやすくする[br]問題に対処しやすくする 0:00:53.762,0:00:56.322 データにより検証し[br]問題に気づきやすくする 0:00:56.945,0:01:02.616 一般的なエラーの元を修正する[br]既存のデータの質を維持する 0:01:02.616,0:01:04.846 そして人によるキューレーション 0:01:05.063,0:01:09.874 そして現在利用可能なものは[br]プロパティの拘束からです 0:01:10.138,0:01:12.421 ウィキデータで[br]これを見たことがあると思います 0:01:12.422,0:01:15.130 このような[br]内部のデータの均一性をチェックする 0:01:15.130,0:01:17.241 アイコンが出ることがあるでしょう 0:01:17.242,0:01:20.800 例えば[br]あるイベントが他に続くなら 0:01:20.801,0:01:23.760 他のイベントもこのイベントに[br]続くべきです 0:01:23.761,0:01:27.161 このWikidataConの項目では[br]それが見られません 0:01:27.162,0:01:29.360 この機能はできてまだ数日かも[br]しれません 0:01:30.040,0:01:34.461 あるいはこれが制限しすぎだったり[br]簡単すぎなら 0:01:34.461,0:01:38.080 Query Service を使って[br]チェックを自分で書くこともできます 0:01:38.081,0:01:41.892 もちろんQuery Serviceは[br]多くのことに有効ですが 0:01:41.892,0:01:44.543 エラーを見つけることもできます 0:01:44.794,0:01:46.974 ひとつ間違いを見つけたら 0:01:46.975,0:01:49.539 他の場所もチェックし 0:01:49.539,0:01:51.608 他の人が同じエラーをしていないか 0:01:51.608,0:01:53.708 Query Serviceで見つけられます 0:01:53.708,0:01:55.259 あるいは2つを組み合わせて 0:01:55.259,0:01:57.874 拘束違反を[br]Query Serviceで探せます 0:01:57.875,0:02:00.910 例えば[br]ある部分にだけあるエラーや 0:02:00.910,0:02:04.122 WikiProjectの[br]あなたの関連した部分だけのエラーなどです 0:02:04.272,0:02:07.828 でも残念なことに[br]その結果は現在のところ完全ではありません 0:02:08.422,0:02:09.877 改訂スコアリングもあります 0:02:10.690,0:02:13.186 これは最近の変更からだけ思いますが 0:02:13.186,0:02:16.217 自動アセスメントのウォッチリストに入れて 0:02:16.217,0:02:19.949 その編集が誠実なものかどうか 0:02:19.949,0:02:22.629 また被害を与えるものかどうかを[br]見ることができます 0:02:22.629,0:02:24.205 これは2次元だと思います 0:02:24.206,0:02:26.426 だから被害を与えるけど 0:02:26.426,0:02:29.898 誠実なものかどうかに注目して 0:02:29.899,0:02:32.523 特に友好的な気分なら 0:02:32.524,0:02:35.293 これらの編集者に 0:02:35.293,0:02:39.470 「貢献してくれてありがとう[br]次回はこのようにしてください」など… 0:02:40.561,0:02:42.186 でもそうでなければ 0:02:42.187,0:02:44.452 誠実でないものや[br]被害を与えるものを 0:02:44.453,0:02:46.660 元に戻すこともできます 0:02:47.544,0:02:49.761 似たものに[br]エンティティ・スコアリングがあり 0:02:49.762,0:02:52.350 これは変更が加えられた[br]編集をスコアリングするのはなく 0:02:52.350,0:02:53.904 全体の改訂をスコアリングします 0:02:53.904,0:02:56.483 これにはリディアは会議の当初に[br]話したのと 0:02:56.483,0:02:59.863 同じ質の検証が使用されると[br]思います 0:03:00.372,0:03:04.569 このユーザースクリプトで[br]これらの1から5のスコアを与えます 0:03:04.570,0:03:08.176 これは現在の項目のクオリティだと[br]思います 0:03:10.043,0:03:14.328 1次資料ツールは[br]すべてのインポートしたい、しかし 0:03:14.328,0:03:18.374 直接ウィキデータに入れられる質でない[br]データベースのためのものです 0:03:18.374,0:03:20.335 だからこれを1次資料ツールで[br]処理し 0:03:20.336,0:03:22.956 それから実際に人が判断し 0:03:22.956,0:03:26.024 個々のステートメントを[br]加えるかどうかを決めます 0:03:28.595,0:03:31.901 座標を地図で示すことは[br]とても便利な機能ですが 0:03:31.901,0:03:33.928 クオリティコントロールにも[br]有用です 0:03:33.928,0:03:36.937 これがウィキデータ・ドイツの[br]オフィスのはずで 0:03:36.938,0:03:39.400 座標がインド海の中にあれば 0:03:39.401,0:03:41.529 何か間違っていると気が付きます 0:03:41.530,0:03:44.790 単に数字を見るより[br]簡単にわかります 0:03:46.133,0:03:49.576 これは 相対的完全性[br]インディケータというガジェットで 0:03:49.577,0:03:52.480 この小さなアイコンで示され 0:03:53.007,0:03:55.652 その項目が完成しているかどうか 0:03:55.652,0:03:57.858 あるいはどのプロパティが[br]欠けていそうかを示し 0:03:57.858,0:04:00.209 項目を編集しているときに便利なもので 0:04:00.209,0:04:03.172 もし馴染みない分野で 0:04:03.172,0:04:05.661 使うべき正確なプロパティが[br]わからないときには 0:04:05.662,0:04:08.230 とても便利なガジェットです 0:04:08.774,0:04:11.971 Shape Expression があります 0:04:11.971,0:04:15.624 アンドレアかホゼが[br]これらについてお話すると思いますが 0:04:15.624,0:04:19.137 基本的には[br]持っているデータをそのテーマに対して 0:04:19.137,0:04:21.258 比較するためのとても有効な方法です 0:04:21.258,0:04:23.570 どのステートメントが[br]特定のエンティティを持つべきか 0:04:23.570,0:04:25.867 他のエンティティがリンクされるべきか[br]どのように完成されるべきか 0:04:26.229,0:04:29.374 それによって間違いを見つけることができます 0:04:30.366,0:04:32.181 えーと[br]これですね 0:04:32.181,0:04:34.696 Integraality または[br]プロパティ・ダッシュボード 0:04:34.696,0:04:36.953 既にあるデータの概要を示します 0:04:36.953,0:04:39.657 例えば WikiProject Red Pandaの[br]このフォームで 0:04:39.657,0:04:41.681 ここにほとんどすべての赤パンダの 0:04:41.682,0:04:43.561 性別があるのかわかります 0:04:43.561,0:04:46.854 誕生日はどこの動物園かによって[br]かなり変わります 0:04:46.854,0:04:50.255 亡くなったパンダは[br]ほとんどいないですね 0:04:50.317,0:04:52.600 よっかた[br]かわいいからね 0:04:53.699,0:04:55.654 これはとても便利です 0:04:56.377,0:04:59.185 そしてOKすると[br]次に出てくるのは 0:04:59.889,0:05:03.784 ウィキデータ Bridge[br]クライアント編集として知られているものです 0:05:03.785,0:05:07.076 ウィキピディア Infobox から[br]ウィキデータを編集します 0:05:07.675,0:05:11.395 これによりより多くの[br]閲覧がなされます 0:05:11.395,0:05:14.302 なぜならもっと多くの人が[br]これらのデータを見るからです 0:05:14.302,0:05:18.841 これによってウィキピディアでより[br]ウィキデータが使われるようになるでしょう 0:05:18.841,0:05:21.420 そしてもっと多くの人に気づかれるように[br]なるでしょう 0:05:21.420,0:05:23.857 例えばデータが古かったり[br]更新が必要なときは 0:05:23.857,0:05:27.000 ウィキデータ自体だけで気が付かれないことを[br]知ることができます 0:05:28.380,0:05:30.656 Tainted Referencesもあります 0:05:30.657,0:05:34.679 これはステートメントの値を編集すると 0:05:34.683,0:05:37.279 タイポなどを直している場合は[br]別として 0:05:37.280,0:05:39.373 リファレンスも更新することがあるでしょう 0:05:39.897,0:05:43.662 このTainted Referencesは[br]編集している人にそれを示す他に 0:05:43.663,0:05:49.756 他の編集者にも他に[br]どのような編集がされたか示します 0:05:49.756,0:05:53.241 ステートメントの値が変更され[br]リファレンスが更新されているいないを知り 0:05:53.241,0:05:57.666 それらを修正するか[br]どうするかを決めることができます 0:05:57.737,0:05:59.566 もっと修正を入れるか 0:05:59.566,0:06:02.796 そのままでリファレンス更新は[br]必要がないとか… 0:06:03.543,0:06:09.336 これはSigned statementsに関して 0:06:09.336,0:06:12.355 データの提供者が心配する… 0:06:14.131,0:06:17.231 UNESCOかなにかが参照された[br]ステートメントがあり 0:06:17.232,0:06:19.872 突然 誰かがそのステートメントに[br]損傷を加えたら 0:06:19.873,0:06:22.827 UNESCOなどの機関が 0:06:22.827,0:06:26.992 その損傷されたステートメントを[br]出したように見られる恐れがあります 0:06:26.993,0:06:28.706 だからSigned statementsは 0:06:28.706,0:06:31.488 暗号的にこのリファレンスに[br]サインを入れることができます 0:06:31.488,0:06:33.562 編集を防ぐことはできません 0:06:34.169,0:06:37.744 でも少なくとも[br]誰かがステートメントを損傷するか 0:06:37.744,0:06:40.255 あるいは編集したりすると[br]サインは無効になります 0:06:40.255,0:06:43.851 そしてそのステートメントが[br]その機関が入れたものでないとわかります 0:06:43.851,0:06:47.484 もし正しい編集なら そのステートメントを[br]再度サインすることができます 0:06:47.484,0:06:49.851 または編集しなおすことができます 0:06:51.203,0:06:54.166 それから[br]素晴らしいものとして 0:06:54.166,0:06:56.846 Citoidがウィキデータにはあります 0:06:57.379,0:07:01.340 これにはURLを貼り付けたり[br]識別子 またはISBN 0:07:01.340,0:07:05.260 ウィキデータIDなど 基本的に[br]何でもVisual Editorに入れられ 0:07:05.260,0:07:08.241 きれいにフォーマットされた[br]リファレンスを作成し 0:07:08.242,0:07:11.049 それにはすべてのデータが含まれていて[br]とても使いやすいです 0:07:11.049,0:07:14.337 それに比べてウィキデータでは [br]リファレンスを入れたければ 0:07:14.338,0:07:18.801 リファレンスURLとタイトル[br]著作者名 0:07:18.802,0:07:20.449 出版元、出版日 0:07:20.450,0:07:25.141 改訂日などを少なくとも加える必要があり[br]とても厄介です 0:07:25.141,0:07:29.261 ウィキデータにCitoidを統合することで[br]それが簡単になります 0:07:30.245,0:07:33.604 私は以上です 0:07:33.604,0:07:36.400 ではクリスティーナに渡します 0:07:37.788,0:07:42.339 (拍手) 0:07:43.780,0:07:45.471 クリスティーナです 0:07:45.472,0:07:47.672 チューリッヒ大学の研究員で 0:07:47.673,0:07:51.417 スイスのコミュニティの[br]活動者でもあります 0:07:51.557,0:07:57.658 クラウディア・ミューラーと私が[br]WikidataConにこれを提示した際 0:07:57.658,0:08:01.278 期待したことは[br]今年の始めに 0:08:01.278,0:08:05.250 データクオリティのワークショップや[br]その他のウィキマニアのセッションで 0:08:05.250,0:08:07.650 始めた議論を継続していくことです 0:08:07.650,0:08:09.204 今日の講演は基本的に 0:08:09.204,0:08:11.482 コミュニティと私達が[br]集めた考察を提供し 0:08:11.482,0:08:16.645 会話を続けていくことが目的です 0:08:16.645,0:08:20.932 これからみなさんと交流を[br]続けていきたいと思います 0:08:20.932,0:08:23.690 私達がもっと重要と思うのは 0:08:23.690,0:08:26.167 コミュニティの様々なユーザーに 0:08:26.167,0:08:32.471 何が必要か そしてデータクオリティの[br]問題が何かを問い続けることです 0:08:32.471,0:08:34.730 編集する人たちだけでなく[br]コードを書く人や 0:08:34.730,0:08:36.510 データを利用する人 0:08:36.510,0:08:40.220 また何が起こったか編集履歴を[br]実際 利用する研究者など 0:08:40.220,0:08:41.691 すべてのユーザーを含みます 0:08:42.571,0:08:47.614 ウィキデータに存在する約80の[br]ツールを評価し 0:08:47.614,0:08:52.826 それらを異なったデータクオリティの次元で[br]整理しました 0:08:52.826,0:08:54.241 実際に気がついたことは 0:08:54.241,0:08:57.780 多くのツールは[br]完成性をモニターしていて 0:08:57.780,0:09:02.960 実際…インターリンクを[br]可能にするものもありますが 0:09:02.960,0:09:08.241 多様性を検証するツールが[br]欠けていて 0:09:08.241,0:09:13.750 これは実際ウィキデータに[br]特にウィキデータのデザイン原則に 0:09:13.750,0:09:15.932 組み込めるもののひとつで 0:09:15.932,0:09:17.297 多様性をもたせ 0:09:17.297,0:09:19.818 異なった出典からの 0:09:19.818,0:09:22.491 異なった値の[br]異なったステートメントを含めます 0:09:22.491,0:09:24.384 これらは2次資料になるので 0:09:24.384,0:09:26.546 実際どれだけの複数の[br]ステートメントがあるか 0:09:26.546,0:09:31.291 どのように どれだけを向上できるか等を[br]示すツールはありません 0:09:31.291,0:09:33.200 また多様なステートメントが存在する 0:09:33.200,0:09:35.451 理由もよくわかりません 0:09:36.191,0:09:39.963 だからこれらのコミュニティでの[br]ディスカッションから 0:09:39.963,0:09:43.271 まだ注目すべきチャレンジが[br]浮き上がってきました 0:09:43.271,0:09:47.538 例えばこれらのクラウドソーシングの[br]コミュニティがあることは 0:09:47.538,0:09:50.914 データやグラフの異なった部分に 0:09:50.914,0:09:53.539 取り組む異なったグループの人々がいて 0:09:53.539,0:09:57.053 また異なったバックグラウンドの知識を[br]注ぎ込まれるという利点がありますが 0:09:57.053,0:10:02.043 実際は異なった人々が[br]異なったプロパティを異なった方法で使い 0:10:02.043,0:10:05.125 エンティティの識別子に[br]異なったものを期待するので 0:10:05.125,0:10:08.801 何か均一なものに整えるのは[br]難しいです 0:10:09.381,0:10:11.370 グローバルな状態を捉えるための 0:10:11.370,0:10:15.843 ツールがもっと必要だと[br]いう声も聞かれました 0:10:15.843,0:10:20.946 どのエンティティが[br]完成性の点で欠けているか 0:10:20.946,0:10:26.340 また人々が現在[br]どのような作業をしているか 0:10:26.340,0:10:29.713 そして異なった言語間のみでなく[br]かつそのWikiProjectと 0:10:29.713,0:10:32.251 異なったウィキメディアの[br]プラットフォームに渡る 0:10:32.251,0:10:35.586 緊密な共同についての[br]言及もありました 0:10:35.586,0:10:39.211 これらのディスカッションからの[br]すべての書き留められたコメントを 0:10:39.211,0:10:42.221 Etherpadのここのリンクに 0:10:42.221,0:10:46.149 またウィキマニアのウィキページに[br]公開しました 0:10:46.149,0:10:49.059 いくつかの解決策は[br]実際 異なったWikiProjectで 0:10:49.059,0:10:51.442 開発された最善の実践方法を 0:10:51.442,0:10:55.681 共有する方向へ向かうように見えますが 0:10:55.681,0:10:58.701 チームでの仕事を整理し 0:10:58.701,0:11:03.841 少なくとも誰が作業をしているか[br]理解できるツールも求められています 0:11:03.841,0:11:08.234 またもっとショーケースが求められ 0:11:08.234,0:11:12.175 よりよい方法でそれらを作成できる[br]テンプレートが求められています 0:11:13.494,0:11:17.105 自治体オープンデータの組織との 0:11:17.105,0:11:18.756 コンタクトを通じて 0:11:18.756,0:11:20.421 そして特に 0:11:20.421,0:11:22.841 チューリッヒ市と州と接していると 0:11:22.841,0:11:26.278 ウィキデータに興味が持たれている[br]ことがわかります 0:11:26.278,0:11:28.972 つまり誰でもアクセスして[br]データを見ることができる場所で 0:11:28.972,0:11:33.897 データを皆に提供したいからです 0:11:33.897,0:11:35.886 だからその目的に沿うには 0:11:35.886,0:11:39.231 何かのクオリティの識別子を持つことが[br]とても気が惹かれるでしょう 0:11:39.231,0:11:41.490 ウィキでは既にありますが 0:11:41.490,0:11:44.090 また SPARQLの結果にも[br]それらがあると良いでしょう 0:11:44.090,0:11:46.742 そしてそのコミュニティからの結果が[br]信頼できるかどうかわかります 0:11:46.742,0:11:50.861 さらに持っているデータのどの部分が[br]ウィキデータに有益かが理解でき 0:11:50.861,0:11:55.976 そしてそれらを自動的に[br]評価するツールが求められます 0:11:56.041,0:12:01.136 またデータをインポートするべきか[br]リンクするべきかを決断する 0:12:01.136,0:12:03.894 ある種の手法かツールも必要です 0:12:03.894,0:12:05.304 場合によっては 0:12:05.304,0:12:08.487 自分たちのリンクのある[br]オープンデータセットを持っている場合 0:12:08.487,0:12:09.746 データを入れるべきか 0:12:09.747,0:12:12.964 ウィキデータへデータセットから[br]リンクを作るべきか 0:12:12.964,0:12:15.540 あるいは逆方向にするかなどが[br]あるからです 0:12:15.840,0:12:20.043 またウィキデータのどこにウェブサイトが[br]参照されているかを知りたいです 0:12:20.044,0:12:23.361 Query Serviceでそのような[br]クエリを行うと 0:12:23.362,0:12:25.392 タイムアウトになることもあるので 0:12:25.392,0:12:28.181 もっとツールを作り 0:12:28.181,0:12:32.240 これらの質問の答えが[br]得られるようにすべきです 0:12:33.148,0:12:36.208 それ以外にも 0:12:36.208,0:12:39.361 ウィキ研究者はしばしば 0:12:39.362,0:12:42.023 編集サマリで情報が[br]欠けていることがあります 0:12:42.024,0:12:45.623 様々なエディタの挙動[br]ツールやボット 0:12:45.623,0:12:49.879 あるいは匿名のユーザーなど[br]理解する作業したとき 0:12:49.879,0:12:53.403 私が覚えていることは 0:12:53.403,0:12:57.514 例えば使用されたツールを[br]追跡する標準の方法などが 0:12:57.514,0:13:00.057 欠けていたことです 0:13:00.593,0:13:03.154 PetScanなどそれを既に行うツールも 0:13:03.155,0:13:05.230 いくつかありますが 0:13:05.230,0:13:09.250 このようなキメの細かい起源を[br]どのように記録するかについて 0:13:09.250,0:13:13.531 コミュニティで検討するべきでしょう 0:13:14.169,0:13:15.321 さらに 0:13:15.322,0:13:20.801 リンクされたデータに関するけど[br]すべてのタイプのデータに関しない 0:13:20.802,0:13:25.262 より強固なデータクオリティ次元を[br]考慮する必要があります 0:13:25.262,0:13:30.402 リンクで可能にされる[br]情報取得(Information gain)を 0:13:30.402,0:13:32.322 調べてみました 0:13:32.322,0:13:33.881 つまり 0:13:33.882,0:13:36.681 ウィキデータを他のデータセットに[br]リンクする際に 0:13:36.682,0:13:41.931 どれだけのエンティティが[br]実際クラシフィケーションに得られるか 0:13:41.931,0:13:44.991 あるいは記述や[br]また使用されている単語などが得られるかも 0:13:44.991,0:13:46.881 考えるべきです 0:13:46.881,0:13:51.041 簡単な例を挙げると… 0:13:51.042,0:13:54.269 この場合 ウィキデータ 0:13:54.270,0:13:57.771 あるいはウィキデータにリンクされた[br]外部のデータセンターで 0:13:57.772,0:14:00.487 ナターシャ・ノイと呼ばれる[br]人のエンティティがあり 0:14:00.487,0:14:02.601 所属やその他の情報があります 0:14:02.602,0:14:05.239 これでOKとして[br]外部にリンクし 0:14:05.240,0:14:08.919 そこにその名前のエンティティが既にあり[br]実際同じ値を持っているとします 0:14:09.670,0:14:12.889 よりよい方法は[br]別の名前をもつものにリンクします 0:14:12.889,0:14:16.881 このひとは2通りの方法で[br]名前を書くことができるので有効です 0:14:16.882,0:14:19.714 あるいはウィキデータにない[br]他の情報や 0:14:19.715,0:14:22.323 他のデータセットにない情報を[br]持つことができます 0:14:22.390,0:14:24.652 もっとよい方法としては 0:14:24.653,0:14:29.210 この情報を分類する新しい方法を持つ[br]ターゲットデータセットを 0:14:29.210,0:14:31.392 見ることです 0:14:31.393,0:14:35.354 これが人であるのみでなく[br]他のデータセットでは 0:14:35.355,0:14:39.525 女性であるとかなど[br]他の分類も言及できます 0:14:39.526,0:14:43.401 もし他のデータセットで[br]もっと多くの単語が使われていれば 0:14:43.402,0:14:46.588 全体の情報を回収するものの[br]助けにもなります 0:14:47.371,0:14:51.233 それに関してさらに言えることは 0:14:51.234,0:14:55.809 フェデレーションクエリーが[br]よりよく行われます 0:14:55.810,0:15:00.448 マリーシェフ達による[br]クエリーログを見ると 0:15:01.285,0:15:04.301 オーガニックなクエリーから 0:15:04.302,0:15:06.921 フェデレーションクエリーは[br]ほんの少ししかないことがわかります 0:15:06.922,0:15:12.801 実際フェデレーションはリンクされた[br]データを持つ主なる有利な点の一つでなので 0:15:12.802,0:15:16.903 コミュニティや[br]ウィキデータを使う人は 0:15:16.903,0:15:18.898 この例がもっと必要でしょう 0:15:18.898,0:15:22.666 使用されたエンドポイントを見ると… 0:15:22.667,0:15:25.401 これは完全なリストではなく[br]もっとあります 0:15:25.402,0:15:30.479 もちろんこのデータは2018年3月までの[br]クエリーを評価していますが 0:15:30.480,0:15:34.807 フェデレーションエンドポイントを見ると 0:15:34.808,0:15:37.048 それらが使用されているかどうかを[br]見るべきです 0:15:37.813,0:15:40.441 後のディスカッションで使用できる 0:15:40.442,0:15:43.001 参加者の皆さんへの2つの質問は 0:15:43.001,0:15:45.511 あなた達の必要に応じるための 0:15:45.511,0:15:47.412 データクオリティの問題は[br]なんであるか 0:15:47.412,0:15:50.401 そしてまた編集や警衛のために 0:15:50.402,0:15:52.943 必要な自動化は何かということです 0:15:53.838,0:15:55.587 以上です[br]ありがとうございました 0:15:55.779,0:15:57.527 (拍手) 0:16:06.030,0:16:08.595 (ホゼ・エミロ・ラブラ)[br]私が話すことは 0:16:08.595,0:16:14.715 Shape Expressionに関連し[br]私達が開発しているツールです 0:16:15.536,0:16:19.371 私はホゼ・エミロ・ラブラです 0:16:19.371,0:16:23.215 これらのツールは異なった人によって[br]つくられました 0:16:23.920,0:16:28.480 主にW3C ShEx, Shape Expressions[br]コミュニティグループに関連しています 0:16:28.481,0:16:30.121 ShEx コミュニティグループです 0:16:30.144,0:16:36.081 まずお話したいのは[br]RDFShapeで これは一般的なツールです 0:16:36.082,0:16:40.681 なぜなら Shape Expressionsは[br]ウィキデータのためだけでなく 0:16:40.682,0:16:44.168 一般的に RDFを検証する言語だからです 0:16:44.168,0:16:47.568 これは私が主で開発したもので 0:16:47.568,0:16:50.880 一般的にRDFを検証するツールです 0:16:50.881,0:16:55.139 RDFについて学習したいとか[br]ウィキデータでのみでなく 0:16:55.140,0:16:58.621 RDFやSPARQL エンドポイントを[br]検証したいなら 0:16:58.622,0:17:00.891 このツールをお勧めします 0:17:00.891,0:17:03.255 また学習については 0:17:03.255,0:17:05.640 私は大学で教えていて 0:17:05.641,0:17:09.151 RDFを教えるにはセマンティクな[br]ウェブコースでそれを使っています 0:17:09.161,0:17:12.121 だからRDFを習いたいなら[br]これはよいツールだと思います 0:17:13.033,0:17:17.598 例えばこのツールでの[br]RDFグラフの可視化です 0:17:18.587,0:17:22.643 ここへ来る前[br]先月 0:17:22.643,0:17:28.441 ウィキデータ用に特に[br]RDFShapeを分岐し始めました 0:17:28.443,0:17:33.082 これを WikiShapeと呼んで[br]ウィキデータのプレゼンで紹介しました 0:17:33.082,0:17:34.441 行ったことは 0:17:34.442,0:17:38.805 ウィキデータに関連しないものを削除して 0:17:38.805,0:17:44.801 ウィキデータ SPARQLエンドポイントなど[br]幾つかのものをコードに書き込みました 0:17:44.802,0:17:49.041 ウィキベースにもできるかと[br]聞かれましたが 0:17:49.042,0:17:52.000 ウィキベース用を作るのも[br]とても簡単にできます 0:17:52.760,0:17:56.280 このWikiShapeツールは[br]新しいもので 0:17:57.015,0:17:59.843 ほとんどの機能は働くと思いますが 0:17:59.844,0:18:02.468 機能しないものもあるでしょう 0:18:02.469,0:18:06.281 使ってみて向上させたいと[br]思われた方はご連絡ください 0:18:06.281,0:18:12.680 これは[不明瞭]キャプチャですが[br]やってみましょう 0:18:15.385,0:18:16.945 動くかどうかみてみましょう 0:18:16.953,0:18:20.070 まず外に出て… 0:18:22.453,0:18:23.453 ここ 0:18:24.226,0:18:28.324 ここにツールがあります 0:18:28.324,0:18:29.844 このツールでできることは 0:18:29.845,0:18:35.275 例えば スキーマ[br]エンティティスキーマの検証です 0:18:35.276,0:18:38.611 ここに新しい名前空間があり[br]Eの何か… 0:18:38.612,0:18:44.805 例えば「human…」と書けば 0:18:44.806,0:18:48.812 書いていく間に補完されるので[br]チェックすることができ 0:18:48.812,0:18:52.001 例えば[br]人のShpae Expressionは 0:18:52.790,0:18:55.937 ここにあるShpae Expression です 0:18:55.938,0:18:59.841 このエディタには[br]シンタックスが色付けされています 0:18:59.842,0:19:04.559 これは…[br]画面が小さいので 0:19:05.676,0:19:07.590 大きくしてみましょう 0:19:09.194,0:19:10.973 見やすくなるでしょう 0:19:10.973,0:19:14.241 これがエディタで[br]シンタックスが色付けされています 0:19:14.241,0:19:17.851 このエディタは[br]ウィキデータ Query Serviceと 0:19:17.851,0:19:19.641 同じソースコードからできています 0:19:19.642,0:19:23.960 例えば[br]マウスを乗せると 0:19:23.961,0:19:27.961 異なったプロパティの[br]ラベルを表示します 0:19:27.962,0:19:33.478 ウィキデータのエンティティ[br]スキーマは単なるテキストアイデアなので 0:19:33.478,0:19:38.601 とても便利だと思います 0:19:38.602,0:19:42.493 このエディタは補完機能があるので[br]よりよく 0:19:42.494,0:19:43.743 また… 0:19:43.744,0:19:48.241 例えば拘束を加えたければ 0:19:48.241,0:19:51.570 「wdt:」と打って 0:19:51.570,0:19:56.884 「author」と書いて[br]Ctrl+Spaceと打てば 0:19:56.884,0:19:58.922 異なった物を提供します 0:19:58.922,0:20:02.388 これはウィキデータの[br]Query Serviceと似ていますが 0:20:02.389,0:20:06.445 これはShpae Expression特定のものです 0:20:06.445,0:20:11.975 なぜならShpae Expressionの作成は 0:20:11.976,0:20:15.841 SPARQL クエリーを書くより[br]難しいものではないと思うからです 0:20:15.842,0:20:21.255 同じレベルだと思う人もいるでしょうが 0:20:22.278,0:20:26.296 私は多分はより簡単だと思います 0:20:26.296,0:20:31.241 なぜならShpae Expressionは簡単に[br]機能するようにデザインされているからです 0:20:31.242,0:20:35.001 これが まず最初の 0:20:35.001,0:20:36.620 Shpae Expressionのための[br]エディタです 0:20:37.371,0:20:41.467 そしてまた例えば[br]簡単に可視化できるでしょう 0:20:41.468,0:20:44.801 Shpae Expressionがあって[br]例えば 0:20:44.802,0:20:49.386 「written work」は[br]よい Shpae Expressionでしょう 0:20:49.386,0:20:53.300 異なった物の間に[br]何らかの関連があるからです 0:20:54.823,0:20:58.160 これは 「written work」の[br]UML可視化です 0:20:58.161,0:21:02.090 UMLでは[br]簡単に異なったプロパティを見れます 0:21:02.790,0:21:06.794 これを行った際[br]何人かの Shpae Expressionに 0:21:06.795,0:21:09.216 間違いがあることに気がつきました 0:21:09.217,0:21:12.988 何が欠けているプロパティかなどが[br]簡単に見つけられるからです 0:21:13.588,0:21:15.771 そしてもうひとつの可能性は 0:21:15.772,0:21:19.520 検証ができることだと思います 0:21:20.496,0:21:25.285 どれかのラベルにあったと思います[br]閉じてしまったかも… 0:21:26.267,0:21:30.988 でも例えばここValidate entitiesを[br]クリックできます 0:21:32.308,0:21:34.232 例えば 0:21:35.404,0:21:41.921 「q52」そして著者である「e42」 0:21:42.818,0:21:46.180 「human」で…[br]「human」でできると思います… 0:21:49.050,0:21:50.050 そして 0:21:50.688,0:21:56.365 SPARQLクエリーをしているので[br]少し時間がかかっています 0:21:56.365,0:21:59.134 この例はネットワークのせいで[br]機能しませんが 0:21:59.657,0:22:01.580 自分で試してみてください 0:22:02.759,0:22:07.026 では他のツールのプレゼンを続けましょう 0:22:07.026,0:22:12.353 試したい方 フィードバックが欲しい方は[br]連絡してください 0:22:13.133,0:22:15.540 プレゼンを続けます 0:22:18.923,0:22:20.576 これが WikiShape です 0:22:23.800,0:22:26.509 既に言いましたが 0:22:27.681,0:22:34.157 Shpae Expression エディタは[br]GitHubの中の独立したプロジェクトです 0:22:35.605,0:22:37.472 個人のプロジェクトで使用できます 0:22:37.472,0:22:41.036 Shpae Expression ツールをしたければ 0:22:41.036,0:22:45.635 任意のプロジェクトに[br]入れ込めばいいだけです 0:22:45.636,0:22:48.235 これはGitHubの中にあるので[br]だれでも使えます 0:22:48.868,0:22:51.970 私の生徒である同じ著者がさらに 0:22:52.034,0:22:55.704 作ったShpae Expression用の[br]エディタがあり 0:22:55.704,0:22:58.819 ウィキデータ Query Serviceに[br]影響されたもので 0:22:58.819,0:23:00.681 欄の中に 0:23:00.682,0:23:05.103 SPARQLクエリーの [br]より可視化されたVisual editorがあり 0:23:05.104,0:23:07.135 このようなものを入れることができます 0:23:07.136,0:23:09.123 これはスクリーンキャプチャです 0:23:09.123,0:23:12.662 これはテキストの[br]Shape Expressionであることがわかりますが 0:23:12.662,0:23:17.822 これはフォーム形式のShape Expressionで[br]ちょっと時間がかかります 0:23:18.595,0:23:23.400 異なったフィールドに[br]異なった行を入れることができます 0:23:23.401,0:23:25.800 そして ShExEr があります 0:23:26.879,0:23:31.882 オビエド大学の大学院生が作ったもので 0:23:31.883,0:23:34.540 彼がここに来ているので[br]ShExErを紹介します 0:23:38.147,0:23:40.024 (ダニー)ダニー・フェナンデスです 0:23:40.025,0:23:43.800 オビエド大学の大学院生で[br]ラビラと一緒に仕事しています 0:23:44.710,0:23:47.725 時間が迫っているので[br]急いでやります 0:23:47.726,0:23:52.641 デモはしないで[br]スクリーンショットを出しましょう 0:23:52.642,0:23:57.897 Shape Expressionや他のShape言語で[br]作業をする通常の方法は 0:23:57.897,0:23:59.521 内容領域専門家がいて 0:23:59.522,0:24:02.313 先験的に[br]グラフをどのようにするか 0:24:02.314,0:24:03.555 構成を定義し 0:24:03.556,0:24:06.983 その構成を使用して[br]実際のデータを検証します 0:24:08.124,0:24:11.641 ラビラが紹介したもののと同様に[br]このツールは 0:24:11.642,0:24:14.441 一般的な任意のRDFソース用のツールで 0:24:14.442,0:24:17.375 逆方向にデザインされています 0:24:17.376,0:24:18.758 幾つかのデータが既にあり 0:24:18.759,0:24:23.165 Shapeを得たいノードを選択し 0:24:23.165,0:24:26.718 すると自動的に抽出また[br]Shapeを推測します 0:24:26.719,0:24:29.791 これは一般目的のツールですが 0:24:29.791,0:24:34.063 WikidataCon のためにしたことは[br]これらの優れたボタンです 0:24:34.884,0:24:37.081 クリックすると起こることは 0:24:37.081,0:24:42.079 たくさんの構成パラメータがあり 0:24:42.080,0:24:46.251 ウィキデータエンドポイントに対して[br]機能するようになっています 0:24:46.251,0:24:47.971 失礼 0:24:48.733,0:24:52.883 このボタンを押せば[br]基本的にこれが得られます 0:24:52.884,0:24:55.126 どのような記述が欲しいか 0:24:55.127,0:24:59.360 またクラスのインスタンスなど[br]探しているものを選択した後 0:24:59.361,0:25:01.321 自動的にスキーマが得られます 0:25:02.319,0:25:07.111 どれだけのモードが実際使われているかで[br]すべての拘束が整理され 0:25:07.112,0:25:09.772 あまり共通しないものを[br]取り除くことができます 0:25:09.772,0:25:12.126 このポスターが下に掲示されていて 0:25:12.127,0:25:14.595 私は今日はこのあたりに 0:25:14.596,0:25:16.454 一日中いますので 0:25:16.455,0:25:19.081 このツールに関心のある方は 0:25:19.082,0:25:21.476 声をかけてください 0:25:21.477,0:25:24.624 ではラブラにマイクを返します[br]ありがとうございました 0:25:24.625,0:25:29.265 (拍手) 0:25:29.812,0:25:32.578 (ホゼ)では次のツールにいきましょう 0:25:32.579,0:25:34.984 これは ShapeDesignerです 0:25:34.984,0:25:37.241 アンドレア ShapeDesignerを[br]ここで紹介しますか 0:25:37.242,0:25:39.287 それも後でワークショップで[br]紹介しますか 0:25:39.287,0:25:40.603 ワークショップがあるので… 0:25:40.603,0:25:44.437 午後 特に Shape Expressionのための[br]ワークショップがあります 0:25:45.265,0:25:47.939 もっと実際に行い[br]ShExを練習したい方は 0:25:47.940,0:25:52.324 そちらへお越しください 0:25:52.875,0:25:55.720 このツールは ShEx…[br]エリックがいます 0:25:55.721,0:25:56.890 紹介してくれますね 0:25:57.969,0:26:00.687 (エリック)簡単に言いたいことは 0:26:00.687,0:26:05.711 すでに ShEx のインターフェイスは[br]見たことがあるでしょう 0:26:05.711,0:26:07.601 これはウィキデータ用のものです 0:26:07.602,0:26:12.930 不要なものを除いた[br]ウィキデータ用のものです 0:26:12.930,0:26:17.937 一般的なものにはもっと機能がありますが[br]言っておきたいことは 0:26:17.937,0:26:19.977 ウィキデータのスキーマを[br]デバグするための 0:26:19.978,0:26:23.201 特に有効な機能です 0:26:23.201,0:26:29.224 Slurpのモードを選択すると 0:26:29.225,0:26:31.444 行われることは[br]検証中に 0:26:31.445,0:26:34.694 すべての3つ揃いを取り出したいとき 0:26:34.695,0:26:36.274 つまり多くの失敗が返ってくると 0:26:36.275,0:26:39.586 これらを見て 0:26:39.587,0:26:41.800 どの3つ揃いがここにあり… 0:26:41.801,0:26:44.120 失礼[br]3つ揃いはこの下です 0:26:44.121,0:26:45.647 これは行われたことのログです 0:26:46.327,0:26:49.180 ここでリアルタイムで[br]いじることができます 0:26:49.181,0:26:51.033 動かしてみたり[br]変えることができます 0:26:51.033,0:26:54.160 素早くできるバージョンです 0:26:54.663,0:26:56.481 これがShExのフォームで 0:26:56.482,0:27:00.035 シャヒーンがドキュメントのためには[br]Shape Expressionによって 0:27:00.035,0:27:04.631 ウィキデータのドキュメントを[br]埋めるに役立つだろうと 0:27:04.631,0:27:07.338 示唆したものです 0:27:08.095,0:27:11.681 ウィキデータ用には[br]つくられていませんので 0:27:11.682,0:27:14.081 これはあるスキーマがあるとき 0:27:14.082,0:27:15.402 そのスキーマを特定の方法で 0:27:15.403,0:27:17.518 描画したいということを注記でき 0:27:17.519,0:27:19.031 そのフォームを作成し 0:27:19.031,0:27:21.582 データがあれば[br]そのフォームを埋めることもできます 0:27:24.517,0:27:26.164 PyShExは素晴らしいです 0:27:28.025,0:27:31.080 (ホゼ)これが最後だと思います 0:27:31.821,0:27:34.080 最後はPyShExです 0:27:34.675,0:27:38.151 PyShExはShape Expressionの[br]Pythonインプリメンテーションです 0:27:39.193,0:27:42.680 お好きな方は Juyiter Notebooksでも[br]使えます 0:27:42.680,0:27:44.432 それだけです 0:27:44.433,0:27:47.170 (拍手) 0:27:52.916,0:27:56.121 (アンドレア)私が関与した[br]特別なプロジェクト 0:27:56.121,0:27:58.074 Gene Wikiについてお話します 0:27:58.075,0:28:04.596 それで私達もクオリティの問題を[br]対処しています 0:28:04.597,0:28:06.684 そのクオリティについて話す前に 0:28:06.685,0:28:09.229 Gene Wiki とは何か[br]ちょっと紹介します 0:28:09.855,0:28:15.175 このプロジェクトの詳細を説明する 0:28:15.175,0:28:18.160 論文を最近 書いてちょうど[br]その出版前のものを公開しました 0:28:19.821,0:28:23.839 写真を撮っている方もいますが[br]基本的に Gene Wikiは 0:28:23.846,0:28:28.027 生医学のデータ 公開されたデータを[br]ウィキデータに入れるもので 0:28:28.028,0:28:32.200 ウィキデータに入れるには[br]特定のパターンに従っています 0:28:33.130,0:28:36.809 新しいレポジトリや[br]データセットが手に入ると 0:28:36.810,0:28:39.600 それがウィキデータに含まれるべきものなら 0:28:39.601,0:28:41.607 まず最初にコミュニティによる関与です 0:28:41.607,0:28:44.184 直接ウィキデータのコミュニティで[br]ある必要はなく 0:28:44.184,0:28:46.530 ローカルな研究コミュニティによる[br]関与です 0:28:46.530,0:28:50.286 オンラインかなにかの方法で会い 0:28:50.286,0:28:52.881 データモデルを想像します 0:28:52.882,0:28:56.197 これによりデータを[br]ウィキデータモデルにつなげます 0:28:56.197,0:28:59.944 去年のワークショップの[br]写真がここにあります 0:28:59.945,0:29:02.663 特定のデータセットを[br]見ようとしています 0:29:02.663,0:29:05.280 たくさんの論議があり 0:29:05.281,0:29:09.780 schema.org とその他の[br]存在するオントロジーに揃えています 0:29:10.320,0:29:15.508 そして最初のステップの終わりに[br]ウィキデータに入れたい 0:29:15.509,0:29:17.336 スキーマが描かれています 0:29:17.337,0:29:20.440 ここにあるものは[br]平素です 0:29:20.441,0:29:21.766 この後ろにあるのは 0:29:21.767,0:29:25.240 今日のパネル内でも[br]幾つかのスキーマを作れます 0:29:26.560,0:29:28.399 スキーマができれば 0:29:28.400,0:29:31.320 次のステップは[br]スキーマを機械可読にすることです 0:29:32.358,0:29:36.841 ウィキデータの入れる生医学の[br]データベースから持ち込むデータを 0:29:36.842,0:29:39.690 つなげる起動可能なモデルが[br]ほしいからです 0:29:40.393,0:29:45.182 ここで Shape Expressionを[br]適用しています 0:29:46.471,0:29:52.518 Shape Expressionは 0:29:52.518,0:29:57.040 データデットが実際…[br]まず 0:29:57.041,0:30:01.782 既にウィキデータに存在する[br]データが同じデータモデルに従っているかが 0:30:01.783,0:30:04.718 先ほどのプロセスで達成されます 0:30:04.719,0:30:08.031 そして Shape Expressionで[br]このトピックのウィキデータのデータが 0:30:08.031,0:30:10.926 修正が必要化どうか[br]ウィキデータの中のモデルに 0:30:10.926,0:30:15.013 当てはめるに必要な操作があるかなど[br]検証します 0:30:15.937,0:30:19.867 それが整ったら[br]ボットを書き始め 0:30:20.670,0:30:23.801 ボットは定期的に[br]情報を入れています 0:30:23.802,0:30:27.308 これがウィキデータに入れられる[br]1次資料です 0:30:27.846,0:30:29.303 ボットが出来上がったら… 0:30:29.304,0:30:33.001 これらのボットは[br]私たちのプロジェクトで作られた 0:30:33.002,0:30:36.201 Wikidata Integratorと呼ばれる[br]Pythonライブラリの 0:30:36.202,0:30:38.167 プラットフォームで書かれます 0:30:38.698,0:30:41.851 ボットが書かれたら[br]継続的インテグレーションのために 0:30:41.851,0:30:44.540 Jenkinsというプラットフォームを[br]使用します 0:30:44.540,0:30:45.762 Jenkinsでは 0:30:45.762,0:30:51.160 ウィキデータを1次資料で[br]継続して更新できます 0:30:52.178,0:30:55.889 これが先に話した論文のダイアグラムです 0:30:55.890,0:30:57.241 これが現在の状態です 0:30:57.242,0:31:02.059 このオレンジの箱が[br]薬物 遺伝子 疾患 0:31:02.060,0:31:07.827 作用する化学物質の[br]1次資料で 0:31:07.827,0:31:10.870 このモデルは小さくで見にくいですが 0:31:10.870,0:31:17.472 これがデータベースで[br]ウィキデータ内で管理される資料で 0:31:17.473,0:31:20.560 1次資料とつながっています 0:31:20.561,0:31:22.355 これがワークフローです 0:31:22.870,0:31:25.312 私達のパートナーのひとつは[br]疾患オントロジーです 0:31:25.312,0:31:27.672 疾患オントロジーは CCOオントロジーで 0:31:28.179,0:31:31.990 このCCOオントロジーはそれ自身の[br]キューレーションサイクルを持っていて 0:31:32.756,0:31:35.736 疾患の領域に合わせて[br]また疾患の解釈に応じて 0:31:35.737,0:31:39.687 継続的に疾患オントロジーを[br]更新しています 0:31:40.336,0:31:44.361 ウィキデータにも疾患に関する[br]キューレーションサイクルがあり 0:31:44.362,0:31:49.844 ウィキデータコミュニティでは[br]ウィキデータで常にモニターしています 0:31:50.406,0:31:51.601 私達には2つの役割があり 0:31:51.602,0:31:55.477 口語的にこれらを[br]ゲートキーパーキュレーターと呼んでいます 0:31:56.009,0:31:59.561 これは私と同僚が5年前に 0:31:59.562,0:32:03.414 コンピュータの前に座って[br]ウィキピディアとウィキデータをモニターし 0:32:03.415,0:32:08.601 もし1次コミュニティ 1次資料へ[br]連絡される問題があれば 0:32:08.602,0:32:11.765 インプリメンテーションを調べ[br]決断を下します 0:32:11.765,0:32:14.850 このウィキデータの入力を信頼するかを見て 0:32:14.850,0:32:18.555 そして考慮されたら[br]このサイクルに入り 0:32:18.555,0:32:22.686 次のイタレーションは[br]疾患オントロジーの部分で 0:32:22.687,0:32:25.411 ウィキデータに入れられます 0:32:27.419,0:32:31.480 WikiPathwayでも同じことをしています 0:32:31.481,0:32:36.601 WikiPathwayはMediaWikiに触発された[br]経路のリポジトリです 0:32:36.602,0:32:40.901 同じ様にウィキデータには既に[br]異なった経路が存在します 0:32:41.463,0:32:44.713 これらの経路のリソースの間で[br]一致しない場合は 0:32:44.722,0:32:46.701 それがゲートキーパー[br]キュレーターから 0:32:46.702,0:32:49.521 コミュニティに連絡され 0:32:49.522,0:32:53.715 個々のキューレーションのサイクルは[br]維持されます 0:32:53.715,0:32:57.068 もし以前のサイクルを覚えていれば 0:32:57.069,0:33:03.041 ここでは2つのサイクルと[br]2つのリソースのみ話しましたが 0:33:03.566,0:33:05.840 すべてのリソースに対して[br]行う必要があり 0:33:05.840,0:33:08.061 何が起こっているかを管理しなくては[br]なりません 0:33:08.062,0:33:09.505 キューレーションというのは 0:33:09.505,0:33:11.377 ウィキピディアのトップページに行き 0:33:11.377,0:33:14.544 ウィキデータのトップページに行き[br]それをやることです 0:33:14.545,0:33:19.316 これは持っている2つのゲートキーパー[br]キュレーターから拡張できません 0:33:19.860,0:33:22.777 2016年の会議のとき 0:33:22.778,0:33:26.933 エリックがShape Expressionのプレゼンをし 0:33:26.934,0:33:29.277 私もこれをやろうと[br]これでいいぞと思いました 0:33:29.278,0:33:34.240 Shape Expressionはウィキデータ内の[br]違いを検知する助けになるので 0:33:34.240,0:33:41.159 ゲートキーパーがより効果的な[br]レポートを出せます 0:33:42.275,0:33:46.019 今年 スキーマエンティティに[br]感激しました 0:33:46.020,0:33:50.765 なぜならそれらのエンティティスキーマを[br]ウィキデータ自体に保存できるからです 0:33:50.765,0:33:53.183 これは以前はGitHubに保存されました 0:33:53.860,0:33:56.815 ウィキデータのインターフェイスと[br]揃えられ 0:33:56.816,0:33:59.350 ドキュメントのディスカッションができたり 0:33:59.350,0:34:00.762 また改訂もできます 0:34:00.763,0:34:05.261 トップページとウィキデータの改訂を[br]利用して 0:34:05.262,0:34:12.255 ウィキデータに何があるべきか[br]1次資料が何かについて 0:34:12.255,0:34:14.060 ディスカッションできます 0:34:14.966,0:34:19.686 エリックがプレゼンしたものは[br]既にとても有益です 0:34:19.686,0:34:24.335 ここにヒト遺伝子のための[br]Shape Expressionを作り 0:34:24.336,0:34:30.225 簡単なShExを通して使ってみました[br]ご覧の通り 0:34:30.225,0:34:32.428 既に… 0:34:32.429,0:34:34.641 ひとつモニターする必要のある[br]問題があります 0:34:34.642,0:34:37.316 スキーマに合わない項目が[br]ひとつあります 0:34:37.316,0:34:43.139 これには既にスキーマエンティティ[br]キューレーションのレポートが作られ 0:34:43.140,0:34:46.360 異なったキューレーションの[br]レポートへ送ります 0:34:48.058,0:34:52.788 ShEx.js は[br]構築されたインターフェイスで 0:34:52.788,0:34:55.860 ここに戻ってみると…[br]10 だけやってますが 0:34:55.860,0:35:00.362 何万ものあるので[br]これもうまく拡張しません 0:35:00.362,0:35:05.168 だから Wikidata Integratorは[br]SgExサポートにも対応し 0:35:05.168,0:35:07.431 そして項目のループをループすることができ 0:35:07.431,0:35:11.494 yes-no yes-no そして真−偽 真−偽と[br]行えます 0:35:11.495,0:35:12.495 そしてまた 0:35:13.065,0:35:16.514 レポートの対処の効率を向上します 0:35:17.256,0:35:22.662 でも最近 ウィキデータの [br]Query Service上にビルドされ 0:35:23.181,0:35:24.998 今 絞り込んでいるところですが 0:35:24.999,0:35:26.560 同様にこれも拡張しません 0:35:26.561,0:35:31.391 どのようにウィキデータのモデルを扱うかは[br]継続している課題です 0:35:32.202,0:35:36.682 ShExは巨大に感じるものであるだけでなく 0:35:36.683,0:35:40.356 その規模は扱うには大きすぎます 0:35:41.068,0:35:46.081 だから最初の概念の証明[br]あるいは演習を始めてみました 0:35:46.082,0:35:47.680 yEDというツールを使います 0:35:48.184,0:35:52.590 これらのShape Expressionをまず描き… 0:35:52.591,0:35:57.788 そしてこのスキーマを 0:35:57.788,0:36:01.279 Shape Expressionの隣接する[br]フォーマットに再生しました 0:36:01.280,0:36:04.840 だからこれは既に[br]Shape Expression言語に尻込みする 0:36:04.840,0:36:07.432 聴衆者でも使用できます 0:36:07.961,0:36:12.308 しかし実際[br]これらの視覚識別子には問題があります 0:36:12.309,0:36:18.229 なぜならここに誰かがすでにyEDに描いた[br]スキーマであるからです 0:36:18.230,0:36:23.838 ここにも別のものがあります[br]これが使っているのは…綺麗ですね 0:36:23.838,0:36:29.414 これは壁にかけたいですが[br]相互運用可能ではありません 0:36:30.281,0:36:32.131 私の講演の終わりに 0:36:32.131,0:36:35.732 このスライドを借りていますが 0:36:35.732,0:36:37.594 視聴に来てくれている彼に[br]感謝します 0:36:37.595,0:36:39.423 これが大好きです 0:36:39.424,0:36:42.362 RDFは複雑で鬱陶しいと思われていますが 0:36:42.362,0:36:44.293 現実はもっと悪く[br]これはとても簡単です 0:36:45.581,0:36:48.133 なぜなら現実のデータの問題は 0:36:48.134,0:36:50.031 実に複雑です 0:36:50.031,0:36:51.981 RDFを避けることはできますが 0:36:51.981,0:36:55.760 複雑なデータやコンピュータの問題を[br]避けることはもっと難しいです 0:36:55.761,0:36:59.535 これはRDFについてですが[br]これはモデリングにも当てはまると思います 0:37:00.112,0:37:02.769 私の講演のポイントは 0:37:03.387,0:37:05.882 どのようにモデリングをやっていくか? 0:37:05.882,0:37:10.826 ShEx または[br]視覚的モデルを討論すべきか… 0:37:11.426,0:37:13.271 いかに継続していくか? 0:37:13.474,0:37:14.840 ご視聴ありがとうございます 0:37:15.102,0:37:17.787 (拍手) 0:37:19.759,0:37:21.543 (リディア)ありがとうございました 0:37:21.692,0:37:24.001 前に来てください 0:37:24.002,0:37:27.741 質疑を始めます 0:37:28.610,0:37:30.203 質問は? 0:37:31.507,0:37:32.507 はい 0:37:34.253,0:37:36.890 カメラのためには… 0:37:38.835,0:37:40.968 (リディア)ええ 0:37:43.094,0:37:46.273 (参加者1)クリスティーナへの質問で 0:37:47.366,0:37:51.371 他のシステムとのリンクで 0:37:51.371,0:37:53.689 「情報取得(information gain)」[br]という言葉を使われましたが 0:37:53.690,0:37:55.619 統計と確率に使われる[br]情報理論の計測に使われる 0:37:55.620,0:37:58.001 information gainという言葉がありますが… 0:37:58.002,0:37:59.541 同じ… 0:37:59.542,0:38:01.736 確率理論からの 0:38:01.736,0:38:04.173 情報理論からの 0:38:04.174,0:38:06.040 information gainと同じ計測を[br]意味しているんですか 0:38:06.040,0:38:09.024 それともなんからの方法で[br]情報の取得を測る概念的な意味ですか 0:38:09.025,0:38:13.695 いいえ実際[br]シャノン エントロピーを使って 0:38:13.695,0:38:20.161 インプリメンテーション測定を[br]定義しているので それを意味します 0:38:20.162,0:38:22.696 詳細な式の説明は避けたかったので… 0:38:22.697,0:38:24.977 (参加者1)はいわかります[br]だから質問したのです 0:38:24.978,0:38:27.088 (参加者1)ありがとうございました 0:38:32.795,0:38:35.047 (参加者2)質問というより[br]コメントですが… 0:38:35.048,0:38:36.241 (リディア)どうぞ 0:38:36.242,0:38:39.840 (参加者2)クオリティや完成性について 0:38:39.840,0:38:42.547 項目レベルに気が配られていますね 0:38:42.547,0:38:47.374 私が気になることは同じことが[br]階層に適応されていないことで 0:38:47.374,0:38:51.480 階層が的確でないという[br]問題があると思います 0:38:51.481,0:38:53.463 コモンズ検索や他のことで 0:38:53.464,0:38:55.774 これが問題になると思います 0:38:56.771,0:39:00.601 できることのひとつは[br]外部の… 0:39:00.602,0:39:04.842 外部の類義語集が[br]その階層を構成する方法として 0:39:04.842,0:39:10.291 P4900 広範な概念修飾子を使って 0:39:11.037,0:39:16.167 しかしもっとよい役に立つツールと[br]思うのは 0:39:16.168,0:39:21.212 それによって外部の…[br]類義語集の階層マップを 0:39:21.212,0:39:24.111 ウィキデータの項目にインポート[br]できるようになります 0:39:24.111,0:39:28.199 これらのP9400 修飾子と置かれれば 0:39:28.200,0:39:32.234 外部の階層から派生した階層を見ることが 0:39:32.490,0:39:37.534 SPARQLを通じて[br]実際よりよいクエリーでできます 0:39:37.534,0:39:41.346 例えばポーラ・モーマは[br]PKMを使いご存知のように 0:39:41.346,0:39:43.533 ファッションの仕事を多くしています 0:39:43.533,0:39:50.524 それを使って私達は[br]ヨーロッパファッション類義語階層と 0:39:50.524,0:39:53.812 ゲッティAATファッション類義語階層を[br]取り入れ 0:39:53.812,0:39:57.957 そして私たちにとって[br]実に問題となる 0:39:57.957,0:40:00.511 高レベルの項目のどこに[br]ギャップがあるか見てみます 0:40:00.511,0:40:04.355 なぜならしばしばこれらはウィキピディアの[br]曖昧性解消ページにのみあるので 0:40:04.356,0:40:09.270 階層が欠けている より高レベルの[br]項目がたくさんあり 0:40:09.271,0:40:14.480 これは時々クオリティと完成性の意味で[br]把握しておかなければならないものです 0:40:14.480,0:40:16.608 しかし実際 0:40:16.643,0:40:20.782 私が書いたたくさんのPullスクリプト[br]よりもよいツールは… 0:40:21.144,0:40:26.472 誰か Pythonで[br]PAWS Notebook内に 0:40:26.472,0:40:31.141 リンクされたデータや[br]そうでない 0:40:31.141,0:40:35.172 外部の類義語集[br]そしてその階層を取り 0:40:35.172,0:40:41.099 それらをP9400値にいれる[br]クイックステートメントに入れることです 0:40:41.165,0:40:42.165 そうすれば後日 0:40:42.166,0:40:44.527 叙述がもっと完全になったとき 0:40:44.528,0:40:48.821 これらのP9400を更新するために 0:40:48.821,0:40:51.590 叙述が更新されるにつれ[br]より密度が上がるので 0:40:51.590,0:40:55.377 システムのその階層が[br]もっと増えたことを示すように 0:40:55.390,0:40:59.526 これらの修飾子も変える必要があります 0:40:59.526,0:41:03.728 誰かそれをしてくれれば[br]とても便利だと思います 0:41:03.728,0:41:07.121 また項目レベルのみでなく 0:41:07.122,0:41:10.762 階層レベルでクオリティと[br]完成性を向上する 0:41:10.763,0:41:12.810 他のアプローチについても[br]検索するべきです 0:41:13.308,0:41:15.216 (アンドレア)付け足していいですか? 0:41:16.362,0:41:19.901 実際にやっています 0:41:19.911,0:41:23.551 フィンが語彙的データで作った 0:41:23.552,0:41:27.330 Shape Expressionを見ることを[br]お勧めします 0:41:27.330,0:41:29.640 彼はShape Expressionを創り[br]そして著作者表現にビルトしています 0:41:29.641,0:41:32.528 だからウィキデータの中の[br]リンクされたShape Expressionの構想で 0:41:32.529,0:41:35.005 特に[br]私が正しく理解していれば 0:41:35.006,0:41:37.183 それはまさに Gene Wikiの中で[br]やっていることです 0:41:37.184,0:41:40.841 ウィキデータに入れられた[br]疾患オントロジーがあれば 0:41:40.842,0:41:44.681 疾患のデータが入れられ 0:41:44.682,0:41:47.767 この類義語集に一致するかを知るに[br]Shape Expressionを応用できます 0:41:47.767,0:41:50.919 またウィキデータに入れる必要のある 0:41:50.920,0:41:53.389 他の類義語集や制御された語彙の[br]他のオントロジーがあります 0:41:53.389,0:41:55.401 これはまさにShape Expressionが[br]有用です 0:41:55.402,0:41:57.963 なぜなら疾患オントロジー用の[br]Shape Expressionが持て 0:41:57.964,0:41:59.644 Mesh用のShape Expressionが持て 0:41:59.645,0:42:01.761 そして「じゃあクオリティを調べよう」[br]ということになります 0:42:01.762,0:42:04.929 なぜなら制御された語彙がある場合 0:42:04.929,0:42:09.567 ウィキデータの内容も[br]このクオリティに沿っているとしても 0:42:09.568,0:42:12.086 それに同意しない[br]コミュニティもあるでしょう 0:42:12.086,0:42:14.521 だからツールは準備されていても 0:42:14.521,0:42:18.144 これらのモデルを作り 異なった[br]ユースケースに適用することになります 0:42:18.811,0:42:22.521 (参加者2)外部のオントロジーを[br]ウィキデータにマップしたものがあれば 0:42:22.521,0:42:25.928 Shape Expressionはとても有益ですが 0:42:25.929,0:42:29.474 私の問題はそれに至ることです 0:42:29.475,0:42:34.881 どれだけの外部のオントロジーが[br]まだウィキデータに中に無いか 0:42:34.882,0:42:37.636 そしてそのギャップがどこになるかを[br]知るために 0:42:37.636,0:42:40.660 より使いやすいツールで 0:42:40.660,0:42:44.286 欠けている[br]外部のオントロジーを探すことは 0:42:44.286,0:42:45.537 とても有益になるでしょう 0:42:47.678,0:42:49.062 ここでの最も大きい問題は 0:42:49.062,0:42:51.201 ツールではなく[br]ライセンスです 0:42:51.803,0:42:55.249 オントロジーをウィキデータに[br]取り込むのは簡単ですが 0:42:55.250,0:42:59.295 ほとんどのオントロジーは[br]どう言えばいいか… 0:42:59.965,0:43:03.256 ライセンスの制御があり[br]ウィキデータには使えません 0:43:04.068,0:43:06.678 (参加者2)とても多くの[br]一般使用可能な類義語辞書が 0:43:06.678,0:43:08.209 文化の分野にはあります 0:43:08.210,0:43:10.851 −(アンドレア)話し合う必要がありますね[br]−(参加者2)そうですね 0:43:10.852,0:43:12.384 (アンドレア)では話しましょう 0:43:13.624,0:43:19.192 (参加者3)コメントしたいことは[br]ジェームスへの答えになります 0:43:19.192,0:43:22.401 つまり階層がグラフを作り 0:43:22.374,0:43:24.041 もしあなたが… 0:43:24.579,0:43:28.888 基本的に言いたいことは 0:43:28.889,0:43:30.820 階層の共通した問題は[br]サークル階層です 0:43:30.821,0:43:33.796 お互いに戻ってくるようになり[br]問題がある際には 0:43:33.796,0:43:35.920 そのような階層を[br]持つべきではありません 0:43:37.022,0:43:41.295 このおかしなことは[br]ウィキピディアのカテゴリでよく起こります 0:43:41.295,0:43:43.374 カテゴリにたくさんサークルがあります 0:43:43.898,0:43:46.612 しかしいいことにはこれは… 0:43:47.713,0:43:51.582 技術的に言ってこれは PMP完成の問題で 0:43:51.583,0:43:53.880 グラフを作ると簡単に[br]見つけることができません 0:43:54.473,0:43:57.046 しかし多くの開発された方法があり 0:43:57.047,0:44:00.624 これらの階層グラフの[br]問題を見つけられます 0:44:00.625,0:44:04.860 例えば「*Finding Cycles Breaking Cycles 0:44:04.861,0:44:07.955 in Noisey Hiearachies*」という論文で 0:44:07.956,0:44:12.671 英語のウィキピディアのカテゴリの[br]問題を助けています 0:44:12.672,0:44:17.141 これをウィキデータのこれらの[br]階層に応用することができ 0:44:17.142,0:44:19.540 問題になりそうなものを見つけ 0:44:19.541,0:44:22.481 支障をきたすものを取り除けばいいです 0:44:22.482,0:44:24.593 実際 支障を見つけます 0:44:24.594,0:44:26.960 これは単にアイデアですが… 0:44:28.250,0:44:29.930 (参加者2)それはいいですね 0:44:29.931,0:44:33.672 しかしあなたは存在する[br]不適切なサブクラスの関係の数を 0:44:33.672,0:44:35.402 軽く見ていると思います 0:44:35.403,0:44:39.680 全く間違った国に[br]市を持っているようなもので 0:44:40.250,0:44:44.874 地理のツールとして[br]それを見つけるものがありますが 0:44:44.875,0:44:49.201 階層に使えるツールが必要です 0:44:49.202,0:44:53.477 完全に欠けている国に相当する[br]項目がどこにあるか 0:44:53.478,0:44:57.673 また全く異なったものに[br]サブクラスされているものがあるかを 0:44:57.674,0:45:01.804 認識するためのツールが必要です 0:45:02.804,0:45:07.165 (リディア)あなたの言っていることは 0:45:07.166,0:45:12.024 私と私のチームが[br]私達のデータを再利用する人たちから 0:45:12.025,0:45:13.991 よく聞くことと似ています 0:45:15.002,0:45:16.638 個々のデータポイントは適正でも 0:45:16.639,0:45:20.163 オントロジーなどで見なければ 0:45:20.164,0:45:21.857 それは… 0:45:22.388,0:45:26.437 なぜこれが起こるかの[br]もっとも問題となる点は 0:45:26.437,0:45:30.736 ウィキデータの編集の多くが 0:45:30.736,0:45:34.544 個々の項目で起こっていて 0:45:34.545,0:45:36.201 項目が編集しています 0:45:37.653,0:45:42.075 例えばそのグラフの他の部分への 0:45:42.075,0:45:44.245 全体への影響を理解していない[br]ことがあります 0:45:45.265,0:45:50.040 個々のローカルでの編集の影響を[br]もっと可視化できる方法について 0:45:50.041,0:45:53.185 アイデアがある方がいれば 0:45:54.005,0:45:57.550 誠実に編集を加える人たちに 0:45:57.550,0:46:02.633 その影響を見せることができれば 0:46:03.214,0:46:04.474 これは探求する価値が 0:46:04.481,0:46:06.481 あると思います 0:46:06.939,0:46:12.237 わあ では君 そして君 そして君 0:46:12.237,0:46:14.238 (参加者3)ディスカッションの後で 0:46:14.238,0:46:18.262 ジェームスの言ったことに[br]同意を示したいです 0:46:18.263,0:46:22.467 基本的にもっと危険なものは[br]階層でしょう 0:46:22.468,0:46:23.910 階層ではなくてもっと一般的に 0:46:23.911,0:46:28.022 ウィキデータ内のサブクラスの関連の[br]意味論でしょう 0:46:28.022,0:46:32.561 この会議のための[br]最近 言語を学んでいます 0:46:32.562,0:46:35.257 例えば多くの場合 0:46:35.257,0:46:39.463 言語は同じもののサブクラス[br]そして一部です 0:46:39.463,0:46:43.577 つまり柔軟なオントロジーを[br]持っているといえます 0:46:43.577,0:46:46.256 ウィキデータはときどき[br]それを自由に表現します 0:46:46.256,0:46:47.257 なぜなら 0:46:47.258,0:46:50.721 言語のオントロジーは[br]政治的にも複雑ですね 0:46:50.722,0:46:55.038 不明瞭のレベルを表現する立場で[br]あるのもいいです 0:46:55.038,0:46:57.983 しかしそれの機械解読をしたければ 0:46:57.984,0:46:59.468 それは非常に問題です 0:46:59.468,0:47:00.468 そしてまた 0:47:00.469,0:47:03.686 オントロジーは[br]元々 私達のものであった何かから 0:47:03.687,0:47:05.490 インポートされたことはないと思います 0:47:05.491,0:47:08.321 言ってみれば初期ウィキピディアから[br]集めれたものです 0:47:08.322,0:47:11.324 このShape Expressionはいいけど 0:47:11.325,0:47:15.575 ウィキデータのオントロジーを[br]外部の資料で 0:47:15.576,0:47:18.191 検証したり修正をしたりもでき 0:47:18.191,0:47:20.026 素晴らしいアイデアですが[br]最後に 0:47:20.027,0:47:25.440 外部のオントロジーをウィキデータに[br]反映することで終わりますか? 0:47:25.441,0:47:28.281 そしてまた外部の資料から 0:47:28.281,0:47:30.642 決して集められない私達のオントロジーの[br]中核はどうすればいいでしょう 0:47:30.643,0:47:32.248 どのように修正すべきでしょうか? 0:47:32.248,0:47:35.276 それはそれ自体の問題になるでしょう 0:47:35.277,0:47:39.010 外部の何かで[br]オントロジーを検証するアイデアから 0:47:39.010,0:47:41.333 独立して注目しなければ[br]ならなくなるでしょう 0:47:49.353,0:47:53.379 (参加者4)拘束やシェープで[br]できることは 0:47:53.380,0:47:54.769 とても素晴らしいですが 0:47:55.205,0:47:58.481 主点ははっきりしていく… 0:47:58.482,0:48:03.229 なぜならデータに何を期待するかが[br]明瞭にできるようになったからです 0:48:03.229,0:48:06.893 以前は個々にツールや[br]スクリプトを作る必要があり 0:48:06.894,0:48:10.601 目につきやすく[br]それについて議論できます 0:48:10.602,0:48:13.641 しかし課題は良し悪しではなく 0:48:13.642,0:48:15.870 期待です 0:48:15.870,0:48:18.105 人によって[br]ウィキデータでどうモデルするかは 0:48:18.106,0:48:20.737 異なった期待と議論があるでしょう 0:48:21.246,0:48:23.095 そしてこれは… 0:48:23.096,0:48:26.280 現在の状況はその方向に[br]一歩進み 0:48:26.281,0:48:28.041 これに取り組むには 0:48:28.042,0:48:31.041 技術的な知識が必要となるので 0:48:31.042,0:48:35.721 この拘束を可視化するための 0:48:35.722,0:48:40.915 それを理解しやすい[br]たぶん自然な言語に変換するための 0:48:40.939,0:48:43.768 方法が求められ[br]良し悪し自体はあまり問題ではないです 0:48:44.925,0:48:45.925 (リディア)はい 0:48:50.986,0:48:53.893 (参加者5)クオリティについて[br]賛同したいのは… 0:48:53.894,0:48:57.010 私はたくさんの問題を見つけました 0:48:58.838,0:49:02.330 インスタンスとサブクラスの間の[br]意見の差にも行き当たりました 0:49:02.331,0:49:05.963 これらの状況のエラーだと思い 0:49:05.963,0:49:11.521 とても時間のかかるプロセスを[br]探しました 0:49:11.522,0:49:14.840 私が見つけたのは「とても[br]興味深い項目を見つけたら 何か… 0:49:14.840,0:49:17.347 そして派生するすべての[br]ステートメントを見つけるに 0:49:17.347,0:49:21.628 すべてのサブクラスの[br]インスタンスを使おう」 0:49:21.628,0:49:26.215 これはこれらのエラーを見つける[br]とても有効な方法です 0:49:26.215,0:49:29.427 しかしShape Expressionができるか… 0:49:29.841,0:49:31.582 何か… 0:49:31.583,0:49:36.934 これらの問題を解消するツールとして[br]使えれば…でも… 0:49:40.514,0:49:43.041 (参加者6)構造的な足跡があれば… 0:49:45.910,0:49:49.310 構造的な足跡があれば[br]改ざん可能な… 0:49:49.310,0:49:51.191 見てみて 0:49:51.192,0:49:54.350 これはできると…[br]しかしこれが単に 0:49:54.350,0:49:56.640 現実のものを[br]マップしようとしているだけなら 0:49:56.640,0:49:59.450 とてもたくさんの頭脳が必要でしょう 0:50:05.810,0:50:09.081 (参加者7)Apple Sire Knowlege の[br]パブロ・メンデスです 0:50:09.081,0:50:12.548 私達はどうプロジェクトとコミュニティを[br]助けるかを見つけるために集まっていますが 0:50:12.548,0:50:15.464 クリスティーナは間違って[br]私達が欲しいものを尋ねました 0:50:16.194,0:50:19.880 (笑)そこで私が思うのは 0:50:19.880,0:50:24.017 検証可能性に関して[br]多くのことが求められます 0:50:24.017,0:50:26.398 それはプロジェクトやコミュニティ 0:50:26.398,0:50:28.841 その信頼性の中核となるもののひとつです 0:50:28.841,0:50:32.322 すべてのステートメントは等しくなく[br]とても争われるものや 0:50:32.322,0:50:34.071 簡単に推測できるものとか 0:50:34.071,0:50:35.772 例えば誰かの誕生日は簡単に[br]検証でき 0:50:35.772,0:50:38.943 今日のキーノートのように[br]性別はもっと複雑です 0:50:40.063,0:50:43.441 もう少しデータのクオリティの分野で 0:50:43.441,0:50:47.255 信頼性と検証可能性に関して[br]知っていることを話してもらえますか 0:50:54.545,0:50:58.440 あまりなければ[br]もっとあって欲しいと思います(笑) 0:51:00.510,0:51:02.672 (リディア)はい 0:51:03.822,0:51:06.516 明らかにあまり言うことがないようです(笑) 0:51:07.666,0:51:12.404 (アンドレア)できることがたくさんありますが[br]昨日 あなたと話したように 0:51:12.404,0:51:16.814 昨日習った私の好みの例は[br]もう昨日拝み倒されたものですが 0:51:16.814,0:51:19.579 Q2 地球に行くと 0:51:19.579,0:51:22.451 地球は平面というステートメントがあります 0:51:23.476,0:51:26.510 この例が大好きです 0:51:26.510,0:51:28.963 なぜならそれを主張するコミュニティがあり 0:51:29.203,0:51:31.128 検証可能なリソースがあるからです 0:51:31.335,0:51:33.191 これは誠実な例で 0:51:33.191,0:51:35.817 拝み倒されるべきでなく[br]ウィキデータにあるべきです 0:51:36.124,0:51:39.664 Shape Expressionは 0:51:39.664,0:51:42.161 ここで非常に役立ちます 0:51:43.141,0:51:45.775 このユースケースにとても[br]関心があるとか 0:51:45.775,0:51:47.652 これは同意しないユースケースとか 0:51:47.652,0:51:53.119 しかしまたこれはいいけど[br]関心があるというユースケースもあります 0:51:53.119,0:51:55.349 ここに例があるとします[br]グルコースがあります 0:51:55.349,0:51:56.419 生物学者なら 0:51:56.419,0:51:59.399 グルコースの分子構造の[br]化学的拘束には興味がないでしょう 0:51:59.399,0:52:03.041 すべてのグルコースに関することは[br]同じです 0:52:03.041,0:52:05.816 でも化学者なら[br]これを聞くと気になると思います 0:52:05.816,0:52:08.281 200ほどのものがあります 0:52:08.281,0:52:10.903 だから複雑のShape Expressionがあります 0:52:10.903,0:52:12.501 ここで[br]化学者の立場で 0:52:12.501,0:52:13.833 これに対応します 0:52:13.833,0:52:16.741 そしてあなたが[br]生物学的なユースケースから 0:52:16.741,0:52:19.447 Shape Expressionを適用したいとします 0:52:19.447,0:52:20.721 そして共同したければ 0:52:20.721,0:52:25.138 エリックと ShExについて[br]話すとよいでしょうが 0:52:25.138,0:52:28.738 この行程はまだ始まったばかりですが 0:52:28.738,0:52:31.660 この分野で非常に[br]重要なものと思っています 0:52:34.230,0:52:35.983 (リディア)あちらの方 0:52:40.682,0:52:46.295 (参加者8)ディスカッションでの[br]幾つかの点についてアイデアがあります 0:52:46.295,0:52:49.827 失わないように…[br]3つのアイデアが… 0:52:51.187,0:52:55.815 ちょっと前にジェームスが言ったことで 0:52:55.815,0:52:58.834 上部のオントロジーのための開始から 0:52:58.834,0:53:01.840 ウィキデータにはとても[br]大きな問題があります 0:53:02.810,0:53:05.411 WikidataConで2年前に[br]話しました 0:53:05.411,0:53:07.483 そしてウィキマニアについて[br]話し合いました 0:53:07.483,0:53:08.889 ウィキデータの会議があると 0:53:08.889,0:53:11.068 いつもこれを話します 0:53:11.068,0:53:15.951 なぜなら目につくレベルの[br]とても大きな問題だからです 0:53:15.951,0:53:22.886 何がエンティティで[br]何が workで 何も分野か 0:53:22.886,0:53:25.502 そして芸術[br]もっとも大きな概念です 0:53:27.152,0:53:33.018 これは実際 グローバルなオントロジーの[br]最大の弱点です 0:53:33.018,0:53:38.815 なぜなら人々は常にこれを整理し 0:53:38.815,0:53:42.707 すべてを線で分けようとしているからです 0:53:43.887,0:53:46.827 覚えている人もいると思いますが 0:53:46.827,0:53:51.716 世界中のすべての市を無意識に[br]壊した人がいます 0:53:51.716,0:53:57.484 地理的な項目ではないので[br]拘束違反に満ちて 0:53:57.484,0:54:01.035 誠実な意図でしたが 0:54:01.035,0:54:04.090 項目の間違いを直そうとしていたのに 0:54:04.090,0:54:06.688 すべてを壊していしまいました 0:54:07.508,0:54:10.210 これをどのように解決できるが[br]私はわかりません 0:54:11.130,0:54:16.261 なぜなら実際に写してこれる[br]外部の機関がないからです 0:54:16.261,0:54:18.486 皆さんが作業している 0:54:18.486,0:54:21.719 例えば 芸能データベースだとします 0:54:21.719,0:54:24.684 直接 芸能のラベルに行くか 0:54:24.684,0:54:29.221 あるいはエンティティがなにかの[br]論理的概念には行かず 0:54:29.221,0:54:31.681 これは実際に… 0:54:31.681,0:54:34.671 このレベルで機能している[br]データベースは知りませんが 0:54:34.671,0:54:38.221 これがウィキデータの弱点です 0:54:38.221,0:54:41.521 データのクオリティを話すにおいて 0:54:41.521,0:54:43.802 実際もっと大きなといえるでしょう 0:54:45.242,0:54:49.512 ここで言ったと同じ様に… 0:54:49.512,0:54:51.644 失礼 話題を変えてしまっています 0:54:51.644,0:54:55.389 クオリティについては[br]別のセッションで言及しました 0:54:55.389,0:55:00.031 それに関しては 実際[br]よいモデリングを行っている人がいて 0:55:00.031,0:55:02.364 ShExを活用したりして[br]それを行っています 0:55:03.054,0:55:07.358 ウィキデータでは見れません[br]ShExは見えません 0:55:07.358,0:55:09.007 ディスカッションページでは 0:55:09.007,0:55:10.525 WikiPeojectを見ず 0:55:10.525,0:55:13.612 そして時には[br]プロパティのトークページも見ません 0:55:13.612,0:55:19.673 そこには明確に a)このプロパティが[br]そのために使用されると記載されています 0:55:20.453,0:55:24.218 先週あるプロパティに[br]拘束を加えました 0:55:24.218,0:55:26.839 そのプロパティの創作の[br]ディスカッションに 0:55:26.839,0:55:29.157 この拘束は明確に記述されていました 0:55:29.157,0:55:33.433 私はその拘束を加える技術部分を[br]作っただけですが 0:55:33.433,0:55:37.420 誰かに「私の編集をすべて[br]台無しにした」と言われました 0:55:37.420,0:55:41.297 その人は過去2年 このプロパティを[br]間違って使っていました 0:55:41.297,0:55:46.872 プロパティは実際はとても明瞭ですが[br]警告などがなく… 0:55:46.872,0:55:50.332 だからウィキマニアの[br]ピンクのポニーのように 0:55:50.332,0:55:54.278 WikiPeojectをもって見やすく[br]ShExをもっと見やすくすべきです 0:55:54.278,0:55:56.992 それがクリスティーナは[br]言ったことです 0:55:56.992,0:56:02.169 既存の解決策が見られていないという[br]問題があるんです 0:56:02.169,0:56:04.667 このセッションでは 0:56:04.667,0:56:08.288 もっとShExを作ろうとか 0:56:08.288,0:56:11.232 整理する人の作業を促進しようとか[br]話していますが 0:56:11.992,0:56:14.262 ウィキデータの一日目から[br]整理をしてきていて 0:56:14.262,0:56:17.617 グローバルには追いついて行けていません 0:56:17.617,0:56:20.437 追いつけていけない訳は… 0:56:20.437,0:56:23.075 名前が複雑だと知っていて 0:56:23.075,0:56:26.211 私だけで整理の作業をしていて 0:56:26.211,0:56:28.900 すべての中国人の研究者に 0:56:28.900,0:56:31.812 ラテン語の名前を追加する人がいるとしたら 0:56:31.812,0:56:35.950 何ヶ月も整理にかかり[br]一人ではやっていけません 0:56:35.950,0:56:39.548 ではその人はバッチで[br]その作業をしたでしょう 0:56:39.548,0:56:41.066 私たちが必要なのは… 0:56:41.066,0:56:44.227 ツールの問題ではなくと[br]見て理解されるというが問題です 0:56:44.227,0:56:46.451 既にツールはたくさんあります 0:56:46.451,0:56:50.268 (リディア)そうですね[br]しかし時間のようで(笑) 0:56:50.268,0:56:52.113 締めくくりましょう 0:56:52.113,0:56:54.185 たくさんのコメントを[br]ありがとうございました 0:56:54.185,0:56:56.461 今日 この後もディスカッションを[br]続けてください 0:56:56.461,0:56:58.553 皆さんのご意見ありがとうございました 0:56:58.553,0:57:03.411 (拍手)