< Return to Video

cdn.media.ccc.de/.../wikidatacon2019-9-eng-Data_quality_panel_hd.mp4

  • 0:01 - 0:03
    データクオリティパネル
  • 0:04 - 0:05
    クロディア・ミューラービン、
    ルーカス・ウェアミニスター
  • 0:05 - 0:07
    ホゼ・エミリオ・ラビラ・ガヤ、
    クリスティナ・サラスナ、アンドレア・
  • 0:07 - 0:09
    データクオリティパネルの皆さん
    こんにちは
  • 0:10 - 0:16
    多くの人が私たちのデータが正しいことを
    頼るのでデータクオリティは重要です
  • 0:16 - 0:19
    だからデータクオリティについて
    話し合いましょう
  • 0:20 - 0:26
    4人の講演者は
    データクオリティについて短い紹介をし
  • 0:26 - 0:30
    その後で質疑を行います
  • 0:30 - 0:32
    ではまずルーカスから
  • 0:34 - 0:35
    ありがとう
  • 0:36 - 0:40
    ルーカスです
    まずウィキデータに既にある
  • 0:40 - 0:44
    データクオリティツールと
    開発されていて公開マジかなものについての
  • 0:44 - 0:46
    概要から始めます
  • 0:47 - 0:51
    いくつかのテーマの
    グループに分けました
  • 0:51 - 0:54
    エラーを見つけやすくする
    問題に対処しやすくする
  • 0:54 - 0:56
    データにより検証し
    問題に気づきやすくする
  • 0:57 - 1:03
    一般的なエラーの元を修正する
    既存のデータの質を維持する
  • 1:03 - 1:05
    そして人によるキューレーション
  • 1:05 - 1:10
    そして現在利用可能なものは
    プロパティの拘束からです
  • 1:10 - 1:12
    ウィキデータで
    これを見たことがあると思います
  • 1:12 - 1:15
    このような
    内部のデータの均一性をチェックする
  • 1:15 - 1:17
    アイコンが出ることがあるでしょう
  • 1:17 - 1:21
    例えば
    あるイベントが他に続くなら
  • 1:21 - 1:24
    他のイベントもこのイベントに
    続くべきです
  • 1:24 - 1:27
    このWikidataConの項目では
    それが見られません
  • 1:27 - 1:29
    この機能はできてまだ数日かも
    しれません
  • 1:30 - 1:34
    あるいはこれが制限しすぎだったり
    簡単すぎなら
  • 1:34 - 1:38
    Query Service を使って
    チェックを自分で書くこともできます
  • 1:38 - 1:42
    もちろんQuery Serviceは
    多くのことに有効ですが
  • 1:42 - 1:45
    エラーを見つけることもできます
  • 1:45 - 1:47
    ひとつ間違いを見つけたら
  • 1:47 - 1:50
    他の場所もチェックし
  • 1:50 - 1:52
    他の人が同じエラーをしていないか
  • 1:52 - 1:54
    Query Serviceで見つけられます
  • 1:54 - 1:55
    あるいは2つを組み合わせて
  • 1:55 - 1:58
    拘束違反を
    Query Serviceで探せます
  • 1:58 - 2:01
    例えば
    ある部分にだけあるエラーや
  • 2:01 - 2:04
    WikiProjectの
    あなたの関連した部分だけのエラーなどです
  • 2:04 - 2:08
    でも残念なことに
    その結果は現在のところ完全ではありません
  • 2:08 - 2:10
    改訂スコアリングもあります
  • 2:11 - 2:13
    これは最近の変更からだけ思いますが
  • 2:13 - 2:16
    自動アセスメントのウォッチリストに入れて
  • 2:16 - 2:20
    その編集が誠実なものかどうか
  • 2:20 - 2:23
    また被害を与えるものかどうかを
    見ることができます
  • 2:23 - 2:24
    これは2次元だと思います
  • 2:24 - 2:26
    だから被害を与えるけど
  • 2:26 - 2:30
    誠実なものかどうかに注目して
  • 2:30 - 2:33
    特に友好的な気分なら
  • 2:33 - 2:35
    これらの編集者に
  • 2:35 - 2:39
    「貢献してくれてありがとう
    次回はこのようにしてください」など…
  • 2:41 - 2:42
    でもそうでなければ
  • 2:42 - 2:44
    誠実でないものや
    被害を与えるものを
  • 2:44 - 2:47
    元に戻すこともできます
  • 2:48 - 2:50
    似たものに
    エンティティ・スコアリングがあり
  • 2:50 - 2:52
    これは変更が加えられた
    編集をスコアリングするのはなく
  • 2:52 - 2:54
    全体の改訂をスコアリングします
  • 2:54 - 2:56
    これにはリディアは会議の当初に
    話したのと
  • 2:56 - 3:00
    同じ質の検証が使用されると
    思います
  • 3:00 - 3:05
    このユーザースクリプトで
    これらの1から5のスコアを与えます
  • 3:05 - 3:08
    これは現在の項目のクオリティだと
    思います
  • 3:10 - 3:14
    1次資料ツールは
    すべてのインポートしたい、しかし
  • 3:14 - 3:18
    直接ウィキデータに入れられる質でない
    データベースのためのものです
  • 3:18 - 3:20
    だからこれを1次資料ツールで
    処理し
  • 3:20 - 3:23
    それから実際に人が判断し
  • 3:23 - 3:26
    個々のステートメントを
    加えるかどうかを決めます
  • 3:29 - 3:32
    座標を地図で示すことは
    とても便利な機能ですが
  • 3:32 - 3:34
    クオリティコントロールにも
    有用です
  • 3:34 - 3:37
    これがウィキデータ・ドイツの
    オフィスのはずで
  • 3:37 - 3:39
    座標がインド海の中にあれば
  • 3:39 - 3:42
    何か間違っていると気が付きます
  • 3:42 - 3:45
    単に数字を見るより
    簡単にわかります
  • 3:46 - 3:50
    これは 相対的完全性
    インディケータというガジェットで
  • 3:50 - 3:52
    この小さなアイコンで示され
  • 3:53 - 3:56
    その項目が完成しているかどうか
  • 3:56 - 3:58
    あるいはどのプロパティが
    欠けていそうかを示し
  • 3:58 - 4:00
    項目を編集しているときに便利なもので
  • 4:00 - 4:03
    もし馴染みない分野で
  • 4:03 - 4:06
    使うべき正確なプロパティが
    わからないときには
  • 4:06 - 4:08
    とても便利なガジェットです
  • 4:09 - 4:12
    Shape Expression があります
  • 4:12 - 4:16
    アンドレアかホゼが
    これらについてお話すると思いますが
  • 4:16 - 4:19
    基本的には
    持っているデータをそのテーマに対して
  • 4:19 - 4:21
    比較するためのとても有効な方法です
  • 4:21 - 4:24
    どのステートメントが
    特定のエンティティを持つべきか
  • 4:24 - 4:26
    他のエンティティがリンクされるべきか
    どのように完成されるべきか
  • 4:26 - 4:29
    それによって間違いを見つけることができます
  • 4:30 - 4:32
    えーと
    これですね
  • 4:32 - 4:35
    Integraality または
    プロパティ・ダッシュボード
  • 4:35 - 4:37
    既にあるデータの概要を示します
  • 4:37 - 4:40
    例えば WikiProject Red Pandaの
    このフォームで
  • 4:40 - 4:42
    ここにほとんどすべての赤パンダの
  • 4:42 - 4:44
    性別があるのかわかります
  • 4:44 - 4:47
    誕生日はどこの動物園かによって
    かなり変わります
  • 4:47 - 4:50
    亡くなったパンダは
    ほとんどいないですね
  • 4:50 - 4:53
    よっかた
    かわいいからね
  • 4:54 - 4:56
    これはとても便利です
  • 4:56 - 4:59
    そしてOKすると
    次に出てくるのは
  • 5:00 - 5:04
    ウィキデータ Bridge
    クライアント編集として知られているものです
  • 5:04 - 5:07
    ウィキピディア Infobox から
    ウィキデータを編集します
  • 5:08 - 5:11
    これによりより多くの
    閲覧がなされます
  • 5:11 - 5:14
    なぜならもっと多くの人が
    これらのデータを見るからです
  • 5:14 - 5:19
    これによってウィキピディアでより
    ウィキデータが使われるようになるでしょう
  • 5:19 - 5:21
    そしてもっと多くの人に気づかれるように
    なるでしょう
  • 5:21 - 5:24
    例えばデータが古かったり
    更新が必要なときは
  • 5:24 - 5:27
    ウィキデータ自体だけで気が付かれないことを
    知ることができます
  • 5:28 - 5:31
    Tainted Referencesもあります
  • 5:31 - 5:35
    これはステートメントの値を編集すると
  • 5:35 - 5:37
    タイポなどを直している場合は
    別として
  • 5:37 - 5:39
    リファレンスも更新することがあるでしょう
  • 5:40 - 5:44
    このTainted Referencesは
    編集している人にそれを示す他に
  • 5:44 - 5:50
    他の編集者にも他に
    どのような編集がされたか示します
  • 5:50 - 5:53
    ステートメントの値が変更され
    リファレンスが更新されているいないを知り
  • 5:53 - 5:58
    それらを修正するか
    どうするかを決めることができます
  • 5:58 - 6:00
    もっと修正を入れるか
  • 6:00 - 6:03
    そのままでリファレンス更新は
    必要がないとか…
  • 6:04 - 6:09
    これはSigned statementsに関して
  • 6:09 - 6:12
    データの提供者が心配する…
  • 6:14 - 6:17
    UNESCOかなにかが参照された
    ステートメントがあり
  • 6:17 - 6:20
    突然 誰かがそのステートメントに
    損傷を加えたら
  • 6:20 - 6:23
    UNESCOなどの機関が
  • 6:23 - 6:27
    その損傷されたステートメントを
    出したように見られる恐れがあります
  • 6:27 - 6:29
    だからSigned statementsは
  • 6:29 - 6:31
    暗号的にこのリファレンスに
    サインを入れることができます
  • 6:31 - 6:34
    編集を防ぐことはできません
  • 6:34 - 6:38
    でも少なくとも
    誰かがステートメントを損傷するか
  • 6:38 - 6:40
    あるいは編集したりすると
    サインは無効になります
  • 6:40 - 6:44
    そしてそのステートメントが
    その機関が入れたものでないとわかります
  • 6:44 - 6:47
    もし正しい編集なら そのステートメントを
    再度サインすることができます
  • 6:47 - 6:50
    または編集しなおすことができます
  • 6:51 - 6:54
    それから
    素晴らしいものとして
  • 6:54 - 6:57
    Citoidがウィキデータにはあります
  • 6:57 - 7:01
    これにはURLを貼り付けたり
    識別子 またはISBN
  • 7:01 - 7:05
    ウィキデータIDなど 基本的に
    何でもVisual Editorに入れられ
  • 7:05 - 7:08
    きれいにフォーマットされた
    リファレンスを作成し
  • 7:08 - 7:11
    それにはすべてのデータが含まれていて
    とても使いやすいです
  • 7:11 - 7:14
    それに比べてウィキデータでは
    リファレンスを入れたければ
  • 7:14 - 7:19
    リファレンスURLとタイトル
    著作者名
  • 7:19 - 7:20
    出版元、出版日
  • 7:20 - 7:25
    改訂日などを少なくとも加える必要があり
    とても厄介です
  • 7:25 - 7:29
    ウィキデータにCitoidを統合することで
    それが簡単になります
  • 7:30 - 7:34
    私は以上です
  • 7:34 - 7:36
    ではクリスティーナに渡します
  • 7:38 - 7:42
    (拍手)
  • 7:44 - 7:45
    クリスティーナです
  • 7:45 - 7:48
    チューリッヒ大学の研究員で
  • 7:48 - 7:51
    スイスのコミュニティの
    活動者でもあります
  • 7:52 - 7:58
    クラウディア・ミューラーと私が
    WikidataConにこれを提示した際
  • 7:58 - 8:01
    期待したことは
    今年の始めに
  • 8:01 - 8:05
    データクオリティのワークショップや
    その他のウィキマニアのセッションで
  • 8:05 - 8:08
    始めた議論を継続していくことです
  • 8:08 - 8:09
    今日の講演は基本的に
  • 8:09 - 8:11
    コミュニティと私達が
    集めた考察を提供し
  • 8:11 - 8:17
    会話を続けていくことが目的です
  • 8:17 - 8:21
    これからみなさんと交流を
    続けていきたいと思います
  • 8:21 - 8:24
    私達がもっと重要と思うのは
  • 8:24 - 8:26
    コミュニティの様々なユーザーに
  • 8:26 - 8:32
    何が必要か そしてデータクオリティの
    問題が何かを問い続けることです
  • 8:32 - 8:35
    編集する人たちだけでなく
    コードを書く人や
  • 8:35 - 8:37
    データを利用する人
  • 8:37 - 8:40
    また何が起こったか編集履歴を
    実際 利用する研究者など
  • 8:40 - 8:42
    すべてのユーザーを含みます
  • 8:43 - 8:48
    ウィキデータに存在する約80の
    ツールを評価し
  • 8:48 - 8:53
    それらを異なったデータクオリティの次元で
    整理しました
  • 8:53 - 8:54
    実際に気がついたことは
  • 8:54 - 8:58
    多くのツールは
    完成性をモニターしていて
  • 8:58 - 9:03
    実際…インターリンクを
    可能にするものもありますが
  • 9:03 - 9:08
    多様性を検証するツールが
    欠けていて
  • 9:08 - 9:14
    これは実際ウィキデータに
    特にウィキデータのデザイン原則に
  • 9:14 - 9:16
    組み込めるもののひとつで
  • 9:16 - 9:17
    多様性をもたせ
  • 9:17 - 9:20
    異なった出典からの
  • 9:20 - 9:22
    異なった値の
    異なったステートメントを含めます
  • 9:22 - 9:24
    これらは2次資料になるので
  • 9:24 - 9:27
    実際どれだけの複数の
    ステートメントがあるか
  • 9:27 - 9:31
    どのように どれだけを向上できるか等を
    示すツールはありません
  • 9:31 - 9:33
    また多様なステートメントが存在する
  • 9:33 - 9:35
    理由もよくわかりません
  • 9:36 - 9:40
    だからこれらのコミュニティでの
    ディスカッションから
  • 9:40 - 9:43
    まだ注目すべきチャレンジが
    浮き上がってきました
  • 9:43 - 9:48
    例えばこれらのクラウドソーシングの
    コミュニティがあることは
  • 9:48 - 9:51
    データやグラフの異なった部分に
  • 9:51 - 9:54
    取り組む異なったグループの人々がいて
  • 9:54 - 9:57
    また異なったバックグラウンドの知識を
    注ぎ込まれるという利点がありますが
  • 9:57 - 10:02
    実際は異なった人々が
    異なったプロパティを異なった方法で使い
  • 10:02 - 10:05
    エンティティの識別子に
    異なったものを期待するので
  • 10:05 - 10:09
    何か均一なものに整えるのは
    難しいです
  • 10:09 - 10:11
    グローバルな状態を捉えるための
  • 10:11 - 10:16
    ツールがもっと必要だと
    いう声も聞かれました
  • 10:16 - 10:21
    どのエンティティが
    完成性の点で欠けているか
  • 10:21 - 10:26
    また人々が現在
    どのような作業をしているか
  • 10:26 - 10:30
    そして異なった言語間のみでなく
    かつそのWikiProjectと
  • 10:30 - 10:32
    異なったウィキメディアの
    プラットフォームに渡る
  • 10:32 - 10:36
    緊密な共同についての
    言及もありました
  • 10:36 - 10:39
    これらのディスカッションからの
    すべての書き留められたコメントを
  • 10:39 - 10:42
    Etherpadのここのリンクに
  • 10:42 - 10:46
    またウィキマニアのウィキページに
    公開しました
  • 10:46 - 10:49
    いくつかの解決策は
    実際 異なったWikiProjectで
  • 10:49 - 10:51
    開発された最善の実践方法を
  • 10:51 - 10:56
    共有する方向へ向かうように見えますが
  • 10:56 - 10:59
    チームでの仕事を整理し
  • 10:59 - 11:04
    少なくとも誰が作業をしているか
    理解できるツールも求められています
  • 11:04 - 11:08
    またもっとショーケースが求められ
  • 11:08 - 11:12
    よりよい方法でそれらを作成できる
    テンプレートが求められています
  • 11:13 - 11:17
    自治体オープンデータの組織との
  • 11:17 - 11:19
    コンタクトを通じて
  • 11:19 - 11:20
    そして特に
  • 11:20 - 11:23
    チューリッヒ市と州と接していると
  • 11:23 - 11:26
    ウィキデータに興味が持たれている
    ことがわかります
  • 11:26 - 11:29
    つまり誰でもアクセスして
    データを見ることができる場所で
  • 11:29 - 11:34
    データを皆に提供したいからです
  • 11:34 - 11:36
    だからその目的に沿うには
  • 11:36 - 11:39
    何かのクオリティの識別子を持つことが
    とても気が惹かれるでしょう
  • 11:39 - 11:41
    ウィキでは既にありますが
  • 11:41 - 11:44
    また SPARQLの結果にも
    それらがあると良いでしょう
  • 11:44 - 11:47
    そしてそのコミュニティからの結果が
    信頼できるかどうかわかります
  • 11:47 - 11:51
    さらに持っているデータのどの部分が
    ウィキデータに有益かが理解でき
  • 11:51 - 11:56
    そしてそれらを自動的に
    評価するツールが求められます
  • 11:56 - 12:01
    またデータをインポートするべきか
    リンクするべきかを決断する
  • 12:01 - 12:04
    ある種の手法かツールも必要です
  • 12:04 - 12:05
    場合によっては
  • 12:05 - 12:08
    自分たちのリンクのある
    オープンデータセットを持っている場合
  • 12:08 - 12:10
    データを入れるべきか
  • 12:10 - 12:13
    ウィキデータへデータセットから
    リンクを作るべきか
  • 12:13 - 12:16
    あるいは逆方向にするかなどが
    あるからです
  • 12:16 - 12:20
    またウィキデータのどこにウェブサイトが
    参照されているかを知りたいです
  • 12:20 - 12:23
    Query Serviceでそのような
    クエリを行うと
  • 12:23 - 12:25
    タイムアウトになることもあるので
  • 12:25 - 12:28
    もっとツールを作り
  • 12:28 - 12:32
    これらの質問の答えが
    得られるようにすべきです
  • 12:33 - 12:36
    それ以外にも
  • 12:36 - 12:39
    ウィキ研究者はしばしば
  • 12:39 - 12:42
    編集サマリで情報が
    欠けていることがあります
  • 12:42 - 12:46
    様々なエディタの挙動
    ツールやボット
  • 12:46 - 12:50
    あるいは匿名のユーザーなど
    理解する作業したとき
  • 12:50 - 12:53
    私が覚えていることは
  • 12:53 - 12:58
    例えば使用されたツールを
    追跡する標準の方法などが
  • 12:58 - 13:00
    欠けていたことです
  • 13:01 - 13:03
    PetScanなどそれを既に行うツールも
  • 13:03 - 13:05
    いくつかありますが
  • 13:05 - 13:09
    このようなキメの細かい起源を
    どのように記録するかについて
  • 13:09 - 13:14
    コミュニティで検討するべきでしょう
  • 13:14 - 13:15
    さらに
  • 13:15 - 13:21
    リンクされたデータに関するけど
    すべてのタイプのデータに関しない
  • 13:21 - 13:25
    より強固なデータクオリティ次元を
    考慮する必要があります
  • 13:25 - 13:30
    リンクで可能にされる
    情報取得(Information gain)を
  • 13:30 - 13:32
    調べてみました
  • 13:32 - 13:34
    つまり
  • 13:34 - 13:37
    ウィキデータを他のデータセットに
    リンクする際に
  • 13:37 - 13:42
    どれだけのエンティティが
    実際クラシフィケーションに得られるか
  • 13:42 - 13:45
    あるいは記述や
    また使用されている単語などが得られるかも
  • 13:45 - 13:47
    考えるべきです
  • 13:47 - 13:51
    簡単な例を挙げると…
  • 13:51 - 13:54
    この場合 ウィキデータ
  • 13:54 - 13:58
    あるいはウィキデータにリンクされた
    外部のデータセンターで
  • 13:58 - 14:00
    ナターシャ・ノイと呼ばれる
    人のエンティティがあり
  • 14:00 - 14:03
    所属やその他の情報があります
  • 14:03 - 14:05
    これでOKとして
    外部にリンクし
  • 14:05 - 14:09
    そこにその名前のエンティティが既にあり
    実際同じ値を持っているとします
  • 14:10 - 14:13
    よりよい方法は
    別の名前をもつものにリンクします
  • 14:13 - 14:17
    このひとは2通りの方法で
    名前を書くことができるので有効です
  • 14:17 - 14:20
    あるいはウィキデータにない
    他の情報や
  • 14:20 - 14:22
    他のデータセットにない情報を
    持つことができます
  • 14:22 - 14:25
    もっとよい方法としては
  • 14:25 - 14:29
    この情報を分類する新しい方法を持つ
    ターゲットデータセットを
  • 14:29 - 14:31
    見ることです
  • 14:31 - 14:35
    これが人であるのみでなく
    他のデータセットでは
  • 14:35 - 14:40
    女性であるとかなど
    他の分類も言及できます
  • 14:40 - 14:43
    もし他のデータセットで
    もっと多くの単語が使われていれば
  • 14:43 - 14:47
    全体の情報を回収するものの
    助けにもなります
  • 14:47 - 14:51
    それに関してさらに言えることは
  • 14:51 - 14:56
    フェデレーションクエリーが
    よりよく行われます
  • 14:56 - 15:00
    マリーシェフ達による
    クエリーログを見ると
  • 15:01 - 15:04
    オーガニックなクエリーから
  • 15:04 - 15:07
    フェデレーションクエリーは
    ほんの少ししかないことがわかります
  • 15:07 - 15:13
    実際フェデレーションはリンクされた
    データを持つ主なる有利な点の一つでなので
  • 15:13 - 15:17
    コミュニティや
    ウィキデータを使う人は
  • 15:17 - 15:19
    この例がもっと必要でしょう
  • 15:19 - 15:23
    使用されたエンドポイントを見ると…
  • 15:23 - 15:25
    これは完全なリストではなく
    もっとあります
  • 15:25 - 15:30
    もちろんこのデータは2018年3月までの
    クエリーを評価していますが
  • 15:30 - 15:35
    フェデレーションエンドポイントを見ると
  • 15:35 - 15:37
    それらが使用されているかどうかを
    見るべきです
  • 15:38 - 15:40
    後のディスカッションで使用できる
  • 15:40 - 15:43
    参加者の皆さんへの2つの質問は
  • 15:43 - 15:46
    あなた達の必要に応じるための
  • 15:46 - 15:47
    データクオリティの問題は
    なんであるか
  • 15:47 - 15:50
    そしてまた編集や警衛のために
  • 15:50 - 15:53
    必要な自動化は何かということです
  • 15:54 - 15:56
    以上です
    ありがとうございました
  • 15:56 - 15:58
    (拍手)
  • 16:06 - 16:09
    (ホゼ・エミロ・ラブラ)
    私が話すことは
  • 16:09 - 16:15
    Shape Expressionに関連し
    私達が開発しているツールです
  • 16:16 - 16:19
    私はホゼ・エミロ・ラブラです
  • 16:19 - 16:23
    これらのツールは異なった人によって
    つくられました
  • 16:24 - 16:28
    主にW3C ShEx, Shape Expressions
    コミュニティグループに関連しています
  • 16:28 - 16:30
    ShEx コミュニティグループです
  • 16:30 - 16:36
    まずお話したいのは
    RDFShapeで これは一般的なツールです
  • 16:36 - 16:41
    なぜなら Shape Expressionsは
    ウィキデータのためだけでなく
  • 16:41 - 16:44
    一般的に RDFを検証する言語だからです
  • 16:44 - 16:48
    これは私が主で開発したもので
  • 16:48 - 16:51
    一般的にRDFを検証するツールです
  • 16:51 - 16:55
    RDFについて学習したいとか
    ウィキデータでのみでなく
  • 16:55 - 16:59
    RDFやSPARQL エンドポイントを
    検証したいなら
  • 16:59 - 17:01
    このツールをお勧めします
  • 17:01 - 17:03
    また学習については
  • 17:03 - 17:06
    私は大学で教えていて
  • 17:06 - 17:09
    RDFを教えるにはセマンティクな
    ウェブコースでそれを使っています
  • 17:09 - 17:12
    だからRDFを習いたいなら
    これはよいツールだと思います
  • 17:13 - 17:18
    例えばこのツールでの
    RDFグラフの可視化です
  • 17:19 - 17:23
    ここへ来る前
    先月
  • 17:23 - 17:28
    ウィキデータ用に特に
    RDFShapeを分岐し始めました
  • 17:28 - 17:33
    これを WikiShapeと呼んで
    ウィキデータのプレゼンで紹介しました
  • 17:33 - 17:34
    行ったことは
  • 17:34 - 17:39
    ウィキデータに関連しないものを削除して
  • 17:39 - 17:45
    ウィキデータ SPARQLエンドポイントなど
    幾つかのものをコードに書き込みました
  • 17:45 - 17:49
    ウィキベースにもできるかと
    聞かれましたが
  • 17:49 - 17:52
    ウィキベース用を作るのも
    とても簡単にできます
  • 17:53 - 17:56
    このWikiShapeツールは
    新しいもので
  • 17:57 - 18:00
    ほとんどの機能は働くと思いますが
  • 18:00 - 18:02
    機能しないものもあるでしょう
  • 18:02 - 18:06
    使ってみて向上させたいと
    思われた方はご連絡ください
  • 18:06 - 18:13
    これは[不明瞭]キャプチャですが
    やってみましょう
  • 18:15 - 18:17
    動くかどうかみてみましょう
  • 18:17 - 18:20
    まず外に出て…
  • 18:22 - 18:23
    ここ
  • 18:24 - 18:28
    ここにツールがあります
  • 18:28 - 18:30
    このツールでできることは
  • 18:30 - 18:35
    例えば スキーマ
    エンティティスキーマの検証です
  • 18:35 - 18:39
    ここに新しい名前空間があり
    Eの何か…
  • 18:39 - 18:45
    例えば「human…」と書けば
  • 18:45 - 18:49
    書いていく間に補完されるので
    チェックすることができ
  • 18:49 - 18:52
    例えば
    人のShpae Expressionは
  • 18:53 - 18:56
    ここにあるShpae Expression です
  • 18:56 - 19:00
    このエディタには
    シンタックスが色付けされています
  • 19:00 - 19:05
    これは…
    画面が小さいので
  • 19:06 - 19:08
    大きくしてみましょう
  • 19:09 - 19:11
    見やすくなるでしょう
  • 19:11 - 19:14
    これがエディタで
    シンタックスが色付けされています
  • 19:14 - 19:18
    このエディタは
    ウィキデータ Query Serviceと
  • 19:18 - 19:20
    同じソースコードからできています
  • 19:20 - 19:24
    例えば
    マウスを乗せると
  • 19:24 - 19:28
    異なったプロパティの
    ラベルを表示します
  • 19:28 - 19:33
    ウィキデータのエンティティ
    スキーマは単なるテキストアイデアなので
  • 19:33 - 19:39
    とても便利だと思います
  • 19:39 - 19:42
    このエディタは補完機能があるので
    よりよく
  • 19:42 - 19:44
    また…
  • 19:44 - 19:48
    例えば拘束を加えたければ
  • 19:48 - 19:52
    「wdt:」と打って
  • 19:52 - 19:57
    「author」と書いて
    Ctrl+Spaceと打てば
  • 19:57 - 19:59
    異なった物を提供します
  • 19:59 - 20:02
    これはウィキデータの
    Query Serviceと似ていますが
  • 20:02 - 20:06
    これはShpae Expression特定のものです
  • 20:06 - 20:12
    なぜならShpae Expressionの作成は
  • 20:12 - 20:16
    SPARQL クエリーを書くより
    難しいものではないと思うからです
  • 20:16 - 20:21
    同じレベルだと思う人もいるでしょうが
  • 20:22 - 20:26
    私は多分はより簡単だと思います
  • 20:26 - 20:31
    なぜならShpae Expressionは簡単に
    機能するようにデザインされているからです
  • 20:31 - 20:35
    これが まず最初の
  • 20:35 - 20:37
    Shpae Expressionのための
    エディタです
  • 20:37 - 20:41
    そしてまた例えば
    簡単に可視化できるでしょう
  • 20:41 - 20:45
    Shpae Expressionがあって
    例えば
  • 20:45 - 20:49
    「written work」は
    よい Shpae Expressionでしょう
  • 20:49 - 20:53
    異なった物の間に
    何らかの関連があるからです
  • 20:55 - 20:58
    これは 「written work」の
    UML可視化です
  • 20:58 - 21:02
    UMLでは
    簡単に異なったプロパティを見れます
  • 21:03 - 21:07
    これを行った際
    何人かの Shpae Expressionに
  • 21:07 - 21:09
    間違いがあることに気がつきました
  • 21:09 - 21:13
    何が欠けているプロパティかなどが
    簡単に見つけられるからです
  • 21:14 - 21:16
    そしてもうひとつの可能性は
  • 21:16 - 21:20
    検証ができることだと思います
  • 21:20 - 21:25
    どれかのラベルにあったと思います
    閉じてしまったかも…
  • 21:26 - 21:31
    でも例えばここValidate entities
    クリックできます
  • 21:32 - 21:34
    例えば
  • 21:35 - 21:42
    「q52」そして著者である「e42」
  • 21:43 - 21:46
    「human」で…
    「human」でできると思います…
  • 21:49 - 21:50
    そして
  • 21:51 - 21:56
    SPARQLクエリーをしているので
    少し時間がかかっています
  • 21:56 - 21:59
    この例はネットワークのせいで
    機能しませんが
  • 22:00 - 22:02
    自分で試してみてください
  • 22:03 - 22:07
    では他のツールのプレゼンを続けましょう
  • 22:07 - 22:12
    試したい方 フィードバックが欲しい方は
    連絡してください
  • 22:13 - 22:16
    プレゼンを続けます
  • 22:19 - 22:21
    これが WikiShape です
  • 22:24 - 22:27
    既に言いましたが
  • 22:28 - 22:34
    Shpae Expression エディタは
    GitHubの中の独立したプロジェクトです
  • 22:36 - 22:37
    個人のプロジェクトで使用できます
  • 22:37 - 22:41
    Shpae Expression ツールをしたければ
  • 22:41 - 22:46
    任意のプロジェクトに
    入れ込めばいいだけです
  • 22:46 - 22:48
    これはGitHubの中にあるので
    だれでも使えます
  • 22:49 - 22:52
    私の生徒である同じ著者がさらに
  • 22:52 - 22:56
    作ったShpae Expression用の
    エディタがあり
  • 22:56 - 22:59
    ウィキデータ Query Serviceに
    影響されたもので
  • 22:59 - 23:01
    欄の中に
  • 23:01 - 23:05
    SPARQLクエリーの
    より可視化されたVisual editorがあり
  • 23:05 - 23:07
    このようなものを入れることができます
  • 23:07 - 23:09
    これはスクリーンキャプチャです
  • 23:09 - 23:13
    これはテキストの
    Shape Expressionであることがわかりますが
  • 23:13 - 23:18
    これはフォーム形式のShape Expressionで
    ちょっと時間がかかります
  • 23:19 - 23:23
    異なったフィールドに
    異なった行を入れることができます
  • 23:23 - 23:26
    そして ShExEr があります
  • 23:27 - 23:32
    オビエド大学の大学院生が作ったもので
  • 23:32 - 23:35
    彼がここに来ているので
    ShExErを紹介します
  • 23:38 - 23:40
    (ダニー)ダニー・フェナンデスです
  • 23:40 - 23:44
    オビエド大学の大学院生で
    ラビラと一緒に仕事しています
  • 23:45 - 23:48
    時間が迫っているので
    急いでやります
  • 23:48 - 23:53
    デモはしないで
    スクリーンショットを出しましょう
  • 23:53 - 23:58
    Shape Expressionや他のShape言語で
    作業をする通常の方法は
  • 23:58 - 24:00
    内容領域専門家がいて
  • 24:00 - 24:02
    先験的に
    グラフをどのようにするか
  • 24:02 - 24:04
    構成を定義し
  • 24:04 - 24:07
    その構成を使用して
    実際のデータを検証します
  • 24:08 - 24:12
    ラビラが紹介したもののと同様に
    このツールは
  • 24:12 - 24:14
    一般的な任意のRDFソース用のツールで
  • 24:14 - 24:17
    逆方向にデザインされています
  • 24:17 - 24:19
    幾つかのデータが既にあり
  • 24:19 - 24:23
    Shapeを得たいノードを選択し
  • 24:23 - 24:27
    すると自動的に抽出また
    Shapeを推測します
  • 24:27 - 24:30
    これは一般目的のツールですが
  • 24:30 - 24:34
    WikidataCon のためにしたことは
    これらの優れたボタンです
  • 24:35 - 24:37
    クリックすると起こることは
  • 24:37 - 24:42
    たくさんの構成パラメータがあり
  • 24:42 - 24:46
    ウィキデータエンドポイントに対して
    機能するようになっています
  • 24:46 - 24:48
    失礼
  • 24:49 - 24:53
    このボタンを押せば
    基本的にこれが得られます
  • 24:53 - 24:55
    どのような記述が欲しいか
  • 24:55 - 24:59
    またクラスのインスタンスなど
    探しているものを選択した後
  • 24:59 - 25:01
    自動的にスキーマが得られます
  • 25:02 - 25:07
    どれだけのモードが実際使われているかで
    すべての拘束が整理され
  • 25:07 - 25:10
    あまり共通しないものを
    取り除くことができます
  • 25:10 - 25:12
    このポスターが下に掲示されていて
  • 25:12 - 25:15
    私は今日はこのあたりに
  • 25:15 - 25:16
    一日中いますので
  • 25:16 - 25:19
    このツールに関心のある方は
  • 25:19 - 25:21
    声をかけてください
  • 25:21 - 25:25
    ではラブラにマイクを返します
    ありがとうございました
  • 25:25 - 25:29
    (拍手)
  • 25:30 - 25:33
    (ホゼ)では次のツールにいきましょう
  • 25:33 - 25:35
    これは ShapeDesignerです
  • 25:35 - 25:37
    アンドレア ShapeDesignerを
    ここで紹介しますか
  • 25:37 - 25:39
    それも後でワークショップで
    紹介しますか
  • 25:39 - 25:41
    ワークショップがあるので…
  • 25:41 - 25:44
    午後 特に Shape Expressionのための
    ワークショップがあります
  • 25:45 - 25:48
    もっと実際に行い
    ShExを練習したい方は
  • 25:48 - 25:52
    そちらへお越しください
  • 25:53 - 25:56
    このツールは ShEx…
    エリックがいます
  • 25:56 - 25:57
    紹介してくれますね
  • 25:58 - 26:01
    (エリック)簡単に言いたいことは
  • 26:01 - 26:06
    すでに ShEx のインターフェイスは
    見たことがあるでしょう
  • 26:06 - 26:08
    これはウィキデータ用のものです
  • 26:08 - 26:13
    不要なものを除いた
    ウィキデータ用のものです
  • 26:13 - 26:18
    一般的なものにはもっと機能がありますが
    言っておきたいことは
  • 26:18 - 26:20
    ウィキデータのスキーマを
    デバグするための
  • 26:20 - 26:23
    特に有効な機能です
  • 26:23 - 26:29
    Slurpのモードを選択すると
  • 26:29 - 26:31
    行われることは
    検証中に
  • 26:31 - 26:35
    すべての3つ揃いを取り出したいとき
  • 26:35 - 26:36
    つまり多くの失敗が返ってくると
  • 26:36 - 26:40
    これらを見て
  • 26:40 - 26:42
    どの3つ揃いがここにあり…
  • 26:42 - 26:44
    失礼
    3つ揃いはこの下です
  • 26:44 - 26:46
    これは行われたことのログです
  • 26:46 - 26:49
    ここでリアルタイムで
    いじることができます
  • 26:49 - 26:51
    動かしてみたり
    変えることができます
  • 26:51 - 26:54
    素早くできるバージョンです
  • 26:55 - 26:56
    これがShExのフォームで
  • 26:56 - 27:00
    シャヒーンがドキュメントのためには
    Shape Expressionによって
  • 27:00 - 27:05
    ウィキデータのドキュメントを
    埋めるに役立つだろうと
  • 27:05 - 27:07
    示唆したものです
  • 27:08 - 27:12
    ウィキデータ用には
    つくられていませんので
  • 27:12 - 27:14
    これはあるスキーマがあるとき
  • 27:14 - 27:15
    そのスキーマを特定の方法で
  • 27:15 - 27:18
    描画したいということを注記でき
  • 27:18 - 27:19
    そのフォームを作成し
  • 27:19 - 27:22
    データがあれば
    そのフォームを埋めることもできます
  • 27:25 - 27:26
    PyShExは素晴らしいです
  • 27:28 - 27:31
    (ホゼ)これが最後だと思います
  • 27:32 - 27:34
    最後はPyShExです
  • 27:35 - 27:38
    PyShExはShape Expressionの
    Pythonインプリメンテーションです
  • 27:39 - 27:43
    お好きな方は Juyiter Notebooksでも
    使えます
  • 27:43 - 27:44
    それだけです
  • 27:44 - 27:47
    (拍手)
  • 27:53 - 27:56
    (アンドレア)私が関与した
    特別なプロジェクト
  • 27:56 - 27:58
    Gene Wikiについてお話します
  • 27:58 - 28:05
    それで私達もクオリティの問題を
    対処しています
  • 28:05 - 28:07
    そのクオリティについて話す前に
  • 28:07 - 28:09
    Gene Wiki とは何か
    ちょっと紹介します
  • 28:10 - 28:15
    このプロジェクトの詳細を説明する
  • 28:15 - 28:18
    論文を最近 書いてちょうど
    その出版前のものを公開しました
  • 28:20 - 28:24
    写真を撮っている方もいますが
    基本的に Gene Wikiは
  • 28:24 - 28:28
    生医学のデータ 公開されたデータを
    ウィキデータに入れるもので
  • 28:28 - 28:32
    ウィキデータに入れるには
    特定のパターンに従っています
  • 28:33 - 28:37
    新しいレポジトリや
    データセットが手に入ると
  • 28:37 - 28:40
    それがウィキデータに含まれるべきものなら
  • 28:40 - 28:42
    まず最初にコミュニティによる関与です
  • 28:42 - 28:44
    直接ウィキデータのコミュニティで
    ある必要はなく
  • 28:44 - 28:47
    ローカルな研究コミュニティによる
    関与です
  • 28:47 - 28:50
    オンラインかなにかの方法で会い
  • 28:50 - 28:53
    データモデルを想像します
  • 28:53 - 28:56
    これによりデータを
    ウィキデータモデルにつなげます
  • 28:56 - 29:00
    去年のワークショップの
    写真がここにあります
  • 29:00 - 29:03
    特定のデータセットを
    見ようとしています
  • 29:03 - 29:05
    たくさんの論議があり
  • 29:05 - 29:10
    schema.org とその他の
    存在するオントロジーに揃えています
  • 29:10 - 29:16
    そして最初のステップの終わりに
    ウィキデータに入れたい
  • 29:16 - 29:17
    スキーマが描かれています
  • 29:17 - 29:20
    ここにあるものは
    平素です
  • 29:20 - 29:22
    この後ろにあるのは
  • 29:22 - 29:25
    今日のパネル内でも
    幾つかのスキーマを作れます
  • 29:27 - 29:28
    スキーマができれば
  • 29:28 - 29:31
    次のステップは
    スキーマを機械可読にすることです
  • 29:32 - 29:37
    ウィキデータの入れる生医学の
    データベースから持ち込むデータを
  • 29:37 - 29:40
    つなげる起動可能なモデルが
    ほしいからです
  • 29:40 - 29:45
    ここで Shape Expressionを
    適用しています
  • 29:46 - 29:53
    Shape Expressionは
  • 29:53 - 29:57
    データデットが実際…
    まず
  • 29:57 - 30:02
    既にウィキデータに存在する
    データが同じデータモデルに従っているかが
  • 30:02 - 30:05
    先ほどのプロセスで達成されます
  • 30:05 - 30:08
    そして Shape Expressionで
    このトピックのウィキデータのデータが
  • 30:08 - 30:11
    修正が必要化どうか
    ウィキデータの中のモデルに
  • 30:11 - 30:15
    当てはめるに必要な操作があるかなど
    検証します
  • 30:16 - 30:20
    それが整ったら
    ボットを書き始め
  • 30:21 - 30:24
    ボットは定期的に
    情報を入れています
  • 30:24 - 30:27
    これがウィキデータに入れられる
    1次資料です
  • 30:28 - 30:29
    ボットが出来上がったら…
  • 30:29 - 30:33
    これらのボットは
    私たちのプロジェクトで作られた
  • 30:33 - 30:36
    Wikidata Integratorと呼ばれる
    Pythonライブラリの
  • 30:36 - 30:38
    プラットフォームで書かれます
  • 30:39 - 30:42
    ボットが書かれたら
    継続的インテグレーションのために
  • 30:42 - 30:45
    Jenkinsというプラットフォームを
    使用します
  • 30:45 - 30:46
    Jenkinsでは
  • 30:46 - 30:51
    ウィキデータを1次資料で
    継続して更新できます
  • 30:52 - 30:56
    これが先に話した論文のダイアグラムです
  • 30:56 - 30:57
    これが現在の状態です
  • 30:57 - 31:02
    このオレンジの箱が
    薬物 遺伝子 疾患
  • 31:02 - 31:08
    作用する化学物質の
    1次資料で
  • 31:08 - 31:11
    このモデルは小さくで見にくいですが
  • 31:11 - 31:17
    これがデータベースで
    ウィキデータ内で管理される資料で
  • 31:17 - 31:21
    1次資料とつながっています
  • 31:21 - 31:22
    これがワークフローです
  • 31:23 - 31:25
    私達のパートナーのひとつは
    疾患オントロジーです
  • 31:25 - 31:28
    疾患オントロジーは CCOオントロジーで
  • 31:28 - 31:32
    このCCOオントロジーはそれ自身の
    キューレーションサイクルを持っていて
  • 31:33 - 31:36
    疾患の領域に合わせて
    また疾患の解釈に応じて
  • 31:36 - 31:40
    継続的に疾患オントロジーを
    更新しています
  • 31:40 - 31:44
    ウィキデータにも疾患に関する
    キューレーションサイクルがあり
  • 31:44 - 31:50
    ウィキデータコミュニティでは
    ウィキデータで常にモニターしています
  • 31:50 - 31:52
    私達には2つの役割があり
  • 31:52 - 31:55
    口語的にこれらを
    ゲートキーパーキュレーターと呼んでいます
  • 31:56 - 32:00
    これは私と同僚が5年前に
  • 32:00 - 32:03
    コンピュータの前に座って
    ウィキピディアとウィキデータをモニターし
  • 32:03 - 32:09
    もし1次コミュニティ 1次資料へ
    連絡される問題があれば
  • 32:09 - 32:12
    インプリメンテーションを調べ
    決断を下します
  • 32:12 - 32:15
    このウィキデータの入力を信頼するかを見て
  • 32:15 - 32:19
    そして考慮されたら
    このサイクルに入り
  • 32:19 - 32:23
    次のイタレーションは
    疾患オントロジーの部分で
  • 32:23 - 32:25
    ウィキデータに入れられます
  • 32:27 - 32:31
    WikiPathwayでも同じことをしています
  • 32:31 - 32:37
    WikiPathwayはMediaWikiに触発された
    経路のリポジトリです
  • 32:37 - 32:41
    同じ様にウィキデータには既に
    異なった経路が存在します
  • 32:41 - 32:45
    これらの経路のリソースの間で
    一致しない場合は
  • 32:45 - 32:47
    それがゲートキーパー
    キュレーターから
  • 32:47 - 32:50
    コミュニティに連絡され
  • 32:50 - 32:54
    個々のキューレーションのサイクルは
    維持されます
  • 32:54 - 32:57
    もし以前のサイクルを覚えていれば
  • 32:57 - 33:03
    ここでは2つのサイクルと
    2つのリソースのみ話しましたが
  • 33:04 - 33:06
    すべてのリソースに対して
    行う必要があり
  • 33:06 - 33:08
    何が起こっているかを管理しなくては
    なりません
  • 33:08 - 33:10
    キューレーションというのは
  • 33:10 - 33:11
    ウィキピディアのトップページに行き
  • 33:11 - 33:15
    ウィキデータのトップページに行き
    それをやることです
  • 33:15 - 33:19
    これは持っている2つのゲートキーパー
    キュレーターから拡張できません
  • 33:20 - 33:23
    2016年の会議のとき
  • 33:23 - 33:27
    エリックがShape Expressionのプレゼンをし
  • 33:27 - 33:29
    私もこれをやろうと
    これでいいぞと思いました
  • 33:29 - 33:34
    Shape Expressionはウィキデータ内の
    違いを検知する助けになるので
  • 33:34 - 33:41
    ゲートキーパーがより効果的な
    レポートを出せます
  • 33:42 - 33:46
    今年 スキーマエンティティに
    感激しました
  • 33:46 - 33:51
    なぜならそれらのエンティティスキーマを
    ウィキデータ自体に保存できるからです
  • 33:51 - 33:53
    これは以前はGitHubに保存されました
  • 33:54 - 33:57
    ウィキデータのインターフェイスと
    揃えられ
  • 33:57 - 33:59
    ドキュメントのディスカッションができたり
  • 33:59 - 34:01
    また改訂もできます
  • 34:01 - 34:05
    トップページとウィキデータの改訂を
    利用して
  • 34:05 - 34:12
    ウィキデータに何があるべきか
    1次資料が何かについて
  • 34:12 - 34:14
    ディスカッションできます
  • 34:15 - 34:20
    エリックがプレゼンしたものは
    既にとても有益です
  • 34:20 - 34:24
    ここにヒト遺伝子のための
    Shape Expressionを作り
  • 34:24 - 34:30
    簡単なShExを通して使ってみました
    ご覧の通り
  • 34:30 - 34:32
    既に…
  • 34:32 - 34:35
    ひとつモニターする必要のある
    問題があります
  • 34:35 - 34:37
    スキーマに合わない項目が
    ひとつあります
  • 34:37 - 34:43
    これには既にスキーマエンティティ
    キューレーションのレポートが作られ
  • 34:43 - 34:46
    異なったキューレーションの
    レポートへ送ります
  • 34:48 - 34:53
    ShEx.js は
    構築されたインターフェイスで
  • 34:53 - 34:56
    ここに戻ってみると…
    10 だけやってますが
  • 34:56 - 35:00
    何万ものあるので
    これもうまく拡張しません
  • 35:00 - 35:05
    だから Wikidata Integratorは
    SgExサポートにも対応し
  • 35:05 - 35:07
    そして項目のループをループすることができ
  • 35:07 - 35:11
    yes-no yes-no そして真−偽 真−偽と
    行えます
  • 35:11 - 35:12
    そしてまた
  • 35:13 - 35:17
    レポートの対処の効率を向上します
  • 35:17 - 35:23
    でも最近 ウィキデータの
    Query Service上にビルドされ
  • 35:23 - 35:25
    今 絞り込んでいるところですが
  • 35:25 - 35:27
    同様にこれも拡張しません
  • 35:27 - 35:31
    どのようにウィキデータのモデルを扱うかは
    継続している課題です
  • 35:32 - 35:37
    ShExは巨大に感じるものであるだけでなく
  • 35:37 - 35:40
    その規模は扱うには大きすぎます
  • 35:41 - 35:46
    だから最初の概念の証明
    あるいは演習を始めてみました
  • 35:46 - 35:48
    yEDというツールを使います
  • 35:48 - 35:53
    これらのShape Expressionをまず描き…
  • 35:53 - 35:58
    そしてこのスキーマを
  • 35:58 - 36:01
    Shape Expressionの隣接する
    フォーマットに再生しました
  • 36:01 - 36:05
    だからこれは既に
    Shape Expression言語に尻込みする
  • 36:05 - 36:07
    聴衆者でも使用できます
  • 36:08 - 36:12
    しかし実際
    これらの視覚識別子には問題があります
  • 36:12 - 36:18
    なぜならここに誰かがすでにyEDに描いた
    スキーマであるからです
  • 36:18 - 36:24
    ここにも別のものがあります
    これが使っているのは…綺麗ですね
  • 36:24 - 36:29
    これは壁にかけたいですが
    相互運用可能ではありません
  • 36:30 - 36:32
    私の講演の終わりに
  • 36:32 - 36:36
    このスライドを借りていますが
  • 36:36 - 36:38
    視聴に来てくれている彼に
    感謝します
  • 36:38 - 36:39
    これが大好きです
  • 36:39 - 36:42
    RDFは複雑で鬱陶しいと思われていますが
  • 36:42 - 36:44
    現実はもっと悪く
    これはとても簡単です
  • 36:46 - 36:48
    なぜなら現実のデータの問題は
  • 36:48 - 36:50
    実に複雑です
  • 36:50 - 36:52
    RDFを避けることはできますが
  • 36:52 - 36:56
    複雑なデータやコンピュータの問題を
    避けることはもっと難しいです
  • 36:56 - 37:00
    これはRDFについてですが
    これはモデリングにも当てはまると思います
  • 37:00 - 37:03
    私の講演のポイントは
  • 37:03 - 37:06
    どのようにモデリングをやっていくか?
  • 37:06 - 37:11
    ShEx または
    視覚的モデルを討論すべきか…
  • 37:11 - 37:13
    いかに継続していくか?
  • 37:13 - 37:15
    ご視聴ありがとうございます
  • 37:15 - 37:18
    (拍手)
  • 37:20 - 37:22
    (リディア)ありがとうございました
  • 37:22 - 37:24
    前に来てください
  • 37:24 - 37:28
    質疑を始めます
  • 37:29 - 37:30
    質問は?
  • 37:32 - 37:33
    はい
  • 37:34 - 37:37
    カメラのためには…
  • 37:39 - 37:41
    (リディア)ええ
  • 37:43 - 37:46
    (参加者1)クリスティーナへの質問で
  • 37:47 - 37:51
    他のシステムとのリンクで
  • 37:51 - 37:54
    「情報取得(information gain)」
    という言葉を使われましたが
  • 37:54 - 37:56
    統計と確率に使われる
    情報理論の計測に使われる
  • 37:56 - 37:58
    information gainという言葉がありますが…
  • 37:58 - 38:00
    同じ…
  • 38:00 - 38:02
    確率理論からの
  • 38:02 - 38:04
    情報理論からの
  • 38:04 - 38:06
    information gainと同じ計測を
    意味しているんですか
  • 38:06 - 38:09
    それともなんからの方法で
    情報の取得を測る概念的な意味ですか
  • 38:09 - 38:14
    いいえ実際
    シャノン エントロピーを使って
  • 38:14 - 38:20
    インプリメンテーション測定を
    定義しているので それを意味します
  • 38:20 - 38:23
    詳細な式の説明は避けたかったので…
  • 38:23 - 38:25
    (参加者1)はいわかります
    だから質問したのです
  • 38:25 - 38:27
    (参加者1)ありがとうございました
  • 38:33 - 38:35
    (参加者2)質問というより
    コメントですが…
  • 38:35 - 38:36
    (リディア)どうぞ
  • 38:36 - 38:40
    (参加者2)クオリティや完成性について
  • 38:40 - 38:43
    項目レベルに気が配られていますね
  • 38:43 - 38:47
    私が気になることは同じことが
    階層に適応されていないことで
  • 38:47 - 38:51
    階層が的確でないという
    問題があると思います
  • 38:51 - 38:53
    コモンズ検索や他のことで
  • 38:53 - 38:56
    これが問題になると思います
  • 38:57 - 39:01
    できることのひとつは
    外部の…
  • 39:01 - 39:05
    外部の類義語集が
    その階層を構成する方法として
  • 39:05 - 39:10
    P4900 広範な概念修飾子を使って
  • 39:11 - 39:16
    しかしもっとよい役に立つツールと
    思うのは
  • 39:16 - 39:21
    それによって外部の…
    類義語集の階層マップを
  • 39:21 - 39:24
    ウィキデータの項目にインポート
    できるようになります
  • 39:24 - 39:28
    これらのP9400 修飾子と置かれれば
  • 39:28 - 39:32
    外部の階層から派生した階層を見ることが
  • 39:32 - 39:38
    SPARQLを通じて
    実際よりよいクエリーでできます
  • 39:38 - 39:41
    例えばポーラ・モーマは
    PKMを使いご存知のように
  • 39:41 - 39:44
    ファッションの仕事を多くしています
  • 39:44 - 39:51
    それを使って私達は
    ヨーロッパファッション類義語階層と
  • 39:51 - 39:54
    ゲッティAATファッション類義語階層を
    取り入れ
  • 39:54 - 39:58
    そして私たちにとって
    実に問題となる
  • 39:58 - 40:01
    高レベルの項目のどこに
    ギャップがあるか見てみます
  • 40:01 - 40:04
    なぜならしばしばこれらはウィキピディアの
    曖昧性解消ページにのみあるので
  • 40:04 - 40:09
    階層が欠けている より高レベルの
    項目がたくさんあり
  • 40:09 - 40:14
    これは時々クオリティと完成性の意味で
    把握しておかなければならないものです
  • 40:14 - 40:17
    しかし実際
  • 40:17 - 40:21
    私が書いたたくさんのPullスクリプト
    よりもよいツールは…
  • 40:21 - 40:26
    誰か Pythonで
    PAWS Notebook内に
  • 40:26 - 40:31
    リンクされたデータや
    そうでない
  • 40:31 - 40:35
    外部の類義語集
    そしてその階層を取り
  • 40:35 - 40:41
    それらをP9400値にいれる
    クイックステートメントに入れることです
  • 40:41 - 40:42
    そうすれば後日
  • 40:42 - 40:45
    叙述がもっと完全になったとき
  • 40:45 - 40:49
    これらのP9400を更新するために
  • 40:49 - 40:52
    叙述が更新されるにつれ
    より密度が上がるので
  • 40:52 - 40:55
    システムのその階層が
    もっと増えたことを示すように
  • 40:55 - 41:00
    これらの修飾子も変える必要があります
  • 41:00 - 41:04
    誰かそれをしてくれれば
    とても便利だと思います
  • 41:04 - 41:07
    また項目レベルのみでなく
  • 41:07 - 41:11
    階層レベルでクオリティと
    完成性を向上する
  • 41:11 - 41:13
    他のアプローチについても
    検索するべきです
  • 41:13 - 41:15
    (アンドレア)付け足していいですか?
  • 41:16 - 41:20
    実際にやっています
  • 41:20 - 41:24
    フィンが語彙的データで作った
  • 41:24 - 41:27
    Shape Expressionを見ることを
    お勧めします
  • 41:27 - 41:30
    彼はShape Expressionを創り
    そして著作者表現にビルトしています
  • 41:30 - 41:33
    だからウィキデータの中の
    リンクされたShape Expressionの構想で
  • 41:33 - 41:35
    特に
    私が正しく理解していれば
  • 41:35 - 41:37
    それはまさに Gene Wikiの中で
    やっていることです
  • 41:37 - 41:41
    ウィキデータに入れられた
    疾患オントロジーがあれば
  • 41:41 - 41:45
    疾患のデータが入れられ
  • 41:45 - 41:48
    この類義語集に一致するかを知るに
    Shape Expressionを応用できます
  • 41:48 - 41:51
    またウィキデータに入れる必要のある
  • 41:51 - 41:53
    他の類義語集や制御された語彙の
    他のオントロジーがあります
  • 41:53 - 41:55
    これはまさにShape Expressionが
    有用です
  • 41:55 - 41:58
    なぜなら疾患オントロジー用の
    Shape Expressionが持て
  • 41:58 - 42:00
    Mesh用のShape Expressionが持て
  • 42:00 - 42:02
    そして「じゃあクオリティを調べよう」
    ということになります
  • 42:02 - 42:05
    なぜなら制御された語彙がある場合
  • 42:05 - 42:10
    ウィキデータの内容も
    このクオリティに沿っているとしても
  • 42:10 - 42:12
    それに同意しない
    コミュニティもあるでしょう
  • 42:12 - 42:15
    だからツールは準備されていても
  • 42:15 - 42:18
    これらのモデルを作り 異なった
    ユースケースに適用することになります
  • 42:19 - 42:23
    (参加者2)外部のオントロジーを
    ウィキデータにマップしたものがあれば
  • 42:23 - 42:26
    Shape Expressionはとても有益ですが
  • 42:26 - 42:29
    私の問題はそれに至ることです
  • 42:29 - 42:35
    どれだけの外部のオントロジーが
    まだウィキデータに中に無いか
  • 42:35 - 42:38
    そしてそのギャップがどこになるかを
    知るために
  • 42:38 - 42:41
    より使いやすいツールで
  • 42:41 - 42:44
    欠けている
    外部のオントロジーを探すことは
  • 42:44 - 42:46
    とても有益になるでしょう
  • 42:48 - 42:49
    ここでの最も大きい問題は
  • 42:49 - 42:51
    ツールではなく
    ライセンスです
  • 42:52 - 42:55
    オントロジーをウィキデータに
    取り込むのは簡単ですが
  • 42:55 - 42:59
    ほとんどのオントロジーは
    どう言えばいいか…
  • 43:00 - 43:03
    ライセンスの制御があり
    ウィキデータには使えません
  • 43:04 - 43:07
    (参加者2)とても多くの
    一般使用可能な類義語辞書が
  • 43:07 - 43:08
    文化の分野にはあります
  • 43:08 - 43:11
    −(アンドレア)話し合う必要がありますね
    −(参加者2)そうですね
  • 43:11 - 43:12
    (アンドレア)では話しましょう
  • 43:14 - 43:19
    (参加者3)コメントしたいことは
    ジェームスへの答えになります
  • 43:19 - 43:22
    つまり階層がグラフを作り
  • 43:22 - 43:24
    もしあなたが…
  • 43:25 - 43:29
    基本的に言いたいことは
  • 43:29 - 43:31
    階層の共通した問題は
    サークル階層です
  • 43:31 - 43:34
    お互いに戻ってくるようになり
    問題がある際には
  • 43:34 - 43:36
    そのような階層を
    持つべきではありません
  • 43:37 - 43:41
    このおかしなことは
    ウィキピディアのカテゴリでよく起こります
  • 43:41 - 43:43
    カテゴリにたくさんサークルがあります
  • 43:44 - 43:47
    しかしいいことにはこれは…
  • 43:48 - 43:52
    技術的に言ってこれは PMP完成の問題で
  • 43:52 - 43:54
    グラフを作ると簡単に
    見つけることができません
  • 43:54 - 43:57
    しかし多くの開発された方法があり
  • 43:57 - 44:01
    これらの階層グラフの
    問題を見つけられます
  • 44:01 - 44:05
    例えば「*Finding Cycles Breaking Cycles
  • 44:05 - 44:08
    in Noisey Hiearachies*」という論文で
  • 44:08 - 44:13
    英語のウィキピディアのカテゴリの
    問題を助けています
  • 44:13 - 44:17
    これをウィキデータのこれらの
    階層に応用することができ
  • 44:17 - 44:20
    問題になりそうなものを見つけ
  • 44:20 - 44:22
    支障をきたすものを取り除けばいいです
  • 44:22 - 44:25
    実際 支障を見つけます
  • 44:25 - 44:27
    これは単にアイデアですが…
  • 44:28 - 44:30
    (参加者2)それはいいですね
  • 44:30 - 44:34
    しかしあなたは存在する
    不適切なサブクラスの関係の数を
  • 44:34 - 44:35
    軽く見ていると思います
  • 44:35 - 44:40
    全く間違った国に
    市を持っているようなもので
  • 44:40 - 44:45
    地理のツールとして
    それを見つけるものがありますが
  • 44:45 - 44:49
    階層に使えるツールが必要です
  • 44:49 - 44:53
    完全に欠けている国に相当する
    項目がどこにあるか
  • 44:53 - 44:58
    また全く異なったものに
    サブクラスされているものがあるかを
  • 44:58 - 45:02
    認識するためのツールが必要です
  • 45:03 - 45:07
    (リディア)あなたの言っていることは
  • 45:07 - 45:12
    私と私のチームが
    私達のデータを再利用する人たちから
  • 45:12 - 45:14
    よく聞くことと似ています
  • 45:15 - 45:17
    個々のデータポイントは適正でも
  • 45:17 - 45:20
    オントロジーなどで見なければ
  • 45:20 - 45:22
    それは…
  • 45:22 - 45:26
    なぜこれが起こるかの
    もっとも問題となる点は
  • 45:26 - 45:31
    ウィキデータの編集の多くが
  • 45:31 - 45:35
    個々の項目で起こっていて
  • 45:35 - 45:36
    項目が編集しています
  • 45:38 - 45:42
    例えばそのグラフの他の部分への
  • 45:42 - 45:44
    全体への影響を理解していない
    ことがあります
  • 45:45 - 45:50
    個々のローカルでの編集の影響を
    もっと可視化できる方法について
  • 45:50 - 45:53
    アイデアがある方がいれば
  • 45:54 - 45:58
    誠実に編集を加える人たちに
  • 45:58 - 46:03
    その影響を見せることができれば
  • 46:03 - 46:04
    これは探求する価値が
  • 46:04 - 46:06
    あると思います
  • 46:07 - 46:12
    わあ では君 そして君 そして君
  • 46:12 - 46:14
    (参加者3)ディスカッションの後で
  • 46:14 - 46:18
    ジェームスの言ったことに
    同意を示したいです
  • 46:18 - 46:22
    基本的にもっと危険なものは
    階層でしょう
  • 46:22 - 46:24
    階層ではなくてもっと一般的に
  • 46:24 - 46:28
    ウィキデータ内のサブクラスの関連の
    意味論でしょう
  • 46:28 - 46:33
    この会議のための
    最近 言語を学んでいます
  • 46:33 - 46:35
    例えば多くの場合
  • 46:35 - 46:39
    言語は同じもののサブクラス
    そして一部です
  • 46:39 - 46:44
    つまり柔軟なオントロジーを
    持っているといえます
  • 46:44 - 46:46
    ウィキデータはときどき
    それを自由に表現します
  • 46:46 - 46:47
    なぜなら
  • 46:47 - 46:51
    言語のオントロジーは
    政治的にも複雑ですね
  • 46:51 - 46:55
    不明瞭のレベルを表現する立場で
    あるのもいいです
  • 46:55 - 46:58
    しかしそれの機械解読をしたければ
  • 46:58 - 46:59
    それは非常に問題です
  • 46:59 - 47:00
    そしてまた
  • 47:00 - 47:04
    オントロジーは
    元々 私達のものであった何かから
  • 47:04 - 47:05
    インポートされたことはないと思います
  • 47:05 - 47:08
    言ってみれば初期ウィキピディアから
    集めれたものです
  • 47:08 - 47:11
    このShape Expressionはいいけど
  • 47:11 - 47:16
    ウィキデータのオントロジーを
    外部の資料で
  • 47:16 - 47:18
    検証したり修正をしたりもでき
  • 47:18 - 47:20
    素晴らしいアイデアですが
    最後に
  • 47:20 - 47:25
    外部のオントロジーをウィキデータに
    反映することで終わりますか?
  • 47:25 - 47:28
    そしてまた外部の資料から
  • 47:28 - 47:31
    決して集められない私達のオントロジーの
    中核はどうすればいいでしょう
  • 47:31 - 47:32
    どのように修正すべきでしょうか?
  • 47:32 - 47:35
    それはそれ自体の問題になるでしょう
  • 47:35 - 47:39
    外部の何かで
    オントロジーを検証するアイデアから
  • 47:39 - 47:41
    独立して注目しなければ
    ならなくなるでしょう
  • 47:49 - 47:53
    (参加者4)拘束やシェープで
    できることは
  • 47:53 - 47:55
    とても素晴らしいですが
  • 47:55 - 47:58
    主点ははっきりしていく…
  • 47:58 - 48:03
    なぜならデータに何を期待するかが
    明瞭にできるようになったからです
  • 48:03 - 48:07
    以前は個々にツールや
    スクリプトを作る必要があり
  • 48:07 - 48:11
    目につきやすく
    それについて議論できます
  • 48:11 - 48:14
    しかし課題は良し悪しではなく
  • 48:14 - 48:16
    期待です
  • 48:16 - 48:18
    人によって
    ウィキデータでどうモデルするかは
  • 48:18 - 48:21
    異なった期待と議論があるでしょう
  • 48:21 - 48:23
    そしてこれは…
  • 48:23 - 48:26
    現在の状況はその方向に
    一歩進み
  • 48:26 - 48:28
    これに取り組むには
  • 48:28 - 48:31
    技術的な知識が必要となるので
  • 48:31 - 48:36
    この拘束を可視化するための
  • 48:36 - 48:41
    それを理解しやすい
    たぶん自然な言語に変換するための
  • 48:41 - 48:44
    方法が求められ
    良し悪し自体はあまり問題ではないです
  • 48:45 - 48:46
    (リディア)はい
  • 48:51 - 48:54
    (参加者5)クオリティについて
    賛同したいのは…
  • 48:54 - 48:57
    私はたくさんの問題を見つけました
  • 48:59 - 49:02
    インスタンスとサブクラスの間の
    意見の差にも行き当たりました
  • 49:02 - 49:06
    これらの状況のエラーだと思い
  • 49:06 - 49:12
    とても時間のかかるプロセスを
    探しました
  • 49:12 - 49:15
    私が見つけたのは「とても
    興味深い項目を見つけたら 何か…
  • 49:15 - 49:17
    そして派生するすべての
    ステートメントを見つけるに
  • 49:17 - 49:22
    すべてのサブクラスの
    インスタンスを使おう」
  • 49:22 - 49:26
    これはこれらのエラーを見つける
    とても有効な方法です
  • 49:26 - 49:29
    しかしShape Expressionができるか…
  • 49:30 - 49:32
    何か…
  • 49:32 - 49:37
    これらの問題を解消するツールとして
    使えれば…でも…
  • 49:41 - 49:43
    (参加者6)構造的な足跡があれば…
  • 49:46 - 49:49
    構造的な足跡があれば
    改ざん可能な…
  • 49:49 - 49:51
    見てみて
  • 49:51 - 49:54
    これはできると…
    しかしこれが単に
  • 49:54 - 49:57
    現実のものを
    マップしようとしているだけなら
  • 49:57 - 49:59
    とてもたくさんの頭脳が必要でしょう
  • 50:06 - 50:09
    (参加者7)Apple Sire Knowlege の
    パブロ・メンデスです
  • 50:09 - 50:13
    私達はどうプロジェクトとコミュニティを
    助けるかを見つけるために集まっていますが
  • 50:13 - 50:15
    クリスティーナは間違って
    私達が欲しいものを尋ねました
  • 50:16 - 50:20
    (笑)そこで私が思うのは
  • 50:20 - 50:24
    検証可能性に関して
    多くのことが求められます
  • 50:24 - 50:26
    それはプロジェクトやコミュニティ
  • 50:26 - 50:29
    その信頼性の中核となるもののひとつです
  • 50:29 - 50:32
    すべてのステートメントは等しくなく
    とても争われるものや
  • 50:32 - 50:34
    簡単に推測できるものとか
  • 50:34 - 50:36
    例えば誰かの誕生日は簡単に
    検証でき
  • 50:36 - 50:39
    今日のキーノートのように
    性別はもっと複雑です
  • 50:40 - 50:43
    もう少しデータのクオリティの分野で
  • 50:43 - 50:47
    信頼性と検証可能性に関して
    知っていることを話してもらえますか
  • 50:55 - 50:58
    あまりなければ
    もっとあって欲しいと思います(笑)
  • 51:01 - 51:03
    (リディア)はい
  • 51:04 - 51:07
    明らかにあまり言うことがないようです(笑)
  • 51:08 - 51:12
    (アンドレア)できることがたくさんありますが
    昨日 あなたと話したように
  • 51:12 - 51:17
    昨日習った私の好みの例は
    もう昨日拝み倒されたものですが
  • 51:17 - 51:20
    Q2 地球に行くと
  • 51:20 - 51:22
    地球は平面というステートメントがあります
  • 51:23 - 51:27
    この例が大好きです
  • 51:27 - 51:29
    なぜならそれを主張するコミュニティがあり
  • 51:29 - 51:31
    検証可能なリソースがあるからです
  • 51:31 - 51:33
    これは誠実な例で
  • 51:33 - 51:36
    拝み倒されるべきでなく
    ウィキデータにあるべきです
  • 51:36 - 51:40
    Shape Expressionは
  • 51:40 - 51:42
    ここで非常に役立ちます
  • 51:43 - 51:46
    このユースケースにとても
    関心があるとか
  • 51:46 - 51:48
    これは同意しないユースケースとか
  • 51:48 - 51:53
    しかしまたこれはいいけど
    関心があるというユースケースもあります
  • 51:53 - 51:55
    ここに例があるとします
    グルコースがあります
  • 51:55 - 51:56
    生物学者なら
  • 51:56 - 51:59
    グルコースの分子構造の
    化学的拘束には興味がないでしょう
  • 51:59 - 52:03
    すべてのグルコースに関することは
    同じです
  • 52:03 - 52:06
    でも化学者なら
    これを聞くと気になると思います
  • 52:06 - 52:08
    200ほどのものがあります
  • 52:08 - 52:11
    だから複雑のShape Expressionがあります
  • 52:11 - 52:13
    ここで
    化学者の立場で
  • 52:13 - 52:14
    これに対応します
  • 52:14 - 52:17
    そしてあなたが
    生物学的なユースケースから
  • 52:17 - 52:19
    Shape Expressionを適用したいとします
  • 52:19 - 52:21
    そして共同したければ
  • 52:21 - 52:25
    エリックと ShExについて
    話すとよいでしょうが
  • 52:25 - 52:29
    この行程はまだ始まったばかりですが
  • 52:29 - 52:32
    この分野で非常に
    重要なものと思っています
  • 52:34 - 52:36
    (リディア)あちらの方
  • 52:41 - 52:46
    (参加者8)ディスカッションでの
    幾つかの点についてアイデアがあります
  • 52:46 - 52:50
    失わないように…
    3つのアイデアが…
  • 52:51 - 52:56
    ちょっと前にジェームスが言ったことで
  • 52:56 - 52:59
    上部のオントロジーのための開始から
  • 52:59 - 53:02
    ウィキデータにはとても
    大きな問題があります
  • 53:03 - 53:05
    WikidataConで2年前に
    話しました
  • 53:05 - 53:07
    そしてウィキマニアについて
    話し合いました
  • 53:07 - 53:09
    ウィキデータの会議があると
  • 53:09 - 53:11
    いつもこれを話します
  • 53:11 - 53:16
    なぜなら目につくレベルの
    とても大きな問題だからです
  • 53:16 - 53:23
    何がエンティティで
    何が workで 何も分野か
  • 53:23 - 53:26
    そして芸術
    もっとも大きな概念です
  • 53:27 - 53:33
    これは実際 グローバルなオントロジーの
    最大の弱点です
  • 53:33 - 53:39
    なぜなら人々は常にこれを整理し
  • 53:39 - 53:43
    すべてを線で分けようとしているからです
  • 53:44 - 53:47
    覚えている人もいると思いますが
  • 53:47 - 53:52
    世界中のすべての市を無意識に
    壊した人がいます
  • 53:52 - 53:57
    地理的な項目ではないので
    拘束違反に満ちて
  • 53:57 - 54:01
    誠実な意図でしたが
  • 54:01 - 54:04
    項目の間違いを直そうとしていたのに
  • 54:04 - 54:07
    すべてを壊していしまいました
  • 54:08 - 54:10
    これをどのように解決できるが
    私はわかりません
  • 54:11 - 54:16
    なぜなら実際に写してこれる
    外部の機関がないからです
  • 54:16 - 54:18
    皆さんが作業している
  • 54:18 - 54:22
    例えば 芸能データベースだとします
  • 54:22 - 54:25
    直接 芸能のラベルに行くか
  • 54:25 - 54:29
    あるいはエンティティがなにかの
    論理的概念には行かず
  • 54:29 - 54:32
    これは実際に…
  • 54:32 - 54:35
    このレベルで機能している
    データベースは知りませんが
  • 54:35 - 54:38
    これがウィキデータの弱点です
  • 54:38 - 54:42
    データのクオリティを話すにおいて
  • 54:42 - 54:44
    実際もっと大きなといえるでしょう
  • 54:45 - 54:50
    ここで言ったと同じ様に…
  • 54:50 - 54:52
    失礼 話題を変えてしまっています
  • 54:52 - 54:55
    クオリティについては
    別のセッションで言及しました
  • 54:55 - 55:00
    それに関しては 実際
    よいモデリングを行っている人がいて
  • 55:00 - 55:02
    ShExを活用したりして
    それを行っています
  • 55:03 - 55:07
    ウィキデータでは見れません
    ShExは見えません
  • 55:07 - 55:09
    ディスカッションページでは
  • 55:09 - 55:11
    WikiPeojectを見ず
  • 55:11 - 55:14
    そして時には
    プロパティのトークページも見ません
  • 55:14 - 55:20
    そこには明確に a)このプロパティが
    そのために使用されると記載されています
  • 55:20 - 55:24
    先週あるプロパティに
    拘束を加えました
  • 55:24 - 55:27
    そのプロパティの創作の
    ディスカッションに
  • 55:27 - 55:29
    この拘束は明確に記述されていました
  • 55:29 - 55:33
    私はその拘束を加える技術部分を
    作っただけですが
  • 55:33 - 55:37
    誰かに「私の編集をすべて
    台無しにした」と言われました
  • 55:37 - 55:41
    その人は過去2年 このプロパティを
    間違って使っていました
  • 55:41 - 55:47
    プロパティは実際はとても明瞭ですが
    警告などがなく…
  • 55:47 - 55:50
    だからウィキマニアの
    ピンクのポニーのように
  • 55:50 - 55:54
    WikiPeojectをもって見やすく
    ShExをもっと見やすくすべきです
  • 55:54 - 55:57
    それがクリスティーナは
    言ったことです
  • 55:57 - 56:02
    既存の解決策が見られていないという
    問題があるんです
  • 56:02 - 56:05
    このセッションでは
  • 56:05 - 56:08
    もっとShExを作ろうとか
  • 56:08 - 56:11
    整理する人の作業を促進しようとか
    話していますが
  • 56:12 - 56:14
    ウィキデータの一日目から
    整理をしてきていて
  • 56:14 - 56:18
    グローバルには追いついて行けていません
  • 56:18 - 56:20
    追いつけていけない訳は…
  • 56:20 - 56:23
    名前が複雑だと知っていて
  • 56:23 - 56:26
    私だけで整理の作業をしていて
  • 56:26 - 56:29
    すべての中国人の研究者に
  • 56:29 - 56:32
    ラテン語の名前を追加する人がいるとしたら
  • 56:32 - 56:36
    何ヶ月も整理にかかり
    一人ではやっていけません
  • 56:36 - 56:40
    ではその人はバッチで
    その作業をしたでしょう
  • 56:40 - 56:41
    私たちが必要なのは…
  • 56:41 - 56:44
    ツールの問題ではなくと
    見て理解されるというが問題です
  • 56:44 - 56:46
    既にツールはたくさんあります
  • 56:46 - 56:50
    (リディア)そうですね
    しかし時間のようで(笑)
  • 56:50 - 56:52
    締めくくりましょう
  • 56:52 - 56:54
    たくさんのコメントを
    ありがとうございました
  • 56:54 - 56:56
    今日 この後もディスカッションを
    続けてください
  • 56:56 - 56:59
    皆さんのご意見ありがとうございました
  • 56:59 - 57:03
    (拍手)
Title:
cdn.media.ccc.de/.../wikidatacon2019-9-eng-Data_quality_panel_hd.mp4
Video Language:
English
Duration:
57:10

Japanese subtitles

Revisions