Return to Video

cdn.media.ccc.de/.../wikidatacon2019-1035-eng-Data_import_process_overview_hd.mp4

  • 0:00 - 0:02
    [GLAMパネル]
  • 0:02 - 0:06
    [スサンナ・オーネス、マイク・ディキソン、
    ユアヒム・ナイバート、ビート・エスターマン]
  • 0:06 - 0:08
    皆さん こんにちは
  • 0:09 - 0:12
    GLAMパネルにようこそ
  • 0:13 - 0:17
    始める前に
    2つお知らせがあります
  • 0:17 - 0:23
    第1に Etherpadを広く活用して
    メモを取ってください
  • 0:24 - 0:29
    第2に 自宅やその他の場所で
    ご覧の皆さんへ
  • 0:30 - 0:32
    ご質問があれば
  • 0:32 - 0:34
    Etherpadへ
    書き込んでください
  • 0:34 - 0:38
    この部屋のサポート担当が
    把握していく予定です
  • 0:39 - 0:44
    皆さんの貢献を拝見した後に
  • 0:44 - 0:49
    私たちが決定した
    今年のパネルのテーマは
  • 0:49 - 0:53
    実際のウィキメディアの
    プロジェクトを凌駕する
  • 0:53 - 0:57
    データ エコシステムにおける
    ウィキデータの役割です
  • 0:57 - 1:04
    これは新しいウィキメディア財団の戦略とも
    完全に一致するものです
  • 1:05 - 1:08
    今日は4名のパネリストがいます
  • 1:08 - 1:10
    3名と私です
  • 1:10 - 1:15
    ご紹介しますので
    登壇してください
  • 1:22 - 1:25
    こちらはスサンナ・オーネスです
  • 1:25 - 1:29
    長年フリー ナレッジの活動をしており
  • 1:29 - 1:32
    数多くのウィキプロジェクトに
    参加しています
  • 1:32 - 1:36
    今日は フィンランド国立図書館との
    共同プロジェクトに関して
  • 1:36 - 1:38
    お伝えいただく予定です
  • 1:39 - 1:43
    次にご紹介するのは 私の隣の
    マイク・ディキソンです
  • 1:43 - 1:46
    ご覧の順で
    2番目にお話しいただきます
  • 1:47 - 1:50
    彼はニュージーランドの学芸員です
  • 1:50 - 1:54
    また 動物学者で
    ウィキペディア編集者でもあり
  • 1:54 - 1:57
    さらに 2018年と2019年における
  • 1:57 - 2:03
    ニュージーランド初の
    ウィキペディアン代表です
  • 2:04 - 2:07
    お話しいただくのは
    その役割に関する経験と
  • 2:07 - 2:13
    その状況の中で
    ウィキデータが果たしている役割です
  • 2:16 - 2:18
    次にご紹介するのは
    ユアヒム・ナイバートです
  • 2:18 - 2:23
    キールとハンブルグにある
    ドイツ国立経済学図書館からお越しです
  • 2:24 - 2:29
    彼が取り組んでいるのは
    世界最大の公開出版物アーカイブを
  • 2:29 - 2:35
    ウィキデータを使用して
    一般に利用しやすくすることです
  • 2:36 - 2:39
    最後に私
    ビート・エスターマンです
  • 2:39 - 2:43
    スイスのベルン応用科学大学に
    勤めています
  • 2:44 - 2:50
    スイスやオーストリアで
    OpenGLAMを長年推進しています
  • 2:50 - 2:53
    今日お伝えするのは
  • 2:53 - 2:59
    Canadian Arts Presenting Associationと
    行っている活動です
  • 2:59 - 3:02
    舞台芸術に焦点を当てたものであって
  • 3:02 - 3:04
    ウィキデータが主ではありませんが
  • 3:04 - 3:09
    そこでもウィキデータが果たしている
    役割を理解していただけるはずです
  • 3:09 - 3:13
    では着席させていただきまして
  • 3:13 - 3:17
    スサンナにお話しいただきましょう
  • 3:20 - 3:23
    こんにちは
    スサンナ・オーネスです
  • 3:23 - 3:25
    ウィキメディア フィンランドで
  • 3:25 - 3:27
    非常勤のGLAMコーディネーターとして
    働いています
  • 3:27 - 3:33
    またオープン ナレッジの分野で
    コンサルタントも行っています
  • 3:33 - 3:36
    これはどちらかと言うと
    後者に関するお話です
  • 3:36 - 3:39
    私が携わっているのは
  • 3:39 - 3:46
    地理的データグループに関する仕事です
  • 3:46 - 3:48
    その対象は―
  • 3:48 - 3:51
    英語では何かというか
    調べました…
  • 3:51 - 3:54
    フィンランド王族統治の
    文化遺産構想です
  • 3:55 - 3:59
    これは次に関係しています
  • 3:59 - 4:00
    地名と
  • 4:00 - 4:07
    地名がフィンランドのGLAMセクターの
    異なるリポジトリにどう表されるか
  • 4:07 - 4:12
    また GLAMセクターが異なるソースを
    どうまとめようとしているか
  • 4:12 - 4:18
    ウィキデータやその他モデリングにより
    GLAMセクターがどう情報を得るかです
  • 4:18 - 4:23
    ここに示されているのは
    YSO placesへの3つの主なソースで
  • 4:23 - 4:28
    これらは全国的または一般的な
    オントロジーの一部です
  • 4:28 - 4:30
    AHAAは
    フィンランドのアーカイブ向け
  • 4:30 - 4:32
    Melindaは
    フィンランド図書館向け
  • 4:32 - 4:34
    KOOKOSは
    フィンランド美術館・博物館向けです
  • 4:34 - 4:38
    ですから3つの
    コンテンツ管理システムが
  • 4:38 - 4:40
    YSO placesにまとまっています
  • 4:42 - 4:48
    ウィキデータとの間では
    すでにデータのやりとりが行われていて
  • 4:48 - 4:53
    国土調査向けの
    ネームプロジェクトも同様です
  • 4:53 - 4:57
    またFinnish Names Archiveという
    第3プロジェクトもあり
  • 4:57 - 5:00
    YSO placesには
    まだ寄与していませんが
  • 5:00 - 5:03
    そのための計画はあります
  • 5:04 - 5:06
    全体の課題の中でも
  • 5:06 - 5:11
    重要なモデリングの課題の1つは
  • 5:11 - 5:16
    このプロジェクトに表されている地名に
  • 5:16 - 5:18
    3種類の要素があることです
  • 5:19 - 5:21
    うち1つ目が場所で
    位置を持つものです
  • 5:22 - 5:25
    2つ目が地名で
    例えば地名学による地名です
  • 5:25 - 5:27
    3つ目がソースで
  • 5:27 - 5:32
    これは場所と地名の双方の由来または
    その裏付けとなる文献です
  • 5:33 - 5:34
    YSO placesは...
  • 5:35 - 5:39
    ここ右上に
    同じ図がまたありますが
  • 5:39 - 5:41
    主に場所を重視しています
  • 5:43 - 5:45
    重要な点は YSO placesが
  • 5:45 - 5:49
    フィンランド国立図書館とFintoの
    プロジェクトであることです
  • 5:50 - 5:56
    現在フィンランド語とスウェーデン語では
    7,000を超える場所が存在し
  • 5:56 - 5:59
    英語では3,000を超える場所が
    存在しており
  • 5:59 - 6:03
    パブリック ドメイン(CC0)の
    ライセンスを取得してあります
  • 6:03 - 6:06
    ここに表示されているのは
    Fintoのサービスです
  • 6:07 - 6:10
    場所はセベッティヤルビを
    選択してあります
  • 6:11 - 6:15
    これは私たちのスコルト・サーミ語での
    言語プロジェクトにも関係しています
  • 6:15 - 6:19
    ここはフィンランドの
    極北に位置する場所で
  • 6:19 - 6:22
    スコルト・サーミが居住しています
  • 6:23 - 6:26
    ここで分かるのは―
  • 6:27 - 6:33
    この場所に関するデータが
  • 6:33 - 6:40
    ウィキデータと
    国土調査のデータに
  • 6:40 - 6:42
    リンクしていることです
  • 6:43 - 6:47
    こちらがその詳細です
  • 6:49 - 6:57
    またこれはリポジトリの中に
    階層的に整理されていますので
  • 6:58 - 7:00
    セベッティヤルビは
    今表示されていませんが
  • 7:00 - 7:06
    この自治体の下に存在しています
  • 7:06 - 7:08
    そして その地域
  • 7:08 - 7:12
    そして国としてのフィンランドや
    さらに広域の地域に含まれています
  • 7:13 - 7:15
    ここで分かるのは
    YSO placesの多くが
  • 7:15 - 7:20
    Mix'n'Matchを通じて
    すでにウィキデータと照合されています
  • 7:20 - 7:22
    未照合のものもあります
  • 7:23 - 7:28
    ですが 名前の量は
    それほど多くありません
  • 7:28 - 7:31
    たった5,000未満です
  • 7:32 - 7:34
    他にもリポジトリとして
  • 7:34 - 7:37
    フィンランドの地理空間的プラットフォーム
    プロジェクトによる
  • 7:37 - 7:40
    Place Names Cardsがあります
  • 7:40 - 7:42
    すべてフィンランドの地図に
    載っている地名です
  • 7:43 - 7:46
    これらにはCCライセンス
    バージョン4.0が付与された
  • 7:46 - 7:48
    リンクトデータもあります
  • 7:49 - 7:50
    80万の地図ラベルは
  • 7:50 - 7:56
    フィンランド語、スウェーデン語
    フィンランドの3つのサーミ語によるものです
  • 7:56 - 7:59
    また2種類の異なるエンティティがあります
  • 7:59 - 8:01
    1つは場所で
  • 8:01 - 8:03
    もう1つは地名などの
    場所の名前です
  • 8:03 - 8:05
    両方に恒久URIがあります
  • 8:06 - 8:08
    例えば同じセベッティヤルビに対し
  • 8:08 - 8:12
    まずフィンランド語
    続いて3つのサーミ語
  • 8:12 - 8:14
    言語同様
    地理的データがあり
  • 8:14 - 8:20
    そして場所の種類などの
    さらなる情報があります
  • 8:22 - 8:26
    これは地名に対するカードで
  • 8:26 - 8:29
    独自のURIがあります
  • 8:30 - 8:34
    失礼 英語のリストに
    翻訳されていないようですが
  • 8:34 - 8:39
    プロジェクトの一部は
    多言語で取り扱われています
  • 8:40 - 8:43
    次にFinnish Names Archive
    についてです
  • 8:43 - 8:46
    これは2017年フィンランドの
    言語機関によるプロジェクトで
  • 8:46 - 8:49
    場所や地名でなく
  • 8:49 - 8:53
    それらのソースを説明するものです
  • 8:53 - 8:57
    地名に関する
    3百万の現地調査記録を含む
  • 8:57 - 9:00
    ウィキベースのプロジェクトです
  • 9:00 - 9:04
    ウィキベースに主にフィンランド語
    いくつかはスウェーデン語で収められています
  • 9:04 - 9:06
    サーミ語の名でも
    傑出したコレクションがあり
  • 9:06 - 9:08
    興味深いものです
  • 9:08 - 9:11
    CC BY(表示)のライセンスが
    付与されているため
  • 9:11 - 9:15
    ウィキデータの観点からは
    困難ではありますが
  • 9:15 - 9:18
    フィンランド語の
    ローカル ウィキベースがあれば
  • 9:18 - 9:23
    私たちがこのプロジェクトで
    初めてそれに取り組めるかもしれません
  • 9:23 - 9:25
    こちらがそのプロジェクトの
    スクリーンショットで
  • 9:26 - 9:30
    表示されているのは
    場所に関する情報―
  • 9:30 - 9:35
    収集者が最初に使用した地図と
  • 9:35 - 9:41
    彼らが収集した情報から
    生み出されたカードです
  • 9:41 - 9:46
    こちらはカードの1つで
  • 9:46 - 9:50
    それらに含まれる詳細データです
  • 9:51 - 9:54
    カードが送られる先は
    リンクト データ プロジェクトで
  • 9:54 - 9:57
    ヘルシンキのデジタル
    ヒューマニティラボ(HDHⅬ)と
  • 9:57 - 9:59
    アールト大学の
    コンピューティング グループである
  • 9:59 - 10:02
    セマティック コンピューターと
    (SeCo)
  • 10:02 - 10:08
    Names Sampoという
    フィンランドの言語機関によるものです
  • 10:08 - 10:11
    これは地名のソースに追加される
  • 10:11 - 10:14
    集約型リサーチインターフェースです
  • 10:14 - 10:17
    左側で 多数のソースが
    あることがここで分かります
  • 10:18 - 10:22
    またこのデータに基づいて
    異なる視覚化も行えます
  • 10:25 - 10:28
    私が提案しているアイデアは
  • 10:28 - 10:33
    ローカル ウィキベース向けのモデリングに
    このデータを使用することです
  • 10:33 - 10:38
    モデル方法などの
    モデリングに関する疑問は出てきます
  • 10:38 - 10:42
    異なる方法や慣習が
    それぞれにあるからです
  • 10:46 - 10:52
    良い点は わずかな努力で
    少数言語をサポートできることです
  • 10:53 - 10:57
    ここに2つの選択肢があります
    [場所が新規項目になるのはいつか]
  • 10:57 - 11:02
    フィンランド語の
    時空オントロジーであるSAPOのモデルと
  • 11:02 - 11:04
    ウィキデータのモデルです
  • 11:04 - 11:08
    ウィキデータでは
    新規項目にならない傾向があります
  • 11:08 - 11:13
    プロパティ変更に関わらず
    同じ項目のままであることが理想です
  • 11:13 - 11:15
    一方 SAPOモデルでは
  • 11:15 - 11:20
    エリアや地名の変更があると
    新規項目になります
  • 11:21 - 11:29
    そこで 場所と地名とソースの
    3つの側面を持つ
  • 11:29 - 11:32
    この区分に戻りましょう
  • 11:32 - 11:38
    地名は エンティティとプロパティの
    どちらにすべきでしょうか
  • 11:38 - 11:40
    ウィキデータが
    プロパティを使用している一方
  • 11:40 - 11:43
    国土調査プロジェクトは
    エンティティを使用しています
  • 11:44 - 11:46
    それとも
    語彙素にするべきでしょうか?
  • 11:46 - 11:50
    ウィキデータは
    地名に対して
  • 11:50 - 11:55
    語彙素よりも
    テキストのプロパティを選択しています
  • 11:56 - 11:58
    失礼 逆でしたか?(笑)
  • 11:58 - 12:00
    ですから 地名は―
  • 12:03 - 12:07
    語彙素ではなく
    プロパティですね
  • 12:07 - 12:11
    ウィキベースの欠点は
  • 12:11 - 12:16
    内部に地理的情報が
    不足していることかもしれません
  • 12:16 - 12:21
    例えば 基本設定では…
  • 12:21 - 12:25
    地域的な地理的情報を
    使用できるようにするためには
  • 12:25 - 12:30
    スタックにテクノロジーを
    加える必要があるでしょう
  • 12:30 - 12:35
    またウィキデータのコーパスを
    活用できるようにするためには
  • 12:35 - 12:38
    フェデレーションが必要です
  • 12:39 - 12:43
    以上です
    ありがとうございます
  • 12:44 - 12:46
    (拍手)
  • 13:01 - 13:03
    はい
  • 13:03 - 13:05
    (マオリ語)
  • 13:05 - 13:08
    ようこそ 皆さん
    マイク・ディキソンです
  • 13:08 - 13:10
    1年間
  • 13:10 - 13:13
    ニュージーランドの
    ウィキペディアン代表でした
  • 13:14 - 13:17
    ウィキペディアン代表とは
    何かと思われるでしょう
  • 13:18 - 13:22
    調べてみると ご覧のように
    そんなものはないからです
  • 13:23 - 13:26
    補助金申請で
    私が造った言葉です
  • 13:26 - 13:30
    財団は気に入ってくれたようなので
  • 13:30 - 13:32
    その肩書を使っています
  • 13:32 - 13:37
    1年間で35の異なる機関を経験しました
  • 13:37 - 13:41
    そのほとんどが在駐で
    トレーニングセッションを行い
  • 13:41 - 13:43
    公開イベントを企画し
  • 13:43 - 13:47
    各所でウィキメディア戦略を
    発展できるよう努めました
  • 13:48 - 13:49
    面白い経験で
  • 13:49 - 13:53
    さまざま広範囲の
    プロジェクトや人々に出会いました
  • 13:53 - 14:00
    面白く啓蒙的な方法で
    ウィキデータを扱っている
  • 14:00 - 14:05
    異なるプロジェクトの
    いくつかをお話します
  • 14:05 - 14:08
    これが皆さんの議論に
    役立つかもしれません
  • 14:09 - 14:11
    このプロジェクトは最初
    ウィキペディアのプロジェクトでした
  • 14:12 - 14:15
    ウィキペディアの名は
    よく知られていたからです
  • 14:15 - 14:20
    伝統的な編集マラソンや
    ジェンダーギャップに関するものなど
  • 14:20 - 14:23
    複数の別のイベントを企画しました
  • 14:25 - 14:27
    多くの皆さんが[聞き取り不能]
  • 14:27 - 14:31
    新しい編集者をうまく募集したり
    することができました
  • 14:32 - 14:34
    コモンズへ
    大量のアップロードを行いました
  • 14:35 - 14:37
    次のような事例もありました
  • 14:38 - 14:41
    昆虫学のイラストレーター
    デス・ヘルモアによる
  • 14:41 - 14:46
    千を超えるオリジナルアート作品の
    コレクションが
  • 14:46 - 14:48
    ハードドライブに放置されており
  • 14:48 - 14:50
    10年に渡る調査研究
    [聞き取り不能]
  • 14:50 - 14:54
    すべてCC BYライセンスの下で
    公表する許可を得たのです
  • 14:55 - 14:58
    これで世間の人たちに
    見てもらいやすくなりました
  • 14:58 - 15:01
    甲虫類のたくさんのイラストで
    皆が理解でき
  • 15:01 - 15:07
    ジェンダーギャップを埋める
    ワークショップも 皆が理解できます
  • 15:07 - 15:09
    ですが ウィキデータは
  • 15:09 - 15:13
    GLAMセクターや
    特定の活動を行う外部の人々に
  • 15:13 - 15:15
    導入してもらうのは
    難しいものでした
  • 15:16 - 15:18
    ウィキデータは
  • 15:18 - 15:21
    ウィキペディアン代表の
    プロジェクトの
  • 15:21 - 15:25
    ますます重要な部分になると
    私は気付き始めました
  • 15:26 - 15:29
    プロジェクトが進むにつれ
  • 15:29 - 15:31
    私の仕事の大部分を
    占めるようになりました
  • 15:32 - 15:36
    そこで ウィキデータを
    自分で学ぼうとし始めました
  • 15:37 - 15:40
    どれだけ重要か
    分かり始めたからです
  • 15:40 - 15:42
    こんなプロジェクトがありました
  • 15:42 - 15:46
    カカポ(フクロウオウム)は
    ニュージーランド固有の跳べないオウムです
  • 15:48 - 15:54
    種を絶滅から救う仕事をしている
    保護局と協働し
  • 15:54 - 15:57
    「ウィキデータへ
    一羽一羽のカカポを収めては」と
  • 15:57 - 15:59
    アイデアを投げ掛けました
  • 16:01 - 16:03
    とんでもないようですが
  • 16:03 - 16:06
    十分に実行可能なプロジェクトで
  • 16:06 - 16:08
    すでにいくつかは収められています
  • 16:09 - 16:12
    カカポはたくさんいるわけではないので
  • 16:12 - 16:13
    扱える作業です
  • 16:14 - 16:17
    開始時には148羽いて
    1羽が死にましたが
  • 16:17 - 16:21
    記録的な繁殖期に
    213羽まで増えました
  • 16:22 - 16:25
    過去50年で最大のカカポ数というのは
    素晴らしいことです
  • 16:26 - 16:28
    これは一大事で
  • 16:28 - 16:31
    ニュージーランドで毎日
    報道されました
  • 16:31 - 16:33
    新しいカカポが生まれるたび
  • 16:33 - 16:34
    (聴衆)ニューヨークタイムズでも
  • 16:34 - 16:36
    (マイク)そうですか
    素晴らしい
  • 16:36 - 16:39
    これは国内ニュースでした
    皆に好かれている鳥です
  • 16:39 - 16:41
    面白いことに
  • 16:41 - 16:44
    個体数の多い種と違い
  • 16:44 - 16:48
    カカポは1羽残らず
    独自の名前が名付けられていて
  • 16:48 - 16:50
    独自のID番号があることです
  • 16:50 - 16:52
    またしばしば
    良い伝記データもあります
  • 16:52 - 16:55
    例えば出生地や
    誕生日
  • 16:55 - 16:57
    孵化した日や
    父母
  • 16:57 - 16:59
    死亡した場合は
    死亡日などです
  • 16:59 - 17:03
    こうした情報は
    保護局のデータベースにあります
  • 17:03 - 17:05
    最も有名なカカポの1羽は
  • 17:05 - 17:09
    風にちなみ名付けられた
    Sirocco(シロコ)で
  • 17:09 - 17:11
    ご覧の誕生データがあり
  • 17:11 - 17:13
    Twitterアカウントもあります
  • 17:14 - 17:17
    ウィキデータは
    それに関して多少問題があります
  • 17:17 - 17:20
    Twitterアカウントを
    持てないからですかね
  • 17:21 - 17:23
    アルバムカバーで
    特集されたりしています
  • 17:23 - 17:26
    このプロパティは複数あり
  • 17:26 - 17:28
    最も有名な
    固有のカカポの1羽です
  • 17:28 - 17:33
    個々のカカポを収めるアイデアを
    保護局に投げ掛けた際
  • 17:33 - 17:37
    どれだけの伝記データを公表するか
  • 17:37 - 17:39
    考慮する必要がありました
  • 17:40 - 17:41
    簡単なリストにして
  • 17:41 - 17:47
    現在212羽...
    2羽は死んだので210羽が
  • 17:47 - 17:50
    生存しているカカポの
    候補すべてです
  • 17:51 - 17:53
    巣立つときに名付けられ
  • 17:53 - 17:55
    まだヒナの間だけ
    コード番号を持ちます
  • 17:56 - 17:59
    完全に羽が生えそろった時に
  • 17:59 - 18:02
    ウィキデータを整えて
  • 18:02 - 18:04
    種全体をウィキデータに収めるのですが
  • 18:05 - 18:07
    DOC IDに対する
    プロパティは考える必要があり
  • 18:07 - 18:09
    それを皆さんにご相談したいのです
  • 18:09 - 18:11
    特定のIDを使用すべきか
  • 18:11 - 18:15
    または 特定の調査プロジェクトに
    タグ付けされている―
  • 18:15 - 18:22
    個体の鳥や植物や動物に対して機能する
    IDを考えるべきかというのは
  • 18:22 - 18:24
    良い質問です
  • 18:25 - 18:28
    2つ目のプロジェクトは
    クライストチャーチ アート ギャラリーです
  • 18:28 - 18:32
    ニュージーランドで
    最も有名なアーティスト
  • 18:32 - 18:34
    コリン・マカホンの絵画が
    数点 存在しています
  • 18:34 - 18:37
    ニュージーランド
    スクール ジャーナルのための絵画で
  • 18:37 - 18:38
    当時 政府が出資したものでした
  • 18:39 - 18:40
    ニュージーランドの
    アーカイブが
  • 18:40 - 18:42
    これらの絵画の著作権を
    持っていました
  • 18:42 - 18:44
    これは非常に稀な状況です
  • 18:45 - 18:47
    私はクライストチャーチ
    アート ギャラリーに勤め
  • 18:47 - 18:49
    オークランド
    アートギャラリーと共に
  • 18:49 - 18:53
    Find New Zealand Artists
    というサイトを管理していました
  • 18:53 - 18:56
    この仕事は
    ニュージーランドのアーティストの
  • 18:56 - 18:58
    各機関の保有資産を追跡することでした
  • 18:58 - 19:03
    データベースにある
    1万8千の異なるアーティストの大半に
  • 19:03 - 19:06
    情報がほとんどありませんでした
  • 19:06 - 19:09
    そこで例のMix'n'Matchで参照し
  • 19:09 - 19:12
    少なくとも誕生日
    または死亡日
  • 19:12 - 19:14
    誕生地や死亡地の
  • 19:14 - 19:18
    情報があるものをエクスポートしました
  • 19:18 - 19:20
    ですから あまり限定されていません
  • 19:21 - 19:23
    それでも 一致したものは
    それほどありませんでした
  • 19:24 - 19:27
    でも 現在ウィキデータで
    著名なアーティストに一致するものは
  • 19:27 - 19:28
    現在約1,500あります
  • 19:29 - 19:30
    これは良いことです
  • 19:30 - 19:32
    ですが彼らにとっての利点は
  • 19:32 - 19:34
    彼らのウェブサイトであることです
  • 19:34 - 19:39
    資産へのリンクで管理するだけです
  • 19:39 - 19:41
    ですがこの伝記データは
  • 19:41 - 19:46
    アーティスト一人一人に対し
    現在 手作業で作成されています
  • 19:46 - 19:49
    エクスポートや
    Mix'n'Matchによる照合で
  • 19:49 - 19:51
    それまで気付かなかった
  • 19:51 - 19:53
    数々の入力ミスと間違いなどが
    明らかになりました
  • 19:54 - 19:56
    Excelを通じて
    並び替えを実行すると
  • 19:56 - 19:57
    これらの問題が明らかになります
  • 19:58 - 20:02
    ウィキデータから情報を取り込めると
    私が言ったとき
  • 20:02 - 20:06
    彼らにとって
    それは真新しい考えで
  • 20:06 - 20:09
    ウィキデータの価値は急に変わりました
  • 20:10 - 20:11
    これは利点の1つだと思います
  • 20:12 - 20:15
    手間暇かけて手作業でキュレートされた
    ウェブサイトがある場合
  • 20:15 - 20:18
    1万8千ものエントリーに
    多数の誤りがあっても
  • 20:18 - 20:21
    他の人に事実確認と修正を
    行ってもらうという
  • 20:21 - 20:23
    別の方法を示せれば
  • 20:23 - 20:25
    共感してもらえます
  • 20:25 - 20:27
    私たちは次のような
    アイデアを投げ掛けました
  • 20:27 - 20:31
    30年代のクライストチャーチの
    ニュージーランド アーティストの
  • 20:31 - 20:33
    歴史本のすべてを
    「ウィキデータ化」するというもので
  • 20:33 - 20:39
    あらゆる人物、コネクション、場所、展示
    などの出版物をデータ化するものです
  • 20:39 - 20:43
    これは管理できる規模のプロジェクトで
    彼らは喜んでいました
  • 20:44 - 20:47
    3つ目に Maori Subject Headings
    (マオリ件名標目)をお見せします
  • 20:47 - 20:48
    waka(ワカ)とは
  • 20:48 - 20:53
    特定の種類のカヌー
    戦争カヌーに対するマオリ名です
  • 20:53 - 20:57
    ニュージーランドの国立図書館に
    wakaに対するリスティングがあり
  • 20:57 - 21:01
    国立図書館は
    マオリの件名標目に関して
  • 21:01 - 21:04
    マオリ語による
    独自の辞書を持っているからです
  • 21:04 - 21:06
    そこでwaka
  • 21:07 - 21:10
    マオリ語と英語で定義されています
  • 21:10 - 21:12
    さらに狭義の言葉もあります
  • 21:12 - 21:14
    画面端でご覧になれます
  • 21:14 - 21:16
    典型的なものは
    taurapa(トゥーラパ)です
  • 21:16 - 21:20
    まずマオリ語で
    次に英語で定義されています
  • 21:20 - 21:22
    これはご覧のように
    彫刻を施した船尾のことで
  • 21:23 - 21:24
    英語で「sternpost」ですが
  • 21:24 - 21:27
    taurapa
    その語は使えません
  • 21:27 - 21:31
    taurapaは特定の種類の
    戦争カヌーの船尾のみを指すからです
  • 21:31 - 21:34
    それに相当する英語はありません
  • 21:35 - 21:42
    文化的特定用語のオントロジー全体が
    注意深くまとめられ
  • 21:42 - 21:45
    国立図書館とマオリ人により
    確認されています
  • 21:45 - 21:48
    英語でもマオリ語でも
  • 21:48 - 21:52
    常に 定義や説明に
    追加や改善がされています
  • 21:52 - 21:53
    素晴らしいことです
  • 21:53 - 21:55
    私はこのたくさんの情報を
  • 21:55 - 21:59
    まずマオリ語で
    次に必要に応じ英語への翻訳で
  • 21:59 - 22:01
    ウィキデータに収めることを
    考えつきました
  • 22:01 - 22:02
    そうなったらいいですよね
  • 22:03 - 22:05
    こちらが著作権とライセンスです
  • 22:05 - 22:09
    あいにく非営利‐改変禁止です
  • 22:10 - 22:13
    そこで彼らがこのライセンスを
    選択した理由について
  • 22:13 - 22:15
    お話ししましょう
  • 22:16 - 22:21
    恐らく このいかなる情報も
    営利目的で使用できないという保証を条件に
  • 22:21 - 22:24
    腰を下ろして
    [聞き取り不能]ことに承諾した
  • 22:24 - 22:27
    マオリ人からのみ同意を得たからです
  • 22:28 - 22:32
    そこがこの仕事のもどかしい面で
  • 22:32 - 22:34
    こうした制限事項に直面しています
  • 22:35 - 22:38
    次の3つを前面に押し出して
    議論の拍車をかけたいと思います
  • 22:38 - 22:41
    ウィキデータに種全体を取り込むこと
  • 22:41 - 22:46
    ウィキデータの価値に関する
    アートギャラリー学芸員の考えを変えること
  • 22:46 - 22:51
    そして別の言語で完全なオントロジーが
    ある場合にどうするか―
  • 22:51 - 22:55
    これはクリエイティブ コモンズの
    ライセンスが限定的なため実現していません
  • 22:56 - 22:57
    ありがとうございました
  • 22:57 - 22:59
    (拍手)
  • 23:11 - 23:14
    ユアヒム・ナイバートです
  • 23:14 - 23:17
    ZBW(ドイツ経済学中央図書館)に
    勤めています
  • 23:18 - 23:21
    これはハンブルグにある
    経済学のための情報センターで
  • 23:21 - 23:24
    私は科学ソフトウェア開発者として
    働いています
  • 23:25 - 23:31
    昨年の仕事の一部は
    ウィキデータへ提供するデータの準備でした
  • 23:32 - 23:38
    メタデータの提供や
    20世紀の出版物アーカイブなど
  • 23:38 - 23:43
    初めての経験として
    その仕事に関してお伝えします
  • 23:46 - 23:48
    私たちが知る限りでは
  • 23:48 - 23:53
    これは世界最大の
    公開出版物アーカイブです
  • 23:54 - 23:59
    1908年から2005年の間に
    集められた
  • 23:59 - 24:09
    1,500を超える新聞と定期刊行物があり
  • 24:09 - 24:13
    収集範囲はドイツ国内から
    世界にまで及びます
  • 24:15 - 24:17
    すべてが網羅されているので
  • 24:17 - 24:22
    興味を引くものであり
  • 24:22 - 24:29
    世界中に進出したい
    ハンブルグの経営者には
  • 24:29 - 24:33
    特に興味深いものだと思います
  • 24:35 - 24:39
    ご覧のとおり
    この資料は新聞の切り抜きで
  • 24:39 - 24:42
    紙に貼られていて
  • 24:42 - 24:45
    それがフォルダーに集められています
  • 24:46 - 24:52
    こちらが人物に関するアーカイブの
    小さなコーナーで
  • 24:52 - 24:55
    それと同様に
  • 24:55 - 25:01
    企業や一般の話題や業績
    すべての人
  • 25:01 - 25:05
    興味を引きそうなこと
    すべてに関する情報が集められています
  • 25:07 - 25:09
    これらのフォルダーは
  • 25:09 - 25:16
    2004年から2007年までのDFG
    (ドイツ研究振興会)出資プロジェクトにより
  • 25:16 - 25:23
    およそ1949年までは
    スキャンされています
  • 25:24 - 25:27
    結果として現在までに
  • 25:27 - 25:33
    この時代の主題関係書類は
    2万5千あります
  • 25:34 - 25:38
    これには約2百万あるいは
    それ以上の数のページが含まれ
  • 25:39 - 25:42
    オンラインに掲載されています
  • 25:44 - 25:48
    当時 ZBWが開発した
    アプリケーションがあり
  • 25:50 - 25:54
    現在では少し時代遅れで
  • 25:55 - 25:58
    凝ったものではなく
    さらに問題なのは
  • 25:59 - 26:05
    オラクルやColdFusionに基づき
    開発されたアプリケーションは
  • 26:05 - 26:09
    Windowsサーバー上で
    運用するものなので
  • 26:09 - 26:15
    長期的に持続可能ではありません
  • 26:16 - 26:23
    もっと凝ったリンクト データ
    アプリケーションへこれを統合すべきか
  • 26:24 - 26:28
    大胆な措置を取って
  • 26:28 - 26:32
    すべてのデータを公開するかを
    話し合いました
  • 26:33 - 26:37
    データにはCC0ライセンスを
    割り当ててあります
  • 26:38 - 26:43
    現在は主要アクセス レイヤー
  • 26:43 - 26:46
    主要ディスカバリ レイヤー
    プライマリ アクセス レイヤーを
  • 26:46 - 26:51
    リンクト オープン データ ウェブへ
    移行していますが
  • 26:51 - 26:57
    ここで実は最も合理的なのは
  • 26:57 - 27:01
    ウィキデータへメタデータを収めて
  • 27:02 - 27:07
    コレクションのすべてのフォルダーを
  • 27:08 - 27:11
    ウィキデータとリンクさせることです
  • 27:11 - 27:13
    そうすれば見つかりやすく
  • 27:14 - 27:18
    これらフォルダーに関する
    すべてのメタデータを
  • 27:18 - 27:23
    ウィキデータへ転送することもできます
  • 27:23 - 27:28
    そこで使用でき
    データの追加や
  • 27:29 - 27:32
    修正も行えるようになります
  • 27:33 - 27:39
    ZBWはまだもちろん
    画像の保管を管理します
  • 27:40 - 27:44
    いかなる方法でも
    移行できないとか
  • 27:46 - 27:51
    オリジナルの作者が所有していたため
    ライセンスを与えられない画像です
  • 27:52 - 27:58
    ですが 将来的には
    IIIFマニフェストに基づき
  • 27:58 - 28:03
    DFGビューアー経由の
    メタデータファイルにより
  • 28:03 - 28:06
    それらを利用できるようにします
  • 28:07 - 28:11
    固定ランディングページも
    準備する予定です
  • 28:12 - 28:18
    これはウィキデータへの参照の
    データポイントの機能を果たすものです
  • 28:18 - 28:23
    また ウィキデータへ
    うまく収められないデータを
  • 28:23 - 28:26
    利用できるようにする予定です
  • 28:31 - 28:38
    私たちはウィキデータへの
    データ統合とデータ提供を
  • 28:38 - 28:42
    そのデータの
    SPARQLエンドポイントから成る
  • 28:42 - 28:46
    カスタムのインフラを使用し行い
  • 28:46 - 28:49
    そして
    フェデレーテッド クエリを使用して
  • 28:49 - 28:54
    エンドポイントと
    ウィキデータのクエリサービスとの間で
  • 28:54 - 28:58
    一致した文を作成します
  • 28:59 - 29:05
    これは SPARQLクエリ自体
    またはスクリプト経由の変換での
  • 29:05 - 29:08
    連結という観点を通して行うものです
  • 29:08 - 29:12
    これにより その文のための
    出典も生成され
  • 29:13 - 29:17
    QuickStatementsの
    コードへ収められ
  • 29:17 - 29:20
    オンラインで使用できます
  • 29:23 - 29:24
    こちらが成果です
  • 29:24 - 29:29
    誕生日などのように
    簡単なものではないですが
  • 29:30 - 29:35
    すでに存在している項目に関する
  • 29:35 - 29:40
    複雑な文もあります
  • 29:40 - 29:45
    例えば 企業の管理役員だったこの人物です
  • 29:47 - 29:49
    ご覧の期間に
  • 29:50 - 29:57
    科学的文脈で使用するために…
  • 29:58 - 30:02
    参照されています
  • 30:08 - 30:11
    データ提供の
    最初の部分が済むと
  • 30:13 - 30:17
    人物のアーカイブは
    完全にウィキデータにリンクされます
  • 30:18 - 30:23
    これは情報ツールでもあります
  • 30:24 - 30:30
    以前は数多くの項目に
    外部の出典がありませんでした
  • 30:31 - 30:36
    私たちには6,000を超える
    文がありましたが
  • 30:36 - 30:42
    これは現在はアーカイブのメタデータが
    出典とされています
  • 30:45 - 30:50
    人物に関しては最も簡単でした
  • 30:51 - 30:55
    なぜならウィキデータで
    人物は簡単に識別できるからです
  • 30:56 - 31:00
    そこに90%超は
    すでに存在していたので
  • 31:00 - 31:02
    私たちはそれにリンクできました
  • 31:03 - 31:09
    欠けている人物のために
    100項目ほど作成しました
  • 31:09 - 31:14
    現在はアーカイブの残りの部分
  • 31:14 - 31:20
    特にトピックのアーカイブに
    取り組んでいます
  • 31:21 - 31:27
    つまり世界全体の
    知識組織化のために
  • 31:27 - 31:30
    歴史体系のマッピングに取り組み
  • 31:30 - 31:34
    ウィキデータへ新聞の切り抜きとして
    資料化しているのです
  • 31:36 - 31:38
    基本的概念をお伝えすると
  • 31:41 - 31:43
    国とトピックのアーカイブは
  • 31:43 - 31:49
    国々の階層構造と
    その他の地理的エンティティで
  • 31:49 - 31:51
    整理されています
  • 31:52 - 31:56
    これは英語に翻訳されていて
    利用しやすくなっています
  • 31:56 - 32:02
    ドイツ語は…
  • 32:04 - 32:08
    トピックでは
    深い階層に分類されています
  • 32:08 - 32:12
    この組み合わせにより
  • 32:13 - 32:16
    1つのフォルダーが定義されています
  • 32:16 - 32:18
    私たちが次に行いたいことは
  • 32:18 - 32:21
    これをウィキデータへの
    構造として一致させ
  • 32:21 - 32:25
    データを移行することです
  • 32:26 - 32:31
    知識組織化という
    この良い挑戦に
  • 32:31 - 32:36
    皆さんご参加ください
  • 32:38 - 32:41
    この仕事を追跡する場が
    ウィキプロジェクトで
  • 32:41 - 32:46
    皆さんはそれをフォローしたり
    それに参加したりできます
  • 32:47 - 32:49
    以上です
    ありがとうございました
  • 32:50 - 32:52
    (拍手)
  • 33:04 - 33:07
    私たちはウィキデータへ
    舞台芸術を取り込んでいます
  • 33:08 - 33:12
    舞台芸術向けのリンクト オープン データ
    エコシステムを構築することで
  • 33:12 - 33:16
    舞台芸術とリンクトデータを
    クラウドへ取り込んでいるのです
  • 33:16 - 33:23
    これからウィキデータに関連する質問に
    お答えしようとしており
  • 33:23 - 33:27
    皆さんにもその回答に
    ご協力いただきたいと思いますが
  • 33:27 - 33:32
    まずは 私の経験からお話しさせてください
  • 33:32 - 33:34
    私は今年―
  • 33:35 - 33:39
    今年前半にCAPACOAと
    楽しく仕事をしていました
  • 33:39 - 33:43
    Canadian Arts Presenting Association
    (カナダ芸術表現協会)の頭文字で
  • 33:43 - 33:48
    リンクト オープン データを
    カナダの芸術部門全体で採用してもらえるよう
  • 33:48 - 33:53
    Linked Digital Future Initiative
    というプロジェクトを開始したのです
  • 33:53 - 33:59
    過去5年間の観察に基づき
    彼らはそれを行いました
  • 34:00 - 34:04
    [聞き取り不能]
    舞台芸術で重要な課題は
  • 34:04 - 34:09
    メタデータが
    不十分な品質であったことと
  • 34:09 - 34:12
    リンクされておらず
    相互運用できなかったことでした
  • 34:12 - 34:16
    そんなわけで
    パフォーマンスやイベントの中には
  • 34:16 - 34:21
    Googleや個人の端末などで
  • 34:21 - 34:25
    うまく見つけてもらえないものも
    ありました
  • 34:26 - 34:30
    そこで私たちが共に築いたビジョンは
  • 34:30 - 34:36
    一度に数多くの利害関係者のための
    情報ベースを持つことでした
  • 34:36 - 34:40
    舞台芸術全体の
    バリューネットワークを調べて
  • 34:40 - 34:42
    そこでの主要な利害関係者を
    明らかにしました
  • 34:43 - 34:48
    また追求したい
    利用シナリオも調べ
  • 34:48 - 34:54
    それを情報ベースまたは
    異なるプラットフォームから成る
  • 34:54 - 34:56
    アーキテクチャ全体に地図化しました
  • 34:57 - 35:00
    これは明らかに
    分散アーキテクチャであり
  • 35:00 - 35:01
    巨大な一枚岩ではありません
  • 35:02 - 35:06
    各自10分しかないので
  • 35:06 - 35:08
    これをさっとご説明しますが
  • 35:09 - 35:12
    詳細に興味がある方がいれば
  • 35:12 - 35:16
    今晩とか明日 理解を深める時間が
    あると思います
  • 35:16 - 35:20
    私たちが着手したのは
    舞台芸術のバリューネットワークからで
  • 35:20 - 35:23
    これは面白いことに
    去年発表されました
  • 35:24 - 35:28
    以前の仕事に基づき
    構築できたのはラッキーです
  • 35:28 - 35:31
    中央にあるのが
    舞台芸術の基本の価値連鎖で
  • 35:31 - 35:34
    さまざまな利害関係者が
    それを取り囲んでいます
  • 35:35 - 35:37
    私たちは全部で
    20の利害関係グループを見つけ
  • 35:37 - 35:41
    各利害関係グループのため
  • 35:41 - 35:45
    それを7つの大きなカテゴリへ要約しました
  • 35:47 - 35:50
    そしてインフラの観点から
  • 35:50 - 35:55
    彼らがどのようなニーズを持ちうるか
  • 35:55 - 35:59
    また 全体がリンクされ
    データが公開で利用できたら
  • 35:59 - 36:02
    何を達成できるかを
    系統立てて明らかにしました
  • 36:03 - 36:05
    異なるタイプが表示されていて
  • 36:05 - 36:07
    Production(制作)
  • 36:07 - 36:09
    Presention & Promotion
    (表現とプロモーション)
  • 36:09 - 36:11
    Coverage & Reuse
    (報道と再利用)
  • 36:11 - 36:12
    Live Audiences
    (ライブ オーディエンス)
  • 36:12 - 36:13
    Online Consumption
    (オンライン消費)
  • 36:13 - 36:14
    Heritage(継承)
  • 36:14 - 36:16
    Research & Education
    (調査研究と教育)
    です
  • 36:16 - 36:19
    こちらに最初の一部分が表示されている
  • 36:19 - 36:21
    大きな表を設定した後
  • 36:21 - 36:24
    その表で比較し
  • 36:24 - 36:29
    すべての利害関係グループが
    全体に渡り利用しているのは
  • 36:29 - 36:31
    どのデータタイプかを調べました
  • 36:31 - 36:37
    これは全体に共通する
    大きな基本データで
  • 36:37 - 36:39
    この領域こそ
  • 36:39 - 36:44
    共に協力して
    データを維持することが
  • 36:44 - 36:46
    合理的な領域なのです
  • 36:48 - 36:51
    プラットフォームの
    アーキテクチャについては
  • 36:51 - 36:54
    ここに4つのレイヤーがありますね
  • 36:54 - 36:56
    下部にはデータレイヤーが表示されています
  • 36:56 - 36:59
    もちろんウィキデータは
    その一部の機能を果たしますが
  • 36:59 - 37:03
    その他データベース
    分散データベースもたくさんあり
  • 37:03 - 37:08
    SPARQLエンドポイントを通じて
    データが公開されています
  • 37:09 - 37:13
    中央の黄色部分が
    セマンティック レイヤーで
  • 37:13 - 37:16
    物事を表現するための
    共通の言語で
  • 37:16 - 37:22
    舞台芸術の物事や
    オントロジーに関する文を作成できます
  • 37:22 - 37:26
    そして次に
    アプリケーション レイヤーがあり
  • 37:26 - 37:32
    これはデータ分析やデータ抽出などの
    さまざまなモジュールで構成されています
  • 37:32 - 37:36
    つまり 非構造化データを
    構造化データにする方法や
  • 37:36 - 37:39
    それをツールでサポートする方法です
  • 37:39 - 37:42
    それからデータの画像化もあります
  • 37:43 - 37:47
    大量のデータがあれば
    何らかの方法で可視化できます
  • 37:48 - 37:50
    また上部に
    プレゼンテーション レイヤーがあり
  • 37:50 - 37:56
    これが普通の人たちが実際に
    日々やりとりするもので
  • 37:56 - 38:00
    検索エンジンや百科事典
    文化的アジェンダ
  • 38:00 - 38:02
    その他各種サービスがあります
  • 38:03 - 38:05
    一から始めたわけではなく
  • 38:05 - 38:09
    この領域で
    すでに作業がなされていました
  • 38:09 - 38:15
    私が参加してきたプロジェクトから
    いくつかの例を取り上げましょう
  • 38:16 - 38:18
    またその他についても
    取り上げていきます
  • 38:19 - 38:20
    私はこの領域において
  • 38:20 - 38:24
    舞台芸術に関する
    スイスのアーカイブから始めました
  • 38:25 - 38:28
    スイスの舞台芸術のデータベースを
    構築するまで
  • 38:28 - 38:31
    舞台芸術のオントロジーを作成しました
  • 38:32 - 38:34
    現在はRDFになっています
  • 38:35 - 38:40
    スイスの舞台芸術の歴史に関しては
  • 38:40 - 38:43
    60、70年間の
    データベースがありますから
  • 38:43 - 38:45
    それを基礎に開発できますし
  • 38:45 - 38:49
    RDFに変換もされています
  • 38:50 - 38:55
    データが利用できる
    構築プラットフォームもありました
  • 38:56 - 39:02
    ウィキデータへ
    いくらか取り込み済みです
  • 39:02 - 39:04
    一部はスイスからのデータで
  • 39:04 - 39:09
    舞台芸術機関からのデータもあります
  • 39:10 - 39:12
    例えば バート・マグナスが
    それに関与しており
  • 39:13 - 39:15
    彼が背景の原動力です
  • 39:15 - 39:18
    またウィキメディア コモンズからの
    データもありますが
  • 39:18 - 39:21
    私たちの残りのメタデータと
    うまくリンクされていません
  • 39:22 - 39:25
    また この取り込みを行うことで
  • 39:25 - 39:32
    スイスのデータモデルを
    ウィキデータへ実装し始めたことになります
  • 39:33 - 39:37
    カナダの実装提携業者の1つが
  • 39:37 - 39:39
    Culture Createsです
  • 39:39 - 39:44
    プラットフォームを運営し
    劇場のウェブサイトから情報を取得し
  • 39:44 - 39:48
    それをナレッジ グラフに入力し
  • 39:48 - 39:55
    そして 検索エンジンや
    その他デバイスに表示します
  • 39:56 - 40:03
    そこでも実装や
    オントロジーへの拡張の必要があり
  • 40:03 - 40:06
    スライドで分かるように
  • 40:06 - 40:10
    まだ空き領域はありますが
    重複もあります
  • 40:10 - 40:13
    重要な重複は
    一般共有された言語で
  • 40:13 - 40:19
    これはさまざまなデータセットを
    リンクするのに役立ちます
  • 40:21 - 40:23
    また重要なことは
  • 40:23 - 40:26
    ベースレジストリと典拠ファイルを
    使用していることです
  • 40:26 - 40:29
    ここが これらのリンクにより
  • 40:29 - 40:34
    ウィキデータが
    重要な役割を果たす所です
  • 40:35 - 40:39
    では Linked Data Future Initiatives
    諮問委員会による
  • 40:39 - 40:42
    アドバイスを共有したいと思います
  • 40:43 - 40:45
    少なくとも2つのアドバイスがあります
  • 40:45 - 40:50
    カナダ自体の舞台芸術の
    ナレッジ グラフを埋めるため
  • 40:50 - 40:53
    カナダの方々には絶対的に重要です
  • 40:53 - 40:56
    スイスの舞台芸術のアーカイブと異なり
  • 40:56 - 40:59
    すでに存在しているデータベースから
    始めるわけではなく
  • 40:59 - 41:02
    一から構築しなければならないからです
  • 41:02 - 41:05
    データをそこに取り込むことが
    間違いなく重要です
  • 41:05 - 41:09
    2つ目に ご覧のように
    ウィキデータはすでに役立っています
  • 41:09 - 41:12
    ウィキデータは
    諮問委員会によると
  • 41:12 - 41:18
    ナレッジグラフArtsdata.ca
    補完するものであり
  • 41:18 - 41:21
    舞台芸術関連のデータを増補するため
  • 41:21 - 41:25
    貢献の努力がなされるべき
    とのことです
  • 41:26 - 41:31
    そこが私たちが今後
    短中期的に取り組む箇所であり
  • 41:31 - 41:34
    そのためここで
    その努力に協力してくれる人が
  • 41:34 - 41:39
    見つけられればと思います
  • 41:41 - 41:45
    現在 私たちは
    互いに補完するものとみなしています
  • 41:45 - 41:50
    そこで両方の手法の
    長所と短所を考える必要があります
  • 41:50 - 41:56
    こちらがウィキデータと従来の
    リンクト オープン データとの比較です
  • 41:57 - 42:03
    皆さんの経験も交えて
    喜んでお話ししたいと思います
  • 42:03 - 42:06
    ウィキデータには大きな長所があります
  • 42:06 - 42:08
    クラウドソースの
    プラットフォームであり
  • 42:08 - 42:12
    関係者を招いて
    協力してもらいやすいからです
  • 42:12 - 42:17
    短所は管理しにくいことです
  • 42:18 - 42:23
    データの所有者は
    自身の図などの権利を手放すことになり
  • 42:23 - 42:26
    データ品質や完成度の管理を
  • 42:27 - 42:31
    自分の管理下にある場合と比べて
    ウィキデータで追跡するのは困難です
  • 42:31 - 42:34
    ウィキデータのその他の長所は
  • 42:34 - 42:40
    世界規模の図への
    瞬時での統合が要求されることです
  • 42:40 - 42:43
    つまり段階的に
    他のデータベースと
  • 42:43 - 42:47
    調整していくことはできません
  • 42:47 - 42:50
    これも長所だと考えられます
  • 42:50 - 42:54
    もちろん統合や
    相互運用性をお求めなら
  • 42:54 - 42:57
    ウィキデータでは初めからきちんと
    その機能が備わっています
  • 42:59 - 43:03
    データ モデリング方法の統一は
  • 43:03 - 43:06
    両方のケースで課題となっています
  • 43:06 - 43:11
    ですが 最初は各自の部門で行うほうが
    簡単に見えます
  • 43:11 - 43:13
    ある時点でその作業が済めば
  • 43:14 - 43:17
    ウィキペディアで
    継続する作業になるからです
  • 43:18 - 43:23
    データ取り込みの
    優先順位付けに関しては
  • 43:24 - 43:29
    現時点で次の規則に従っています
  • 43:30 - 43:34
    まず 本来誰に権限があるか
    確かでない状態で
  • 43:34 - 43:37
    データを取り込むことです
  • 43:37 - 43:40
    こうすれば間違いなく
    共有で管理されることになります
  • 43:41 - 43:47
    また クラウドソースの手法の
    可能性が高いデータを取り込むこと
  • 43:47 - 43:54
    ウィキペディアで再利用される
    可能性の高いデータを取り込むことです
  • 43:55 - 44:00
    また データモデリングと
    標準化に関する
  • 44:00 - 44:04
    国際的な共同作業は
  • 44:04 - 44:07
    もし他の場所で行われていなければ
  • 44:07 - 44:09
    ウィキデータ上で
    直接行われることが望ましいです
  • 44:09 - 44:15
    同じ場所でデータを取り込めば
    交流が生まれるからです
  • 44:16 - 44:22
    次に ベースレジストリと典拠ファイルに
    焦点を当てましょう
  • 44:22 - 44:26
    既存オントロジーの拡張として
  • 44:26 - 44:31
    異なるデータや
    管理されていない語彙の間で
  • 44:31 - 44:33
    リンクしやすくなるからです
  • 44:34 - 44:36
    スライドがあと2枚だけあります
  • 44:36 - 44:40
    次のステップは
    Wiki Loves Performing Artsに向け
  • 44:40 - 44:43
    すべてのGLAMの手法を
    合わせることです
  • 44:43 - 44:48
    つまり会場や組織を
  • 44:48 - 44:51
    インフォボックスや
    バブル テンプレートの形式で表し
  • 44:51 - 44:54
    ウィキペディアに
    データを取り込もうとする試みです
  • 44:55 - 45:00
    もう1つ追求するプロジェクトは
    COST Actionで
  • 45:00 - 45:03
    来年 提起する予定の
  • 45:03 - 45:06
    舞台芸術向けのリンクト オープン データ
    エコシステムです
  • 45:06 - 45:08
    COSTはヨーロッパのプログラムで
  • 45:08 - 45:10
    ネットワーキング活動と
  • 45:10 - 45:14
    ここに取り上げ挙げられた
    トピックをサポートしています
  • 45:14 - 45:16
    うち2つを抜粋してありますが
  • 45:16 - 45:21
    1つはウィキデータと
    従来のリンクト オープン データ間での
  • 45:21 - 45:24
    フェデレーションに関する質問です
  • 45:24 - 45:28
    もう1つは
    これも重要だと思いますが
  • 45:28 - 45:31
    大きな可能性を秘めている部分で
  • 45:31 - 45:36
    ウィキデータのデータを追加する
    国際キャンペーンの実施です
  • 45:38 - 45:41
    以上です
    ありがとうございました
  • 45:41 - 45:46
    では 私の同僚たちに
    登壇いただきましょう
  • 45:47 - 45:51
    パネルへどうぞ
    マイクも必要かもしれません
  • 45:54 - 45:56
    それから…
  • 45:57 - 46:00
    質問の機会を差し上げます
  • 46:01 - 46:05
    また 私の同僚たちにも
  • 46:05 - 46:08
    お互いに質問があるかお尋ねします
  • 46:12 - 46:15
    聴衆の皆さんからは
    質問があるでしょうか
  • 46:21 - 46:23
    (聴衆1)[聞き取り不能]
  • 46:24 - 46:27
    お一人ずつに質問ですが
  • 46:27 - 46:31
    どこで線引きをして
  • 46:31 - 46:33
    どのように―
  • 46:33 - 46:36
    自分のウィキベースを
    運用する必要がある場合や
  • 46:36 - 46:39
    ウィキデータへ取り込みたい内容を
    規定するのでしょうか
  • 46:39 - 46:46
    順序良く取り込める背景には
    明確な図表があるのでしょうか
  • 46:48 - 46:51
    マイクがあるので
    まず私からお答えします
  • 46:52 - 46:57
    課題の1つは著名度です
  • 46:59 - 47:02
    別のプロジェクトで
    それに取り組んでいます
  • 47:03 - 47:06
    ライセンス供与も課題の1つです
  • 47:06 - 47:10
    ご自分のデータベースでは
    自分独自の規定を適用できますから
  • 47:10 - 47:14
    そうなると
    どこでも可能だと思います
  • 47:14 - 47:20
    3つ目はサンドボックスとして
    データを保持し
  • 47:20 - 47:23
    ウィキデータへ取り込むため
    それを準備することです
  • 47:23 - 47:26
    以上が今考えられる
    主要な3つですが
  • 47:26 - 47:29
    まだあると思います
  • 47:30 - 47:32
    私にとっては
    著作権はいつも課題です
  • 47:33 - 47:37
    国立図書館が
    ウィキベースに向けて移行したい場合
  • 47:37 - 47:40
    マオリ語の言葉での
    これまでの業績のため
  • 47:40 - 47:43
    彼らがライセンス管理を
    継続しなければなりません
  • 47:43 - 47:46
    カカポのデータベースには
  • 47:46 - 47:50
    保護局が公開できると考えた
    データのみがありますが
  • 47:50 - 47:53
    その運用を見れば
  • 47:53 - 47:55
    非公開のウィキベースを使用して
  • 47:55 - 47:58
    独自データベースを
    管理したくなるかもしれません
  • 47:59 - 48:03
    単に彼らが現在運用している
    Excelスプレッドシート体系よりも
  • 48:03 - 48:07
    視覚化ツールの一部を
    適用できたほうがいいからです
  • 48:12 - 48:17
    データの種類に依ると思います
  • 48:18 - 48:22
    出版物のアーカイブでは
    もちろん幸運な立場で
  • 48:22 - 48:27
    資料は出版されたものや
  • 48:27 - 48:32
    当時 出版するには高額で
    公開されたものですから
  • 48:33 - 48:36
    これは簡単です
  • 48:36 - 48:39
    プロジェクトは―
  • 48:40 - 48:42
    典型的なプロジェクトでは
  • 48:42 - 48:46
    ある期間 資金提供され
    それが終了すると
  • 48:46 - 48:52
    データに起こることは
    倉庫に格納されるか
  • 48:52 - 48:55
    永遠には運用されないソフトウェアに
    格納されることになります
  • 48:56 - 48:59
    ですから私の観点からは
    明らかで
  • 49:00 - 49:03
    当時はウィキデータはありませんでしたが
    現在はあるので
  • 49:03 - 49:07
    ウィキデータのような
    より大きなエコシステムへ
  • 49:07 - 49:11
    データを取り込む方法と照らし合わせ
  • 49:11 - 49:13
    早い段階で
    持続可能性を議論することは
  • 49:13 - 49:17
    私たちのプロジェクトにとって
    間違いなく合理的です
  • 49:17 - 49:21
    またデータコミュニティーと
    話し合うのも意味があります
  • 49:22 - 49:27
    例えば ウィキデータへ追加するには
    何が著名で合理的か
  • 49:27 - 49:32
    また所有権の形式を保つには
    何が合理的か
  • 49:32 - 49:36
    洗練されたアプリケーションよりも
  • 49:36 - 49:40
    簡単な形式でも
    視認性を高めたほうがいいとか
  • 49:40 - 49:46
    維持されない保管場所へ
    多額の資金を提供する代わりに
  • 49:46 - 49:53
    大きなデータクラウドへ
    リンクさせたほうがいいなどの議論です
  • 49:55 - 50:00
    先ほどここでプレゼンした
    プロジェクトでもお伝えしたように
  • 50:00 - 50:05
    従来のリンクト オープン データ手法と
    ウィキデータとでは二重性がありますので
  • 50:05 - 50:08
    非公開のウィキベース設定
    という問題ではないのです
  • 50:11 - 50:15
    抱えていた課題の1つは
    もちろんウィキデータで
  • 50:15 - 50:18
    自分自身のデータを取り込む際に
  • 50:18 - 50:23
    人々というか 他人の
    ハウスキーピングを行う必要があります
  • 50:24 - 50:26
    それによって参加する人が
    減るかもしれませんが
  • 50:27 - 50:30
    段階的に取り組んでいくということです
  • 50:30 - 50:33
    現時点では データベースは
  • 50:33 - 50:36
    従来のリンクト オープン データに
    ありますが
  • 50:36 - 50:38
    私たちはそれをウィキデータと
    リンクし始めており
  • 50:38 - 50:41
    これは継続的なプロセスで
  • 50:41 - 50:48
    最終的に大半のデータを
    ウィキデータに収める領域と
  • 50:48 - 50:52
    その他のデータベースに残す領域とを
    明らかにしていきます
  • 50:53 - 50:57
    明らかに同期に関しては
    すでに課題であるように
  • 50:57 - 50:59
    今後も課題になります
  • 50:59 - 51:02
    リンクトデータの分野では
  • 51:02 - 51:05
    誰を信用できるか
  • 51:05 - 51:09
    誰が何の権限を持つかなど
    協議が必要です
  • 51:14 - 51:16
    (司会者)他にご質問は?
  • 51:24 - 51:26
    (聴衆2)ありがとうございます
  • 51:26 - 51:32
    私が完全に同感できるのは
  • 51:32 - 51:41
    どこで境界線を引き
    ウィキデータにデータを収めるかどうか
  • 51:43 - 51:49
    どのような理由や目的で
    ローカルのデータベースに
  • 51:49 - 51:53
    データを保存し 作成や管理や維持を
    行うかという課題です
  • 51:54 - 51:57
    これは大きな議論で
  • 51:57 - 52:03
    単にウィキデータへデータを
    移行するという
  • 52:03 - 52:06
    流行りを超えたものだと思います
  • 52:06 - 52:11
    公開により人類に貢献でき
  • 52:11 - 52:14
    優れたツールがあるからです
  • 52:14 - 52:18
    現実の物事はもっと複雑だと思います
  • 52:19 - 52:24
    それにも関わらず
    興味深い議論だと思います
  • 52:24 - 52:30
    また 別のパネルのイベントで
    議論されている
  • 52:30 - 52:35
    別の問題もあります
  • 52:36 - 52:41
    1つの側面では
    自身のデータベースを持ち
  • 52:41 - 52:43
    どのようなテクノロジーであれ
  • 52:43 - 52:47
    ウィキデータへ公開したり
  • 52:47 - 52:53
    またはウィキベースのテクノロジーで
    情報を作成管理する
  • 52:53 - 52:58
    独自のシステムを開発したりすると
  • 52:59 - 53:04
    同期やフェデレーションなどは
  • 53:04 - 53:09
    使用するテクノロジーの問題です
  • 53:09 - 53:15
    実際は ウィキデータを
    公開のためだけに使用しているか
  • 53:15 - 53:19
    ウィキデータの下にある
    インフラを使用して
  • 53:19 - 53:23
    自分のデータの作成や
    管理をしているかです
  • 53:26 - 53:32
    ウィキデータのパネルについて
    議論があり
  • 53:33 - 53:37
    ここで別の議論も出てきますが
  • 53:37 - 53:41
    物事は別のレベルにあると思います
  • 53:42 - 53:48
    ウィキベースかウィキデータかという
    議論に達するのは―
  • 53:49 - 53:51
    間違いだと思います
  • 53:51 - 53:54
    ウィキデータのインフラを
    重視しすぎてしまいます
  • 53:54 - 53:59
    舞台芸術の領域のように
    他にもインフラはあるからです
  • 54:00 - 54:02
    私たちには
    別の補完コミュニティーもあり
  • 54:02 - 54:06
    MusicBrainzは
    独自のプラットフォームを運用し
  • 54:06 - 54:09
    リンクト オープン データを提供しています
  • 54:10 - 54:13
    私が理解している限りでは
  • 54:14 - 54:17
    ウィキデータのコミュニティー内で
  • 54:17 - 54:20
    彼らのデータを
    重複しないという同意があり
  • 54:20 - 54:24
    すべてのデータをコピーはしませんが
    補完し合うものだと受け入れています
  • 54:25 - 54:30
    そこで ウィキペディアで
    データを統合するとどうなるでしょう?
  • 54:30 - 54:32
    例えばインフォボックスです
  • 54:32 - 54:36
    彼らのSPARQLエンドポイントから
    そのデータを直接引き出せるでしょうか?
  • 54:37 - 54:40
    またはすべてのデータを
    コピーせざるを得ないのであれば
  • 54:40 - 54:42
    それにはどんなプロセスが
    関与するのでしょうか?
  • 54:42 - 54:45
    (聴衆2)議論はまだ続いていると思います
  • 54:45 - 54:47
    このイベントの中では
  • 54:47 - 54:50
    関心を寄せるコミュニティーは
    両方あるはずですから―
  • 54:50 - 54:52
    ウィキベースに関心がある人たちと
  • 54:52 - 54:54
    ウィキデータに関心がある人たち
  • 54:54 - 54:56
    そしてその両方に関心がある人たちです
  • 54:56 - 55:00
    ですが余儀なくウィキベースに
    移行するわけではありません
  • 55:00 - 55:01
    そうとも限りません
  • 55:01 - 55:03
    MusicBrainzは
    ウィキベース稼働ではありません
  • 55:03 - 55:07
    (聴衆2)別の問題があると
    申し上げたかったのです
  • 55:07 - 55:11
    相関する場合もありますし
    まったく関係ない場合もあります
  • 55:12 - 55:17
    もう1つ質問か意見があります
  • 55:17 - 55:22
    管理された語彙の
    階層構造の管理についてです
  • 55:22 - 55:26
    例えば シソーラスや
    Fintoです
  • 55:28 - 55:31
    場所があり
  • 55:32 - 55:35
    マオリ語での―
  • 55:36 - 55:41
    Subject Headingsがあり
  • 55:42 - 55:48
    階層構造での管理という概念に
    対処しなければなりません
  • 55:48 - 55:52
    ご意見をお聞かせください―
  • 55:52 - 55:57
    ウィキデータで管理された
    知識組織化体系を
  • 55:59 - 56:02
    管理する可能性については?
  • 56:07 - 56:10
    FintoとYSO placesの場合では
  • 56:11 - 56:14
    リポジトリは
  • 56:14 - 56:19
    最終的にいくつかのソースの
    集まりになります
  • 56:19 - 56:22
    ですから ともかく流動的です
  • 56:22 - 56:25
    必ずしも必要ありません
  • 56:25 - 56:28
    私は国立図書館の代表ではないですが
  • 56:28 - 56:32
    その考えられるプロジェクトで
  • 56:32 - 56:39
    既存の構造を管理したり
    対処したりする必要はないのです
  • 56:39 - 56:45
    その意味では
    まだ探索がされるべき領域です
  • 56:49 - 56:51
    Maori Subject Headingsは
  • 56:51 - 56:54
    ウィキペディアの構造に対して
    理想的に自身に役立っているようです
  • 56:54 - 56:57
    ですが ライセンス供与は
    禁じられています
  • 56:57 - 56:59
    ライセンスが異なっていたら
  • 56:59 - 57:02
    ウィキデータへ
    取り込まれていたでしょう
  • 57:02 - 57:06
    誰かが階層構造を好まずに
    変更を始めると同時に
  • 57:06 - 57:12
    その構造を構築した人から
    すぐに激しい抗議が来て
  • 57:12 - 57:14
    さまざまな異なるマオリから
  • 57:14 - 57:18
    最新の階層構造について
    承認を得ることになります
  • 57:18 - 57:21
    それが解決しようとしている課題です
  • 57:24 - 57:27
    知識組織化体系という言葉は
  • 57:27 - 57:28
    すべて違います
  • 57:29 - 57:32
    ウィキデータで
    異なる階層構造を表すことが
  • 57:32 - 57:37
    良い考えかは確かではありません
  • 57:38 - 57:45
    データの重ね合わせを
    考えたほうがいいかもしれません
  • 57:45 - 57:49
    コンセプトレベルでの
    マッピング作業については
  • 57:49 - 57:54
    例えば ZBWの共同事業として
    経済学向けのシソーラスがあります
  • 57:55 - 57:59
    このシソーラスは
    自身の階層構造を持っており
  • 58:00 - 58:03
    もちろん ウィキデータのコンセプトへ
  • 58:03 - 58:08
    ウィキデータの中に
    代替構造を実際に保管せず
  • 58:08 - 58:15
    シソーラスの階層構造を
    反映することは可能ですが
  • 58:15 - 58:19
    これは混乱を招きます
  • 58:19 - 58:25
    しかし ウィキデータを
    コンセプトの貯蔵庫として考えるべきでしょう
  • 58:25 - 58:30
    外部にあるレイヤーとリンクでき
  • 58:30 - 58:36
    必ずしもウィキデータの中に
    存在する必要がないものという
  • 58:36 - 58:39
    別の見方を与えてくれます
  • 58:46 - 58:48
    (司会者)他にご質問は?
  • 58:49 - 58:52
    なければ...どうぞ
  • 58:55 - 58:58
    (聴衆3)ユアヒム
    最後の点を確認させてください
  • 58:58 - 59:01
    レイヤーは あなたのお考えでは
  • 59:02 - 59:05
    外部で管理され
  • 59:05 - 59:08
    誰かがどうにかして ウィキデータ側から
  • 59:08 - 59:12
    ウィキデータと統合されるものですか?
  • 59:13 - 59:19
    それとも管理方法について
    すでにお考えがありましたか?
  • 59:22 - 59:25
    いいえ 考えてはいませんでした
  • 59:25 - 59:30
    ZBWとウィキデータで
    いくつか試みはありましたが
  • 59:31 - 59:33
    ウィキデータで
    [聞き取り不能]でした
  • 59:33 - 59:39
    これはまったく新しい
    複雑な問題です
  • 59:39 - 59:43
    議論によりますし
  • 59:44 - 59:48
    そのようなことを行うには
    管理を諦めなければなりません
  • 59:48 - 59:50
    ですが 明らかにされるべきです
  • 59:57 - 59:58
    もう1つ受けますか?
  • 59:58 - 60:03
    (聴衆4)質問は
    カカポのプロジェクトについてです
  • 60:04 - 60:05
    はい
  • 60:05 - 60:11
    (聴衆4)こうした項目に
    個々の動物を持つことについて
  • 60:11 - 60:15
    ウィキデータの
    コミュニティーから反対はありましたか?
  • 60:16 - 60:17
    これまでのところないです
  • 60:17 - 60:19
    (聴衆4)以前この件を
    聞いたことのある人は?
  • 60:19 - 60:22
    これまで反対がないのは
    まだ誰も知らないからでは?
  • 60:23 - 60:26
    時に小さな議論がされています
  • 60:26 - 60:29
    ウィキデータで
    こうしたことに関心がある方たちは皆
  • 60:29 - 60:34
    これを 有名な競走馬やネコに対する
    個々のウィキデータ項目の付与を
  • 60:34 - 60:37
    自然に延長したものだと
    見なしています
  • 60:37 - 60:40
    うまくモデル化されています
  • 60:40 - 60:44
    そこに種全体を収めるのは
    大胆でしょうが
  • 60:44 - 60:48
    完全に管理できることだと思います
  • 60:48 - 60:50
    (聴衆4)ネコやイヌで
    お試しにならないように
  • 60:50 - 60:52
    (笑)
  • 60:52 - 60:54
    (司会者)お時間が参りました
  • 60:54 - 60:56
    ご参加ありがとうございました
  • 60:56 - 60:59
    パネリストの皆さんが
    休憩の間も質問をお受けします
  • 60:59 - 61:01
    お楽しみください
  • 61:01 - 61:02
    ありがとうございました
  • 61:02 - 61:04
    (拍手)
Title:
cdn.media.ccc.de/.../wikidatacon2019-1035-eng-Data_import_process_overview_hd.mp4
Video Language:
English
Duration:
54:29

Japanese subtitles

Revisions