[GLAMパネル]
[スサンナ・オーネス、マイク・ディキソン、
ユアヒム・ナイバート、ビート・エスターマン]
皆さん こんにちは
GLAMパネルにようこそ
始める前に
2つお知らせがあります
第1に Etherpadを広く活用して
メモを取ってください
第2に 自宅やその他の場所で
ご覧の皆さんへ
ご質問があれば
Etherpadへ
書き込んでください
この部屋のサポート担当が
把握していく予定です
皆さんの貢献を拝見した後に
私たちが決定した
今年のパネルのテーマは
実際のウィキメディアの
プロジェクトを凌駕する
データ エコシステムにおける
ウィキデータの役割です
これは新しいウィキメディア財団の戦略とも
完全に一致するものです
今日は4名のパネリストがいます
3名と私です
ご紹介しますので
登壇してください
こちらはスサンナ・オーネスです
長年フリー ナレッジの活動をしており
数多くのウィキプロジェクトに
参加しています
今日は フィンランド国立図書館との
共同プロジェクトに関して
お伝えいただく予定です
次にご紹介するのは 私の隣の
マイク・ディキソンです
ご覧の順で
2番目にお話しいただきます
彼はニュージーランドの学芸員です
また 動物学者で
ウィキペディア編集者でもあり
さらに 2018年と2019年における
ニュージーランド初の
ウィキペディアン代表です
お話しいただくのは
その役割に関する経験と
その状況の中で
ウィキデータが果たしている役割です
次にご紹介するのは
ユアヒム・ナイバートです
キールとハンブルグにある
ドイツ国立経済学図書館からお越しです
彼が取り組んでいるのは
世界最大の公開出版物アーカイブを
ウィキデータを使用して
一般に利用しやすくすることです
最後に私
ビート・エスターマンです
スイスのベルン応用科学大学に
勤めています
スイスやオーストリアで
OpenGLAMを長年推進しています
今日お伝えするのは
Canadian Arts Presenting Associationと
行っている活動です
舞台芸術に焦点を当てたものであって
ウィキデータが主ではありませんが
そこでもウィキデータが果たしている
役割を理解していただけるはずです
では着席させていただきまして
スサンナにお話しいただきましょう
こんにちは
スサンナ・オーネスです
ウィキメディア フィンランドで
非常勤のGLAMコーディネーターとして
働いています
またオープン ナレッジの分野で
コンサルタントも行っています
これはどちらかと言うと
後者に関するお話です
私が携わっているのは
地理的データグループに関する仕事です
その対象は―
英語では何かというか
調べました…
フィンランド王族統治の
文化遺産構想です
これは次に関係しています
地名と
地名がフィンランドのGLAMセクターの
異なるリポジトリにどう表されるか
また GLAMセクターが異なるソースを
どうまとめようとしているか
ウィキデータやその他モデリングにより
GLAMセクターがどう情報を得るかです
ここに示されているのは
YSO placesへの3つの主なソースで
これらは全国的または一般的な
オントロジーの一部です
AHAAは
フィンランドのアーカイブ向け
Melindaは
フィンランド図書館向け
KOOKOSは
フィンランド美術館・博物館向けです
ですから3つの
コンテンツ管理システムが
YSO placesにまとまっています
ウィキデータとの間では
すでにデータのやりとりが行われていて
国土調査向けの
ネームプロジェクトも同様です
またFinnish Names Archiveという
第3プロジェクトもあり
YSO placesには
まだ寄与していませんが
そのための計画はあります
全体の課題の中でも
重要なモデリングの課題の1つは
このプロジェクトに表されている地名に
3種類の要素があることです
うち1つ目が場所で
位置を持つものです
2つ目が地名で
例えば地名学による地名です
3つ目がソースで
これは場所と地名の双方の由来または
その裏付けとなる文献です
YSO placesは...
ここ右上に
同じ図がまたありますが
主に場所を重視しています
重要な点は YSO placesが
フィンランド国立図書館とFintoの
プロジェクトであることです
現在フィンランド語とスウェーデン語では
7,000を超える場所が存在し
英語では3,000を超える場所が
存在しており
パブリック ドメイン(CC0)の
ライセンスを取得してあります
ここに表示されているのは
Fintoのサービスです
場所はセベッティヤルビを
選択してあります
これは私たちのスコルト・サーミ語での
言語プロジェクトにも関係しています
ここはフィンランドの
極北に位置する場所で
スコルト・サーミが居住しています
ここで分かるのは―
この場所に関するデータが
ウィキデータと
国土調査のデータに
リンクしていることです
こちらがその詳細です
またこれはリポジトリの中に
階層的に整理されていますので
セベッティヤルビは
今表示されていませんが
この自治体の下に存在しています
そして その地域
そして国としてのフィンランドや
さらに広域の地域に含まれています
ここで分かるのは
YSO placesの多くが
Mix'n'Matchを通じて
すでにウィキデータと照合されています
未照合のものもあります
ですが 名前の量は
それほど多くありません
たった5,000未満です
他にもリポジトリとして
フィンランドの地理空間的プラットフォーム
プロジェクトによる
Place Names Cardsがあります
すべてフィンランドの地図に
載っている地名です
これらにはCCライセンス
バージョン4.0が付与された
リンクトデータもあります
80万の地図ラベルは
フィンランド語、スウェーデン語
フィンランドの3つのサーミ語によるものです
また2種類の異なるエンティティがあります
1つは場所で
もう1つは地名などの
場所の名前です
両方に恒久URIがあります
例えば同じセベッティヤルビに対し
まずフィンランド語
続いて3つのサーミ語
言語同様
地理的データがあり
そして場所の種類などの
さらなる情報があります
これは地名に対するカードで
独自のURIがあります
失礼 英語のリストに
翻訳されていないようですが
プロジェクトの一部は
多言語で取り扱われています
次にFinnish Names Archive
についてです
これは2017年フィンランドの
言語機関によるプロジェクトで
場所や地名でなく
それらのソースを説明するものです
地名に関する
3百万の現地調査記録を含む
ウィキベースのプロジェクトです
ウィキベースに主にフィンランド語
いくつかはスウェーデン語で収められています
サーミ語の名でも
傑出したコレクションがあり
興味深いものです
CC BY(表示)のライセンスが
付与されているため
ウィキデータの観点からは
困難ではありますが
フィンランド語の
ローカル ウィキベースがあれば
私たちがこのプロジェクトで
初めてそれに取り組めるかもしれません
こちらがそのプロジェクトの
スクリーンショットで
表示されているのは
場所に関する情報―
収集者が最初に使用した地図と
彼らが収集した情報から
生み出されたカードです
こちらはカードの1つで
それらに含まれる詳細データです
カードが送られる先は
リンクト データ プロジェクトで
ヘルシンキのデジタル
ヒューマニティラボ(HDHⅬ)と
アールト大学の
コンピューティング グループである
セマティック コンピューターと
(SeCo)
Names Sampoという
フィンランドの言語機関によるものです
これは地名のソースに追加される
集約型リサーチインターフェースです
左側で 多数のソースが
あることがここで分かります
またこのデータに基づいて
異なる視覚化も行えます
私が提案しているアイデアは
ローカル ウィキベース向けのモデリングに
このデータを使用することです
モデル方法などの
モデリングに関する疑問は出てきます
異なる方法や慣習が
それぞれにあるからです
良い点は わずかな努力で
少数言語をサポートできることです
ここに2つの選択肢があります
[場所が新規項目になるのはいつか]
フィンランド語の
時空オントロジーであるSAPOのモデルと
ウィキデータのモデルです
ウィキデータでは
新規項目にならない傾向があります
プロパティ変更に関わらず
同じ項目のままであることが理想です
一方 SAPOモデルでは
エリアや地名の変更があると
新規項目になります
そこで 場所と地名とソースの
3つの側面を持つ
この区分に戻りましょう
地名は エンティティとプロパティの
どちらにすべきでしょうか
ウィキデータが
プロパティを使用している一方
国土調査プロジェクトは
エンティティを使用しています
それとも
語彙素にするべきでしょうか?
ウィキデータは
地名に対して
語彙素よりも
テキストのプロパティを選択しています
失礼 逆でしたか?(笑)
ですから 地名は―
語彙素ではなく
プロパティですね
ウィキベースの欠点は
内部に地理的情報が
不足していることかもしれません
例えば 基本設定では…
地域的な地理的情報を
使用できるようにするためには
スタックにテクノロジーを
加える必要があるでしょう
またウィキデータのコーパスを
活用できるようにするためには
フェデレーションが必要です
以上です
ありがとうございます
(拍手)
はい
(マオリ語)
ようこそ 皆さん
マイク・ディキソンです
1年間
ニュージーランドの
ウィキペディアン代表でした
ウィキペディアン代表とは
何かと思われるでしょう
調べてみると ご覧のように
そんなものはないからです
補助金申請で
私が造った言葉です
財団は気に入ってくれたようなので
その肩書を使っています
1年間で35の異なる機関を経験しました
そのほとんどが在駐で
トレーニングセッションを行い
公開イベントを企画し
各所でウィキメディア戦略を
発展できるよう努めました
面白い経験で
さまざま広範囲の
プロジェクトや人々に出会いました
面白く啓蒙的な方法で
ウィキデータを扱っている
異なるプロジェクトの
いくつかをお話します
これが皆さんの議論に
役立つかもしれません
このプロジェクトは最初
ウィキペディアのプロジェクトでした
ウィキペディアの名は
よく知られていたからです
伝統的な編集マラソンや
ジェンダーギャップに関するものなど
複数の別のイベントを企画しました
多くの皆さんが[聞き取り不能]
新しい編集者をうまく募集したり
することができました
コモンズへ
大量のアップロードを行いました
次のような事例もありました
昆虫学のイラストレーター
デス・ヘルモアによる
千を超えるオリジナルアート作品の
コレクションが
ハードドライブに放置されており
10年に渡る調査研究
[聞き取り不能]
すべてCC BYライセンスの下で
公表する許可を得たのです
これで世間の人たちに
見てもらいやすくなりました
甲虫類のたくさんのイラストで
皆が理解でき
ジェンダーギャップを埋める
ワークショップも 皆が理解できます
ですが ウィキデータは
GLAMセクターや
特定の活動を行う外部の人々に
導入してもらうのは
難しいものでした
ウィキデータは
ウィキペディアン代表の
プロジェクトの
ますます重要な部分になると
私は気付き始めました
プロジェクトが進むにつれ
私の仕事の大部分を
占めるようになりました
そこで ウィキデータを
自分で学ぼうとし始めました
どれだけ重要か
分かり始めたからです
こんなプロジェクトがありました
カカポ(フクロウオウム)は
ニュージーランド固有の跳べないオウムです
種を絶滅から救う仕事をしている
保護局と協働し
「ウィキデータへ
一羽一羽のカカポを収めては」と
アイデアを投げ掛けました
とんでもないようですが
十分に実行可能なプロジェクトで
すでにいくつかは収められています
カカポはたくさんいるわけではないので
扱える作業です
開始時には148羽いて
1羽が死にましたが
記録的な繁殖期に
213羽まで増えました
過去50年で最大のカカポ数というのは
素晴らしいことです
これは一大事で
ニュージーランドで毎日
報道されました
新しいカカポが生まれるたび
(聴衆)ニューヨークタイムズでも
(マイク)そうですか
素晴らしい
これは国内ニュースでした
皆に好かれている鳥です
面白いことに
個体数の多い種と違い
カカポは1羽残らず
独自の名前が名付けられていて
独自のID番号があることです
またしばしば
良い伝記データもあります
例えば出生地や
誕生日
孵化した日や
父母
死亡した場合は
死亡日などです
こうした情報は
保護局のデータベースにあります
最も有名なカカポの1羽は
風にちなみ名付けられた
Sirocco(シロコ)で
ご覧の誕生データがあり
Twitterアカウントもあります
ウィキデータは
それに関して多少問題があります
Twitterアカウントを
持てないからですかね
アルバムカバーで
特集されたりしています
このプロパティは複数あり
最も有名な
固有のカカポの1羽です
個々のカカポを収めるアイデアを
保護局に投げ掛けた際
どれだけの伝記データを公表するか
考慮する必要がありました
簡単なリストにして
現在212羽...
2羽は死んだので210羽が
生存しているカカポの
候補すべてです
巣立つときに名付けられ
まだヒナの間だけ
コード番号を持ちます
完全に羽が生えそろった時に
ウィキデータを整えて
種全体をウィキデータに収めるのですが
DOC IDに対する
プロパティは考える必要があり
それを皆さんにご相談したいのです
特定のIDを使用すべきか
または 特定の調査プロジェクトに
タグ付けされている―
個体の鳥や植物や動物に対して機能する
IDを考えるべきかというのは
良い質問です
2つ目のプロジェクトは
クライストチャーチ アート ギャラリーです
ニュージーランドで
最も有名なアーティスト
コリン・マカホンの絵画が
数点 存在しています
ニュージーランド
スクール ジャーナルのための絵画で
当時 政府が出資したものでした
ニュージーランドの
アーカイブが
これらの絵画の著作権を
持っていました
これは非常に稀な状況です
私はクライストチャーチ
アート ギャラリーに勤め
オークランド
アートギャラリーと共に
Find New Zealand Artists
というサイトを管理していました
この仕事は
ニュージーランドのアーティストの
各機関の保有資産を追跡することでした
データベースにある
1万8千の異なるアーティストの大半に
情報がほとんどありませんでした
そこで例のMix'n'Matchで参照し
少なくとも誕生日
または死亡日
誕生地や死亡地の
情報があるものをエクスポートしました
ですから あまり限定されていません
それでも 一致したものは
それほどありませんでした
でも 現在ウィキデータで
著名なアーティストに一致するものは
現在約1,500あります
これは良いことです
ですが彼らにとっての利点は
彼らのウェブサイトであることです
資産へのリンクで管理するだけです
ですがこの伝記データは
アーティスト一人一人に対し
現在 手作業で作成されています
エクスポートや
Mix'n'Matchによる照合で
それまで気付かなかった
数々の入力ミスと間違いなどが
明らかになりました
Excelを通じて
並び替えを実行すると
これらの問題が明らかになります
ウィキデータから情報を取り込めると
私が言ったとき
彼らにとって
それは真新しい考えで
ウィキデータの価値は急に変わりました
これは利点の1つだと思います
手間暇かけて手作業でキュレートされた
ウェブサイトがある場合
1万8千ものエントリーに
多数の誤りがあっても
他の人に事実確認と修正を
行ってもらうという
別の方法を示せれば
共感してもらえます
私たちは次のような
アイデアを投げ掛けました
30年代のクライストチャーチの
ニュージーランド アーティストの
歴史本のすべてを
「ウィキデータ化」するというもので
あらゆる人物、コネクション、場所、展示
などの出版物をデータ化するものです
これは管理できる規模のプロジェクトで
彼らは喜んでいました
3つ目に Maori Subject Headings
(マオリ件名標目)をお見せします
waka(ワカ)とは
特定の種類のカヌー
戦争カヌーに対するマオリ名です
ニュージーランドの国立図書館に
wakaに対するリスティングがあり
国立図書館は
マオリの件名標目に関して
マオリ語による
独自の辞書を持っているからです
そこでwakaは
マオリ語と英語で定義されています
さらに狭義の言葉もあります
画面端でご覧になれます
典型的なものは
taurapa(トゥーラパ)です
まずマオリ語で
次に英語で定義されています
これはご覧のように
彫刻を施した船尾のことで
英語で「sternpost」ですが
taurapaに
その語は使えません
taurapaは特定の種類の
戦争カヌーの船尾のみを指すからです
それに相当する英語はありません
文化的特定用語のオントロジー全体が
注意深くまとめられ
国立図書館とマオリ人により
確認されています
英語でもマオリ語でも
常に 定義や説明に
追加や改善がされています
素晴らしいことです
私はこのたくさんの情報を
まずマオリ語で
次に必要に応じ英語への翻訳で
ウィキデータに収めることを
考えつきました
そうなったらいいですよね
こちらが著作権とライセンスです
あいにく非営利‐改変禁止です
そこで彼らがこのライセンスを
選択した理由について
お話ししましょう
恐らく このいかなる情報も
営利目的で使用できないという保証を条件に
腰を下ろして
[聞き取り不能]ことに承諾した
マオリ人からのみ同意を得たからです
そこがこの仕事のもどかしい面で
こうした制限事項に直面しています
次の3つを前面に押し出して
議論の拍車をかけたいと思います
ウィキデータに種全体を取り込むこと
ウィキデータの価値に関する
アートギャラリー学芸員の考えを変えること
そして別の言語で完全なオントロジーが
ある場合にどうするか―
これはクリエイティブ コモンズの
ライセンスが限定的なため実現していません
ありがとうございました
(拍手)
ユアヒム・ナイバートです
ZBW(ドイツ経済学中央図書館)に
勤めています
これはハンブルグにある
経済学のための情報センターで
私は科学ソフトウェア開発者として
働いています
昨年の仕事の一部は
ウィキデータへ提供するデータの準備でした
メタデータの提供や
20世紀の出版物アーカイブなど
初めての経験として
その仕事に関してお伝えします
私たちが知る限りでは
これは世界最大の
公開出版物アーカイブです
1908年から2005年の間に
集められた
1,500を超える新聞と定期刊行物があり
収集範囲はドイツ国内から
世界にまで及びます
すべてが網羅されているので
興味を引くものであり
世界中に進出したい
ハンブルグの経営者には
特に興味深いものだと思います
ご覧のとおり
この資料は新聞の切り抜きで
紙に貼られていて
それがフォルダーに集められています
こちらが人物に関するアーカイブの
小さなコーナーで
それと同様に
企業や一般の話題や業績
すべての人
興味を引きそうなこと
すべてに関する情報が集められています
これらのフォルダーは
2004年から2007年までのDFG
(ドイツ研究振興会)出資プロジェクトにより
およそ1949年までは
スキャンされています
結果として現在までに
この時代の主題関係書類は
2万5千あります
これには約2百万あるいは
それ以上の数のページが含まれ
オンラインに掲載されています
当時 ZBWが開発した
アプリケーションがあり
現在では少し時代遅れで
凝ったものではなく
さらに問題なのは
オラクルやColdFusionに基づき
開発されたアプリケーションは
Windowsサーバー上で
運用するものなので
長期的に持続可能ではありません
もっと凝ったリンクト データ
アプリケーションへこれを統合すべきか
大胆な措置を取って
すべてのデータを公開するかを
話し合いました
データにはCC0ライセンスを
割り当ててあります
現在は主要アクセス レイヤー
主要ディスカバリ レイヤー
プライマリ アクセス レイヤーを
リンクト オープン データ ウェブへ
移行していますが
ここで実は最も合理的なのは
ウィキデータへメタデータを収めて
コレクションのすべてのフォルダーを
ウィキデータとリンクさせることです
そうすれば見つかりやすく
これらフォルダーに関する
すべてのメタデータを
ウィキデータへ転送することもできます
そこで使用でき
データの追加や
修正も行えるようになります
ZBWはまだもちろん
画像の保管を管理します
いかなる方法でも
移行できないとか
オリジナルの作者が所有していたため
ライセンスを与えられない画像です
ですが 将来的には
IIIFマニフェストに基づき
DFGビューアー経由の
メタデータファイルにより
それらを利用できるようにします
固定ランディングページも
準備する予定です
これはウィキデータへの参照の
データポイントの機能を果たすものです
また ウィキデータへ
うまく収められないデータを
利用できるようにする予定です
私たちはウィキデータへの
データ統合とデータ提供を
そのデータの
SPARQLエンドポイントから成る
カスタムのインフラを使用し行い
そして
フェデレーテッド クエリを使用して
エンドポイントと
ウィキデータのクエリサービスとの間で
一致した文を作成します
これは SPARQLクエリ自体
またはスクリプト経由の変換での
連結という観点を通して行うものです
これにより その文のための
出典も生成され
QuickStatementsの
コードへ収められ
オンラインで使用できます
こちらが成果です
誕生日などのように
簡単なものではないですが
すでに存在している項目に関する
複雑な文もあります
例えば 企業の管理役員だったこの人物です
ご覧の期間に
科学的文脈で使用するために…
参照されています
データ提供の
最初の部分が済むと
人物のアーカイブは
完全にウィキデータにリンクされます
これは情報ツールでもあります
以前は数多くの項目に
外部の出典がありませんでした
私たちには6,000を超える
文がありましたが
これは現在はアーカイブのメタデータが
出典とされています
人物に関しては最も簡単でした
なぜならウィキデータで
人物は簡単に識別できるからです
そこに90%超は
すでに存在していたので
私たちはそれにリンクできました
欠けている人物のために
100項目ほど作成しました
現在はアーカイブの残りの部分
特にトピックのアーカイブに
取り組んでいます
つまり世界全体の
知識組織化のために
歴史体系のマッピングに取り組み
ウィキデータへ新聞の切り抜きとして
資料化しているのです
基本的概念をお伝えすると
国とトピックのアーカイブは
国々の階層構造と
その他の地理的エンティティで
整理されています
これは英語に翻訳されていて
利用しやすくなっています
ドイツ語は…
トピックでは
深い階層に分類されています
この組み合わせにより
1つのフォルダーが定義されています
私たちが次に行いたいことは
これをウィキデータへの
構造として一致させ
データを移行することです
知識組織化という
この良い挑戦に
皆さんご参加ください
この仕事を追跡する場が
ウィキプロジェクトで
皆さんはそれをフォローしたり
それに参加したりできます
以上です
ありがとうございました
(拍手)
私たちはウィキデータへ
舞台芸術を取り込んでいます
舞台芸術向けのリンクト オープン データ
エコシステムを構築することで
舞台芸術とリンクトデータを
クラウドへ取り込んでいるのです
これからウィキデータに関連する質問に
お答えしようとしており
皆さんにもその回答に
ご協力いただきたいと思いますが
まずは 私の経験からお話しさせてください
私は今年―
今年前半にCAPACOAと
楽しく仕事をしていました
Canadian Arts Presenting Association
(カナダ芸術表現協会)の頭文字で
リンクト オープン データを
カナダの芸術部門全体で採用してもらえるよう
Linked Digital Future Initiative
というプロジェクトを開始したのです
過去5年間の観察に基づき
彼らはそれを行いました
[聞き取り不能]
舞台芸術で重要な課題は
メタデータが
不十分な品質であったことと
リンクされておらず
相互運用できなかったことでした
そんなわけで
パフォーマンスやイベントの中には
Googleや個人の端末などで
うまく見つけてもらえないものも
ありました
そこで私たちが共に築いたビジョンは
一度に数多くの利害関係者のための
情報ベースを持つことでした
舞台芸術全体の
バリューネットワークを調べて
そこでの主要な利害関係者を
明らかにしました
また追求したい
利用シナリオも調べ
それを情報ベースまたは
異なるプラットフォームから成る
アーキテクチャ全体に地図化しました
これは明らかに
分散アーキテクチャであり
巨大な一枚岩ではありません
各自10分しかないので
これをさっとご説明しますが
詳細に興味がある方がいれば
今晩とか明日 理解を深める時間が
あると思います
私たちが着手したのは
舞台芸術のバリューネットワークからで
これは面白いことに
去年発表されました
以前の仕事に基づき
構築できたのはラッキーです
中央にあるのが
舞台芸術の基本の価値連鎖で
さまざまな利害関係者が
それを取り囲んでいます
私たちは全部で
20の利害関係グループを見つけ
各利害関係グループのため
それを7つの大きなカテゴリへ要約しました
そしてインフラの観点から
彼らがどのようなニーズを持ちうるか
また 全体がリンクされ
データが公開で利用できたら
何を達成できるかを
系統立てて明らかにしました
異なるタイプが表示されていて
Production(制作)
Presention & Promotion
(表現とプロモーション)
Coverage & Reuse
(報道と再利用)
Live Audiences
(ライブ オーディエンス)
Online Consumption
(オンライン消費)
Heritage(継承)
Research & Education
(調査研究と教育)です
こちらに最初の一部分が表示されている
大きな表を設定した後
その表で比較し
すべての利害関係グループが
全体に渡り利用しているのは
どのデータタイプかを調べました
これは全体に共通する
大きな基本データで
この領域こそ
共に協力して
データを維持することが
合理的な領域なのです
プラットフォームの
アーキテクチャについては
ここに4つのレイヤーがありますね
下部にはデータレイヤーが表示されています
もちろんウィキデータは
その一部の機能を果たしますが
その他データベース
分散データベースもたくさんあり
SPARQLエンドポイントを通じて
データが公開されています
中央の黄色部分が
セマンティック レイヤーで
物事を表現するための
共通の言語で
舞台芸術の物事や
オントロジーに関する文を作成できます
そして次に
アプリケーション レイヤーがあり
これはデータ分析やデータ抽出などの
さまざまなモジュールで構成されています
つまり 非構造化データを
構造化データにする方法や
それをツールでサポートする方法です
それからデータの画像化もあります
大量のデータがあれば
何らかの方法で可視化できます
また上部に
プレゼンテーション レイヤーがあり
これが普通の人たちが実際に
日々やりとりするもので
検索エンジンや百科事典
文化的アジェンダ
その他各種サービスがあります
一から始めたわけではなく
この領域で
すでに作業がなされていました
私が参加してきたプロジェクトから
いくつかの例を取り上げましょう
またその他についても
取り上げていきます
私はこの領域において
舞台芸術に関する
スイスのアーカイブから始めました
スイスの舞台芸術のデータベースを
構築するまで
舞台芸術のオントロジーを作成しました
現在はRDFになっています
スイスの舞台芸術の歴史に関しては
60、70年間の
データベースがありますから
それを基礎に開発できますし
RDFに変換もされています
データが利用できる
構築プラットフォームもありました
ウィキデータへ
いくらか取り込み済みです
一部はスイスからのデータで
舞台芸術機関からのデータもあります
例えば バート・マグナスが
それに関与しており
彼が背景の原動力です
またウィキメディア コモンズからの
データもありますが
私たちの残りのメタデータと
うまくリンクされていません
また この取り込みを行うことで
スイスのデータモデルを
ウィキデータへ実装し始めたことになります
カナダの実装提携業者の1つが
Culture Createsです
プラットフォームを運営し
劇場のウェブサイトから情報を取得し
それをナレッジ グラフに入力し
そして 検索エンジンや
その他デバイスに表示します
そこでも実装や
オントロジーへの拡張の必要があり
スライドで分かるように
まだ空き領域はありますが
重複もあります
重要な重複は
一般共有された言語で
これはさまざまなデータセットを
リンクするのに役立ちます
また重要なことは
ベースレジストリと典拠ファイルを
使用していることです
ここが これらのリンクにより
ウィキデータが
重要な役割を果たす所です
では Linked Data Future Initiatives
諮問委員会による
アドバイスを共有したいと思います
少なくとも2つのアドバイスがあります
カナダ自体の舞台芸術の
ナレッジ グラフを埋めるため
カナダの方々には絶対的に重要です
スイスの舞台芸術のアーカイブと異なり
すでに存在しているデータベースから
始めるわけではなく
一から構築しなければならないからです
データをそこに取り込むことが
間違いなく重要です
2つ目に ご覧のように
ウィキデータはすでに役立っています
ウィキデータは
諮問委員会によると
ナレッジグラフArtsdata.caを
補完するものであり
舞台芸術関連のデータを増補するため
貢献の努力がなされるべき
とのことです
そこが私たちが今後
短中期的に取り組む箇所であり
そのためここで
その努力に協力してくれる人が
見つけられればと思います
現在 私たちは
互いに補完するものとみなしています
そこで両方の手法の
長所と短所を考える必要があります
こちらがウィキデータと従来の
リンクト オープン データとの比較です
皆さんの経験も交えて
喜んでお話ししたいと思います
ウィキデータには大きな長所があります
クラウドソースの
プラットフォームであり
関係者を招いて
協力してもらいやすいからです
短所は管理しにくいことです
データの所有者は
自身の図などの権利を手放すことになり
データ品質や完成度の管理を
自分の管理下にある場合と比べて
ウィキデータで追跡するのは困難です
ウィキデータのその他の長所は
世界規模の図への
瞬時での統合が要求されることです
つまり段階的に
他のデータベースと
調整していくことはできません
これも長所だと考えられます
もちろん統合や
相互運用性をお求めなら
ウィキデータでは初めからきちんと
その機能が備わっています
データ モデリング方法の統一は
両方のケースで課題となっています
ですが 最初は各自の部門で行うほうが
簡単に見えます
ある時点でその作業が済めば
ウィキペディアで
継続する作業になるからです
データ取り込みの
優先順位付けに関しては
現時点で次の規則に従っています
まず 本来誰に権限があるか
確かでない状態で
データを取り込むことです
こうすれば間違いなく
共有で管理されることになります
また クラウドソースの手法の
可能性が高いデータを取り込むこと
ウィキペディアで再利用される
可能性の高いデータを取り込むことです
また データモデリングと
標準化に関する
国際的な共同作業は
もし他の場所で行われていなければ
ウィキデータ上で
直接行われることが望ましいです
同じ場所でデータを取り込めば
交流が生まれるからです
次に ベースレジストリと典拠ファイルに
焦点を当てましょう
既存オントロジーの拡張として
異なるデータや
管理されていない語彙の間で
リンクしやすくなるからです
スライドがあと2枚だけあります
次のステップは
Wiki Loves Performing Artsに向け
すべてのGLAMの手法を
合わせることです
つまり会場や組織を
インフォボックスや
バブル テンプレートの形式で表し
ウィキペディアに
データを取り込もうとする試みです
もう1つ追求するプロジェクトは
COST Actionで
来年 提起する予定の
舞台芸術向けのリンクト オープン データ
エコシステムです
COSTはヨーロッパのプログラムで
ネットワーキング活動と
ここに取り上げ挙げられた
トピックをサポートしています
うち2つを抜粋してありますが
1つはウィキデータと
従来のリンクト オープン データ間での
フェデレーションに関する質問です
もう1つは
これも重要だと思いますが
大きな可能性を秘めている部分で
ウィキデータのデータを追加する
国際キャンペーンの実施です
以上です
ありがとうございました
では 私の同僚たちに
登壇いただきましょう
パネルへどうぞ
マイクも必要かもしれません
それから…
質問の機会を差し上げます
また 私の同僚たちにも
お互いに質問があるかお尋ねします
聴衆の皆さんからは
質問があるでしょうか
(聴衆1)[聞き取り不能]
お一人ずつに質問ですが
どこで線引きをして
どのように―
自分のウィキベースを
運用する必要がある場合や
ウィキデータへ取り込みたい内容を
規定するのでしょうか
順序良く取り込める背景には
明確な図表があるのでしょうか
マイクがあるので
まず私からお答えします
課題の1つは著名度です
別のプロジェクトで
それに取り組んでいます
ライセンス供与も課題の1つです
ご自分のデータベースでは
自分独自の規定を適用できますから
そうなると
どこでも可能だと思います
3つ目はサンドボックスとして
データを保持し
ウィキデータへ取り込むため
それを準備することです
以上が今考えられる
主要な3つですが
まだあると思います
私にとっては
著作権はいつも課題です
国立図書館が
ウィキベースに向けて移行したい場合
マオリ語の言葉での
これまでの業績のため
彼らがライセンス管理を
継続しなければなりません
カカポのデータベースには
保護局が公開できると考えた
データのみがありますが
その運用を見れば
非公開のウィキベースを使用して
独自データベースを
管理したくなるかもしれません
単に彼らが現在運用している
Excelスプレッドシート体系よりも
視覚化ツールの一部を
適用できたほうがいいからです
データの種類に依ると思います
出版物のアーカイブでは
もちろん幸運な立場で
資料は出版されたものや
当時 出版するには高額で
公開されたものですから
これは簡単です
プロジェクトは―
典型的なプロジェクトでは
ある期間 資金提供され
それが終了すると
データに起こることは
倉庫に格納されるか
永遠には運用されないソフトウェアに
格納されることになります
ですから私の観点からは
明らかで
当時はウィキデータはありませんでしたが
現在はあるので
ウィキデータのような
より大きなエコシステムへ
データを取り込む方法と照らし合わせ
早い段階で
持続可能性を議論することは
私たちのプロジェクトにとって
間違いなく合理的です
またデータコミュニティーと
話し合うのも意味があります
例えば ウィキデータへ追加するには
何が著名で合理的か
また所有権の形式を保つには
何が合理的か
洗練されたアプリケーションよりも
簡単な形式でも
視認性を高めたほうがいいとか
維持されない保管場所へ
多額の資金を提供する代わりに
大きなデータクラウドへ
リンクさせたほうがいいなどの議論です
先ほどここでプレゼンした
プロジェクトでもお伝えしたように
従来のリンクト オープン データ手法と
ウィキデータとでは二重性がありますので
非公開のウィキベース設定
という問題ではないのです
抱えていた課題の1つは
もちろんウィキデータで
自分自身のデータを取り込む際に
人々というか 他人の
ハウスキーピングを行う必要があります
それによって参加する人が
減るかもしれませんが
段階的に取り組んでいくということです
現時点では データベースは
従来のリンクト オープン データに
ありますが
私たちはそれをウィキデータと
リンクし始めており
これは継続的なプロセスで
最終的に大半のデータを
ウィキデータに収める領域と
その他のデータベースに残す領域とを
明らかにしていきます
明らかに同期に関しては
すでに課題であるように
今後も課題になります
リンクトデータの分野では
誰を信用できるか
誰が何の権限を持つかなど
協議が必要です
(司会者)他にご質問は?
(聴衆2)ありがとうございます
私が完全に同感できるのは
どこで境界線を引き
ウィキデータにデータを収めるかどうか
どのような理由や目的で
ローカルのデータベースに
データを保存し 作成や管理や維持を
行うかという課題です
これは大きな議論で
単にウィキデータへデータを
移行するという
流行りを超えたものだと思います
公開により人類に貢献でき
優れたツールがあるからです
現実の物事はもっと複雑だと思います
それにも関わらず
興味深い議論だと思います
また 別のパネルのイベントで
議論されている
別の問題もあります
1つの側面では
自身のデータベースを持ち
どのようなテクノロジーであれ
ウィキデータへ公開したり
またはウィキベースのテクノロジーで
情報を作成管理する
独自のシステムを開発したりすると
同期やフェデレーションなどは
使用するテクノロジーの問題です
実際は ウィキデータを
公開のためだけに使用しているか
ウィキデータの下にある
インフラを使用して
自分のデータの作成や
管理をしているかです
ウィキデータのパネルについて
議論があり
ここで別の議論も出てきますが
物事は別のレベルにあると思います
ウィキベースかウィキデータかという
議論に達するのは―
間違いだと思います
ウィキデータのインフラを
重視しすぎてしまいます
舞台芸術の領域のように
他にもインフラはあるからです
私たちには
別の補完コミュニティーもあり
MusicBrainzは
独自のプラットフォームを運用し
リンクト オープン データを提供しています
私が理解している限りでは
ウィキデータのコミュニティー内で
彼らのデータを
重複しないという同意があり
すべてのデータをコピーはしませんが
補完し合うものだと受け入れています
そこで ウィキペディアで
データを統合するとどうなるでしょう?
例えばインフォボックスです
彼らのSPARQLエンドポイントから
そのデータを直接引き出せるでしょうか?
またはすべてのデータを
コピーせざるを得ないのであれば
それにはどんなプロセスが
関与するのでしょうか?
(聴衆2)議論はまだ続いていると思います
このイベントの中では
関心を寄せるコミュニティーは
両方あるはずですから―
ウィキベースに関心がある人たちと
ウィキデータに関心がある人たち
そしてその両方に関心がある人たちです
ですが余儀なくウィキベースに
移行するわけではありません
そうとも限りません
MusicBrainzは
ウィキベース稼働ではありません
(聴衆2)別の問題があると
申し上げたかったのです
相関する場合もありますし
まったく関係ない場合もあります
もう1つ質問か意見があります
管理された語彙の
階層構造の管理についてです
例えば シソーラスや
Fintoです
場所があり
マオリ語での―
Subject Headingsがあり
階層構造での管理という概念に
対処しなければなりません
ご意見をお聞かせください―
ウィキデータで管理された
知識組織化体系を
管理する可能性については?
FintoとYSO placesの場合では
リポジトリは
最終的にいくつかのソースの
集まりになります
ですから ともかく流動的です
必ずしも必要ありません
私は国立図書館の代表ではないですが
その考えられるプロジェクトで
既存の構造を管理したり
対処したりする必要はないのです
その意味では
まだ探索がされるべき領域です
Maori Subject Headingsは
ウィキペディアの構造に対して
理想的に自身に役立っているようです
ですが ライセンス供与は
禁じられています
ライセンスが異なっていたら
ウィキデータへ
取り込まれていたでしょう
誰かが階層構造を好まずに
変更を始めると同時に
その構造を構築した人から
すぐに激しい抗議が来て
さまざまな異なるマオリから
最新の階層構造について
承認を得ることになります
それが解決しようとしている課題です
知識組織化体系という言葉は
すべて違います
ウィキデータで
異なる階層構造を表すことが
良い考えかは確かではありません
データの重ね合わせを
考えたほうがいいかもしれません
コンセプトレベルでの
マッピング作業については
例えば ZBWの共同事業として
経済学向けのシソーラスがあります
このシソーラスは
自身の階層構造を持っており
もちろん ウィキデータのコンセプトへ
ウィキデータの中に
代替構造を実際に保管せず
シソーラスの階層構造を
反映することは可能ですが
これは混乱を招きます
しかし ウィキデータを
コンセプトの貯蔵庫として考えるべきでしょう
外部にあるレイヤーとリンクでき
必ずしもウィキデータの中に
存在する必要がないものという
別の見方を与えてくれます
(司会者)他にご質問は?
なければ...どうぞ
(聴衆3)ユアヒム
最後の点を確認させてください
レイヤーは あなたのお考えでは
外部で管理され
誰かがどうにかして ウィキデータ側から
ウィキデータと統合されるものですか?
それとも管理方法について
すでにお考えがありましたか?
いいえ 考えてはいませんでした
ZBWとウィキデータで
いくつか試みはありましたが
ウィキデータで
[聞き取り不能]でした
これはまったく新しい
複雑な問題です
議論によりますし
そのようなことを行うには
管理を諦めなければなりません
ですが 明らかにされるべきです
もう1つ受けますか?
(聴衆4)質問は
カカポのプロジェクトについてです
はい
(聴衆4)こうした項目に
個々の動物を持つことについて
ウィキデータの
コミュニティーから反対はありましたか?
これまでのところないです
(聴衆4)以前この件を
聞いたことのある人は?
これまで反対がないのは
まだ誰も知らないからでは?
時に小さな議論がされています
ウィキデータで
こうしたことに関心がある方たちは皆
これを 有名な競走馬やネコに対する
個々のウィキデータ項目の付与を
自然に延長したものだと
見なしています
うまくモデル化されています
そこに種全体を収めるのは
大胆でしょうが
完全に管理できることだと思います
(聴衆4)ネコやイヌで
お試しにならないように
(笑)
(司会者)お時間が参りました
ご参加ありがとうございました
パネリストの皆さんが
休憩の間も質問をお受けします
お楽しみください
ありがとうございました
(拍手)