-
[GLAMパネル]
-
[スサンナ・オーネス、マイク・ディキソン、
ユアヒム・ナイバート、ビート・エスターマン]
-
皆さん こんにちは
-
GLAMパネルにようこそ
-
始める前に
2つお知らせがあります
-
第1に Etherpadを広く活用して
メモを取ってください
-
第2に 自宅やその他の場所で
ご覧の皆さんへ
-
ご質問があれば
-
Etherpadへ
書き込んでください
-
この部屋のサポート担当が
把握していく予定です
-
皆さんの貢献を拝見した後に
-
私たちが決定した
今年のパネルのテーマは
-
実際のウィキメディアの
プロジェクトを凌駕する
-
データ エコシステムにおける
ウィキデータの役割です
-
これは新しいウィキメディア財団の戦略とも
完全に一致するものです
-
今日は4名のパネリストがいます
-
3名と私です
-
ご紹介しますので
登壇してください
-
こちらはスサンナ・オーネスです
-
長年フリー ナレッジの活動をしており
-
数多くのウィキプロジェクトに
参加しています
-
今日は フィンランド国立図書館との
共同プロジェクトに関して
-
お伝えいただく予定です
-
次にご紹介するのは 私の隣の
マイク・ディキソンです
-
ご覧の順で
2番目にお話しいただきます
-
彼はニュージーランドの学芸員です
-
また 動物学者で
ウィキペディア編集者でもあり
-
さらに 2018年と2019年における
-
ニュージーランド初の
ウィキペディアン代表です
-
お話しいただくのは
その役割に関する経験と
-
その状況の中で
ウィキデータが果たしている役割です
-
次にご紹介するのは
ユアヒム・ナイバートです
-
キールとハンブルグにある
ドイツ国立経済学図書館からお越しです
-
彼が取り組んでいるのは
世界最大の公開出版物アーカイブを
-
ウィキデータを使用して
一般に利用しやすくすることです
-
最後に私
ビート・エスターマンです
-
スイスのベルン応用科学大学に
勤めています
-
スイスやオーストリアで
OpenGLAMを長年推進しています
-
今日お伝えするのは
-
Canadian Arts Presenting Associationと
行っている活動です
-
舞台芸術に焦点を当てたものであって
-
ウィキデータが主ではありませんが
-
そこでもウィキデータが果たしている
役割を理解していただけるはずです
-
では着席させていただきまして
-
スサンナにお話しいただきましょう
-
こんにちは
スサンナ・オーネスです
-
ウィキメディア フィンランドで
-
非常勤のGLAMコーディネーターとして
働いています
-
またオープン ナレッジの分野で
コンサルタントも行っています
-
これはどちらかと言うと
後者に関するお話です
-
私が携わっているのは
-
地理的データグループに関する仕事です
-
その対象は―
-
英語では何かというか
調べました…
-
フィンランド王族統治の
文化遺産構想です
-
これは次に関係しています
-
地名と
-
地名がフィンランドのGLAMセクターの
異なるリポジトリにどう表されるか
-
また GLAMセクターが異なるソースを
どうまとめようとしているか
-
ウィキデータやその他モデリングにより
GLAMセクターがどう情報を得るかです
-
ここに示されているのは
YSO placesへの3つの主なソースで
-
これらは全国的または一般的な
オントロジーの一部です
-
AHAAは
フィンランドのアーカイブ向け
-
Melindaは
フィンランド図書館向け
-
KOOKOSは
フィンランド美術館・博物館向けです
-
ですから3つの
コンテンツ管理システムが
-
YSO placesにまとまっています
-
ウィキデータとの間では
すでにデータのやりとりが行われていて
-
国土調査向けの
ネームプロジェクトも同様です
-
またFinnish Names Archiveという
第3プロジェクトもあり
-
YSO placesには
まだ寄与していませんが
-
そのための計画はあります
-
全体の課題の中でも
-
重要なモデリングの課題の1つは
-
このプロジェクトに表されている地名に
-
3種類の要素があることです
-
うち1つ目が場所で
位置を持つものです
-
2つ目が地名で
例えば地名学による地名です
-
3つ目がソースで
-
これは場所と地名の双方の由来または
その裏付けとなる文献です
-
YSO placesは...
-
ここ右上に
同じ図がまたありますが
-
主に場所を重視しています
-
重要な点は YSO placesが
-
フィンランド国立図書館とFintoの
プロジェクトであることです
-
現在フィンランド語とスウェーデン語では
7,000を超える場所が存在し
-
英語では3,000を超える場所が
存在しており
-
パブリック ドメイン(CC0)の
ライセンスを取得してあります
-
ここに表示されているのは
Fintoのサービスです
-
場所はセベッティヤルビを
選択してあります
-
これは私たちのスコルト・サーミ語での
言語プロジェクトにも関係しています
-
ここはフィンランドの
極北に位置する場所で
-
スコルト・サーミが居住しています
-
ここで分かるのは―
-
この場所に関するデータが
-
ウィキデータと
国土調査のデータに
-
リンクしていることです
-
こちらがその詳細です
-
またこれはリポジトリの中に
階層的に整理されていますので
-
セベッティヤルビは
今表示されていませんが
-
この自治体の下に存在しています
-
そして その地域
-
そして国としてのフィンランドや
さらに広域の地域に含まれています
-
ここで分かるのは
YSO placesの多くが
-
Mix'n'Matchを通じて
すでにウィキデータと照合されています
-
未照合のものもあります
-
ですが 名前の量は
それほど多くありません
-
たった5,000未満です
-
他にもリポジトリとして
-
フィンランドの地理空間的プラットフォーム
プロジェクトによる
-
Place Names Cardsがあります
-
すべてフィンランドの地図に
載っている地名です
-
これらにはCCライセンス
バージョン4.0が付与された
-
リンクトデータもあります
-
80万の地図ラベルは
-
フィンランド語、スウェーデン語
フィンランドの3つのサーミ語によるものです
-
また2種類の異なるエンティティがあります
-
1つは場所で
-
もう1つは地名などの
場所の名前です
-
両方に恒久URIがあります
-
例えば同じセベッティヤルビに対し
-
まずフィンランド語
続いて3つのサーミ語
-
言語同様
地理的データがあり
-
そして場所の種類などの
さらなる情報があります
-
これは地名に対するカードで
-
独自のURIがあります
-
失礼 英語のリストに
翻訳されていないようですが
-
プロジェクトの一部は
多言語で取り扱われています
-
次にFinnish Names Archive
についてです
-
これは2017年フィンランドの
言語機関によるプロジェクトで
-
場所や地名でなく
-
それらのソースを説明するものです
-
地名に関する
3百万の現地調査記録を含む
-
ウィキベースのプロジェクトです
-
ウィキベースに主にフィンランド語
いくつかはスウェーデン語で収められています
-
サーミ語の名でも
傑出したコレクションがあり
-
興味深いものです
-
CC BY(表示)のライセンスが
付与されているため
-
ウィキデータの観点からは
困難ではありますが
-
フィンランド語の
ローカル ウィキベースがあれば
-
私たちがこのプロジェクトで
初めてそれに取り組めるかもしれません
-
こちらがそのプロジェクトの
スクリーンショットで
-
表示されているのは
場所に関する情報―
-
収集者が最初に使用した地図と
-
彼らが収集した情報から
生み出されたカードです
-
こちらはカードの1つで
-
それらに含まれる詳細データです
-
カードが送られる先は
リンクト データ プロジェクトで
-
ヘルシンキのデジタル
ヒューマニティラボ(HDHⅬ)と
-
アールト大学の
コンピューティング グループである
-
セマティック コンピューターと
(SeCo)
-
Names Sampoという
フィンランドの言語機関によるものです
-
これは地名のソースに追加される
-
集約型リサーチインターフェースです
-
左側で 多数のソースが
あることがここで分かります
-
またこのデータに基づいて
異なる視覚化も行えます
-
私が提案しているアイデアは
-
ローカル ウィキベース向けのモデリングに
このデータを使用することです
-
モデル方法などの
モデリングに関する疑問は出てきます
-
異なる方法や慣習が
それぞれにあるからです
-
良い点は わずかな努力で
少数言語をサポートできることです
-
ここに2つの選択肢があります
[場所が新規項目になるのはいつか]
-
フィンランド語の
時空オントロジーであるSAPOのモデルと
-
ウィキデータのモデルです
-
ウィキデータでは
新規項目にならない傾向があります
-
プロパティ変更に関わらず
同じ項目のままであることが理想です
-
一方 SAPOモデルでは
-
エリアや地名の変更があると
新規項目になります
-
そこで 場所と地名とソースの
3つの側面を持つ
-
この区分に戻りましょう
-
地名は エンティティとプロパティの
どちらにすべきでしょうか
-
ウィキデータが
プロパティを使用している一方
-
国土調査プロジェクトは
エンティティを使用しています
-
それとも
語彙素にするべきでしょうか?
-
ウィキデータは
地名に対して
-
語彙素よりも
テキストのプロパティを選択しています
-
失礼 逆でしたか?(笑)
-
ですから 地名は―
-
語彙素ではなく
プロパティですね
-
ウィキベースの欠点は
-
内部に地理的情報が
不足していることかもしれません
-
例えば 基本設定では…
-
地域的な地理的情報を
使用できるようにするためには
-
スタックにテクノロジーを
加える必要があるでしょう
-
またウィキデータのコーパスを
活用できるようにするためには
-
フェデレーションが必要です
-
以上です
ありがとうございます
-
(拍手)
-
はい
-
(マオリ語)
-
ようこそ 皆さん
マイク・ディキソンです
-
1年間
-
ニュージーランドの
ウィキペディアン代表でした
-
ウィキペディアン代表とは
何かと思われるでしょう
-
調べてみると ご覧のように
そんなものはないからです
-
補助金申請で
私が造った言葉です
-
財団は気に入ってくれたようなので
-
その肩書を使っています
-
1年間で35の異なる機関を経験しました
-
そのほとんどが在駐で
トレーニングセッションを行い
-
公開イベントを企画し
-
各所でウィキメディア戦略を
発展できるよう努めました
-
面白い経験で
-
さまざま広範囲の
プロジェクトや人々に出会いました
-
面白く啓蒙的な方法で
ウィキデータを扱っている
-
異なるプロジェクトの
いくつかをお話します
-
これが皆さんの議論に
役立つかもしれません
-
このプロジェクトは最初
ウィキペディアのプロジェクトでした
-
ウィキペディアの名は
よく知られていたからです
-
伝統的な編集マラソンや
ジェンダーギャップに関するものなど
-
複数の別のイベントを企画しました
-
多くの皆さんが[聞き取り不能]
-
新しい編集者をうまく募集したり
することができました
-
コモンズへ
大量のアップロードを行いました
-
次のような事例もありました
-
昆虫学のイラストレーター
デス・ヘルモアによる
-
千を超えるオリジナルアート作品の
コレクションが
-
ハードドライブに放置されており
-
10年に渡る調査研究
[聞き取り不能]
-
すべてCC BYライセンスの下で
公表する許可を得たのです
-
これで世間の人たちに
見てもらいやすくなりました
-
甲虫類のたくさんのイラストで
皆が理解でき
-
ジェンダーギャップを埋める
ワークショップも 皆が理解できます
-
ですが ウィキデータは
-
GLAMセクターや
特定の活動を行う外部の人々に
-
導入してもらうのは
難しいものでした
-
ウィキデータは
-
ウィキペディアン代表の
プロジェクトの
-
ますます重要な部分になると
私は気付き始めました
-
プロジェクトが進むにつれ
-
私の仕事の大部分を
占めるようになりました
-
そこで ウィキデータを
自分で学ぼうとし始めました
-
どれだけ重要か
分かり始めたからです
-
こんなプロジェクトがありました
-
カカポ(フクロウオウム)は
ニュージーランド固有の跳べないオウムです
-
種を絶滅から救う仕事をしている
保護局と協働し
-
「ウィキデータへ
一羽一羽のカカポを収めては」と
-
アイデアを投げ掛けました
-
とんでもないようですが
-
十分に実行可能なプロジェクトで
-
すでにいくつかは収められています
-
カカポはたくさんいるわけではないので
-
扱える作業です
-
開始時には148羽いて
1羽が死にましたが
-
記録的な繁殖期に
213羽まで増えました
-
過去50年で最大のカカポ数というのは
素晴らしいことです
-
これは一大事で
-
ニュージーランドで毎日
報道されました
-
新しいカカポが生まれるたび
-
(聴衆)ニューヨークタイムズでも
-
(マイク)そうですか
素晴らしい
-
これは国内ニュースでした
皆に好かれている鳥です
-
面白いことに
-
個体数の多い種と違い
-
カカポは1羽残らず
独自の名前が名付けられていて
-
独自のID番号があることです
-
またしばしば
良い伝記データもあります
-
例えば出生地や
誕生日
-
孵化した日や
父母
-
死亡した場合は
死亡日などです
-
こうした情報は
保護局のデータベースにあります
-
最も有名なカカポの1羽は
-
風にちなみ名付けられた
Sirocco(シロコ)で
-
ご覧の誕生データがあり
-
Twitterアカウントもあります
-
ウィキデータは
それに関して多少問題があります
-
Twitterアカウントを
持てないからですかね
-
アルバムカバーで
特集されたりしています
-
このプロパティは複数あり
-
最も有名な
固有のカカポの1羽です
-
個々のカカポを収めるアイデアを
保護局に投げ掛けた際
-
どれだけの伝記データを公表するか
-
考慮する必要がありました
-
簡単なリストにして
-
現在212羽...
2羽は死んだので210羽が
-
生存しているカカポの
候補すべてです
-
巣立つときに名付けられ
-
まだヒナの間だけ
コード番号を持ちます
-
完全に羽が生えそろった時に
-
ウィキデータを整えて
-
種全体をウィキデータに収めるのですが
-
DOC IDに対する
プロパティは考える必要があり
-
それを皆さんにご相談したいのです
-
特定のIDを使用すべきか
-
または 特定の調査プロジェクトに
タグ付けされている―
-
個体の鳥や植物や動物に対して機能する
IDを考えるべきかというのは
-
良い質問です
-
2つ目のプロジェクトは
クライストチャーチ アート ギャラリーです
-
ニュージーランドで
最も有名なアーティスト
-
コリン・マカホンの絵画が
数点 存在しています
-
ニュージーランド
スクール ジャーナルのための絵画で
-
当時 政府が出資したものでした
-
ニュージーランドの
アーカイブが
-
これらの絵画の著作権を
持っていました
-
これは非常に稀な状況です
-
私はクライストチャーチ
アート ギャラリーに勤め
-
オークランド
アートギャラリーと共に
-
Find New Zealand Artists
というサイトを管理していました
-
この仕事は
ニュージーランドのアーティストの
-
各機関の保有資産を追跡することでした
-
データベースにある
1万8千の異なるアーティストの大半に
-
情報がほとんどありませんでした
-
そこで例のMix'n'Matchで参照し
-
少なくとも誕生日
または死亡日
-
誕生地や死亡地の
-
情報があるものをエクスポートしました
-
ですから あまり限定されていません
-
それでも 一致したものは
それほどありませんでした
-
でも 現在ウィキデータで
著名なアーティストに一致するものは
-
現在約1,500あります
-
これは良いことです
-
ですが彼らにとっての利点は
-
彼らのウェブサイトであることです
-
資産へのリンクで管理するだけです
-
ですがこの伝記データは
-
アーティスト一人一人に対し
現在 手作業で作成されています
-
エクスポートや
Mix'n'Matchによる照合で
-
それまで気付かなかった
-
数々の入力ミスと間違いなどが
明らかになりました
-
Excelを通じて
並び替えを実行すると
-
これらの問題が明らかになります
-
ウィキデータから情報を取り込めると
私が言ったとき
-
彼らにとって
それは真新しい考えで
-
ウィキデータの価値は急に変わりました
-
これは利点の1つだと思います
-
手間暇かけて手作業でキュレートされた
ウェブサイトがある場合
-
1万8千ものエントリーに
多数の誤りがあっても
-
他の人に事実確認と修正を
行ってもらうという
-
別の方法を示せれば
-
共感してもらえます
-
私たちは次のような
アイデアを投げ掛けました
-
30年代のクライストチャーチの
ニュージーランド アーティストの
-
歴史本のすべてを
「ウィキデータ化」するというもので
-
あらゆる人物、コネクション、場所、展示
などの出版物をデータ化するものです
-
これは管理できる規模のプロジェクトで
彼らは喜んでいました
-
3つ目に Maori Subject Headings
(マオリ件名標目)をお見せします
-
waka(ワカ)とは
-
特定の種類のカヌー
戦争カヌーに対するマオリ名です
-
ニュージーランドの国立図書館に
wakaに対するリスティングがあり
-
国立図書館は
マオリの件名標目に関して
-
マオリ語による
独自の辞書を持っているからです
-
そこでwakaは
-
マオリ語と英語で定義されています
-
さらに狭義の言葉もあります
-
画面端でご覧になれます
-
典型的なものは
taurapa(トゥーラパ)です
-
まずマオリ語で
次に英語で定義されています
-
これはご覧のように
彫刻を施した船尾のことで
-
英語で「sternpost」ですが
-
taurapaに
その語は使えません
-
taurapaは特定の種類の
戦争カヌーの船尾のみを指すからです
-
それに相当する英語はありません
-
文化的特定用語のオントロジー全体が
注意深くまとめられ
-
国立図書館とマオリ人により
確認されています
-
英語でもマオリ語でも
-
常に 定義や説明に
追加や改善がされています
-
素晴らしいことです
-
私はこのたくさんの情報を
-
まずマオリ語で
次に必要に応じ英語への翻訳で
-
ウィキデータに収めることを
考えつきました
-
そうなったらいいですよね
-
こちらが著作権とライセンスです
-
あいにく非営利‐改変禁止です
-
そこで彼らがこのライセンスを
選択した理由について
-
お話ししましょう
-
恐らく このいかなる情報も
営利目的で使用できないという保証を条件に
-
腰を下ろして
[聞き取り不能]ことに承諾した
-
マオリ人からのみ同意を得たからです
-
そこがこの仕事のもどかしい面で
-
こうした制限事項に直面しています
-
次の3つを前面に押し出して
議論の拍車をかけたいと思います
-
ウィキデータに種全体を取り込むこと
-
ウィキデータの価値に関する
アートギャラリー学芸員の考えを変えること
-
そして別の言語で完全なオントロジーが
ある場合にどうするか―
-
これはクリエイティブ コモンズの
ライセンスが限定的なため実現していません
-
ありがとうございました
-
(拍手)
-
ユアヒム・ナイバートです
-
ZBW(ドイツ経済学中央図書館)に
勤めています
-
これはハンブルグにある
経済学のための情報センターで
-
私は科学ソフトウェア開発者として
働いています
-
昨年の仕事の一部は
ウィキデータへ提供するデータの準備でした
-
メタデータの提供や
20世紀の出版物アーカイブなど
-
初めての経験として
その仕事に関してお伝えします
-
私たちが知る限りでは
-
これは世界最大の
公開出版物アーカイブです
-
1908年から2005年の間に
集められた
-
1,500を超える新聞と定期刊行物があり
-
収集範囲はドイツ国内から
世界にまで及びます
-
すべてが網羅されているので
-
興味を引くものであり
-
世界中に進出したい
ハンブルグの経営者には
-
特に興味深いものだと思います
-
ご覧のとおり
この資料は新聞の切り抜きで
-
紙に貼られていて
-
それがフォルダーに集められています
-
こちらが人物に関するアーカイブの
小さなコーナーで
-
それと同様に
-
企業や一般の話題や業績
すべての人
-
興味を引きそうなこと
すべてに関する情報が集められています
-
これらのフォルダーは
-
2004年から2007年までのDFG
(ドイツ研究振興会)出資プロジェクトにより
-
およそ1949年までは
スキャンされています
-
結果として現在までに
-
この時代の主題関係書類は
2万5千あります
-
これには約2百万あるいは
それ以上の数のページが含まれ
-
オンラインに掲載されています
-
当時 ZBWが開発した
アプリケーションがあり
-
現在では少し時代遅れで
-
凝ったものではなく
さらに問題なのは
-
オラクルやColdFusionに基づき
開発されたアプリケーションは
-
Windowsサーバー上で
運用するものなので
-
長期的に持続可能ではありません
-
もっと凝ったリンクト データ
アプリケーションへこれを統合すべきか
-
大胆な措置を取って
-
すべてのデータを公開するかを
話し合いました
-
データにはCC0ライセンスを
割り当ててあります
-
現在は主要アクセス レイヤー
-
主要ディスカバリ レイヤー
プライマリ アクセス レイヤーを
-
リンクト オープン データ ウェブへ
移行していますが
-
ここで実は最も合理的なのは
-
ウィキデータへメタデータを収めて
-
コレクションのすべてのフォルダーを
-
ウィキデータとリンクさせることです
-
そうすれば見つかりやすく
-
これらフォルダーに関する
すべてのメタデータを
-
ウィキデータへ転送することもできます
-
そこで使用でき
データの追加や
-
修正も行えるようになります
-
ZBWはまだもちろん
画像の保管を管理します
-
いかなる方法でも
移行できないとか
-
オリジナルの作者が所有していたため
ライセンスを与えられない画像です
-
ですが 将来的には
IIIFマニフェストに基づき
-
DFGビューアー経由の
メタデータファイルにより
-
それらを利用できるようにします
-
固定ランディングページも
準備する予定です
-
これはウィキデータへの参照の
データポイントの機能を果たすものです
-
また ウィキデータへ
うまく収められないデータを
-
利用できるようにする予定です
-
私たちはウィキデータへの
データ統合とデータ提供を
-
そのデータの
SPARQLエンドポイントから成る
-
カスタムのインフラを使用し行い
-
そして
フェデレーテッド クエリを使用して
-
エンドポイントと
ウィキデータのクエリサービスとの間で
-
一致した文を作成します
-
これは SPARQLクエリ自体
またはスクリプト経由の変換での
-
連結という観点を通して行うものです
-
これにより その文のための
出典も生成され
-
QuickStatementsの
コードへ収められ
-
オンラインで使用できます
-
こちらが成果です
-
誕生日などのように
簡単なものではないですが
-
すでに存在している項目に関する
-
複雑な文もあります
-
例えば 企業の管理役員だったこの人物です
-
ご覧の期間に
-
科学的文脈で使用するために…
-
参照されています
-
データ提供の
最初の部分が済むと
-
人物のアーカイブは
完全にウィキデータにリンクされます
-
これは情報ツールでもあります
-
以前は数多くの項目に
外部の出典がありませんでした
-
私たちには6,000を超える
文がありましたが
-
これは現在はアーカイブのメタデータが
出典とされています
-
人物に関しては最も簡単でした
-
なぜならウィキデータで
人物は簡単に識別できるからです
-
そこに90%超は
すでに存在していたので
-
私たちはそれにリンクできました
-
欠けている人物のために
100項目ほど作成しました
-
現在はアーカイブの残りの部分
-
特にトピックのアーカイブに
取り組んでいます
-
つまり世界全体の
知識組織化のために
-
歴史体系のマッピングに取り組み
-
ウィキデータへ新聞の切り抜きとして
資料化しているのです
-
基本的概念をお伝えすると
-
国とトピックのアーカイブは
-
国々の階層構造と
その他の地理的エンティティで
-
整理されています
-
これは英語に翻訳されていて
利用しやすくなっています
-
ドイツ語は…
-
トピックでは
深い階層に分類されています
-
この組み合わせにより
-
1つのフォルダーが定義されています
-
私たちが次に行いたいことは
-
これをウィキデータへの
構造として一致させ
-
データを移行することです
-
知識組織化という
この良い挑戦に
-
皆さんご参加ください
-
この仕事を追跡する場が
ウィキプロジェクトで
-
皆さんはそれをフォローしたり
それに参加したりできます
-
以上です
ありがとうございました
-
(拍手)
-
私たちはウィキデータへ
舞台芸術を取り込んでいます
-
舞台芸術向けのリンクト オープン データ
エコシステムを構築することで
-
舞台芸術とリンクトデータを
クラウドへ取り込んでいるのです
-
これからウィキデータに関連する質問に
お答えしようとしており
-
皆さんにもその回答に
ご協力いただきたいと思いますが
-
まずは 私の経験からお話しさせてください
-
私は今年―
-
今年前半にCAPACOAと
楽しく仕事をしていました
-
Canadian Arts Presenting Association
(カナダ芸術表現協会)の頭文字で
-
リンクト オープン データを
カナダの芸術部門全体で採用してもらえるよう
-
Linked Digital Future Initiative
というプロジェクトを開始したのです
-
過去5年間の観察に基づき
彼らはそれを行いました
-
[聞き取り不能]
舞台芸術で重要な課題は
-
メタデータが
不十分な品質であったことと
-
リンクされておらず
相互運用できなかったことでした
-
そんなわけで
パフォーマンスやイベントの中には
-
Googleや個人の端末などで
-
うまく見つけてもらえないものも
ありました
-
そこで私たちが共に築いたビジョンは
-
一度に数多くの利害関係者のための
情報ベースを持つことでした
-
舞台芸術全体の
バリューネットワークを調べて
-
そこでの主要な利害関係者を
明らかにしました
-
また追求したい
利用シナリオも調べ
-
それを情報ベースまたは
異なるプラットフォームから成る
-
アーキテクチャ全体に地図化しました
-
これは明らかに
分散アーキテクチャであり
-
巨大な一枚岩ではありません
-
各自10分しかないので
-
これをさっとご説明しますが
-
詳細に興味がある方がいれば
-
今晩とか明日 理解を深める時間が
あると思います
-
私たちが着手したのは
舞台芸術のバリューネットワークからで
-
これは面白いことに
去年発表されました
-
以前の仕事に基づき
構築できたのはラッキーです
-
中央にあるのが
舞台芸術の基本の価値連鎖で
-
さまざまな利害関係者が
それを取り囲んでいます
-
私たちは全部で
20の利害関係グループを見つけ
-
各利害関係グループのため
-
それを7つの大きなカテゴリへ要約しました
-
そしてインフラの観点から
-
彼らがどのようなニーズを持ちうるか
-
また 全体がリンクされ
データが公開で利用できたら
-
何を達成できるかを
系統立てて明らかにしました
-
異なるタイプが表示されていて
-
Production(制作)
-
Presention & Promotion
(表現とプロモーション)
-
Coverage & Reuse
(報道と再利用)
-
Live Audiences
(ライブ オーディエンス)
-
Online Consumption
(オンライン消費)
-
Heritage(継承)
-
Research & Education
(調査研究と教育)です
-
こちらに最初の一部分が表示されている
-
大きな表を設定した後
-
その表で比較し
-
すべての利害関係グループが
全体に渡り利用しているのは
-
どのデータタイプかを調べました
-
これは全体に共通する
大きな基本データで
-
この領域こそ
-
共に協力して
データを維持することが
-
合理的な領域なのです
-
プラットフォームの
アーキテクチャについては
-
ここに4つのレイヤーがありますね
-
下部にはデータレイヤーが表示されています
-
もちろんウィキデータは
その一部の機能を果たしますが
-
その他データベース
分散データベースもたくさんあり
-
SPARQLエンドポイントを通じて
データが公開されています
-
中央の黄色部分が
セマンティック レイヤーで
-
物事を表現するための
共通の言語で
-
舞台芸術の物事や
オントロジーに関する文を作成できます
-
そして次に
アプリケーション レイヤーがあり
-
これはデータ分析やデータ抽出などの
さまざまなモジュールで構成されています
-
つまり 非構造化データを
構造化データにする方法や
-
それをツールでサポートする方法です
-
それからデータの画像化もあります
-
大量のデータがあれば
何らかの方法で可視化できます
-
また上部に
プレゼンテーション レイヤーがあり
-
これが普通の人たちが実際に
日々やりとりするもので
-
検索エンジンや百科事典
文化的アジェンダ
-
その他各種サービスがあります
-
一から始めたわけではなく
-
この領域で
すでに作業がなされていました
-
私が参加してきたプロジェクトから
いくつかの例を取り上げましょう
-
またその他についても
取り上げていきます
-
私はこの領域において
-
舞台芸術に関する
スイスのアーカイブから始めました
-
スイスの舞台芸術のデータベースを
構築するまで
-
舞台芸術のオントロジーを作成しました
-
現在はRDFになっています
-
スイスの舞台芸術の歴史に関しては
-
60、70年間の
データベースがありますから
-
それを基礎に開発できますし
-
RDFに変換もされています
-
データが利用できる
構築プラットフォームもありました
-
ウィキデータへ
いくらか取り込み済みです
-
一部はスイスからのデータで
-
舞台芸術機関からのデータもあります
-
例えば バート・マグナスが
それに関与しており
-
彼が背景の原動力です
-
またウィキメディア コモンズからの
データもありますが
-
私たちの残りのメタデータと
うまくリンクされていません
-
また この取り込みを行うことで
-
スイスのデータモデルを
ウィキデータへ実装し始めたことになります
-
カナダの実装提携業者の1つが
-
Culture Createsです
-
プラットフォームを運営し
劇場のウェブサイトから情報を取得し
-
それをナレッジ グラフに入力し
-
そして 検索エンジンや
その他デバイスに表示します
-
そこでも実装や
オントロジーへの拡張の必要があり
-
スライドで分かるように
-
まだ空き領域はありますが
重複もあります
-
重要な重複は
一般共有された言語で
-
これはさまざまなデータセットを
リンクするのに役立ちます
-
また重要なことは
-
ベースレジストリと典拠ファイルを
使用していることです
-
ここが これらのリンクにより
-
ウィキデータが
重要な役割を果たす所です
-
では Linked Data Future Initiatives
諮問委員会による
-
アドバイスを共有したいと思います
-
少なくとも2つのアドバイスがあります
-
カナダ自体の舞台芸術の
ナレッジ グラフを埋めるため
-
カナダの方々には絶対的に重要です
-
スイスの舞台芸術のアーカイブと異なり
-
すでに存在しているデータベースから
始めるわけではなく
-
一から構築しなければならないからです
-
データをそこに取り込むことが
間違いなく重要です
-
2つ目に ご覧のように
ウィキデータはすでに役立っています
-
ウィキデータは
諮問委員会によると
-
ナレッジグラフArtsdata.caを
補完するものであり
-
舞台芸術関連のデータを増補するため
-
貢献の努力がなされるべき
とのことです
-
そこが私たちが今後
短中期的に取り組む箇所であり
-
そのためここで
その努力に協力してくれる人が
-
見つけられればと思います
-
現在 私たちは
互いに補完するものとみなしています
-
そこで両方の手法の
長所と短所を考える必要があります
-
こちらがウィキデータと従来の
リンクト オープン データとの比較です
-
皆さんの経験も交えて
喜んでお話ししたいと思います
-
ウィキデータには大きな長所があります
-
クラウドソースの
プラットフォームであり
-
関係者を招いて
協力してもらいやすいからです
-
短所は管理しにくいことです
-
データの所有者は
自身の図などの権利を手放すことになり
-
データ品質や完成度の管理を
-
自分の管理下にある場合と比べて
ウィキデータで追跡するのは困難です
-
ウィキデータのその他の長所は
-
世界規模の図への
瞬時での統合が要求されることです
-
つまり段階的に
他のデータベースと
-
調整していくことはできません
-
これも長所だと考えられます
-
もちろん統合や
相互運用性をお求めなら
-
ウィキデータでは初めからきちんと
その機能が備わっています
-
データ モデリング方法の統一は
-
両方のケースで課題となっています
-
ですが 最初は各自の部門で行うほうが
簡単に見えます
-
ある時点でその作業が済めば
-
ウィキペディアで
継続する作業になるからです
-
データ取り込みの
優先順位付けに関しては
-
現時点で次の規則に従っています
-
まず 本来誰に権限があるか
確かでない状態で
-
データを取り込むことです
-
こうすれば間違いなく
共有で管理されることになります
-
また クラウドソースの手法の
可能性が高いデータを取り込むこと
-
ウィキペディアで再利用される
可能性の高いデータを取り込むことです
-
また データモデリングと
標準化に関する
-
国際的な共同作業は
-
もし他の場所で行われていなければ
-
ウィキデータ上で
直接行われることが望ましいです
-
同じ場所でデータを取り込めば
交流が生まれるからです
-
次に ベースレジストリと典拠ファイルに
焦点を当てましょう
-
既存オントロジーの拡張として
-
異なるデータや
管理されていない語彙の間で
-
リンクしやすくなるからです
-
スライドがあと2枚だけあります
-
次のステップは
Wiki Loves Performing Artsに向け
-
すべてのGLAMの手法を
合わせることです
-
つまり会場や組織を
-
インフォボックスや
バブル テンプレートの形式で表し
-
ウィキペディアに
データを取り込もうとする試みです
-
もう1つ追求するプロジェクトは
COST Actionで
-
来年 提起する予定の
-
舞台芸術向けのリンクト オープン データ
エコシステムです
-
COSTはヨーロッパのプログラムで
-
ネットワーキング活動と
-
ここに取り上げ挙げられた
トピックをサポートしています
-
うち2つを抜粋してありますが
-
1つはウィキデータと
従来のリンクト オープン データ間での
-
フェデレーションに関する質問です
-
もう1つは
これも重要だと思いますが
-
大きな可能性を秘めている部分で
-
ウィキデータのデータを追加する
国際キャンペーンの実施です
-
以上です
ありがとうございました
-
では 私の同僚たちに
登壇いただきましょう
-
パネルへどうぞ
マイクも必要かもしれません
-
それから…
-
質問の機会を差し上げます
-
また 私の同僚たちにも
-
お互いに質問があるかお尋ねします
-
聴衆の皆さんからは
質問があるでしょうか
-
(聴衆1)[聞き取り不能]
-
お一人ずつに質問ですが
-
どこで線引きをして
-
どのように―
-
自分のウィキベースを
運用する必要がある場合や
-
ウィキデータへ取り込みたい内容を
規定するのでしょうか
-
順序良く取り込める背景には
明確な図表があるのでしょうか
-
マイクがあるので
まず私からお答えします
-
課題の1つは著名度です
-
別のプロジェクトで
それに取り組んでいます
-
ライセンス供与も課題の1つです
-
ご自分のデータベースでは
自分独自の規定を適用できますから
-
そうなると
どこでも可能だと思います
-
3つ目はサンドボックスとして
データを保持し
-
ウィキデータへ取り込むため
それを準備することです
-
以上が今考えられる
主要な3つですが
-
まだあると思います
-
私にとっては
著作権はいつも課題です
-
国立図書館が
ウィキベースに向けて移行したい場合
-
マオリ語の言葉での
これまでの業績のため
-
彼らがライセンス管理を
継続しなければなりません
-
カカポのデータベースには
-
保護局が公開できると考えた
データのみがありますが
-
その運用を見れば
-
非公開のウィキベースを使用して
-
独自データベースを
管理したくなるかもしれません
-
単に彼らが現在運用している
Excelスプレッドシート体系よりも
-
視覚化ツールの一部を
適用できたほうがいいからです
-
データの種類に依ると思います
-
出版物のアーカイブでは
もちろん幸運な立場で
-
資料は出版されたものや
-
当時 出版するには高額で
公開されたものですから
-
これは簡単です
-
プロジェクトは―
-
典型的なプロジェクトでは
-
ある期間 資金提供され
それが終了すると
-
データに起こることは
倉庫に格納されるか
-
永遠には運用されないソフトウェアに
格納されることになります
-
ですから私の観点からは
明らかで
-
当時はウィキデータはありませんでしたが
現在はあるので
-
ウィキデータのような
より大きなエコシステムへ
-
データを取り込む方法と照らし合わせ
-
早い段階で
持続可能性を議論することは
-
私たちのプロジェクトにとって
間違いなく合理的です
-
またデータコミュニティーと
話し合うのも意味があります
-
例えば ウィキデータへ追加するには
何が著名で合理的か
-
また所有権の形式を保つには
何が合理的か
-
洗練されたアプリケーションよりも
-
簡単な形式でも
視認性を高めたほうがいいとか
-
維持されない保管場所へ
多額の資金を提供する代わりに
-
大きなデータクラウドへ
リンクさせたほうがいいなどの議論です
-
先ほどここでプレゼンした
プロジェクトでもお伝えしたように
-
従来のリンクト オープン データ手法と
ウィキデータとでは二重性がありますので
-
非公開のウィキベース設定
という問題ではないのです
-
抱えていた課題の1つは
もちろんウィキデータで
-
自分自身のデータを取り込む際に
-
人々というか 他人の
ハウスキーピングを行う必要があります
-
それによって参加する人が
減るかもしれませんが
-
段階的に取り組んでいくということです
-
現時点では データベースは
-
従来のリンクト オープン データに
ありますが
-
私たちはそれをウィキデータと
リンクし始めており
-
これは継続的なプロセスで
-
最終的に大半のデータを
ウィキデータに収める領域と
-
その他のデータベースに残す領域とを
明らかにしていきます
-
明らかに同期に関しては
すでに課題であるように
-
今後も課題になります
-
リンクトデータの分野では
-
誰を信用できるか
-
誰が何の権限を持つかなど
協議が必要です
-
(司会者)他にご質問は?
-
(聴衆2)ありがとうございます
-
私が完全に同感できるのは
-
どこで境界線を引き
ウィキデータにデータを収めるかどうか
-
どのような理由や目的で
ローカルのデータベースに
-
データを保存し 作成や管理や維持を
行うかという課題です
-
これは大きな議論で
-
単にウィキデータへデータを
移行するという
-
流行りを超えたものだと思います
-
公開により人類に貢献でき
-
優れたツールがあるからです
-
現実の物事はもっと複雑だと思います
-
それにも関わらず
興味深い議論だと思います
-
また 別のパネルのイベントで
議論されている
-
別の問題もあります
-
1つの側面では
自身のデータベースを持ち
-
どのようなテクノロジーであれ
-
ウィキデータへ公開したり
-
またはウィキベースのテクノロジーで
情報を作成管理する
-
独自のシステムを開発したりすると
-
同期やフェデレーションなどは
-
使用するテクノロジーの問題です
-
実際は ウィキデータを
公開のためだけに使用しているか
-
ウィキデータの下にある
インフラを使用して
-
自分のデータの作成や
管理をしているかです
-
ウィキデータのパネルについて
議論があり
-
ここで別の議論も出てきますが
-
物事は別のレベルにあると思います
-
ウィキベースかウィキデータかという
議論に達するのは―
-
間違いだと思います
-
ウィキデータのインフラを
重視しすぎてしまいます
-
舞台芸術の領域のように
他にもインフラはあるからです
-
私たちには
別の補完コミュニティーもあり
-
MusicBrainzは
独自のプラットフォームを運用し
-
リンクト オープン データを提供しています
-
私が理解している限りでは
-
ウィキデータのコミュニティー内で
-
彼らのデータを
重複しないという同意があり
-
すべてのデータをコピーはしませんが
補完し合うものだと受け入れています
-
そこで ウィキペディアで
データを統合するとどうなるでしょう?
-
例えばインフォボックスです
-
彼らのSPARQLエンドポイントから
そのデータを直接引き出せるでしょうか?
-
またはすべてのデータを
コピーせざるを得ないのであれば
-
それにはどんなプロセスが
関与するのでしょうか?
-
(聴衆2)議論はまだ続いていると思います
-
このイベントの中では
-
関心を寄せるコミュニティーは
両方あるはずですから―
-
ウィキベースに関心がある人たちと
-
ウィキデータに関心がある人たち
-
そしてその両方に関心がある人たちです
-
ですが余儀なくウィキベースに
移行するわけではありません
-
そうとも限りません
-
MusicBrainzは
ウィキベース稼働ではありません
-
(聴衆2)別の問題があると
申し上げたかったのです
-
相関する場合もありますし
まったく関係ない場合もあります
-
もう1つ質問か意見があります
-
管理された語彙の
階層構造の管理についてです
-
例えば シソーラスや
Fintoです
-
場所があり
-
マオリ語での―
-
Subject Headingsがあり
-
階層構造での管理という概念に
対処しなければなりません
-
ご意見をお聞かせください―
-
ウィキデータで管理された
知識組織化体系を
-
管理する可能性については?
-
FintoとYSO placesの場合では
-
リポジトリは
-
最終的にいくつかのソースの
集まりになります
-
ですから ともかく流動的です
-
必ずしも必要ありません
-
私は国立図書館の代表ではないですが
-
その考えられるプロジェクトで
-
既存の構造を管理したり
対処したりする必要はないのです
-
その意味では
まだ探索がされるべき領域です
-
Maori Subject Headingsは
-
ウィキペディアの構造に対して
理想的に自身に役立っているようです
-
ですが ライセンス供与は
禁じられています
-
ライセンスが異なっていたら
-
ウィキデータへ
取り込まれていたでしょう
-
誰かが階層構造を好まずに
変更を始めると同時に
-
その構造を構築した人から
すぐに激しい抗議が来て
-
さまざまな異なるマオリから
-
最新の階層構造について
承認を得ることになります
-
それが解決しようとしている課題です
-
知識組織化体系という言葉は
-
すべて違います
-
ウィキデータで
異なる階層構造を表すことが
-
良い考えかは確かではありません
-
データの重ね合わせを
考えたほうがいいかもしれません
-
コンセプトレベルでの
マッピング作業については
-
例えば ZBWの共同事業として
経済学向けのシソーラスがあります
-
このシソーラスは
自身の階層構造を持っており
-
もちろん ウィキデータのコンセプトへ
-
ウィキデータの中に
代替構造を実際に保管せず
-
シソーラスの階層構造を
反映することは可能ですが
-
これは混乱を招きます
-
しかし ウィキデータを
コンセプトの貯蔵庫として考えるべきでしょう
-
外部にあるレイヤーとリンクでき
-
必ずしもウィキデータの中に
存在する必要がないものという
-
別の見方を与えてくれます
-
(司会者)他にご質問は?
-
なければ...どうぞ
-
(聴衆3)ユアヒム
最後の点を確認させてください
-
レイヤーは あなたのお考えでは
-
外部で管理され
-
誰かがどうにかして ウィキデータ側から
-
ウィキデータと統合されるものですか?
-
それとも管理方法について
すでにお考えがありましたか?
-
いいえ 考えてはいませんでした
-
ZBWとウィキデータで
いくつか試みはありましたが
-
ウィキデータで
[聞き取り不能]でした
-
これはまったく新しい
複雑な問題です
-
議論によりますし
-
そのようなことを行うには
管理を諦めなければなりません
-
ですが 明らかにされるべきです
-
もう1つ受けますか?
-
(聴衆4)質問は
カカポのプロジェクトについてです
-
はい
-
(聴衆4)こうした項目に
個々の動物を持つことについて
-
ウィキデータの
コミュニティーから反対はありましたか?
-
これまでのところないです
-
(聴衆4)以前この件を
聞いたことのある人は?
-
これまで反対がないのは
まだ誰も知らないからでは?
-
時に小さな議論がされています
-
ウィキデータで
こうしたことに関心がある方たちは皆
-
これを 有名な競走馬やネコに対する
個々のウィキデータ項目の付与を
-
自然に延長したものだと
見なしています
-
うまくモデル化されています
-
そこに種全体を収めるのは
大胆でしょうが
-
完全に管理できることだと思います
-
(聴衆4)ネコやイヌで
お試しにならないように
-
(笑)
-
(司会者)お時間が参りました
-
ご参加ありがとうございました
-
パネリストの皆さんが
休憩の間も質問をお受けします
-
お楽しみください
-
ありがとうございました
-
(拍手)