[ウィキベース インスピレーションパネル]
[ジェンス・オーリグ]
ウィルコメン、ビエンヴェニュー、ウェルカム
舞台でいつか言ってみたかったセリフです
(笑)
皆さんもインスピレーションを受けて下さい
ウィキデータコン2019の
オフィシャルなウィキベース
インスピレーション・パネルです
パネルの狙いは
各国の人々がさまざまな分野で
ウィキデータの裏にあるソフトウェアである
ウィキベースをどう使ってるか
聞いてインスパイアされることです
今日 こんなことを言われて驚きました
「ウィキベースのこと
今日初めて聞きました」
そう ウィキデータを走らせている
ソフトウェアなんです
世界のモノを
ウィキデータのやり方で整理する際に
既に掲載されている項目に異論がある場合ー
それは もっと詳しい記述が必要とか
「Q1」はウィキデータ上は「宇宙」だけど
あなたの小宇宙が図書館の場合
「Q1」は本の題名かも知れません
あるいは生物学の分野であれば
何らかの動物のことだったり
デジタル・ヒューマニティーズでは
歴史上の人物の指すのかも知れません
それでも 同じシステムに従って
整理したいのであれば
ウィキベースはあなたに
ぴったりのものです
ここ1-2年で
各領域のパイオニアである一流の人々に
ウィキベースを評価してもらいました
素晴らしい成果が上がっています
このパネルは
慌ただしいものになります
このパネルの参加者は皆
1時間ずつプレゼンをするだけの
成果をお持ちですが
プログラムが詰まっていますので
シートベルトを装着して
ウィキベースの世界にインスパイアされる
旅をお楽しみ下さい
まず最初は 2つの団体によるもので
既に注目されているプロジェクトです
2団体とはフランスの国立図書館である
Bibliothèque nationale de France
そして高等教育機関であるアベスです
詳しい内容はプレゼンをお聞き下さい
アニーラ・アンジェリさんと
ベンジャミン・ボーベアさんに
最初の10分間の
インスピレーションを頂きましょう
(拍手)
こんにちは
私がベンジャミン・ボーベアです
アベスで働いてます
アベス (Abes) とは
高等教育書誌センターの略称です
フランス全土の大学図書館と協力して
総合目録を管理してあげてます
また典拠管理もしています
こちらはフランス国立図書館のBnFの
アニーラ・アンジェリさんです
我々の共同プロジェクトについてご説明します
人物、法人、概念などの
典拠データのための
新しいプロダクション・ツール構築です
過去数ヶ月間
ウィキベースに作業してもらいました
手短に経緯をご説明します
我々図書館にとってはー
近年のテクノロジー進捗により
リンクされたオープンデータに
移行が進んでおりー
我々は書誌機関として
その新しい潮流に乗る必要がありました
リンクされたオープンデータは
RDF、SPARQLなどで
昔から実験はして来ました
でも今が前進の好機と考えました
書誌データについての考え方も
根本的に変わっているので
良いタイミングなのです
昔からーそして今でも
図書館では
MARCレコードというもので
データを保存しています
MARCと呼ばれる特別な規格です
でも最近
違う考え方が現れました
記録に基づく世界から
人 企業 その他のエンティティと
相互接続した
エンティティ・ベースの世界への移行です
このような経緯により
共同プロジェクトを立ち上げました
でも 我々の目標は図書館だけに止まりません
フランスの他のGLAM(美術館 図書館
アーカイブ 博物館)にも
参加してもらいたいです
このプロジェクトは彼らにも
役立つと考えていますので
プロジェクト名は
Fichier National d'Entités (FNE)
「国立エントリー・ファイル」です
エンティティに関する参考データを
共同で作成し管理するための
共通プラットフォームです
先ほど述べた通り
人、法人、場所、概念
創作物のエンティティです
新しいことに取り組んでます
BnFとアベスが
ここまで密接にコラボするのは
初めてのことですから
難題もあります
現状をご紹介します
最初の状態から現在の状況です
2017年から協働しています
類似した企画を比較検証した結果
ウィキベースを
FNEのバックボーンとすることに
強い関心強い関心があるという
結論に昨年至りました
基礎とするべき
良いソリューションと考えていましたが
現在も迷いがあります
何故ならば
特定のニーズを満たす必要があるからです
そこで まずは立ち上げて
BnFの典拠目録と
我々の典拠目録の実際のデータに基づき
今年は概念実証を構築することにしました
そしてウィキベースにこのデータを統合し
データの挙動を確認し
ツールが我々のニーズに
合致するか検証するのです
この概念実証で
手助けをしてくれたのが
Invertaire.ioのマキシムとヴァンサンで
ウィキベースがどのよう役立つか
理解するのを助けてくれました
アニーラが検証結果についてお話します
ウィキベースをFNEの
技術的なインフラ・バックボーン
あるいは基本レイヤーとするという
実験を進めるという決断は
システム移行という面でも大変なことで
ウィキベースを
我々のデータの技術的インフラとして
利用するということ自体も
旧来のシステム情報
または図書館情報システムから
移行することを意味していました
そこで 最初は実験をしてみました
我々の実務的な環境において
日常の業務に必要な機能について
確認をしました
ここではデータの作成と
管理を指しており
出版は全く異なる業務なので除外しています
先ほどの講演では
ウィキデータ・コモンズがGLAMに
戦略提供していることが紹介されていました
それは出版が範疇で
創造過程そのものを対象としていました
我々は一歩ずつ進む必要があるので
概念実証から取り組むことにしました
嬉しいことに
特定のオントロジーに従い
書誌データをインジェストするには
重大な障害はありませんでした
我々はデータを2種類のMARCにし
[聞き取り不能]なプロパティを定義しました
それにより
データ統合で実験ができ
技術的観点から重大な問題は
発生しませんでした
確認できたことは
ウィキベースの付随機能が
FNEの技術的インフラの基礎として
利用でるということです
しかし 決断はまだ下されていません
何故ならが実験はまだー
開発は完了してるものの
現在最終結論を執筆している段階で
戦略的な観点からは決断は下されていませんが
現時点でお話できる検証結果は以上です
我々にとってウィキベースは
この企画を管理するのに最適な
実務的ソリューションかも知れません
共同でコラボレーションしながら
エンティティというモノを構築するという
プロジェクトですから
それに対抗するものは念のため
モノと文字列です
でもギャップがあることに気がついたのです
我々の機関における特定のニーズにおいて
それぞれのカルチャーや伝統が
特定のコミュニティに存在しており
図書館毎にも特別なプロセスがあります
ウィキベースが提供するソリューションー
例えば検索は
プロフェッショナルの見地からはー
エンドユーザーではなく
プロの観点からは
データ品質とキュレーションを担保するため
インデックスが必要です
プロにとり大切なことなのですが
ウィキベースの
Elasticsearchや
CirrusSearchでは可能ではないのです
まだ検証の余地はありますけどね
役割はどのように
マネージされるのでしょうか?
官僚とかパトロールとか
私たちの世界とは違うものがあります
使えるレイヤーは確かにあります
我々のデータ管理方法と
もっと適合した役割を
その上に構築することは可能です
あるいは異なる制約条件ー
データ出版とかデータ…
スライドに間違いがありますね
データポリシーに関しても同様です
ウィキベース上に構築しなければならない
他のレイヤーやレンガがある訳です
そしてもちろん
本日ここで皆さんの前にいる一番の目的は
我々と同じ問題意識を持つコミュニティに
参加する意思があり
必要があると考えているからです
今回の講演内容から
図書館やGLAM関連の
参加者が多いことも分かってますから
あと数週間 または来年には
今の状況からどう進むかという決断につき
もっと公に発表することができると思います
有難うございました
有難うございました
(拍手)
それぞれの短いプレゼンの後
全員に舞台に戻って頂き
時間があれば質疑応答をしましょう
今のはフランスからでしたが
次のプロジェクトは
フィッシー・ナショナル・デンテ…
ではなく…
Gemeinsame Normdatei (GND)ー
ドイツ語圏の
統合典拠ファイルです
ウィキメディア活動の
良い友人たちです
バーバラ・フィッシャーさんと
サラ・ハートマンさんです
私たちのプロジェクト
「GNDミーツ・ウィキベース」について
話をする機会を有難うございます
これはウィキメディア・ドイツと
GNDの共同プロジェクトです
簡単に概要をご説明します
ジェンスが言ったように
10分しかありませんので
なぜウィキベースを評価し
コラボレーションの観点から
典拠データを管理する際の要件を
満たすと判断したかご説明します
我々の組織の由来は何で
典拠管理とは何でしょうか
GDNはドイツ語で
「統合典拠ファイル」の頭文字ですが
どういう概念でしょうか
まず組織の由来については
先ほどのアニーラとベンの説明と
余り違いはありません
GNDはリソースの表現に利用されます
例えば出版物やモノに関してです
正確なデータ再取得ができるように
GNDは明瞭且つ明確な
エンティティを提供します
皆さんもご存知のように
エンティティの識別とリファレンス用の
永続的識別子もあります
典拠ファイルは
ドイツ語圏では
主に図書館で利用されていますが
文化遺産関係の領域でも
幾つかの機関が
典拠ファイルを利用しています
全部で6千万件ほどのレコードがあり
ウィキベースでは「項目」ですが
人名 法人 それから
地域名や作品名が網羅されています
GNDはいわゆるGNDエージェンシーにより
共同組合として運営されており
現在千ほどの機関が
GNDをアクティブに活用していますー
恒常的にレコードや項目を新規に作成したり
追加したりしているということです
我々の観点から最も大切なことは
GNDデータは
CC0条件のもとで
無料提供されているという点です
APIとドキュメンテーションも
すべて公開されています
オープンと言えばー
重要なポイントですが
現在我々はGNDを
他のGLAM機関 そして
科学関係の機関に公開するよう求めています
現時点ではGNDは
図書館セクターに集中していますので
それは 司書にとって便利なツールを
他の領域で受け入れられ利用されている
ツールに進化させる必要があるということです
それは 組織に関する仕事や
コミュニティ構築
現在のデータモデルに関する議論
そしてインフラや技術的な問題に
取り組む必要があることを意味します
インフラ問題と言えば
ウィキベースと
いわば共犯者になろうと考えた訳です
文化的なデータへのアクセスを改善し
お互いにオペレーション可能にするという
類似した目標を持っていますから
ソフトウェアは
ウィキデータという唯一のアプリケーションの
ために元々は開発されたものでしたが
それが典拠データの管理に使えるものかどうか
評価をしました
私からもこんにちは
ウィキメディア・ドイツと一緒に
プロジェクトの評価に取り組んでます
まず第一に
ウィキベースが
GLAMー
美術館 図書館 アーカイブ 博物館の
要求水準を満たし
典拠ファイルを共同で運営できるか
というのが基本的質問です
また ウィキベースが利便性を高めて
くれることに期待しています
現在我々が使用している
ソフトウェアシステムは
かなり複雑なソフトウェアで
利便性は余り良くありませんから
次に知りたいことは
ウィキベースが
データのリンキングを簡単にし
コミュニティの多様性を
拡大してくれるかということです
サラが先ほど述べた通り
我々は今GNDを
幅広いGLAM機関や科学機関に
開放しようとしているところです
もちろん 彼らもそれぞれの
ソフトウェア構造の中で運営されているので
ウィキベースが彼らと我々の
協働とコラボレーションを
簡単にしてくれるか注目しています
なぜ そうするのでしょうか?
それは 我々がウィキベースが
魅力的なコミュニティ・ゾーンかも
知れないと考えているからです
手元のメモが必要ですがー
第一に オープンソースだから
GLAM機関が目録作成に利用している
独自作成のソフトウェアシステムより
アクセスしやすいだろという点です
次に ウィキベース・コミュニティは今や
とても熱心なメンバーに支えられており
我々もその熱心なコミュニティに
参加したいということです
「共有することは思いやり」
と信じていますから
我々の知識を皆さんのものとして共有し
結合した上で重複を削除するため
同一の情報を繰り返し編集するのではなく
データを再利用し リンクし
引用し 深みを与えたいのです
この図では
ウィキデータで広く使われているツールである
ヒストロペディアを紹介しています
それは 我々のデータをウィキベースに
導入できるのであれば
ツールもシェアして
コードも改良することにより
コミュニティに
活発に貢献できるメンバーになりたいのです
有難うございます
のちほど議論しましょう
有難うございました
(拍手)
有難うございます
我々は自問しますねー
「偶然図書館ソフト作っちゃった?」って
図書館の分野でウィキベース採用が
急増していますから
それだけではありません
もちろん 偶然図書館システムを
作ったということではなく
他の分野でも使われています
例えば 生物学です
デービッド・フィシュミューラが
ウィキベースを
生物多様性のプラットフォームとして
活用することを説明してくれます
フルスクリーンになった?
オッケー
皆さん こんにちは
私はデービッドで
ベルリン=ダーレム植物園で働いています
コンピュータ・サイエンティストです
生物多様性インフォマティクスという
専門部署があります
生物学者が日々の仕事で使う
ソフトウェアを開発しているのです
プライベートでは
15年近くウィキペディアに協力しており
そしてウィキデータに貢献し始めて
もうすぐ5年です
また 仕事の一環として
メディアウィキ・ファームの共同運営者であり
生物学コミュニティに関し
80以上のウィキを運営しています
2年ほど前に
標準作りのプロジェクトに参加しました
ABCDという標準で
改善が必要でした
皆さんはABCDなんて
聞いたことがないでしょうが
別に悪いことじゃありません
非常に特殊な分野なんです
「生物学的データ収集へのアクセス」
の頭文字をとっており
XMLスキーマです
生物学情報を表現できます
植物標本や
アルコール保存された魚の
コレクション等の特殊情報以外に
観察記録もあります
科学者が自然界で見つけた
特定の植物や
動物に関する情報です
多種多様な情報があるため
結構詳しい標準となっています
1,800ものコンセプトが含まれています
ファイルに含まれる種々のXPathの数です
難問だったのは
これを新しいセマンティックな標準である
OWLオントロジーに変換する作業でした
OWLであれば
従来のXMLファイルで表現できていた
情報を同じように表現しつつ
既存のドキュメンテーションや
制約 そして項目間の繋がりを保ち
コラボレーション可能な
プラットフォーム構築が可能です
そこで 他の科学者が
自分の専門分野について
我々にアドバイスしてくれる
ことができるようになります
このモデルは正しいですか?
何か忘れてないですか?
これらのことを前提に
我々がいろいろ探した結果
みつけてたソリューションは
皆さん誰も驚かないでしょうが
ウィキベースでしたー
じゃなきゃここで講演してませんよね
ウィキベースを使うことにしました
ドッカーイメージなしで
インストールを始めました
大きな間違いでした
絶対避けた方がいいです
(笑)
言い訳になりますが
我々は2年半前からプロジェクトを始めており
2年前のウィキデータコンで
ドッカ―イメージがリリースされたんです
だから自分たちで
やり方を考えなければなりませんでした
立ち上げが完了して稼働していたから
変更したりして壊したくなかったんです
クエリ―サービスに
ドッカ―はインストールしてあります
それから カスタムインストレーションと
ドッカ―インストレーションが
奇妙なハイブリッド構成になってて
モディファイされたスクリプトが
両インスタンスを接続しています
QuickStatementsを
またしてもマニュアルでインストールしました
その頃はまだクエリサービスの
一部ではありませんでしたから
微妙な修正と調整をして
作動するようになりました
今ではドッカ―イメージの
一部であることは知ってますが
既に稼働していましたので
変更するのは避けた訳です
この点は覚えておいて下さい
次に詳細を説明する前に
混乱を回避したいと思います
データ標準のことを話している訳で
物事をセマンティックに表現する際に
コンセプトをXMLからクラスとプロパティに
変換します
これが異なるクラスを繋ぐ
オブジェクト・プロパティで
これがコンテンツを格納している
データタイプ・プロパティです
テキストや数字等を格納してます
そして ウィキベース内で
これらをすべて表現しますが
これらは皆ウィキベース内の項目です
そして ウィキベースの
プロパティで表現されます
ここで ABCDプロパティは項目が
ウィキベースプロパティとして
表現されています
プロパティに対応する前置詞を
明言するよう心掛けるようにします
そうすれば 私がどのプロパティについて
話しているかわかりますから
ではプロパティー
特にウィキベースプロパティについて
見てみましょう
我々はまず
「モデルしたいコンセプトを
表現するには何が必要?」と考えました
そして label description aliasはもちろん
全部で25くらいのプロパティを使用しました
すべては口にしませんが
とにかく多種多様のものを採用しました
要件を満たすものを使った訳です
制約を表現するものもありますが
他のものは
大体オプショナルなものが多く
必須なものはほんの一握りです
次に この情報をすべてインポートしました
異なるコンセプトすべてを抽出する
スキーマ・パーサーを書きました
XMLスキーマ内でXPathがあるものすべて
そして XMLスキーマの一部である
ドキュメンテーションすべてを
CSVファイルに入れて
QuickStatementsを使いインポートしました
結構うまく行きました
でも先ほど述べた通り
ウィキベースインスタンス内に
1,800以上のコンセプトがあります
でもスキーマ内で
人名や連絡先Eメール等
複数回現れるものがあります
データセットのオーナー名と
イメージ撮影者名が重複してたりします
当然ながら 重複分は削減し
再利用可能なクラスへと統合する
必要がありました
たくさんのマニュアルな編集により
コンセプト数を減らし
結局 500ちょっとになりました
クラス、オブジェクト・プロパティ、
データタイプ・プロパティがあり
幾つかすっ飛ばしてます
ややこしくなりますから
スケールが大きい編集には
やはりQuickStatementsを使いました
こうして編集がすべて終わったら
データの整合性を確認します
そこでMaintenance Queryと呼ぶものを
使いました
SPARQLクエリも含む
クエリ・インターフェースを使って
漏れているプロパティや
コンセプト間の誤ったリンクー
すなわち我々のコンセプトと
構造にマッチしないものをチェックしました
最後に すべてのコンセプトの
マニュアル・レビューをしました
ミスがないか念のため確認した訳です
結構な作業量でした
項目毎に5分かかるとして
550倍すれば
1週間以上の集中作業になります
もちろん5分じゃない場合もあります
モデリングで問題がある場合等
項目の修正に30分かかることもあります
これでデータがすべて完了しました
次はデータを
ウィキベースから抽出する段階です
クエリサービスを使う
エキスポートスクリプトをPythonで書き
コンセプトの情報を取得し
事前に準備したテンプレートに入力しました
ちゃんとした整合性のある
OWLファイルで手に入りました
必要なものがすべて含まれています
これが標準の実際のベーシスです
将来のバージョンで改訂版を作成する場合
ウィキベースが我々の
稼働プラットフォームです
エキスポートが完了すれば
これが標準の新バージョンです
これらを分けておくことにより
サーバーを異なるインスタンスに
移動するこが可能になります
または先ほど述べた通り
インストレーションを変えることができます
ウェブサイトのドキュメンテーションには
JSONをエキスポートします
そして2つ目のウィキベースインスタンスへも
データをエキスポートします
まだ初期の実験段階なので
コンセプトが実際のデータを表現できる
プロダクション段階では利用していません
ウィキベースの項目であるプロパティから
分解しステップダウンして
実際のウィキベースプロパティに
変換しているのです
すべてのデータを保持し
リンクの整合性を保つため
かなりのステップを要しますが
うまく機能はしています
結論としては成功でした
生物多様性情報標準についての
巨大なコミュニティがあり
つい先日年次総会を開催してましたが
他の標準においても
このアプローチを再利用することに
多いに関心があるようです
今後については
Shape Expressionsを試そうと考えています
さきほどの通り エキスポートには
幾つか制約があるので
新バージョンでは
ワークフローが改善できればと思ってます
まだ着手できてませんが
それからドッカ―インスタンスの
スイッチアップです
最後に 私の小さなウィッシュリストです
改善できれば良いことです
ウィキデータのために書かれているツールで
もっと汎用性が高ければと思うものがあります
特にQuickStatements
さきほど述べた通り
マニュアルで結構調整しました
問題の多くは解消したはずですが
すべてではないと思います
それから 既存のテンプレートや
SPARQLテンプレート
QそしてPテンプレートも
インポートしたいです
ウィキベースで作業する時にとても便利です
しかも自動的にできればいいです
マニュアル編集をたくさんしましたから
便利なツールとしては
エクセルのテーブルで
幾つかの項目とプロパティをロードして
セルからセルにジャンプして
半ば自動的にたくさんのものを
素早く編集できると便利です
これで終わりです
有難うございました
(拍手)
話題は尽きません
画面をどうやって戻すかな
科学だけではなく
図書館だけではありません
ウィキベースで芸術と美を
作ることもできます
そのことを説明してくれる最適任者が
スチュアート・プライアーさんです
恥ずかしいことなんですが
芸術と美について話すのに
とても醜いプレゼンなんです
(笑)
ウィキメディア人で一杯の部屋ですが
列車ー人は列車好きですね
目的はあります
これがロンドン北東の
ハックニーダウンズ駅です
これはウィキベースと
Banner Repeaterの話です
詳細は後で説明します
これはひどい写真ですが
アーチスト達の出版アーカイブなんです
駅のプラットフォームにあるんです
中には さまざまなタイプの
アーチストの出版物が
数百編納められています
来訪者は多いです
一般大衆に向けて
いろいろ発信しています
列車に乗ると
車内に風変わりなアートが
たくさん飾ってあります
とても面白いプロジェクトであり
より広いコミュニティの一部でもあります
アーティストの出版物ー
美術書って何でしょう?
私も知りませんでした
ウィキペディアの定義では
「書籍の中でも美術を主題とする書籍の総称」
とあります
読んでみて下さい
個々の美術作品の場合もあれば
出版物というメディアを使った
作品集の場合もあります
いろいろな種類があり面白いです
1920年代初期から1930年代にかけて
かなり流行して
60年代から70年代にかけて
再びブームがありました
今でも拡大を続けています
グローバルなコミュニティで
多言語で
大きな美術機関とは
やや離れた存在です
コレクションはあります
V&A博物館は当然
コレクションを保有しています
この類の美術書はいろいろ所蔵しています
これは記事だけなので
あまり綺麗に写ってませんが
とても興味深いが
若干ニッチな分野でしょう
でもウィキデータでは
あまり良くありません
こちらも ひどい写真です
私が撮ったんじゃありませんが
Banner Repeaterのアーカイブが写ってます
真ん中のピンク色の「Blast」は
かなり有名な美術書で
1920年代のものです
ウィキデータではどうでしょう?
ウィキデータでは良くありません
本やその他の出版物と
混同してしまうことが多いようです
著名な美術書に関する
平均的なウィキデータ項目は
大したことが書いてありません
こんな感じです
識別番号もあまりありません
このように
美術書に関しては
いろいろ不備があると言えるでしょう
特に もっと伝統的な芸術形態ー
絵画や彫刻等と比べたらそうです
これを具体的に体系化しようという
強い意思がコミュニティにはあります
何が可能か例をお見せします
このクエリで何がおかしいか
探してみて下さい
これだけなんです
ウィキデータの美術書は
どれもこんな感じです
スカスカです
ラベルすらないものもあります
絶対に拡張が必要です
拡張の余地が十分あります
このクエリの間違いを
見つけた方はいますか?
ラベルですー「ソーセージ」となってます
誰かのクエリを盗んだため
キー番号が変わっちゃいました
(笑)
ソーセージに関するクエリになってます
次に行きましょう
存在感がほとんどないわけです
Banner Repeaterから
アプローチを受けました
私はウィキメディアUKで働いていますが
Banner Repeaterが助けて欲しいと
言って来たんです
ウィキベース設定に際して
追加資金の調達の支援に加え
幅広いコミュニティを取り込み
プロセスに参画して欲しい
ということでした
プロセスとは基本的に
アーチストとアーキビスト
そしてデータリンクの専門家の
コミュニティーを集結し
美術書のスキーマとデータモデルが
どうあるべきかについて
考えてもらいます
非常に特殊な分野ですから
ウィキデータにぴったりとは
マッピングできません
細かすぎるのでしょう
そのフレキシブルな性質も
ウィキデータには合わないのかも知れません
ウィキデータはまだ硬直的すぎるでしょう
ウィキベースは構築中で
まだ完成しておらず
お見せできることはあまりないので
プロセスをお見せします
それはさまざまな種類の
広範囲なコミュニティへの
コンサルテーションです
一つのコンサルテーションだけで
終らせません
数人で決定するのではありません
何度も繰り返し継続するものです
この影響はかなり大きいでしょう
誰もこんな試みはしていませんから
大規模な機関の多くでは
美術書が奥の部屋に
置きっ放しになっています
どう分類すれば良いか分からないのです
上手く分類できていないのです
あまり関心もありません
でも関心がある
巨大なコミュニティがあるんです
これが現時点でのプロセスになります
最初のワークショップはやりました
エキスパートによるワークショップで
美術書の分野に造詣のある人々ー
アクティビストやアートを所蔵する人々が
基本的な優先事項のようなものを決めて
どのようなものが存在するか調べました
既存のステータスはウィキデータであり
それを如何に拡張し改善できるか検討しました
その結果をドキュメンテーションし
基本的構造を確立しました
次のプロセスでは
より広範なコミュニティの参加を
呼びかけます
それは データ人間だけでなく
クリエーターも含みます
解説文もたくさんありますし
属性情報も豊富です
いずれもウィキデータには
居場所がないものです
アーキビストや
データリンクの専門家と
協働することにより
すべてを統合して
アクセスが容易なフロントエンドを持つ
リソースを構築します
そしてデータセットの持ち主でもあり
貢献もしてくれる人々である
コミュニティも構築します
現時点の状況をお見せします
まだ変わる可能性がありますが
エキスパートと構築したものは
こんな感じになってます
いろいろなP値が開発されており
ウィキデータで対応するものが見えます
明らかに現時点のウィキデータよりも
かなり詳細な情報があります
相当詳しいですー
高さ 幅 厚み等の属性は
ウィキデータ上の
美術書の他のグループにも
あまり存在していません
他にも「依頼主」「貢献先」等の
データもあります
多くの美術書は複数の貢献者と
複数の版がありますから
この作業を通じて
多くの詳細情報が得られます
解説文もたくさんあります
時間と共にいろいろ変遷し
人々の解釈も変わって来ますから
これが作られたわけです
多くのものがウィキデータで
対応するものがありますが
まだないものもあります
こちらは何でしょう
他の版やその他情報です
かなり専門的で
まだ初期段階です
次のプロセスでは
人々が削除したり追加したりします
この柔軟性が大切なんです
あたかも古い標準から移行し
最新の標準のもとで
コミュニティが本当にものを改変でき
命令されてでなくー
もっと早く話しますね
次は 現在の権力の力学と
「なぜウィキベースか?」です
これが現在のアートの世界です
巨大なオレンジ色のものですが
大規模な機関がある一方で
幾つかのグループが
美術書を出版してます
デリーやメキシコシティ
ロンドン等に存在しています
我々が避けたいのは
大規模な機関やエキスパートが
オントロジーや物事のやり方を
支配してしまうような状況です
アーチストのコニュニティ内で
ウィキベースを作ることにより
彼ら自身で何をするか決め
大規模な機関に対抗して
より柔軟なデータモデルや
より最新のツールを使い
草の根的な組織により
大規模機関主導でない
活動を支援したいと考えています
このアプローチには
大きな価値があると思います
それは並列のインフラ創造ですー
ウィキメディアのような
コンテンツの持ち主たちによる
コミュニティのためのインフラを
大手機関に展開してゆくもので
逆の流れではありません
次のスライドは?
一番ひどいスライドなので
いつも入れるようにしてます
ステレオタイプです
次は コミュニティへの
コンサルテーションのステージです
もっと幅広く面白いものになるでしょう
このデータベースはもちろん
ウィキデータと会話をします
でもどのような内容になるか
まだ完全には分かってません
もしかすると
ウィキデータが引用できる
美術書に関する特定のインスタンスになるか
またはその逆かも知れません
最後のこの写真をまたお見せします
気に入ってるんです
以上です
有難うございました
有難うございました
(拍手)
この急行列車も
もうすぐ終点です
一番良いプレゼンを
最後まで取っておいたと言いましょうか?
というより
最後のプレゼンは
デジタル・ヒューマニティの分野での
ウィキベースの利用に関する
真のパイオニアの
オラフ・シモンズによるものです
スライドはなく
ライブアクションをされるとか
その通り
私はウィキペディアに
2004年以来関わってますので
15年をクリアしてます
何をお見せするかというと
お褒めに預かったこともありますが
我々が作ったウィキベースの
インスタンスをお見せします
ドッカーイメージじゃありません
ドッカーイメージを単独インストールするのは
最良のアプローチではありません
難しいです
我々も大変苦労しました
ウィキメディア・ドイツが相互契約に基づき
完成させるのを助けてくれて感謝してます
幾つかのプロジェクトがあります
ウィキデータよりもプロジェクト中心です
私のプロジェクトも
そこにあります
それを開いてー
ご覧の通りです
イルミナティの歴史ー
これから始めましょう
短編の動画で
ポール・オリヴィエ・デヘイェの作品です
私は彼をTwitterで知ってました
彼は私たちに
ウィキベースを手に入れた
体験はどうだったかと聞いてきたんです
彼自身もウィキベースを試していました
そこで できることや
できないことについて説明しました
この動画は是非作ってみたいものでした
彼は言いました
「簡単だよ
SPARQL検索で情報を入手して
プログラムに入れれば
見ることができるよ」と
イルミナティについての
20年間の研究成果で
組織全体の簡単な歴史と
通信内容の全記録です
ウィキメディアのツールじゃありません
ウィキベースのツールでもありません
でも可能だったんです
実際 既にツールになってないことが
気に入ってます
ツールになるべきと思います
我々のデータが本当に無料だから
気に入ってます
誰でもデータをダウンロードできて
それで作業もできるのです
予想外のことでした
しかも2時間以内に可能ですー
もし彼みたいに頭が良ければ
彼はこれを作ってくれました
プレゼンに戻ります
なぜウィキベースか?
ウィキメディアにアプローチした際の
最初の質問でした
2010年以来ウィキデータは知っていて
2017年には我々も使おうとしていました
ウィキメディアの人たちも関心があり
「取り組むならばサポートします」
と言ってくれました
なぜ自分たちのベースを?
やらねばならない独自研究だったんです
インストレーション全体が
研究ツールだったんです
我々がしたことを
展示するためだけでなく
実際 自分の研究のために
毎日使っています
ドキュメントの日付を変えて
その結果見た目がどう変わるか確認します
仮説検証もたくさんやります
データを持っているプロジェクトに
データをくれるよう頼み
データを注入し
再びラベルを貼り
データセットに項目を付けて
「これは以下のプロジェクトにより
生産されました」と説明します
次のプロジェクトが継続してくれる時に
あるプロジェクトからのデータセットだと
マーカーが既に付いていれば
例えばプロジェクトで
DFG(ドイツ研究振興協会)が
ファンディングしたものがあれば
その成果を示したいことでしょう
SPARQL検索をして
データセット全体のグループを
自分の完成作品として
レジュメに掲載することができます
我々は独自研究をし
研究を特定し
仮説検証を促進します
機能しているツールで
実際 最初から始めるのが有益ですー
最後に何か見せるのではなく
初日から作業をして
質問に対する正解を考え抜き
ウィキベースに入れて
人物を正しく特定したり
今まで日付が特定できなかったことについて
正しい日付が判明するまで
情報を実証することができます
作業をしながら成果を累積し
ウィキベースを
最終結果に近づくための
ツールとして使うのです
最初のミーティングは2017年
12月1日に開かれました
その時 私はあなたに
一つの問いかけをしました
ある人物の死亡日でした
ソースを探していたのですが
非常に難しかったのです
彼はソースをまず作成した後に
接続する必要があったからです
部屋の中で私たちは
やるとしたら
ウィキベースの既存インストレーション内の
ソースでやろうと
はっきりとしたイメージを持っていました
その中にソースがあればー
すなわち
初期に出版された近代美術書があれば
理想的だと考えました
それがあるのであれば
GNDもそこに必要でした
GNDの人たちがソフトウェアを
テストする予定だと聞いた時
アプローチし こう言いました
「共同でやりませんか?
あなた方のデータが必要です
とにかくデータが欲しいんです
ウィキベース上でどうなるか分かります」
これが今の我々の状況です
現在も どうすれば良いか
我々も分からないことー
少なくとも私が分からないことが一杯あります
インプット方法
文字列リソースから
項目ベースのリソースに移行する方法等々
要するに 私のプレゼンは
皆さんへのお誘いなんです
ジョインして下さい
我々はまだウィキベース・コミュニティの
一員ではありません
まだ存在しませんから
ウィキデータコミュニティはあります
ウィキデータでは
いろいろなことが起きていますが
ウィキデータでないことについて
ウィキベースで質問しても
難しいです
まず 我々と一緒にやるのは楽しいです
ウィキデータからCC0で
いつでもデータが掴めますから
あなたの作業の孵化装置として活用し
ウィキデータにドラッグすれば良いのです
GNDが入った時点で
ビッグデータで作業できることになり
これも大変楽しみです
チャレンジが好きならば
我々のプラットフォームで挑戦して下さい
面白いコミュニティも提供します
他と異なることと言えば
はっきりとした名前のアカウントと
機関があるということです
それはウィキデータではできないことが
できることも意味しています
我々のサイトで系譜学が研究できます
気にしません
そういうデータを人が入手することも
面白いでしょう
あなたの都市の検索ー
歴史研究等を
我々のプラットフォームでしても結構です
我々のプラットフォームでは
研究を続けてもらえます
いろいろやることがあります
データベース運営で難題が山積してます
ウィキメディアが立ち上げくれましたが
今や 上手く行ってないことが
たくさんあります
我々で直すことはできません
データベースの運営や
データベースの更新について
助けてもらうのは難しいです
ウィキデータの外でインスタンスを
走らせるとすぐに
細かい技術的な問題が発生するんです
直接GNDリンクを入手することも難しいです
ウィキデータでは上手く行くのに
我々のインスタンスでは駄目です
Wikimedia Commonsから画像を
我々のウィキベースに移すのも
苦労しています
細かいトラブルがたくさん残ってます
お誘いです
マス・インプットに参加される場合は
是非お願いします
とにかく来て下さい
技術的なことで助けて頂ければ
大歓迎です
それから ツールも必要です
最初にお見せしたようなツールは
入手するのはさほど難しくありません
可視化のために必要なクエリもわかってます
いったん手に入れば
簡単の変更できるはずです
これらのツールは
デジタル・ヒューマニティの
プロジェクトのコミュニティにとり
とても貴重なものです
この類のツールを作ってるのは
小さな企業で
繰り返し利用させることにより儲けています
できれば そのツールを市場から無料で
ウィキベースインスタンスと
ワークするものを入手したいのです
ツール開発に興味があったら
アプローチして下さい
歴史家が欲しがっている可視化ツールに関し
何が必要かも含め
アイディアはたっぷりあります
このようにやることは
たくさん残ってます
あと1分ですか
その1分、いりません
プレッシャーかけてますね
(聴衆)聴衆に時間を下さい
1分を聴衆に差し上げます
有難うございました
お座り下さい
他の皆さんも舞台にお戻り下さい
質問を受けましょう
募集で終わったのは良かったですね
これも募集ですから
ご質問をどうぞ
明日のウィキベースのミートアップ
にもご参加下さい
あなたの所属団体や
あなたの趣味のため
それとも世界を変えるための
凄いウィキベース・インストレーションの
アイディアがあれば
是非ミートアップに参加して下さい
椅子が混乱してますね
立ってやりましょう
ここのマイクがもう一つあります
(聴衆)質問用のマイク持ってます
講演者の方々有難うございました
ウィキベース・ミートアップで会いましょう
パネルへの質問を是非どうぞ
最初はだれですか?
(聴衆)稲妻セッションで
地球科学についてプレゼンする予定です
地球科学では 何年もの期間ー
場合によっては何十年もの間
コミュニティで収集されシェアされた
多くのデータリポジトリがあります
データセットがキュレートされ
スキーマが継続的に進化し
コミュニティから多くの
フィードバックを得ています
彼らが望んでるのはただ
コミュニティを組織化して
レポジトリを拡大させることです
だから コンテンツをすべて
ウィキデータにのせて
コントロールを失いたくないのです
このコンテンツのキュレーションに
甚大な貢献をしてくれています
パネリストの皆さんが述べられた
要件やニーズは
私のコミュニティでも同様に
あることを指摘したかったんです
私からの質問は次のようなものです
スキーマや標準を混合したり維持しつつ
継続的にコミュニティにフィードバックさせ
ウィキデータが持つクラウドソーシング精神を
促進するにはどうすれば良いのでしょうか?
誰が答えても良さそうですが
デービッドからどうですか?
私が適任かどうか分かりません
何故なら 我々のユースケースでは
データモデリングの観点からは
実際の作業はほんの数人が担当しているんです
関連セグメントでは
エキスパートにコンタクトして
彼らに助けてもらうこともありますが
現在のイテレーションでは
私と同僚2名で作業しました
エキスパートを招聘するという
オプションはキープしつつも
それは いつも我々と密接な
コラボレーションを通じたもので
クラウドソーシングの問題について
悩む必要は実際ないんです
ウィキメディアのコミュニティの一員として
心配ないと言えます
編集の95%は良い編集で
改善かそれ以上の効果をもたらします
閉鎖されたインスタンスに遭遇した場合
アカウントを本当の名前で提供しますが
それを超えようとする愚か者はいないような
追加のハードルです
我々のインスタンスでは ページにー
私にではなくページに
アドレス提供を求められます
これは通常大手機関がすること
あるいは個人が
「個人としてこの研究が気に入った
自分の分野だからアドレスあげる」
と言ってやることです
これはウィキデータを
破壊しようという輩を
追い払う良い方法です
システムを閉鎖的にすること可能ですが
流れのあるコミュニティの一員では
なくなります
ただしCC0に行けば
オープンにすることが可能で
インキュベータとなり
そこで人々が研究をして
コミュニティにその成果が拡散します
これは招待ですー
閉鎖された作業を利用して
一緒に作業をしたい人とは
インスタンスを利用するんです
私だけの意見ではないでしょう
さまざまな見解があり
すべての意見を集約して
「ウィキデータは全世界が入るべき
ソリューションだ」ということはできません
ウィキデータはソリューションではないと
言うつもりはありませんが
いろいろな意見があり
いろいろなニーズがあるんです
世界には本当に各種各様のニーズや
プロフェッショナルな意見があり
唯一のデータベースに集約することは
無理なんです
両方ともー
一番難しいのは
両方の大きなグループのニーズや意見を
いかに調和させ
両者が会話できる切り口を
見つけるかということです
もっと質問があれば
是非お願いします
どなたか?
皆さんが質問を考えている間 私からー
それが私たちがウィキベースを
検討している理由の一つなんです
ウィキデータ内のように
権利と役割がある中で
ウィキベースインスタンス内で
情報を足したり編集することは
ウィキデータ内の情報を
より簡単に簡便に
シェアする機会を与えてくれているからです
我々の典拠ファイルと
ウィキデータの間に
橋を渡そうとするより
よっぽど簡単です
(聴衆)お話を伺い
あなた方がコミュニティを活性化させ
彼らが自分たちでデータモデリングできる
方法を探したり
それをウィキベースにも入れらると聞いて
とても面白いと思いました
スチュアート・プライアさんの
コミュニティについてー
あるいは他の方々についてもー
コミュニティとして
ウィキデータに回帰すると決断された
アプローチを推進するためこう言いますか?
「美術書はやった
幾つかのイテレーションを完遂した
これがとても上手く行った
これが使うべきプロパティだ
これがウィキデータのデータモデルに
加えるべき修正だ」と
いい質問ですが答えは短く
興味深い質問です
他のタイプでもワークする
モデルかどうかは分かりません
ワークすれば良いですが
もしあなたの質問が
ウィキデータコミュニティが
勝手に違う作業を自分でやってしまう
別のコミュニティの権威を受容するかという
ものであれば難しい質問です
でも それが人々が
必ずしもウィキデータ上でやらなくても
このプロセスにフィードバックできる
方法であることを私は望んでます
「掴みなさい」と言いたいです
便利なら掴んで
他のインスタンスで使えるか
試してご覧なさい
もし それが特定の検索をするために
役立つプロパティだと思えば
採用されるでしょう
流れが良いでしょうから
当局がこれをやるとは思いません
(聴衆)ウィキデータユーザーの観点から
あなた方がやってることの素晴らしい点は
作動するコードを確立したことです
人々が見ることができ
実装し作動できるデータモデルを確立しました
オープンソース社会においては
コード公開が原則ですが
それができたのです
データモデリング用に折りたためる
枝があるというのは
とても良いことだと考えます
有難うございます
的を射ていると思います
「活性化」という動詞も良かったです
まさにそれを目指しています
スタートレックの「転送!」と
同じ言葉ですね
これでこのパネルは終了です
もっとウィキベースプロジェクトに関する
質問があれば、話して下さい
- 明日も来て下さい
- 議論しましょう
それがこのコンファレンスの狙いです
有難うございました
(拍手)