-
[ウィキベース インスピレーションパネル]
-
[ジェンス・オーリグ]
-
ウィルコメン、ビエンヴェニュー、ウェルカム
-
舞台でいつか言ってみたかったセリフです
-
(笑)
-
皆さんもインスピレーションを受けて下さい
-
ウィキデータコン2019の
-
オフィシャルなウィキベース
インスピレーション・パネルです
-
パネルの狙いは
各国の人々がさまざまな分野で
-
ウィキデータの裏にあるソフトウェアである
ウィキベースをどう使ってるか
-
聞いてインスパイアされることです
-
今日 こんなことを言われて驚きました
-
「ウィキベースのこと
今日初めて聞きました」
-
そう ウィキデータを走らせている
ソフトウェアなんです
-
世界のモノを
-
ウィキデータのやり方で整理する際に
-
既に掲載されている項目に異論がある場合ー
-
それは もっと詳しい記述が必要とか
-
「Q1」はウィキデータ上は「宇宙」だけど
-
あなたの小宇宙が図書館の場合
「Q1」は本の題名かも知れません
-
あるいは生物学の分野であれば
何らかの動物のことだったり
-
デジタル・ヒューマニティーズでは
歴史上の人物の指すのかも知れません
-
それでも 同じシステムに従って
整理したいのであれば
-
ウィキベースはあなたに
ぴったりのものです
-
ここ1-2年で
-
各領域のパイオニアである一流の人々に
-
ウィキベースを評価してもらいました
-
素晴らしい成果が上がっています
-
このパネルは
慌ただしいものになります
-
このパネルの参加者は皆
-
1時間ずつプレゼンをするだけの
成果をお持ちですが
-
プログラムが詰まっていますので
-
シートベルトを装着して
-
ウィキベースの世界にインスパイアされる
旅をお楽しみ下さい
-
まず最初は 2つの団体によるもので
-
既に注目されているプロジェクトです
-
2団体とはフランスの国立図書館である
Bibliothèque nationale de France
-
そして高等教育機関であるアベスです
-
詳しい内容はプレゼンをお聞き下さい
-
アニーラ・アンジェリさんと
ベンジャミン・ボーベアさんに
-
最初の10分間の
インスピレーションを頂きましょう
-
(拍手)
-
こんにちは
-
私がベンジャミン・ボーベアです
-
アベスで働いてます
-
アベス (Abes) とは
-
高等教育書誌センターの略称です
-
フランス全土の大学図書館と協力して
-
総合目録を管理してあげてます
-
また典拠管理もしています
-
こちらはフランス国立図書館のBnFの
-
アニーラ・アンジェリさんです
-
我々の共同プロジェクトについてご説明します
-
人物、法人、概念などの
-
典拠データのための
-
新しいプロダクション・ツール構築です
-
過去数ヶ月間
-
ウィキベースに作業してもらいました
-
手短に経緯をご説明します
-
我々図書館にとってはー
-
近年のテクノロジー進捗により
-
リンクされたオープンデータに
移行が進んでおりー
-
我々は書誌機関として
-
その新しい潮流に乗る必要がありました
-
リンクされたオープンデータは
-
RDF、SPARQLなどで
-
昔から実験はして来ました
-
でも今が前進の好機と考えました
-
書誌データについての考え方も
-
根本的に変わっているので
-
良いタイミングなのです
-
昔からーそして今でも
-
図書館では
-
MARCレコードというもので
データを保存しています
-
MARCと呼ばれる特別な規格です
-
でも最近
-
違う考え方が現れました
-
記録に基づく世界から
-
人 企業 その他のエンティティと
相互接続した
-
エンティティ・ベースの世界への移行です
-
このような経緯により
共同プロジェクトを立ち上げました
-
でも 我々の目標は図書館だけに止まりません
-
フランスの他のGLAM(美術館 図書館
アーカイブ 博物館)にも
-
参加してもらいたいです
-
このプロジェクトは彼らにも
役立つと考えていますので
-
プロジェクト名は
Fichier National d'Entités (FNE)
-
「国立エントリー・ファイル」です
-
エンティティに関する参考データを
-
共同で作成し管理するための
共通プラットフォームです
-
先ほど述べた通り
人、法人、場所、概念
-
創作物のエンティティです
-
新しいことに取り組んでます
-
BnFとアベスが
ここまで密接にコラボするのは
-
初めてのことですから
難題もあります
-
現状をご紹介します
-
最初の状態から現在の状況です
-
2017年から協働しています
-
類似した企画を比較検証した結果
-
ウィキベースを
FNEのバックボーンとすることに
-
強い関心強い関心があるという
結論に昨年至りました
-
基礎とするべき
良いソリューションと考えていましたが
-
現在も迷いがあります
-
何故ならば
特定のニーズを満たす必要があるからです
-
そこで まずは立ち上げて
-
BnFの典拠目録と
我々の典拠目録の実際のデータに基づき
-
今年は概念実証を構築することにしました
-
そしてウィキベースにこのデータを統合し
-
データの挙動を確認し
-
ツールが我々のニーズに
合致するか検証するのです
-
この概念実証で
手助けをしてくれたのが
-
Invertaire.ioのマキシムとヴァンサンで
-
ウィキベースがどのよう役立つか
-
理解するのを助けてくれました
-
アニーラが検証結果についてお話します
-
ウィキベースをFNEの
-
技術的なインフラ・バックボーン
-
あるいは基本レイヤーとするという
-
実験を進めるという決断は
-
システム移行という面でも大変なことで
-
ウィキベースを
我々のデータの技術的インフラとして
-
利用するということ自体も
-
旧来のシステム情報
-
または図書館情報システムから
-
移行することを意味していました
-
そこで 最初は実験をしてみました
-
我々の実務的な環境において
-
日常の業務に必要な機能について
-
確認をしました
-
ここではデータの作成と
管理を指しており
-
出版は全く異なる業務なので除外しています
-
先ほどの講演では
-
ウィキデータ・コモンズがGLAMに
-
戦略提供していることが紹介されていました
-
それは出版が範疇で
創造過程そのものを対象としていました
-
我々は一歩ずつ進む必要があるので
-
概念実証から取り組むことにしました
-
嬉しいことに
特定のオントロジーに従い
-
書誌データをインジェストするには
重大な障害はありませんでした
-
我々はデータを2種類のMARCにし
-
[聞き取り不能]なプロパティを定義しました
-
それにより
データ統合で実験ができ
-
技術的観点から重大な問題は
発生しませんでした
-
確認できたことは
-
ウィキベースの付随機能が
-
FNEの技術的インフラの基礎として
利用でるということです
-
しかし 決断はまだ下されていません
-
何故ならが実験はまだー
-
開発は完了してるものの
-
現在最終結論を執筆している段階で
-
戦略的な観点からは決断は下されていませんが
-
現時点でお話できる検証結果は以上です
-
我々にとってウィキベースは
-
この企画を管理するのに最適な
実務的ソリューションかも知れません
-
共同でコラボレーションしながら
-
エンティティというモノを構築するという
プロジェクトですから
-
それに対抗するものは念のため
モノと文字列です
-
でもギャップがあることに気がついたのです
-
我々の機関における特定のニーズにおいて
-
それぞれのカルチャーや伝統が
特定のコミュニティに存在しており
-
図書館毎にも特別なプロセスがあります
-
ウィキベースが提供するソリューションー
例えば検索は
-
プロフェッショナルの見地からはー
-
エンドユーザーではなく
-
プロの観点からは
-
データ品質とキュレーションを担保するため
インデックスが必要です
-
プロにとり大切なことなのですが
-
ウィキベースの
Elasticsearchや
-
CirrusSearchでは可能ではないのです
-
まだ検証の余地はありますけどね
-
役割はどのように
マネージされるのでしょうか?
-
官僚とかパトロールとか
-
私たちの世界とは違うものがあります
-
使えるレイヤーは確かにあります
-
我々のデータ管理方法と
-
もっと適合した役割を
その上に構築することは可能です
-
あるいは異なる制約条件ー
データ出版とかデータ…
-
スライドに間違いがありますね
-
データポリシーに関しても同様です
-
ウィキベース上に構築しなければならない
-
他のレイヤーやレンガがある訳です
-
そしてもちろん
-
本日ここで皆さんの前にいる一番の目的は
-
我々と同じ問題意識を持つコミュニティに
-
参加する意思があり
必要があると考えているからです
-
今回の講演内容から
-
図書館やGLAM関連の
-
参加者が多いことも分かってますから
-
あと数週間 または来年には
-
今の状況からどう進むかという決断につき
-
もっと公に発表することができると思います
-
有難うございました
-
有難うございました
-
(拍手)
-
それぞれの短いプレゼンの後
-
全員に舞台に戻って頂き
-
時間があれば質疑応答をしましょう
-
今のはフランスからでしたが
-
次のプロジェクトは
-
フィッシー・ナショナル・デンテ…
ではなく…
-
Gemeinsame Normdatei (GND)ー
-
ドイツ語圏の
-
統合典拠ファイルです
-
ウィキメディア活動の
良い友人たちです
-
バーバラ・フィッシャーさんと
サラ・ハートマンさんです
-
私たちのプロジェクト
-
「GNDミーツ・ウィキベース」について
話をする機会を有難うございます
-
これはウィキメディア・ドイツと
-
GNDの共同プロジェクトです
-
簡単に概要をご説明します
-
ジェンスが言ったように
10分しかありませんので
-
なぜウィキベースを評価し
-
コラボレーションの観点から
-
典拠データを管理する際の要件を
満たすと判断したかご説明します
-
我々の組織の由来は何で
典拠管理とは何でしょうか
-
GDNはドイツ語で
「統合典拠ファイル」の頭文字ですが
-
どういう概念でしょうか
-
まず組織の由来については
-
先ほどのアニーラとベンの説明と
-
余り違いはありません
-
GNDはリソースの表現に利用されます
-
例えば出版物やモノに関してです
-
正確なデータ再取得ができるように
-
GNDは明瞭且つ明確な
エンティティを提供します
-
皆さんもご存知のように
-
エンティティの識別とリファレンス用の
永続的識別子もあります
-
典拠ファイルは
-
ドイツ語圏では
主に図書館で利用されていますが
-
文化遺産関係の領域でも
-
幾つかの機関が
典拠ファイルを利用しています
-
全部で6千万件ほどのレコードがあり
-
ウィキベースでは「項目」ですが
-
人名 法人 それから
地域名や作品名が網羅されています
-
GNDはいわゆるGNDエージェンシーにより
共同組合として運営されており
-
現在千ほどの機関が
-
GNDをアクティブに活用していますー
-
恒常的にレコードや項目を新規に作成したり
追加したりしているということです
-
我々の観点から最も大切なことは
-
GNDデータは
CC0条件のもとで
-
無料提供されているという点です
-
APIとドキュメンテーションも
すべて公開されています
-
オープンと言えばー
-
重要なポイントですが
-
現在我々はGNDを
-
他のGLAM機関 そして
科学関係の機関に公開するよう求めています
-
現時点ではGNDは
図書館セクターに集中していますので
-
それは 司書にとって便利なツールを
-
他の領域で受け入れられ利用されている
ツールに進化させる必要があるということです
-
それは 組織に関する仕事や
-
コミュニティ構築
現在のデータモデルに関する議論
-
そしてインフラや技術的な問題に
取り組む必要があることを意味します
-
インフラ問題と言えば
-
ウィキベースと
いわば共犯者になろうと考えた訳です
-
文化的なデータへのアクセスを改善し
お互いにオペレーション可能にするという
-
類似した目標を持っていますから
-
ソフトウェアは
-
ウィキデータという唯一のアプリケーションの
ために元々は開発されたものでしたが
-
それが典拠データの管理に使えるものかどうか
評価をしました
-
私からもこんにちは
-
ウィキメディア・ドイツと一緒に
-
プロジェクトの評価に取り組んでます
-
まず第一に
ウィキベースが
-
GLAMー
美術館 図書館 アーカイブ 博物館の
-
要求水準を満たし
典拠ファイルを共同で運営できるか
-
というのが基本的質問です
-
また ウィキベースが利便性を高めて
くれることに期待しています
-
現在我々が使用している
ソフトウェアシステムは
-
かなり複雑なソフトウェアで
-
利便性は余り良くありませんから
-
次に知りたいことは
-
ウィキベースが
データのリンキングを簡単にし
-
コミュニティの多様性を
拡大してくれるかということです
-
サラが先ほど述べた通り
我々は今GNDを
-
幅広いGLAM機関や科学機関に
-
開放しようとしているところです
-
もちろん 彼らもそれぞれの
ソフトウェア構造の中で運営されているので
-
ウィキベースが彼らと我々の
-
協働とコラボレーションを
簡単にしてくれるか注目しています
-
なぜ そうするのでしょうか?
-
それは 我々がウィキベースが
-
魅力的なコミュニティ・ゾーンかも
知れないと考えているからです
-
手元のメモが必要ですがー
-
第一に オープンソースだから
-
GLAM機関が目録作成に利用している
-
独自作成のソフトウェアシステムより
アクセスしやすいだろという点です
-
次に ウィキベース・コミュニティは今や
-
とても熱心なメンバーに支えられており
-
我々もその熱心なコミュニティに
参加したいということです
-
「共有することは思いやり」
と信じていますから
-
我々の知識を皆さんのものとして共有し
-
結合した上で重複を削除するため
-
同一の情報を繰り返し編集するのではなく
-
データを再利用し リンクし
-
引用し 深みを与えたいのです
-
この図では
-
ウィキデータで広く使われているツールである
ヒストロペディアを紹介しています
-
それは 我々のデータをウィキベースに
導入できるのであれば
-
ツールもシェアして
コードも改良することにより
-
コミュニティに
活発に貢献できるメンバーになりたいのです
-
有難うございます
-
のちほど議論しましょう
-
有難うございました
-
(拍手)
-
有難うございます
-
我々は自問しますねー
-
「偶然図書館ソフト作っちゃった?」って
-
図書館の分野でウィキベース採用が
急増していますから
-
それだけではありません
-
もちろん 偶然図書館システムを
作ったということではなく
-
他の分野でも使われています
-
例えば 生物学です
-
デービッド・フィシュミューラが
ウィキベースを
-
生物多様性のプラットフォームとして
活用することを説明してくれます
-
フルスクリーンになった?
オッケー
-
皆さん こんにちは
-
私はデービッドで
ベルリン=ダーレム植物園で働いています
-
コンピュータ・サイエンティストです
-
生物多様性インフォマティクスという
専門部署があります
-
生物学者が日々の仕事で使う
-
ソフトウェアを開発しているのです
-
プライベートでは
-
15年近くウィキペディアに協力しており
-
そしてウィキデータに貢献し始めて
もうすぐ5年です
-
また 仕事の一環として
-
メディアウィキ・ファームの共同運営者であり
-
生物学コミュニティに関し
80以上のウィキを運営しています
-
2年ほど前に
-
標準作りのプロジェクトに参加しました
-
ABCDという標準で
-
改善が必要でした
-
皆さんはABCDなんて
聞いたことがないでしょうが
-
別に悪いことじゃありません
-
非常に特殊な分野なんです
-
「生物学的データ収集へのアクセス」
の頭文字をとっており
-
XMLスキーマです
-
生物学情報を表現できます
-
植物標本や
-
アルコール保存された魚の
コレクション等の特殊情報以外に
-
観察記録もあります
-
科学者が自然界で見つけた
特定の植物や
-
動物に関する情報です
-
多種多様な情報があるため
-
結構詳しい標準となっています
-
1,800ものコンセプトが含まれています
-
ファイルに含まれる種々のXPathの数です
-
難問だったのは
-
これを新しいセマンティックな標準である
-
OWLオントロジーに変換する作業でした
-
OWLであれば
従来のXMLファイルで表現できていた
-
情報を同じように表現しつつ
-
既存のドキュメンテーションや
-
制約 そして項目間の繋がりを保ち
-
コラボレーション可能な
プラットフォーム構築が可能です
-
そこで 他の科学者が
自分の専門分野について
-
我々にアドバイスしてくれる
ことができるようになります
-
このモデルは正しいですか?
-
何か忘れてないですか?
-
これらのことを前提に
我々がいろいろ探した結果
-
みつけてたソリューションは
皆さん誰も驚かないでしょうが
-
ウィキベースでしたー
じゃなきゃここで講演してませんよね
-
ウィキベースを使うことにしました
-
ドッカーイメージなしで
インストールを始めました
-
大きな間違いでした
絶対避けた方がいいです
-
(笑)
-
言い訳になりますが
我々は2年半前からプロジェクトを始めており
-
2年前のウィキデータコンで
-
ドッカ―イメージがリリースされたんです
-
だから自分たちで
やり方を考えなければなりませんでした
-
立ち上げが完了して稼働していたから
-
変更したりして壊したくなかったんです
-
クエリ―サービスに
ドッカ―はインストールしてあります
-
それから カスタムインストレーションと
-
ドッカ―インストレーションが
奇妙なハイブリッド構成になってて
-
モディファイされたスクリプトが
両インスタンスを接続しています
-
QuickStatementsを
またしてもマニュアルでインストールしました
-
その頃はまだクエリサービスの
一部ではありませんでしたから
-
微妙な修正と調整をして
作動するようになりました
-
今ではドッカ―イメージの
一部であることは知ってますが
-
既に稼働していましたので
変更するのは避けた訳です
-
この点は覚えておいて下さい
-
次に詳細を説明する前に
-
混乱を回避したいと思います
-
データ標準のことを話している訳で
-
物事をセマンティックに表現する際に
-
コンセプトをXMLからクラスとプロパティに
変換します
-
これが異なるクラスを繋ぐ
オブジェクト・プロパティで
-
これがコンテンツを格納している
データタイプ・プロパティです
-
テキストや数字等を格納してます
-
そして ウィキベース内で
これらをすべて表現しますが
-
これらは皆ウィキベース内の項目です
-
そして ウィキベースの
プロパティで表現されます
-
ここで ABCDプロパティは項目が
-
ウィキベースプロパティとして
表現されています
-
プロパティに対応する前置詞を
明言するよう心掛けるようにします
-
そうすれば 私がどのプロパティについて
話しているかわかりますから
-
ではプロパティー
-
特にウィキベースプロパティについて
見てみましょう
-
我々はまず
「モデルしたいコンセプトを
-
表現するには何が必要?」と考えました
-
そして label description aliasはもちろん
-
全部で25くらいのプロパティを使用しました
-
すべては口にしませんが
-
とにかく多種多様のものを採用しました
-
要件を満たすものを使った訳です
-
制約を表現するものもありますが
-
他のものは
-
大体オプショナルなものが多く
-
必須なものはほんの一握りです
-
次に この情報をすべてインポートしました
-
異なるコンセプトすべてを抽出する
スキーマ・パーサーを書きました
-
XMLスキーマ内でXPathがあるものすべて
-
そして XMLスキーマの一部である
ドキュメンテーションすべてを
-
CSVファイルに入れて
-
QuickStatementsを使いインポートしました
-
結構うまく行きました
-
でも先ほど述べた通り
-
ウィキベースインスタンス内に
1,800以上のコンセプトがあります
-
でもスキーマ内で
-
人名や連絡先Eメール等
-
複数回現れるものがあります
-
データセットのオーナー名と
イメージ撮影者名が重複してたりします
-
当然ながら 重複分は削減し
-
再利用可能なクラスへと統合する
必要がありました
-
たくさんのマニュアルな編集により
-
コンセプト数を減らし
-
結局 500ちょっとになりました
-
クラス、オブジェクト・プロパティ、
データタイプ・プロパティがあり
-
幾つかすっ飛ばしてます
-
ややこしくなりますから
-
スケールが大きい編集には
やはりQuickStatementsを使いました
-
こうして編集がすべて終わったら
-
データの整合性を確認します
-
そこでMaintenance Queryと呼ぶものを
使いました
-
SPARQLクエリも含む
クエリ・インターフェースを使って
-
漏れているプロパティや
-
コンセプト間の誤ったリンクー
-
すなわち我々のコンセプトと
構造にマッチしないものをチェックしました
-
最後に すべてのコンセプトの
-
マニュアル・レビューをしました
-
ミスがないか念のため確認した訳です
-
結構な作業量でした
-
項目毎に5分かかるとして
-
550倍すれば
-
1週間以上の集中作業になります
-
もちろん5分じゃない場合もあります
-
モデリングで問題がある場合等
-
項目の修正に30分かかることもあります
-
これでデータがすべて完了しました
-
次はデータを
ウィキベースから抽出する段階です
-
クエリサービスを使う
エキスポートスクリプトをPythonで書き
-
コンセプトの情報を取得し
-
事前に準備したテンプレートに入力しました
-
ちゃんとした整合性のある
OWLファイルで手に入りました
-
必要なものがすべて含まれています
-
これが標準の実際のベーシスです
-
将来のバージョンで改訂版を作成する場合
-
ウィキベースが我々の
稼働プラットフォームです
-
エキスポートが完了すれば
これが標準の新バージョンです
-
これらを分けておくことにより
-
サーバーを異なるインスタンスに
移動するこが可能になります
-
または先ほど述べた通り
インストレーションを変えることができます
-
ウェブサイトのドキュメンテーションには
JSONをエキスポートします
-
そして2つ目のウィキベースインスタンスへも
データをエキスポートします
-
まだ初期の実験段階なので
-
コンセプトが実際のデータを表現できる
-
プロダクション段階では利用していません
-
ウィキベースの項目であるプロパティから
-
分解しステップダウンして
-
実際のウィキベースプロパティに
変換しているのです
-
すべてのデータを保持し
-
リンクの整合性を保つため
かなりのステップを要しますが
-
うまく機能はしています
-
結論としては成功でした
-
生物多様性情報標準についての
-
巨大なコミュニティがあり
-
つい先日年次総会を開催してましたが
-
他の標準においても
このアプローチを再利用することに
-
多いに関心があるようです
-
今後については
-
Shape Expressionsを試そうと考えています
-
さきほどの通り エキスポートには
幾つか制約があるので
-
新バージョンでは
ワークフローが改善できればと思ってます
-
まだ着手できてませんが
-
それからドッカ―インスタンスの
スイッチアップです
-
最後に 私の小さなウィッシュリストです
-
改善できれば良いことです
-
ウィキデータのために書かれているツールで
-
もっと汎用性が高ければと思うものがあります
-
特にQuickStatements
-
さきほど述べた通り
マニュアルで結構調整しました
-
問題の多くは解消したはずですが
-
すべてではないと思います
-
それから 既存のテンプレートや
SPARQLテンプレート
-
QそしてPテンプレートも
インポートしたいです
-
ウィキベースで作業する時にとても便利です
-
しかも自動的にできればいいです
-
マニュアル編集をたくさんしましたから
-
便利なツールとしては
-
エクセルのテーブルで
-
幾つかの項目とプロパティをロードして
-
セルからセルにジャンプして
-
半ば自動的にたくさんのものを
-
素早く編集できると便利です
-
これで終わりです
-
有難うございました
-
(拍手)
-
話題は尽きません
-
画面をどうやって戻すかな
-
科学だけではなく
図書館だけではありません
-
ウィキベースで芸術と美を
作ることもできます
-
そのことを説明してくれる最適任者が
スチュアート・プライアーさんです
-
恥ずかしいことなんですが
芸術と美について話すのに
-
とても醜いプレゼンなんです
-
(笑)
-
ウィキメディア人で一杯の部屋ですが
-
列車ー人は列車好きですね
-
目的はあります
-
これがロンドン北東の
ハックニーダウンズ駅です
-
これはウィキベースと
Banner Repeaterの話です
-
詳細は後で説明します
-
これはひどい写真ですが
-
アーチスト達の出版アーカイブなんです
-
駅のプラットフォームにあるんです
-
中には さまざまなタイプの
アーチストの出版物が
-
数百編納められています
-
来訪者は多いです
-
一般大衆に向けて
いろいろ発信しています
-
列車に乗ると
-
車内に風変わりなアートが
たくさん飾ってあります
-
とても面白いプロジェクトであり
-
より広いコミュニティの一部でもあります
-
アーティストの出版物ー
美術書って何でしょう?
-
私も知りませんでした
-
ウィキペディアの定義では
-
「書籍の中でも美術を主題とする書籍の総称」
-
とあります
読んでみて下さい
-
個々の美術作品の場合もあれば
-
出版物というメディアを使った
作品集の場合もあります
-
いろいろな種類があり面白いです
-
1920年代初期から1930年代にかけて
かなり流行して
-
60年代から70年代にかけて
再びブームがありました
-
今でも拡大を続けています
-
グローバルなコミュニティで
多言語で
-
大きな美術機関とは
やや離れた存在です
-
コレクションはあります
-
V&A博物館は当然
コレクションを保有しています
-
この類の美術書はいろいろ所蔵しています
-
これは記事だけなので
あまり綺麗に写ってませんが
-
とても興味深いが
若干ニッチな分野でしょう
-
でもウィキデータでは
あまり良くありません
-
こちらも ひどい写真です
私が撮ったんじゃありませんが
-
Banner Repeaterのアーカイブが写ってます
-
真ん中のピンク色の「Blast」は
-
かなり有名な美術書で
-
1920年代のものです
-
ウィキデータではどうでしょう?
-
ウィキデータでは良くありません
-
本やその他の出版物と
-
混同してしまうことが多いようです
-
著名な美術書に関する
-
平均的なウィキデータ項目は
-
大したことが書いてありません
-
こんな感じです
-
識別番号もあまりありません
-
このように
美術書に関しては
-
いろいろ不備があると言えるでしょう
-
特に もっと伝統的な芸術形態ー
-
絵画や彫刻等と比べたらそうです
-
これを具体的に体系化しようという
-
強い意思がコミュニティにはあります
-
何が可能か例をお見せします
-
このクエリで何がおかしいか
探してみて下さい
-
これだけなんです
-
ウィキデータの美術書は
どれもこんな感じです
-
スカスカです
-
ラベルすらないものもあります
-
絶対に拡張が必要です
-
拡張の余地が十分あります
-
このクエリの間違いを
見つけた方はいますか?
-
ラベルですー「ソーセージ」となってます
-
誰かのクエリを盗んだため
-
キー番号が変わっちゃいました
-
(笑)
-
ソーセージに関するクエリになってます
-
次に行きましょう
-
存在感がほとんどないわけです
-
Banner Repeaterから
アプローチを受けました
-
私はウィキメディアUKで働いていますが
-
Banner Repeaterが助けて欲しいと
言って来たんです
-
ウィキベース設定に際して
-
追加資金の調達の支援に加え
-
幅広いコミュニティを取り込み
-
プロセスに参画して欲しい
ということでした
-
プロセスとは基本的に
アーチストとアーキビスト
-
そしてデータリンクの専門家の
コミュニティーを集結し
-
美術書のスキーマとデータモデルが
どうあるべきかについて
-
考えてもらいます
-
非常に特殊な分野ですから
-
ウィキデータにぴったりとは
マッピングできません
-
細かすぎるのでしょう
-
そのフレキシブルな性質も
-
ウィキデータには合わないのかも知れません
-
ウィキデータはまだ硬直的すぎるでしょう
-
ウィキベースは構築中で
まだ完成しておらず
-
お見せできることはあまりないので
-
プロセスをお見せします
-
それはさまざまな種類の
-
広範囲なコミュニティへの
コンサルテーションです
-
一つのコンサルテーションだけで
終らせません
-
数人で決定するのではありません
-
何度も繰り返し継続するものです
-
この影響はかなり大きいでしょう
-
誰もこんな試みはしていませんから
-
大規模な機関の多くでは
美術書が奥の部屋に
-
置きっ放しになっています
-
どう分類すれば良いか分からないのです
-
上手く分類できていないのです
-
あまり関心もありません
-
でも関心がある
巨大なコミュニティがあるんです
-
これが現時点でのプロセスになります
-
最初のワークショップはやりました
-
エキスパートによるワークショップで
-
美術書の分野に造詣のある人々ー
-
アクティビストやアートを所蔵する人々が
-
基本的な優先事項のようなものを決めて
-
どのようなものが存在するか調べました
-
既存のステータスはウィキデータであり
-
それを如何に拡張し改善できるか検討しました
-
その結果をドキュメンテーションし
-
基本的構造を確立しました
-
次のプロセスでは
-
より広範なコミュニティの参加を
呼びかけます
-
それは データ人間だけでなく
クリエーターも含みます
-
解説文もたくさんありますし
-
属性情報も豊富です
-
いずれもウィキデータには
居場所がないものです
-
アーキビストや
-
データリンクの専門家と
協働することにより
-
すべてを統合して
-
アクセスが容易なフロントエンドを持つ
リソースを構築します
-
そしてデータセットの持ち主でもあり
貢献もしてくれる人々である
-
コミュニティも構築します
-
現時点の状況をお見せします
-
まだ変わる可能性がありますが
-
エキスパートと構築したものは
-
こんな感じになってます
-
いろいろなP値が開発されており
-
ウィキデータで対応するものが見えます
-
明らかに現時点のウィキデータよりも
-
かなり詳細な情報があります
-
相当詳しいですー
-
高さ 幅 厚み等の属性は
-
ウィキデータ上の
美術書の他のグループにも
-
あまり存在していません
-
他にも「依頼主」「貢献先」等の
データもあります
-
多くの美術書は複数の貢献者と
-
複数の版がありますから
-
この作業を通じて
-
多くの詳細情報が得られます
-
解説文もたくさんあります
-
時間と共にいろいろ変遷し
-
人々の解釈も変わって来ますから
-
これが作られたわけです
-
多くのものがウィキデータで
対応するものがありますが
-
まだないものもあります
-
こちらは何でしょう
-
他の版やその他情報です
-
かなり専門的で
-
まだ初期段階です
-
次のプロセスでは
-
人々が削除したり追加したりします
-
この柔軟性が大切なんです
-
あたかも古い標準から移行し
-
最新の標準のもとで
-
コミュニティが本当にものを改変でき
-
命令されてでなくー
もっと早く話しますね
-
次は 現在の権力の力学と
「なぜウィキベースか?」です
-
これが現在のアートの世界です
-
巨大なオレンジ色のものですが
-
大規模な機関がある一方で
-
幾つかのグループが
美術書を出版してます
-
デリーやメキシコシティ
ロンドン等に存在しています
-
我々が避けたいのは
-
大規模な機関やエキスパートが
-
オントロジーや物事のやり方を
支配してしまうような状況です
-
アーチストのコニュニティ内で
ウィキベースを作ることにより
-
彼ら自身で何をするか決め
-
大規模な機関に対抗して
-
より柔軟なデータモデルや
-
より最新のツールを使い
-
草の根的な組織により
-
大規模機関主導でない
活動を支援したいと考えています
-
このアプローチには
大きな価値があると思います
-
それは並列のインフラ創造ですー
-
ウィキメディアのような
-
コンテンツの持ち主たちによる
コミュニティのためのインフラを
-
大手機関に展開してゆくもので
-
逆の流れではありません
-
次のスライドは?
-
一番ひどいスライドなので
いつも入れるようにしてます
-
ステレオタイプです
-
次は コミュニティへの
コンサルテーションのステージです
-
もっと幅広く面白いものになるでしょう
-
このデータベースはもちろん
ウィキデータと会話をします
-
でもどのような内容になるか
まだ完全には分かってません
-
もしかすると
-
ウィキデータが引用できる
美術書に関する特定のインスタンスになるか
-
またはその逆かも知れません
-
最後のこの写真をまたお見せします
-
気に入ってるんです
-
以上です
有難うございました
-
有難うございました
(拍手)
-
この急行列車も
もうすぐ終点です
-
一番良いプレゼンを
最後まで取っておいたと言いましょうか?
-
というより
最後のプレゼンは
-
デジタル・ヒューマニティの分野での
ウィキベースの利用に関する
-
真のパイオニアの
-
オラフ・シモンズによるものです
-
スライドはなく
ライブアクションをされるとか
-
その通り
-
私はウィキペディアに
2004年以来関わってますので
-
15年をクリアしてます
-
何をお見せするかというと
-
お褒めに預かったこともありますが
-
我々が作ったウィキベースの
インスタンスをお見せします
-
ドッカーイメージじゃありません
-
ドッカーイメージを単独インストールするのは
最良のアプローチではありません
-
難しいです
-
我々も大変苦労しました
-
ウィキメディア・ドイツが相互契約に基づき
-
完成させるのを助けてくれて感謝してます
-
幾つかのプロジェクトがあります
-
ウィキデータよりもプロジェクト中心です
-
私のプロジェクトも
そこにあります
-
それを開いてー
-
ご覧の通りです
-
イルミナティの歴史ー
これから始めましょう
-
短編の動画で
-
ポール・オリヴィエ・デヘイェの作品です
-
私は彼をTwitterで知ってました
-
彼は私たちに
-
ウィキベースを手に入れた
体験はどうだったかと聞いてきたんです
-
彼自身もウィキベースを試していました
-
そこで できることや
-
できないことについて説明しました
-
この動画は是非作ってみたいものでした
-
彼は言いました
-
「簡単だよ
SPARQL検索で情報を入手して
-
プログラムに入れれば
見ることができるよ」と
-
イルミナティについての
20年間の研究成果で
-
組織全体の簡単な歴史と
-
通信内容の全記録です
-
ウィキメディアのツールじゃありません
-
ウィキベースのツールでもありません
-
でも可能だったんです
-
実際 既にツールになってないことが
気に入ってます
-
ツールになるべきと思います
-
我々のデータが本当に無料だから
気に入ってます
-
誰でもデータをダウンロードできて
それで作業もできるのです
-
予想外のことでした
しかも2時間以内に可能ですー
-
もし彼みたいに頭が良ければ
-
彼はこれを作ってくれました
-
プレゼンに戻ります
-
なぜウィキベースか?
-
ウィキメディアにアプローチした際の
最初の質問でした
-
2010年以来ウィキデータは知っていて
-
2017年には我々も使おうとしていました
-
ウィキメディアの人たちも関心があり
-
「取り組むならばサポートします」
と言ってくれました
-
なぜ自分たちのベースを?
-
やらねばならない独自研究だったんです
-
インストレーション全体が
研究ツールだったんです
-
我々がしたことを
-
展示するためだけでなく
-
実際 自分の研究のために
毎日使っています
-
ドキュメントの日付を変えて
-
その結果見た目がどう変わるか確認します
-
仮説検証もたくさんやります
-
データを持っているプロジェクトに
データをくれるよう頼み
-
データを注入し
-
再びラベルを貼り
-
データセットに項目を付けて
-
「これは以下のプロジェクトにより
生産されました」と説明します
-
次のプロジェクトが継続してくれる時に
-
あるプロジェクトからのデータセットだと
-
マーカーが既に付いていれば
-
例えばプロジェクトで
-
DFG(ドイツ研究振興協会)が
ファンディングしたものがあれば
-
その成果を示したいことでしょう
-
SPARQL検索をして
-
データセット全体のグループを
-
自分の完成作品として
レジュメに掲載することができます
-
我々は独自研究をし
研究を特定し
-
仮説検証を促進します
-
機能しているツールで
-
実際 最初から始めるのが有益ですー
-
最後に何か見せるのではなく
-
初日から作業をして
-
質問に対する正解を考え抜き
-
ウィキベースに入れて
-
人物を正しく特定したり
-
今まで日付が特定できなかったことについて
-
正しい日付が判明するまで
-
情報を実証することができます
-
作業をしながら成果を累積し
-
ウィキベースを
-
最終結果に近づくための
ツールとして使うのです
-
最初のミーティングは2017年
12月1日に開かれました
-
その時 私はあなたに
一つの問いかけをしました
-
ある人物の死亡日でした
-
ソースを探していたのですが
-
非常に難しかったのです
-
彼はソースをまず作成した後に
-
接続する必要があったからです
-
部屋の中で私たちは
-
やるとしたら
ウィキベースの既存インストレーション内の
-
ソースでやろうと
はっきりとしたイメージを持っていました
-
その中にソースがあればー
-
すなわち
初期に出版された近代美術書があれば
-
理想的だと考えました
-
それがあるのであれば
GNDもそこに必要でした
-
GNDの人たちがソフトウェアを
テストする予定だと聞いた時
-
アプローチし こう言いました
「共同でやりませんか?
-
あなた方のデータが必要です
-
とにかくデータが欲しいんです
-
ウィキベース上でどうなるか分かります」
-
これが今の我々の状況です
-
現在も どうすれば良いか
-
我々も分からないことー
-
少なくとも私が分からないことが一杯あります
-
インプット方法
文字列リソースから
-
項目ベースのリソースに移行する方法等々
-
要するに 私のプレゼンは
皆さんへのお誘いなんです
-
ジョインして下さい
-
我々はまだウィキベース・コミュニティの
一員ではありません
-
まだ存在しませんから
-
ウィキデータコミュニティはあります
-
ウィキデータでは
いろいろなことが起きていますが
-
ウィキデータでないことについて
ウィキベースで質問しても
-
難しいです
-
まず 我々と一緒にやるのは楽しいです
-
ウィキデータからCC0で
いつでもデータが掴めますから
-
あなたの作業の孵化装置として活用し
-
ウィキデータにドラッグすれば良いのです
-
GNDが入った時点で
ビッグデータで作業できることになり
-
これも大変楽しみです
-
チャレンジが好きならば
-
我々のプラットフォームで挑戦して下さい
-
面白いコミュニティも提供します
-
他と異なることと言えば
-
はっきりとした名前のアカウントと
機関があるということです
-
それはウィキデータではできないことが
-
できることも意味しています
-
我々のサイトで系譜学が研究できます
-
気にしません
-
そういうデータを人が入手することも
面白いでしょう
-
あなたの都市の検索ー
歴史研究等を
-
我々のプラットフォームでしても結構です
-
我々のプラットフォームでは
研究を続けてもらえます
-
いろいろやることがあります
-
データベース運営で難題が山積してます
-
ウィキメディアが立ち上げくれましたが
-
今や 上手く行ってないことが
たくさんあります
-
我々で直すことはできません
-
データベースの運営や
データベースの更新について
-
助けてもらうのは難しいです
-
ウィキデータの外でインスタンスを
走らせるとすぐに
-
細かい技術的な問題が発生するんです
-
直接GNDリンクを入手することも難しいです
-
ウィキデータでは上手く行くのに
我々のインスタンスでは駄目です
-
Wikimedia Commonsから画像を
-
我々のウィキベースに移すのも
苦労しています
-
細かいトラブルがたくさん残ってます
-
お誘いです
-
マス・インプットに参加される場合は
是非お願いします
-
とにかく来て下さい
-
技術的なことで助けて頂ければ
-
大歓迎です
-
それから ツールも必要です
-
最初にお見せしたようなツールは
-
入手するのはさほど難しくありません
-
可視化のために必要なクエリもわかってます
-
いったん手に入れば
簡単の変更できるはずです
-
これらのツールは
デジタル・ヒューマニティの
-
プロジェクトのコミュニティにとり
とても貴重なものです
-
この類のツールを作ってるのは
小さな企業で
-
繰り返し利用させることにより儲けています
-
できれば そのツールを市場から無料で
-
ウィキベースインスタンスと
ワークするものを入手したいのです
-
ツール開発に興味があったら
-
アプローチして下さい
-
歴史家が欲しがっている可視化ツールに関し
何が必要かも含め
-
アイディアはたっぷりあります
-
このようにやることは
たくさん残ってます
-
あと1分ですか
その1分、いりません
-
プレッシャーかけてますね
-
(聴衆)聴衆に時間を下さい
-
1分を聴衆に差し上げます
-
有難うございました
-
お座り下さい
-
他の皆さんも舞台にお戻り下さい
-
質問を受けましょう
-
募集で終わったのは良かったですね
-
これも募集ですから
-
ご質問をどうぞ
-
明日のウィキベースのミートアップ
にもご参加下さい
-
あなたの所属団体や
あなたの趣味のため
-
それとも世界を変えるための
-
凄いウィキベース・インストレーションの
アイディアがあれば
-
是非ミートアップに参加して下さい
-
椅子が混乱してますね
-
立ってやりましょう
-
ここのマイクがもう一つあります
-
(聴衆)質問用のマイク持ってます
-
講演者の方々有難うございました
-
ウィキベース・ミートアップで会いましょう
-
パネルへの質問を是非どうぞ
-
最初はだれですか?
-
(聴衆)稲妻セッションで
-
地球科学についてプレゼンする予定です
-
地球科学では 何年もの期間ー
場合によっては何十年もの間
-
コミュニティで収集されシェアされた
-
多くのデータリポジトリがあります
-
データセットがキュレートされ
スキーマが継続的に進化し
-
コミュニティから多くの
フィードバックを得ています
-
彼らが望んでるのはただ
コミュニティを組織化して
-
レポジトリを拡大させることです
-
だから コンテンツをすべて
ウィキデータにのせて
-
コントロールを失いたくないのです
-
このコンテンツのキュレーションに
甚大な貢献をしてくれています
-
パネリストの皆さんが述べられた
要件やニーズは
-
私のコミュニティでも同様に
-
あることを指摘したかったんです
-
私からの質問は次のようなものです
-
スキーマや標準を混合したり維持しつつ
-
継続的にコミュニティにフィードバックさせ
-
ウィキデータが持つクラウドソーシング精神を
促進するにはどうすれば良いのでしょうか?
-
誰が答えても良さそうですが
デービッドからどうですか?
-
私が適任かどうか分かりません
-
何故なら 我々のユースケースでは
-
データモデリングの観点からは
-
実際の作業はほんの数人が担当しているんです
-
関連セグメントでは
エキスパートにコンタクトして
-
彼らに助けてもらうこともありますが
現在のイテレーションでは
-
私と同僚2名で作業しました
-
エキスパートを招聘するという
オプションはキープしつつも
-
それは いつも我々と密接な
コラボレーションを通じたもので
-
クラウドソーシングの問題について
-
悩む必要は実際ないんです
-
ウィキメディアのコミュニティの一員として
-
心配ないと言えます
-
編集の95%は良い編集で
改善かそれ以上の効果をもたらします
-
閉鎖されたインスタンスに遭遇した場合
-
アカウントを本当の名前で提供しますが
-
それを超えようとする愚か者はいないような
追加のハードルです
-
我々のインスタンスでは ページにー
-
私にではなくページに
アドレス提供を求められます
-
これは通常大手機関がすること
-
あるいは個人が
-
「個人としてこの研究が気に入った
-
自分の分野だからアドレスあげる」
と言ってやることです
-
これはウィキデータを
破壊しようという輩を
-
追い払う良い方法です
-
システムを閉鎖的にすること可能ですが
-
流れのあるコミュニティの一員では
なくなります
-
ただしCC0に行けば
-
オープンにすることが可能で
インキュベータとなり
-
そこで人々が研究をして
コミュニティにその成果が拡散します
-
これは招待ですー
閉鎖された作業を利用して
-
一緒に作業をしたい人とは
インスタンスを利用するんです
-
私だけの意見ではないでしょう
-
さまざまな見解があり
-
すべての意見を集約して
-
「ウィキデータは全世界が入るべき
ソリューションだ」ということはできません
-
ウィキデータはソリューションではないと
言うつもりはありませんが
-
いろいろな意見があり
いろいろなニーズがあるんです
-
世界には本当に各種各様のニーズや
-
プロフェッショナルな意見があり
唯一のデータベースに集約することは
-
無理なんです
-
両方ともー
-
一番難しいのは
両方の大きなグループのニーズや意見を
-
いかに調和させ
両者が会話できる切り口を
-
見つけるかということです
-
もっと質問があれば
-
是非お願いします
-
どなたか?
-
皆さんが質問を考えている間 私からー
-
それが私たちがウィキベースを
-
検討している理由の一つなんです
-
ウィキデータ内のように
権利と役割がある中で
-
ウィキベースインスタンス内で
情報を足したり編集することは
-
ウィキデータ内の情報を
-
より簡単に簡便に
-
シェアする機会を与えてくれているからです
-
我々の典拠ファイルと
ウィキデータの間に
-
橋を渡そうとするより
よっぽど簡単です
-
(聴衆)お話を伺い
-
あなた方がコミュニティを活性化させ
-
彼らが自分たちでデータモデリングできる
方法を探したり
-
それをウィキベースにも入れらると聞いて
とても面白いと思いました
-
スチュアート・プライアさんの
コミュニティについてー
-
あるいは他の方々についてもー
-
コミュニティとして
-
ウィキデータに回帰すると決断された
アプローチを推進するためこう言いますか?
-
「美術書はやった
-
幾つかのイテレーションを完遂した
-
これがとても上手く行った
-
これが使うべきプロパティだ
-
これがウィキデータのデータモデルに
加えるべき修正だ」と
-
いい質問ですが答えは短く
-
興味深い質問です
-
他のタイプでもワークする
-
モデルかどうかは分かりません
-
ワークすれば良いですが
-
もしあなたの質問が
-
ウィキデータコミュニティが
勝手に違う作業を自分でやってしまう
-
別のコミュニティの権威を受容するかという
ものであれば難しい質問です
-
でも それが人々が
-
必ずしもウィキデータ上でやらなくても
-
このプロセスにフィードバックできる
方法であることを私は望んでます
-
「掴みなさい」と言いたいです
-
便利なら掴んで
他のインスタンスで使えるか
-
試してご覧なさい
-
もし それが特定の検索をするために
-
役立つプロパティだと思えば
採用されるでしょう
-
流れが良いでしょうから
-
当局がこれをやるとは思いません
-
(聴衆)ウィキデータユーザーの観点から
-
あなた方がやってることの素晴らしい点は
-
作動するコードを確立したことです
-
人々が見ることができ
実装し作動できるデータモデルを確立しました
-
オープンソース社会においては
-
コード公開が原則ですが
-
それができたのです
-
データモデリング用に折りたためる
枝があるというのは
-
とても良いことだと考えます
-
有難うございます
-
的を射ていると思います
-
「活性化」という動詞も良かったです
-
まさにそれを目指しています
-
スタートレックの「転送!」と
同じ言葉ですね
-
これでこのパネルは終了です
-
もっとウィキベースプロジェクトに関する
-
質問があれば、話して下さい
-
- 明日も来て下さい
- 議論しましょう
-
それがこのコンファレンスの狙いです
-
有難うございました
-
(拍手)