34C3 Vorspannmusik
Herald-Engel: Einen wunderschönen guten
Morgen am Tag vier des 34. Chaos
Communication Congress. Es freut mich,
dass so viele von euch schon hier sind,
und wir legen auch gleich los, damit wir
nicht gleich wieder in Verzug
kommen. Mit mir auf der Bühne steht
Leander Seige, und er erzählt euch etwas
zum Thema 'International Image
Interoperability Framework -
Kulturinstitutionen schaffen interoperable
Schnittstellen für digitalisiertes
Kulturgut'. Bitte einen
großen Applaus für Leander!
Applaus
Leander: Ja, vielen vielen Dank, auch von
mir einen wunderschönen guten Morgen, und
ich freue mich sehr, dass obwohl heute der
vierte Konferenz Tag ist, ihr dennoch
schon zum ersten Talk heute hier
erschienen seid. Vielen Dank dafür. Ich
freue mich, und ich freue mich vor allen
Dingen auch, dass ich heute die
Gelegenheit habe, hier meine aktuelle
Lieblings- Technologie zu präsentieren,
nämlich das International Image
Interoperability Framework. Das es
erlaubt, interoperable Schnittstellen für
digitalisiertes Kulturgut zu realisieren.
Ganz wenige Worte zu mir selbst: ich
arbeite in der Universitätsbibliothek
Leipzig, bin verantwortlich für den
Bereich Digitale Dienste, und habe aus
diesem Kontext heraus mit diesen Dingen
natürlich sehr zu tun. Aber ich begeistere
mich auch persönlich dafür und das führt
dazu, dass ich auch das eine oder andere
kleine selbst motivierte private Projekt
in diesem Bereich durchführe, da zeige ich
nachher auch noch ein kleines Beispiel.
Ich denke, es ist bekannt und viele würden
mir da zustimmen, dass digitalisierte
Bilder heutzutage ein fundamentaler
Informationsträger kulturellen Erbes sind.
Handschriften, Drucke, Zeichnungen und
Gemälde und viele andere Dinge werden auf
diese Weise viel besser zugänglich. Früher
war dieser Zugang nur exklusiv Forschenden
möglich, heute ist das für jedermann
möglich und die Originale erfahren dadurch
auch einen viel höheren Schutz.
Digitalisierung ist nichts Neues. Doch
bisher war Digitalisierung oft damit
verbunden, dass die Daten, die Metadaten,
und die digitalisierten Bilder selbst in
Silo-artigen Systemen präsentiert wurden,
nur kaum mit anderen Daten verknüpfbar
waren. Entsprechend schwerfällig intern
auch die Prozesse waren, Bilder
bereitzustellen, und auch immer
individuell an die Realisierung des
jeweiligen Portals geknüpft waren. Ich hab
hier ein Beispiel aus unserer eigenen
Bibliothek genommen, eine alte Bibel-
Handschrift, die ich später noch genauer
vorstellen werde, bei der das der Fall
war, als dieses Portal gebaut wurde, war
es damals ein sehr modernes und
fortschrittliches Portal, aber heutzutage
kann es diesen Ansprüchen nicht mehr
genügen, die heute daran angelegt werden.
Und ja, wie das genau aussieht, komm ich
dann gleich dazu. Also hier nochmal die..
ein Sinnbild dafür, wie die Situation oft
ist, wie Präsentationen von Digitalisaten
im Netz oft realisiert werden. Die Systeme
sind, isoliert tragen ihren
institutionellen Charakter nach außen und
sind, ja, Zugänge zu den Repositorien, was
schön ist, aber sie sind eben nicht
interoperabel miteinander. Und diesen
Punkt, den adressiert das IIIF, das
speziell für diesen Zweck konstruiert
wurde, nämlich einen API Layer, einen
standardisierten API Layer, zwischen den
eigentlichen Repositorien, also den
Speichersystemen für digitalisierte Bilder
und die Metadaten zu schaffen. Und diese
APIs mit den Präsentationen zu verbinden,
so, dass die Daten aus verschiedenen
Repositorien in verschiedenen,
institutionell auch nicht gebundenen, also
bsp. privaten Arbeitsoberflächen, virtuos
vom Nutzer selbst zusammengesetzt werden
können. Die Community um diesen, um dieses
Framework ist recht groß geworden.
Gebildet wurde sie aus einer Gemeinschaft
von der Stanford University Libraries, der
British Library und der.. den Bibliotheken
in Oxford. Inzwischen ist das sehr stark
gewachsen, die Community, in Deutschland
ist es vor allen Dingen bsp. die
Bayerische Staatsbibliothek, die sich da
sehr engagiert. Die Universitätsbibliothek
Leipzig tut das auch, Französische
Nationalbibliothek und viele andere, in
der Community finden sich inzwischen sehr
viele internationale, bedeutende
Bibliotheken - Universitätsbibliotheken,
Nationalbibliotheken. Auch die
Vatikanische Bibliothek stellt ihre
Digitalisate in diesem interoperablen
Format inzwischen bereit. Es gibt derzeit
vier APIs, die spezifiziert sind unter CC-
BY Lizenz. Zwei von diesen APIs sind
tatsächlich erforderlich, um eine
Präsentation aufzusetzen. Das ist einmal
die Image API, die tatsächlich die Pixel
ausliefert. Und es gibt die Presentation
API, die dafür da ist, die Struktur und
Metadaten zu diesen Pixeln zu definieren
und interoperabel abrufbar zu machen.
Weitere APIs kümmern sich dann um das
Thema Suche und Authentifizierung, aber
auf die gehe ich hier nicht weiter ein,
weil das den Rahmen sprengen würde. Das
besonders Schöne an diesem Standard ist,
dass er auf Linked Data beruht. Die Daten
sind typischerweise in JSON-LD abgelegt,
die Identifier für die verschiedenen Dinge
in diesen Daten sind i.d.R. HTTP URIs, die
also auflösbar sind und auch den Bezug von
Metadaten aus verschiedenen Quellen
zueinander ermöglichen, völlig unabhängig
von ihrer Speicherung. Ganz kurz wenige
Worte über die Presentation API, die die
Hierarchie modelliert, in der die
Metadaten abgelegt sind: zunächst gibt es
da die Kollektionen, die also mehrere
Werke zu einer sinnhaften Einheit
zusammenfassen. Solche Kollektionen können
auch selbst gebildet werden, Forscher
können sich ihre eigenen Forschungs-
Kollektion zusammenlegen, die aus
Manifest-Dateien bestehen, die dann
Sequenzen von Bildern definieren. Eine
Manifest-Datei beschreibt also ein Werk,
das aus Bildsequenzen besteht. Diese
Bildsequenzen sind Canvas-Objekte, also
reine Seiten- Objekte, die dann durch
Inhalte, durch Bilder, aber das kann
können eben auch Texte sein, annotiert
werden. Ich gehe noch einmal zu der Slide
zurück: das sieht man hier auf dieser
Slide sehr schön, wie die.. wie dieses
abstrakte Canvas-Objekt schließlich mit
dem eigentlichen Bildinhalt annotiert
wird, was es ermöglicht, dieses Canvas-
Objekt eben auch durch mehrere
verschiedene Bilddateien und auch Texte,
beschreibende Texte, Transkriptionen und
vielleicht sogar Übersetzungen, zu
beschreiben. Die Manifest-Dateien sind so
aufgebaut: ich hab ich hier, vielleicht
ganz kurz mal, so einen schematischen
Überblick zusammengestellt, den muss man
jetzt nicht genau anschauen, soll nur
beschreiben, wie die innere Struktur in
Linked Data-Manier aufgebaut ist. Und nach
dem gleichen Modus sind eben auch die
Annotationen, die die Nutzer selbst auch
anlegen können in diesen Systemen
strukturiert, so dass es möglich ist,
eigene Annotationen in eigenen
Speichersystem auf Objekte sich beziehen
zu lassen, die gar nicht in meinem eigenen
Speichersystem vorhanden sein müssen.
Diese Funktionalität ist hier auf dieser
Slide noch einmal abgebildet. Es ist also
möglich, mit IIIF Präsentations-Systeme
aufzusetzen, die aus verschiedenen
Repositorien Bilder in eine virtuelle
Forschungsmgebung, um diesen belasteten
Begriff mal zu benutzen, zusammenzufassen
und dann in verschiedenen Annotationen zu
speichern.. die wissenschaftlichen
Bemerkungen zu speichern. Für die APIs von
IIIF gibt es inzwischen zahlreiche
Software-Anwendungen. Ich greife hier
immer nur ein Beispiel raus, das ich auch
gleich noch live zeigen werde. Die.. für
die Presentation API gibt es einige
Viewer, die die Digitalisate darstellen
können. Speziell erwähnen möchte ich hier
den Mirador-Viewer, der Multi-
Dokumentenfähig ist, also aus
verschiedenen Quellen verschiedene
Digitalisate zusammenstellen kann und auch
über umfangreiche Funktionen der Bild-
Manipulation und der Annotationen verfügt.
Die Image API, die tatsächlich die Bilder
ausliefert, ist sehr dynamisch
strukturiert, d.h. man kann dem Bild-
Server, der dieser API entspricht,
tatsächlich sagen, welchen Ausschnitt aus
einem Bild, skaliert oder nicht skaliert,
gedreht und so weiter, also man kann Bild-
Manipulationen direkt beim Server auch
erbitten, der die Digitalisate dann
entsprechend aufbereitet. Und so ist es
eben möglich, Digitalisate, die von
Institutionen bereitgestellt werden,
dynamisch in seine eigenen Anwendungen zu
übernehmen. Wie auch bei der Presentation
API gibt es eine ganze Reihe von
Softwareprodukten, die Bild-Server auf
dieser Technologie realisieren. Als
Beispiel nenne ich hier den IIPImage
Server. Der.. das ist ein FastCGI-Modul
für Apache, das unter der GPLv3
bereitgestellt wird, und dieser Server ist
eben in der Lage, diese Presentation API
zu .. umzusetzen, und das tut er auf der
Grundlage von präprozessierten
Bilddateien, da.. dafür legt man
Bilddateien an, die über die mehrere
Auflösung des Digitalisats enthalten und
idealerweise auch schon in Kacheln
unterteilt sind, die von dem Bild-Server
dann dynamisch ausgeliefert werden. Es
gibt leider nur eine geringe Auswahl an
Software, mit der man solche Dateien zur
Zeit erstellen kann. TIFF Dateien lassen
sich recht gut mit ImageMagick herstellen,
aber für JPEG 2000 ist es schon
schwieriger, da gibt es leider nur die
kommerzielle Lösung Kakadu, und die
OpenJPEG Implementierung wird, glaube ich,
gerade verbessert, um in diesem Kontext
auch eingesetzt werden zu können. Beispiel
Nummer eins: der Papyrus Ebers, möchte ich
kurz präsentieren. Jetzt wird es ein
bisschen praktisch, ich zeig paar Demos.
Der Papyrus Ebers ist eine Schriftrolle,
die ist dreieinhalbtausend Jahre alt, ist
sehr gut erhalten und enthält 880
medizinische Behandlungsverfahren, die
Beschreibungen davon, aus dem alten
Ägypten. Die Rolle hat eine Gesamtlänge
von 18 m, wurde aus konservatorischen
Gründen einst zerschnitten und ist jetzt
digitalisiert wieder zusammengefügt
worden. Auf ... dieser ... auf unserer
Seite und die ist auch per IIIF abrufbar,
natürlich, und ich zeige nur ganz kurz,
wie das funktioniert und auch die.. die
Qualität der Darstellung zu präsentieren.
Das ist also die gesamte Schriftrolle, die
so physisch gar nicht mehr existiert. Und
das Digitalisat hat übrigens.. ist 145 000
Pixel breit und 3000 Pixel hoch und lässt
sich trotzdem hier wunderbar zoomen.
Darüber hinaus haben wir die IIIF
Funktionalität, auch die.. kann man das
sehen?. auch die Übersetzungen dieser
medizinischen Rezepte hinterlegt, so dass
man hierauch drüber schauen kann, welche
medizinischen Verfahren für welche
Gebrechen angewendet wurden. So. Zur
Sicherheit habe ich das hier noch als
Slides, das überspringe ich jetzt.
Beispiel zwei: der Codex Sinaiticus ist
eine Bibel- Handschrift aus dem 4. Jh. Die
gilt als die erste Bibel-Handschrift, die
das vollständige Neue Testament enthält
und heute sich leider auf vier
Einrichtungen verteilt. Der größte Teil
liegt in der British Library in London,
ein kleinerer Teil liegt hier in der
Universitätsbibliothek in Leipzig, die
Nationalbibliothek in Russland und das
Saint Catherine's Monastery in Ägypten
besitzen auch noch kleinere Teile des
Codex, und das ist ein perfekter use case,
eigentlich, für IIIF, um aus diesen
einzelnen besitzenden Institutionen das
Gesamtwerk wieder in einer Präsentation
zusammenzuführen und dann blätterbar zu
machen. Toppen kann man die ganze Sache
allerdings noch dadurch, dass es eine
zweite Bibel-Handschrift gibt, die in etwa
das gleiche Alter hat, den Codex
Vaticanus. Der, wie der Name schon sagt,
im Vatikan liegt, und das Schöne ist jetzt
eben, dass die Blätter, zumindestens die
Leipziger Blätter des Codex Sinaiticus,
bei uns als IIIF bereitstellen, und die..
- bereitstehen - und die Blätter des
Vatikans auch von den Vatikanischen
Bibliotheken als ... als IIIF bereit
gestellt wurden. So. Und jetzt kann ich
zeigen, wie es möglich ist, in eine.. in
einer IIIF kompatiblen Oberfläche, die man
sich auch selbst aufsetzen kann, sich
Digitalisate aus unterschiedlichen
Einrichtungen zusammen zu ziehen. Ich
nehme hier zunächst den Codex Sinaiticus
aus.. aus Leipzig und lade auch die
Manifest-Datei des Codex Vaticanus in
diese Oberfläche und ja, öffne diese
Ansicht hier in Mirador-Viewer. Und kann
jetzt über diese relativ komfortable
Möglichkeit, die Digitalisate
nebeneinander anzuzeigen, tatsächlich als
Forscher - an diesem prominenten Beispiel
demonstriert - die Digitalisate aus ganz
unterschiedlichen Häusern mir individuell
in meiner Forschungs-Umgebung
zusammenstellen. Ich rufe mal hier zwei
Mal die gleiche Stelle auf, also
inhaltlich die gleiche Stelle, der.. das
ist der Beginn des Buches Esther. Und auch
mir als völligem Laie auf dem Gebiet ist
das dann auch schon gleich ersichtlich,
dass es sich hier offensichtlich um den
gleichen Inhalt handelt. So. Weiter
geht's. Die Folien.. ja, hier nochmal das
Sinnbild, um zu verdeutlichen, dass die
beiden Digitalisate in diesem Moment von
unterschiedlichen Repositorien
ausgeliefert werden. Beispiel Nummer drei
ist eine Demo, die in dem offiziellen
Demo-System des Project Mirador zu finden
ist. Ich schließe mal hier dieses andere
Objekt - zeigt eine.. eine Handschrift aus
Frankreich, aus der, das ist wohl immer
wieder vorgekommen, aus der hier eine,
eine Illustration ausgeschnitten wurde.
Und diese Illustration sich heute
offensichtlich in einer anderen
Institution befindet und das Datenmodell
von IIIF, das institutionsübergreifende,
lässt es eben jetzt auch zu, Digitalisate
aus verschiedenen Institutionen auf den
gleichen Canvas - ich hatte das vorhin
kurz gezeigt - auf dem gleichen Canvas
zusammen zu führen, um den Eindruck des
Originals virtuell auch wieder
herzustellen. Und weil dieses, weil diese
Demo-System hier ja so schön ist, kann ich
gleich noch ganz kurz zeigen, wie das mit
den Annotationen funktioniert. Dafür rufe
man diesen.. kann man hier so einen
Bereich aufrufen und dann hier seine
wichtige Bemerkung hinterlassen. Und je
nachdem, wie das Viewer-System dann
konfiguriert ist, kann diese Annotation in
eine institutionelle Speicherung vervoll..
äh, gespeichert werden. Aber es ist
durchaus auch möglich, Forschern
Arbeitsumgebungen in Zukunft
bereitzustellen, die es ermöglichen, dass
diese dort ihre privaten Annotationen,
ihre Notizen zu den Werken, an denen sie
arbeiten.. zu hinterlegen. So. Ja, hier
hab ich nochmal so einen Ausriss gemacht,
in dem man sieht, wie in der Manifest-
Datei diese beiden unterschiedlichen
Digitalisaten.. und wenn man sich die URL
anschaut, auch aus unterschiedlichen Bild-
Servern, hier auf der Cancas-Oberfläche
zusammengefasst werden. So, das war ein
Fehler... So. Ja, ein Beispiel kann ich
noch benennen: wir haben diese Technologie
auch praktisch ausprobiert in diesem Jahr.
Es findet jährlich ein Handschriften-Kurs
an der Universitätsbibliothek Leipzig
statt. Und dieses Jahr war es zum ersten
Mal so, dass wir eine virtuelle
Arbeitsumgebung den Kursteilnehmern
bereitgestellt haben, in der sie virtuell
mit den Handschriften, mit den.. mit
unseren eigenen Handschriften, aber eben
auch mit Handschriften aus anderen
Häusern, arbeiten konnten, und dann in
Gruppen zusammengestellt Annotationen über
Handschriften gemeinsam erstellt haben und
so ihre Forschungsergebnisse gemeinsam
dokumentieren konnten. Das basierte
übrigens auf einer Software, die von den
Stanford University Libraries
bereitgestellt wird und die auch frei
verfügbar ist, und den Mirador-Viewer, den
ich vorhin gezeigt habe, noch einmal um
Funktionen erweitert. Ich möchte auch, wie
eingangs angekündigt, noch ein kleines
privates Projekt vorstellen. Ich hab
mittels Wikidata und der Nutzung des
SPARQL - Endpoints mir hochauflösende
Bilder von Gemälden, Zeichnungen und
Karten auf meinen eigenen Server gezogen
und die dort in IIIF umgewandelt und
bereitgestellt und auch durchsuchbar
gemacht, und ... und auf diesem System
kann man sich jetzt eben diese
Digitalisate raussuchen und hier kann ich
auch noch das Drag-and-Drop-Feature
zeigen, das jetzt sehr oft benutzt wird,
oder empfohlen wird, für die Einbindung
oder die Verbindung von Discovery-Systemen
mit Bildpräsentations-Systemen, in denen
man diese Daten hier abrufbar macht. Und
über dieses Logo sind dann auch die IIIF
Manifest-Dateien, die man benötigt, um die
Daten in andere workspaces zu ziehen,
erreichbar. Vielleicht noch wirklich ein
ganz winziger Aus.. eine ganz winzige
Auswahl: es haben sehr viele bedeutende
Einrichtungen inzwischen IIIF Digitalisate
online gestellt, unter anderem das
Metropolitan Museum of Art in New York und
die französischen Nationalbibliothek. Aber
beispielsweise gibt es auch in der Schweiz
ein Handschriften-Portal, dass die
bedeutenden Handschriften, die in den
Schweizer Institutionen liegen,
zusammenfaßt. Auch das ist alles IIIF
kompatibel. Hier sind die.. die Links
dazu. Wen das interessiert, der kann das
sich ja später im PDF raussuchen. Oder die
Wellcome Library hat auch große
Bildbestände, archive.org unterstützt IIIF
inzwischen auch, das nur ganz kurz als
Beispiele von großen Datenpools, die man
anzapfen kann, um seine eigenen
Präsentationen, oder sonstige Projekte,
die man mit diesen Daten anstellen möchte,
zu realisieren. Die IIIF APIs entwickeln
sich natürlich weiter, in Kürze soll die
Version 3.0 der Presentation API
veröffentlicht werden, die zum Einen einen
Wechsel der Datenmodelle bezüglich der
Annotationen vorsieht und auf der anderen
Seite aber auch die Unterstützung für
Videodaten mitbringen soll. Institutionell
gesehen, noch zwei Worte zur
Universitätsbibliothek Leipzig, die Open..
wir haben für uns eine Open Digitization
Policy gefasst, mit der Absicht, die dafür
geeigneten Digitalisate in unserem Haus
unter CC0 oder CC-PD-Mark frei verfügbar
zu machen und das auch eben in dieser
institutions-übergreifenden kompatiblen
Art und Weise, unter der hier
eingeblendeten URL kann man in unsere
Digitalisierungs-Werkstatt schauen,
sozusagen, in der immer die letzten 20
Digitalisate, die durch unseren
Digitalisierung-Workflow gegangen sind,
live angeschaut werden können. Der eine
Hinweis sei mir noch gestattet: wir führen
demnächst einen Hackathon durch in
Leipzig, zu dem.. aus dessen Anlass wir
auch einen IIIF Workshop veranstalten
werden. Ich danke vielmals für ihre
Aufmerksamkeit, wenn..
seufzt
wenn ihr mehr wissen wollt über IIIF, dann
kann das.. könnt ihr euch's unter iiif.io.
erfahren, meine Kontakt.. Kontaktdaten
stehen auch hier. Vielen Dank und wer noch
Fragen an mich hat, da stehen jetzt
vielleicht auch noch ein paar Minuten
Zeit.
Applaus
Herald: Dankeschön!
weiterhin Applaus
Herald: Vielen herzlichen Dank, Leander.
Wir haben 5 Minuten für Q&A, d.h. wenn ihr
Fragen habt, stellt euch ruhig an. Frage
an den Signal-Angel: ist das Internet
schon munter und hat Fragen? Keine Fragen
aus dem Internet. Dann fangen wir bitte
mit Mikrofon 1 an.
M1: Guten Morgen, vielen Dank für den
Vortrag. Meine Frage: gibt es
Schnittstellen zu Inventurda.. oder
Inventar-Datenbaken, wie startext HiDa,
oder ähnliches?
Leander: Da, also, auf speziell dieses
Produkt, da kann ich keine Aussage drüber
machen, aber ich glaube, IIIF ist ja ein..
eine standartisierte.. also, eigentlich
nur die Beschreibung eines Schnittstellen-
Standarts. Und Systeme, die damit
kompatibel gemacht werden sollen, müßten
eben Schnittstellen anbieten, die diesen
Standart realisieren.
M1: Danke.
Herald: Dann machen wir weiter mit
Mikrofon 1.
M1: Meine Frage ist, das ist ja jetzt ein
Standart. Gibt's denn alternative
Standarts, die irgendwo auch verwendet
werden? Weil ich mein, der große Vorteil
ist ja, dass wenn das alle verwenden,
diese.. dass verschiedene Institutionen
das machen. Wenn jetzt aber irgendwie in
Berlin die Bibliothek anfängt, einen
anderen Standart umzusetzen, ist es
vielleicht ein bisl schlecht, darum meine
Frage: wird das irgendwie allgemein
verwendet in der Bibliotheks-Szene, oder
gibt's da konkurrierende Standarts?
Leander: Es gibt tatsächlich einen
älteren, konkurrierenden Standart, das
sind.. der basiert auf XML Dateien und
dort ist auch vorgesehen, dass die Daten
i.d.R. als ... als komplette Bilder
ausgeliefert werden, aber auf diesem
technologischen Standart, diese dynamische
Auslieferung auf Kachel-Basis, die Basis
auf Linked Data-Technologien, ist aus
mein.. nach meinem Kenntnisstand so
konkurrenzlos im Moment.
Herald: Wunderbar, herzlichen Dank. Gibt
es sonst noch Fragen? Hat sich das
Internet mittlerweile gemeldet? Noch immer
nicht? Die schlafen alle noch. Haben die
auch Party gemacht, so wie wir alle.
lacht
Gut, an den Mikrofonen steht sonst niemand
mehr, dann würde ich sagen: Vielen
herzlichen Dank, Leander!
Leander: Danke.
Applaus
34c3 Abspannmusik
Untertitel erstellt von c3subtitles.de
im Jahr 2018. Mach mit und hilf uns!