34C3 Vorspannmusik Herald-Engel: Einen wunderschönen guten Morgen am Tag vier des 34. Chaos Communication Congress. Es freut mich, dass so viele von euch schon hier sind, und wir legen auch gleich los, damit wir nicht gleich wieder in Verzug kommen. Mit mir auf der Bühne steht Leander Seige, und er erzählt euch etwas zum Thema 'International Image Interoperability Framework - Kulturinstitutionen schaffen interoperable Schnittstellen für digitalisiertes Kulturgut'. Bitte einen großen Applaus für Leander! Applaus Leander: Ja, vielen vielen Dank, auch von mir einen wunderschönen guten Morgen, und ich freue mich sehr, dass obwohl heute der vierte Konferenz Tag ist, ihr dennoch schon zum ersten Talk heute hier erschienen seid. Vielen Dank dafür. Ich freue mich, und ich freue mich vor allen Dingen auch, dass ich heute die Gelegenheit habe, hier meine aktuelle Lieblings- Technologie zu präsentieren, nämlich das International Image Interoperability Framework. Das es erlaubt, interoperable Schnittstellen für digitalisiertes Kulturgut zu realisieren. Ganz wenige Worte zu mir selbst: ich arbeite in der Universitätsbibliothek Leipzig, bin verantwortlich für den Bereich Digitale Dienste, und habe aus diesem Kontext heraus mit diesen Dingen natürlich sehr zu tun. Aber ich begeistere mich auch persönlich dafür und das führt dazu, dass ich auch das eine oder andere kleine selbst motivierte private Projekt in diesem Bereich durchführe, da zeige ich nachher auch noch ein kleines Beispiel. Ich denke, es ist bekannt und viele würden mir da zustimmen, dass digitalisierte Bilder heutzutage ein fundamentaler Informationsträger kulturellen Erbes sind. Handschriften, Drucke, Zeichnungen und Gemälde und viele andere Dinge werden auf diese Weise viel besser zugänglich. Früher war dieser Zugang nur exklusiv Forschenden möglich, heute ist das für jedermann möglich und die Originale erfahren dadurch auch einen viel höheren Schutz. Digitalisierung ist nichts Neues. Doch bisher war Digitalisierung oft damit verbunden, dass die Daten, die Metadaten, und die digitalisierten Bilder selbst in Silo-artigen Systemen präsentiert wurden, nur kaum mit anderen Daten verknüpfbar waren. Entsprechend schwerfällig intern auch die Prozesse waren, Bilder bereitzustellen, und auch immer individuell an die Realisierung des jeweiligen Portals geknüpft waren. Ich hab hier ein Beispiel aus unserer eigenen Bibliothek genommen, eine alte Bibel- Handschrift, die ich später noch genauer vorstellen werde, bei der das der Fall war, als dieses Portal gebaut wurde, war es damals ein sehr modernes und fortschrittliches Portal, aber heutzutage kann es diesen Ansprüchen nicht mehr genügen, die heute daran angelegt werden. Und ja, wie das genau aussieht, komm ich dann gleich dazu. Also hier nochmal die.. ein Sinnbild dafür, wie die Situation oft ist, wie Präsentationen von Digitalisaten im Netz oft realisiert werden. Die Systeme sind, isoliert tragen ihren institutionellen Charakter nach außen und sind, ja, Zugänge zu den Repositorien, was schön ist, aber sie sind eben nicht interoperabel miteinander. Und diesen Punkt, den adressiert das IIIF, das speziell für diesen Zweck konstruiert wurde, nämlich einen API Layer, einen standardisierten API Layer, zwischen den eigentlichen Repositorien, also den Speichersystemen für digitalisierte Bilder und die Metadaten zu schaffen. Und diese APIs mit den Präsentationen zu verbinden, so, dass die Daten aus verschiedenen Repositorien in verschiedenen, institutionell auch nicht gebundenen, also bsp. privaten Arbeitsoberflächen, virtuos vom Nutzer selbst zusammengesetzt werden können. Die Community um diesen, um dieses Framework ist recht groß geworden. Gebildet wurde sie aus einer Gemeinschaft von der Stanford University Libraries, der British Library und der.. den Bibliotheken in Oxford. Inzwischen ist das sehr stark gewachsen, die Community, in Deutschland ist es vor allen Dingen bsp. die Bayerische Staatsbibliothek, die sich da sehr engagiert. Die Universitätsbibliothek Leipzig tut das auch, Französische Nationalbibliothek und viele andere, in der Community finden sich inzwischen sehr viele internationale, bedeutende Bibliotheken - Universitätsbibliotheken, Nationalbibliotheken. Auch die Vatikanische Bibliothek stellt ihre Digitalisate in diesem interoperablen Format inzwischen bereit. Es gibt derzeit vier APIs, die spezifiziert sind unter CC- BY Lizenz. Zwei von diesen APIs sind tatsächlich erforderlich, um eine Präsentation aufzusetzen. Das ist einmal die Image API, die tatsächlich die Pixel ausliefert. Und es gibt die Presentation API, die dafür da ist, die Struktur und Metadaten zu diesen Pixeln zu definieren und interoperabel abrufbar zu machen. Weitere APIs kümmern sich dann um das Thema Suche und Authentifizierung, aber auf die gehe ich hier nicht weiter ein, weil das den Rahmen sprengen würde. Das besonders Schöne an diesem Standard ist, dass er auf Linked Data beruht. Die Daten sind typischerweise in JSON-LD abgelegt, die Identifier für die verschiedenen Dinge in diesen Daten sind i.d.R. HTTP URIs, die also auflösbar sind und auch den Bezug von Metadaten aus verschiedenen Quellen zueinander ermöglichen, völlig unabhängig von ihrer Speicherung. Ganz kurz wenige Worte über die Presentation API, die die Hierarchie modelliert, in der die Metadaten abgelegt sind: zunächst gibt es da die Kollektionen, die also mehrere Werke zu einer sinnhaften Einheit zusammenfassen. Solche Kollektionen können auch selbst gebildet werden, Forscher können sich ihre eigenen Forschungs- Kollektion zusammenlegen, die aus Manifest-Dateien bestehen, die dann Sequenzen von Bildern definieren. Eine Manifest-Datei beschreibt also ein Werk, das aus Bildsequenzen besteht. Diese Bildsequenzen sind Canvas-Objekte, also reine Seiten- Objekte, die dann durch Inhalte, durch Bilder, aber das kann können eben auch Texte sein, annotiert werden. Ich gehe noch einmal zu der Slide zurück: das sieht man hier auf dieser Slide sehr schön, wie die.. wie dieses abstrakte Canvas-Objekt schließlich mit dem eigentlichen Bildinhalt annotiert wird, was es ermöglicht, dieses Canvas- Objekt eben auch durch mehrere verschiedene Bilddateien und auch Texte, beschreibende Texte, Transkriptionen und vielleicht sogar Übersetzungen, zu beschreiben. Die Manifest-Dateien sind so aufgebaut: ich hab ich hier, vielleicht ganz kurz mal, so einen schematischen Überblick zusammengestellt, den muss man jetzt nicht genau anschauen, soll nur beschreiben, wie die innere Struktur in Linked Data-Manier aufgebaut ist. Und nach dem gleichen Modus sind eben auch die Annotationen, die die Nutzer selbst auch anlegen können in diesen Systemen strukturiert, so dass es möglich ist, eigene Annotationen in eigenen Speichersystem auf Objekte sich beziehen zu lassen, die gar nicht in meinem eigenen Speichersystem vorhanden sein müssen. Diese Funktionalität ist hier auf dieser Slide noch einmal abgebildet. Es ist also möglich, mit IIIF Präsentations-Systeme aufzusetzen, die aus verschiedenen Repositorien Bilder in eine virtuelle Forschungsmgebung, um diesen belasteten Begriff mal zu benutzen, zusammenzufassen und dann in verschiedenen Annotationen zu speichern.. die wissenschaftlichen Bemerkungen zu speichern. Für die APIs von IIIF gibt es inzwischen zahlreiche Software-Anwendungen. Ich greife hier immer nur ein Beispiel raus, das ich auch gleich noch live zeigen werde. Die.. für die Presentation API gibt es einige Viewer, die die Digitalisate darstellen können. Speziell erwähnen möchte ich hier den Mirador-Viewer, der Multi- Dokumentenfähig ist, also aus verschiedenen Quellen verschiedene Digitalisate zusammenstellen kann und auch über umfangreiche Funktionen der Bild- Manipulation und der Annotationen verfügt. Die Image API, die tatsächlich die Bilder ausliefert, ist sehr dynamisch strukturiert, d.h. man kann dem Bild- Server, der dieser API entspricht, tatsächlich sagen, welchen Ausschnitt aus einem Bild, skaliert oder nicht skaliert, gedreht und so weiter, also man kann Bild- Manipulationen direkt beim Server auch erbitten, der die Digitalisate dann entsprechend aufbereitet. Und so ist es eben möglich, Digitalisate, die von Institutionen bereitgestellt werden, dynamisch in seine eigenen Anwendungen zu übernehmen. Wie auch bei der Presentation API gibt es eine ganze Reihe von Softwareprodukten, die Bild-Server auf dieser Technologie realisieren. Als Beispiel nenne ich hier den IIPImage Server. Der.. das ist ein FastCGI-Modul für Apache, das unter der GPLv3 bereitgestellt wird, und dieser Server ist eben in der Lage, diese Presentation API zu .. umzusetzen, und das tut er auf der Grundlage von präprozessierten Bilddateien, da.. dafür legt man Bilddateien an, die über die mehrere Auflösung des Digitalisats enthalten und idealerweise auch schon in Kacheln unterteilt sind, die von dem Bild-Server dann dynamisch ausgeliefert werden. Es gibt leider nur eine geringe Auswahl an Software, mit der man solche Dateien zur Zeit erstellen kann. TIFF Dateien lassen sich recht gut mit ImageMagick herstellen, aber für JPEG 2000 ist es schon schwieriger, da gibt es leider nur die kommerzielle Lösung Kakadu, und die OpenJPEG Implementierung wird, glaube ich, gerade verbessert, um in diesem Kontext auch eingesetzt werden zu können. Beispiel Nummer eins: der Papyrus Ebers, möchte ich kurz präsentieren. Jetzt wird es ein bisschen praktisch, ich zeig paar Demos. Der Papyrus Ebers ist eine Schriftrolle, die ist dreieinhalbtausend Jahre alt, ist sehr gut erhalten und enthält 880 medizinische Behandlungsverfahren, die Beschreibungen davon, aus dem alten Ägypten. Die Rolle hat eine Gesamtlänge von 18 m, wurde aus konservatorischen Gründen einst zerschnitten und ist jetzt digitalisiert wieder zusammengefügt worden. Auf ... dieser ... auf unserer Seite und die ist auch per IIIF abrufbar, natürlich, und ich zeige nur ganz kurz, wie das funktioniert und auch die.. die Qualität der Darstellung zu präsentieren. Das ist also die gesamte Schriftrolle, die so physisch gar nicht mehr existiert. Und das Digitalisat hat übrigens.. ist 145 000 Pixel breit und 3000 Pixel hoch und lässt sich trotzdem hier wunderbar zoomen. Darüber hinaus haben wir die IIIF Funktionalität, auch die.. kann man das sehen?. auch die Übersetzungen dieser medizinischen Rezepte hinterlegt, so dass man hierauch drüber schauen kann, welche medizinischen Verfahren für welche Gebrechen angewendet wurden. So. Zur Sicherheit habe ich das hier noch als Slides, das überspringe ich jetzt. Beispiel zwei: der Codex Sinaiticus ist eine Bibel- Handschrift aus dem 4. Jh. Die gilt als die erste Bibel-Handschrift, die das vollständige Neue Testament enthält und heute sich leider auf vier Einrichtungen verteilt. Der größte Teil liegt in der British Library in London, ein kleinerer Teil liegt hier in der Universitätsbibliothek in Leipzig, die Nationalbibliothek in Russland und das Saint Catherine's Monastery in Ägypten besitzen auch noch kleinere Teile des Codex, und das ist ein perfekter use case, eigentlich, für IIIF, um aus diesen einzelnen besitzenden Institutionen das Gesamtwerk wieder in einer Präsentation zusammenzuführen und dann blätterbar zu machen. Toppen kann man die ganze Sache allerdings noch dadurch, dass es eine zweite Bibel-Handschrift gibt, die in etwa das gleiche Alter hat, den Codex Vaticanus. Der, wie der Name schon sagt, im Vatikan liegt, und das Schöne ist jetzt eben, dass die Blätter, zumindestens die Leipziger Blätter des Codex Sinaiticus, bei uns als IIIF bereitstellen, und die.. - bereitstehen - und die Blätter des Vatikans auch von den Vatikanischen Bibliotheken als ... als IIIF bereit gestellt wurden. So. Und jetzt kann ich zeigen, wie es möglich ist, in eine.. in einer IIIF kompatiblen Oberfläche, die man sich auch selbst aufsetzen kann, sich Digitalisate aus unterschiedlichen Einrichtungen zusammen zu ziehen. Ich nehme hier zunächst den Codex Sinaiticus aus.. aus Leipzig und lade auch die Manifest-Datei des Codex Vaticanus in diese Oberfläche und ja, öffne diese Ansicht hier in Mirador-Viewer. Und kann jetzt über diese relativ komfortable Möglichkeit, die Digitalisate nebeneinander anzuzeigen, tatsächlich als Forscher - an diesem prominenten Beispiel demonstriert - die Digitalisate aus ganz unterschiedlichen Häusern mir individuell in meiner Forschungs-Umgebung zusammenstellen. Ich rufe mal hier zwei Mal die gleiche Stelle auf, also inhaltlich die gleiche Stelle, der.. das ist der Beginn des Buches Esther. Und auch mir als völligem Laie auf dem Gebiet ist das dann auch schon gleich ersichtlich, dass es sich hier offensichtlich um den gleichen Inhalt handelt. So. Weiter geht's. Die Folien.. ja, hier nochmal das Sinnbild, um zu verdeutlichen, dass die beiden Digitalisate in diesem Moment von unterschiedlichen Repositorien ausgeliefert werden. Beispiel Nummer drei ist eine Demo, die in dem offiziellen Demo-System des Project Mirador zu finden ist. Ich schließe mal hier dieses andere Objekt - zeigt eine.. eine Handschrift aus Frankreich, aus der, das ist wohl immer wieder vorgekommen, aus der hier eine, eine Illustration ausgeschnitten wurde. Und diese Illustration sich heute offensichtlich in einer anderen Institution befindet und das Datenmodell von IIIF, das institutionsübergreifende, lässt es eben jetzt auch zu, Digitalisate aus verschiedenen Institutionen auf den gleichen Canvas - ich hatte das vorhin kurz gezeigt - auf dem gleichen Canvas zusammen zu führen, um den Eindruck des Originals virtuell auch wieder herzustellen. Und weil dieses, weil diese Demo-System hier ja so schön ist, kann ich gleich noch ganz kurz zeigen, wie das mit den Annotationen funktioniert. Dafür rufe man diesen.. kann man hier so einen Bereich aufrufen und dann hier seine wichtige Bemerkung hinterlassen. Und je nachdem, wie das Viewer-System dann konfiguriert ist, kann diese Annotation in eine institutionelle Speicherung vervoll.. äh, gespeichert werden. Aber es ist durchaus auch möglich, Forschern Arbeitsumgebungen in Zukunft bereitzustellen, die es ermöglichen, dass diese dort ihre privaten Annotationen, ihre Notizen zu den Werken, an denen sie arbeiten.. zu hinterlegen. So. Ja, hier hab ich nochmal so einen Ausriss gemacht, in dem man sieht, wie in der Manifest- Datei diese beiden unterschiedlichen Digitalisaten.. und wenn man sich die URL anschaut, auch aus unterschiedlichen Bild- Servern, hier auf der Cancas-Oberfläche zusammengefasst werden. So, das war ein Fehler... So. Ja, ein Beispiel kann ich noch benennen: wir haben diese Technologie auch praktisch ausprobiert in diesem Jahr. Es findet jährlich ein Handschriften-Kurs an der Universitätsbibliothek Leipzig statt. Und dieses Jahr war es zum ersten Mal so, dass wir eine virtuelle Arbeitsumgebung den Kursteilnehmern bereitgestellt haben, in der sie virtuell mit den Handschriften, mit den.. mit unseren eigenen Handschriften, aber eben auch mit Handschriften aus anderen Häusern, arbeiten konnten, und dann in Gruppen zusammengestellt Annotationen über Handschriften gemeinsam erstellt haben und so ihre Forschungsergebnisse gemeinsam dokumentieren konnten. Das basierte übrigens auf einer Software, die von den Stanford University Libraries bereitgestellt wird und die auch frei verfügbar ist, und den Mirador-Viewer, den ich vorhin gezeigt habe, noch einmal um Funktionen erweitert. Ich möchte auch, wie eingangs angekündigt, noch ein kleines privates Projekt vorstellen. Ich hab mittels Wikidata und der Nutzung des SPARQL - Endpoints mir hochauflösende Bilder von Gemälden, Zeichnungen und Karten auf meinen eigenen Server gezogen und die dort in IIIF umgewandelt und bereitgestellt und auch durchsuchbar gemacht, und ... und auf diesem System kann man sich jetzt eben diese Digitalisate raussuchen und hier kann ich auch noch das Drag-and-Drop-Feature zeigen, das jetzt sehr oft benutzt wird, oder empfohlen wird, für die Einbindung oder die Verbindung von Discovery-Systemen mit Bildpräsentations-Systemen, in denen man diese Daten hier abrufbar macht. Und über dieses Logo sind dann auch die IIIF Manifest-Dateien, die man benötigt, um die Daten in andere workspaces zu ziehen, erreichbar. Vielleicht noch wirklich ein ganz winziger Aus.. eine ganz winzige Auswahl: es haben sehr viele bedeutende Einrichtungen inzwischen IIIF Digitalisate online gestellt, unter anderem das Metropolitan Museum of Art in New York und die französischen Nationalbibliothek. Aber beispielsweise gibt es auch in der Schweiz ein Handschriften-Portal, dass die bedeutenden Handschriften, die in den Schweizer Institutionen liegen, zusammenfaßt. Auch das ist alles IIIF kompatibel. Hier sind die.. die Links dazu. Wen das interessiert, der kann das sich ja später im PDF raussuchen. Oder die Wellcome Library hat auch große Bildbestände, archive.org unterstützt IIIF inzwischen auch, das nur ganz kurz als Beispiele von großen Datenpools, die man anzapfen kann, um seine eigenen Präsentationen, oder sonstige Projekte, die man mit diesen Daten anstellen möchte, zu realisieren. Die IIIF APIs entwickeln sich natürlich weiter, in Kürze soll die Version 3.0 der Presentation API veröffentlicht werden, die zum Einen einen Wechsel der Datenmodelle bezüglich der Annotationen vorsieht und auf der anderen Seite aber auch die Unterstützung für Videodaten mitbringen soll. Institutionell gesehen, noch zwei Worte zur Universitätsbibliothek Leipzig, die Open.. wir haben für uns eine Open Digitization Policy gefasst, mit der Absicht, die dafür geeigneten Digitalisate in unserem Haus unter CC0 oder CC-PD-Mark frei verfügbar zu machen und das auch eben in dieser institutions-übergreifenden kompatiblen Art und Weise, unter der hier eingeblendeten URL kann man in unsere Digitalisierungs-Werkstatt schauen, sozusagen, in der immer die letzten 20 Digitalisate, die durch unseren Digitalisierung-Workflow gegangen sind, live angeschaut werden können. Der eine Hinweis sei mir noch gestattet: wir führen demnächst einen Hackathon durch in Leipzig, zu dem.. aus dessen Anlass wir auch einen IIIF Workshop veranstalten werden. Ich danke vielmals für ihre Aufmerksamkeit, wenn.. seufzt wenn ihr mehr wissen wollt über IIIF, dann kann das.. könnt ihr euch's unter iiif.io. erfahren, meine Kontakt.. Kontaktdaten stehen auch hier. Vielen Dank und wer noch Fragen an mich hat, da stehen jetzt vielleicht auch noch ein paar Minuten Zeit. Applaus Herald: Dankeschön! weiterhin Applaus Herald: Vielen herzlichen Dank, Leander. Wir haben 5 Minuten für Q&A, d.h. wenn ihr Fragen habt, stellt euch ruhig an. Frage an den Signal-Angel: ist das Internet schon munter und hat Fragen? Keine Fragen aus dem Internet. Dann fangen wir bitte mit Mikrofon 1 an. M1: Guten Morgen, vielen Dank für den Vortrag. Meine Frage: gibt es Schnittstellen zu Inventurda.. oder Inventar-Datenbaken, wie startext HiDa, oder ähnliches? Leander: Da, also, auf speziell dieses Produkt, da kann ich keine Aussage drüber machen, aber ich glaube, IIIF ist ja ein.. eine standartisierte.. also, eigentlich nur die Beschreibung eines Schnittstellen- Standarts. Und Systeme, die damit kompatibel gemacht werden sollen, müßten eben Schnittstellen anbieten, die diesen Standart realisieren. M1: Danke. Herald: Dann machen wir weiter mit Mikrofon 1. M1: Meine Frage ist, das ist ja jetzt ein Standart. Gibt's denn alternative Standarts, die irgendwo auch verwendet werden? Weil ich mein, der große Vorteil ist ja, dass wenn das alle verwenden, diese.. dass verschiedene Institutionen das machen. Wenn jetzt aber irgendwie in Berlin die Bibliothek anfängt, einen anderen Standart umzusetzen, ist es vielleicht ein bisl schlecht, darum meine Frage: wird das irgendwie allgemein verwendet in der Bibliotheks-Szene, oder gibt's da konkurrierende Standarts? Leander: Es gibt tatsächlich einen älteren, konkurrierenden Standart, das sind.. der basiert auf XML Dateien und dort ist auch vorgesehen, dass die Daten i.d.R. als ... als komplette Bilder ausgeliefert werden, aber auf diesem technologischen Standart, diese dynamische Auslieferung auf Kachel-Basis, die Basis auf Linked Data-Technologien, ist aus mein.. nach meinem Kenntnisstand so konkurrenzlos im Moment. Herald: Wunderbar, herzlichen Dank. Gibt es sonst noch Fragen? Hat sich das Internet mittlerweile gemeldet? Noch immer nicht? Die schlafen alle noch. Haben die auch Party gemacht, so wie wir alle. lacht Gut, an den Mikrofonen steht sonst niemand mehr, dann würde ich sagen: Vielen herzlichen Dank, Leander! Leander: Danke. Applaus 34c3 Abspannmusik Untertitel erstellt von c3subtitles.de im Jahr 2018. Mach mit und hilf uns!