Die OAI (Open Archives Initiative)-Schnittstelle dient dem Städel Museum zum Datenaustausch und der Synchronisation von Metadaten. Die Daten werden regelmäßig aktualisiert und können eingesehen bzw. geharvestet werden. Enthalten sind zwei verschiedene Metadatenformate: zum einen eine sehr reduzierte Anzeige zur Identifikation der Objekte mit Dublin Core, zum anderen LIDO (Lightweight Information Describing Objects) für deskriptive Metadaten.
Die Metadaten stehen Ihnen zu der Lizenz CC0 1.0 zur Verfügung.
Sie können nun auf die OAI-Schnittstelle des Städel Museums zugreifen, bitte speichern Sie sich diesen Link für zukünftige Nutzung.
LIDO ist ein von der Arbeitsgruppe CIDOC (International Committee for Documentation) von ICOM (International Council of Museums) ausgehendes XML-basiertes Metadatenformat und Harvesting-Schema. Es soll international helfen, Museumsmetadaten in ein einheitliches Ausgabeformat zu gießen und so das Datensharing und Harvesting zu vereinheitlichen. Hier werden die Metadaten in eventbasierten Wraps sortiert.
Interessierte können sich eine detaillierte Dokumentation von LIDO anschauen, Beispieldatensätze der Sammlung mit In-line-Kommentaren herunterladen oder im Bereich „Details Metadaten“ nachschlagen. Zur Validierung des LIDO-Schemas laden Sie sich die entsprechende XSD-Datei herunter.
Um große Mengen an Daten aus der OAI zu extrahieren, muss der OAI-Nutzer einen OAI-Harvester implementieren, der sich mittels rekursiver Schleife durch die Ergebnisse crawlt.
Die OAI-Schnittstelle ist HTTP-basiert und unterstützt TLS / SSL. Sie verwendet den GET-Befehl um XML-Dokumente zu erstellen und kann per HTTP-Client angesprochen werden. Z.B.:
curl "https://sammlung.staedelmuseum.de/api/oai?verb=Identify"
Die OAI hat verschiedene Unterseiten, die mithilfe der Oberfläche angesprochen werden können. Zum Verfeinern der Ergebnisse können diese mit verschiedenen Parametern kombiniert werden.
/api/oai?verb=Identify
Allgemeine Informationen zur OAI-Schnittstelle und dem zugehörigen Repositorium, also dem Städel Museum.
/api/oai?verb=ListRecords
Listet alle in der OAI vorliegenden Datensätze auf, der zugehörige Befehl ist
verb=ListRecords
.
Zum Selektieren und Ansprechen der großen Ergebnismenge können verschiedene Parameter verwendet werden:
Der Zeitstempel from
/ until
ansprechen. Dadurch können z. B. alle Datensätze gefunden
werden, die in einem gewissen Zeitraum aktualisiert wurden. Der Zusatz
&from=2020-05-01
liefert folglich alle Ergebnisse, die nach dem 01.05.2020
aktualisiert worden sind.
Die Ergebnismenge kann ebenso mithilfe der unter ListSets genannten Parameter eingeschränkt werden.
Da auf einer Ergebnisseite immer nur 1000 Datensätze angezeigt werden, findet sich am Ende einer jeden Ergebnisseite das zugehörige resumptionToken für die nächsten 1000 Ergebnisse. Das resumptionToken wiederholt die eingegebenen Parameter und erhöht den Offset-Wert. Bsp.:
&resumptionToken={"format":"lido","from":"2020-05-01T00:00:00Z","until":"2020-05-03T17:18:41Z","offset":100,"set":"scope:major"}
Ein Harvester muss also mithilfe einer rekursiven Schleife das am Ende der
Ergebnisse befindliche resumptionToken an verb=ListRecords
anhängen, um auf
die nächste Seite zu kommen. Wenn kein resumptionToken mehr zu finden ist,
endet die Schleife.
/api/oai?verb=ListRecords&metadataPrefix=lido&until=2020-05-01
/api/oai?verb=ListRecords&metadataPrefix=lido&from=2019-12-01&until=2020-05-01
/api/oai?verb=ListRecords&resumptionToken={"format":"lido","from":"2019-08-08T09:32:15Z","until":"2019-12-16T17:18:41Z","offset":1500}
/api/oai?verb=ListRecords&metadataPrefix=lido&set=scope:major &until=2020-05-01
/api/oai?verb=ListSets
Hier finden sich alle vorliegenden Unterdatensets, die eine eingeschränkte Auswahl
an Datensätzen ausgeben. Der Parameter set
gibt an, in welchem Set die Auswahl
stattfindet.
&set=scope:major
enthält alle Hauptwerke der einzelnen Sammlungsbereiche.
&set=scope:graphics
enthält alle Werke der Graphischen Sammlung, insbesondere
des DFG-Projekts zur Erfassung der Handzeichnungen.
/api/oai?verb=ListMetadataFormats
In der Schnittstelle finden sich unterschiedliche Datenformate für die Anzeige
der Metadaten. Der Parameter metadataPrefix
bestimmt, welches Metadatenformat
ausgegeben wird.
&metadataPrefix=oai_dc
gibt eingeschränkte Daten in Dublin Core aus. Das
Format dient der Identifikation und Wiedergabe grober Metadaten.
&metadataPrefix=lido
gibt Daten in LIDO aus, hier sind alle deskriptiven
Metadaten enthalten, siehe Abschnitt „LIDO“ bzw. „Details Metadaten“.
/api/oai?verb=ListIdentifiers
Listet alle in der OAI vorhandenen Identifier auf und ermöglicht so das Harvesten der IDs des gesamten Bestandes. Auch für die IDs kann das resumptionToken relevant werden, um alle Ergebnisse harvesten zu können. Mehr Informationen zu dem Parameter finden sich unter „ListRecords“.
/api/oai?verb=GetRecord
Zuletzt gibt es die Möglichkeit, einen spezifischen Datensatz direkt anzusprechen,
und zwar mithilfe des Parameters &verb=GetRecord
. Hierfür muss hinter das
metadataPrefix der OAI-Identifier des Objektes angeschlossen werden, also z. B.
&identifier=oai%3ADE-MUS-048017%3A1694&
Doppelpunkte im Identifier werden in der URL durch %3A
ersetzt.
/api/oai?verb=GetRecord&metadataPrefix=lido&identifier=oai%3ADE-MUS-048017%3A2442
Der OAI-Identifier identifiziert jedes Objekt mithilfe der ISIL-Nummer des Städel Museums DE-MUS-048017 und der Objektnummer des einzelnen Kunstwerkes. Somit wird ein international eindeutiger Identifikator für jedes Objekt geschaffen, z. B. „DE-MUS-048017:2442“.
Dieser Identifikator findet sich erstens im Header jedes Objektes als
<identifier>
, zweitens in der <lido:lidoRecID>
und drittens in der
<lido:objectPublishedID>
.
Der <datestamp>
eines Objektes gibt an, wann es das letzte Mal aktualisiert
wurde. So können z. B. alle Datensätze gefunden und geharvestet werden, die
seit der letzten Extrahierung geändert wurden (siehe Parameter von ListRecords
im Abschnitt „OAI-Harvester“).
Die Objektnummer des Objektes bildet den eindeutigen Identifikator des Objektes
im Städel. Sie findet sich in der <lido:workID lido:type="Objekt ID">
und
ist ein Bestandteil des OAI-Identifiers.
Einige Sammlungswerke haben eine von der Objektnummer abweichende
Inventarnummer (die auf die Inventarisierung der Bestände zurückgeht). Diese
Nummer bildet keinen eindeutigen Identifikator des Werkes im Haus, sondern
lediglich innerhalb eines Sammlungsbestandes. Sie findet sich in
<lido:workID lido:type="Inventarnummer">
.
Der Permalink zu einem Objekt in der Digitalen Sammlung des Städel Museums
findet sich in der <lido:objectWebResource>
des <lido:relatedWorksWrap>
.
Dieser besteht immer aus http://www.staedelmuseum.de/go/ds/ und der
Objektnummer des Werks (ohne Leerzeichen oder Punkte).
Die Abbildung zum Datensatz findet sich in der <lido:linkResource>
innerhalb des <lido:resourceWrap>
. Sie steht zur Lizenz
CC BY-SA 4.0
zur Verfügung. Bitte kennzeichnen Sie das Bild mit folgender Angabe
„CC BY-SA 4.0
Städel Museum, Frankfurt am Main“.
Zur bestmöglichen Einbindung und Nachnutzung sind die Abbildungen vor dem Alphakanal freigestellt oder im Fall der Graphischen Sammlung rechteckig im Bereich der Unterlage beschnitten.
Die Metadaten liegen in deutscher und englischer Sprache vor, diese können
anhand der Marker xml:lang="de"
und xml:lang="en"
separat genutzt werden.
LIDO Daten sind in Events gegliedert. <lido:eventSet>
haben verschiedene
<lido:eventType>
, die angeben, zu welchem Bereich die nachfolgenden
Informationen gehören.
Das <lido:eventSet>
mit <lido:eventType>
„Work conception“
liefert Informationen über die Entstehung eines Objektes.
Im <lido:eventSet>
mit <lido:eventType>
„Acquisition“ finden sich
Informationen über den Erwerb des Objektes.
Im <lido:eventSet>
mit <lido:eventType>
„Designing“ finden sich
Informationen über die Erfindung des Motivs (falls es sich um eine
Kopie/Nachahmung handelt oder z. B. eine Vorzeichnung existiert).
Elemente, die mit <lido:display…>
beginnen, vereinen Inhalte aus mehreren
Einzelfeldern, die zur besseren Anzeige zusammengeführt wurden. Für die
korrekten, in den Normdaten angegebenen Informationen, nutzen Sie bitte die
einzelnen Felder.
Einige Objekte weisen mehrere Künstler auf, das können Kollaborationen von
Künstlern sein, aber auch ehemalige Zuschreibungen des Objektes, die nicht
mehr gültig sind. Es ist also auf den <lido:attributionQualifierActor>
zu
achten, sobald mehrere <lido:eventActor>
existieren.
Um die Metadaten zu vereinheitlichen (dies betrifft insbesondere Personennamen,
Geografika und sonstige Schlagwörter) wurden sie vielerorts mit Links zur GND
(Gemeinsame Normdatei)
der DNB (Deutsche Nationalbibliothek) versehen. Diese sind an der
lido:source="http://d-nb.info/
zu erkennen und geben nachfolgend den Link
zum entsprechenden Eintrag in der Normdatei an.
Die Schlagworte der Digitalen Sammlung finden sich im <lido:objectRelationWrap>
und lassen sich in folgende Kategorien unterteilen:
Das <lido:subjectConcept>
mit der <lido:conceptID>
„Motivgattung“ gibt
einen gattungsähnlichen Begriff an und bildet die oberste Kategorie, in welche
ein Werk eingeordnet wird.
Der nächste Schritt ist das <lido:subjectConcept>
mit der <lido:conceptID>
„Motiv“, das verschiedene allgemeine Motive des Objektes angibt.
Im <lido:subjectConcept>
mit der <lido:conceptID>
„Bildelement“ finden
sich bis ins Detail alle auf dem Objekt dargestellten Elemente.
Bei <lido:subjectConcept>
mit einer <lido:conceptID>
mit der Angabe
„http://iconclass.org/[...]“ handelt es sich um einen Begriff der Iconclass.
Die Iconclass ist ein Klassifizierungssystem zur
inhaltlichen Erschließung und Erfassung von Bildinhalten. Hier werden ganze
Objektgattungen in einer ID zusammengefasst. Dabei steht die IconclassID
„25I1“ mit der Verlinkung http://iconclass.org/25I1 beispielsweise für
Stadtansichten.
In <lido:subjectActor>
finden sich auf dem Objekt dargestellte Personen
(z. B. biblische Personen).
Bei mehrteiligen Werken (z. B. Altäre, Serien, Reihen) verweisen die jeweiligen
Einzeldatensätze auf einen Dachdatensatz und umgekehrt. Diese Relationen finden
sich unter <lido:relatedWorksWrap>
. Dort wird zu jedem einzelnen Werk
<lido:relatedWork>
sowohl der Permalink der Digitalen Sammlung
<lido:objectWebResource>
als auch seine <lido:objectID>
angezeigt. In
<lido:relatedWorkRelType>
wird die Art der Relation beschrieben, z. B.
„Altar“, „Flügel Innenseite“, „Rückseite“ etc.