Nach oben

Willkommen in der OAI-Schnittstelle des Städel Museums!

Die OAI (Open Archives Initiative)-Schnittstelle dient dem Städel Museum zum Datenaustausch und der Synchronisation von Metadaten. Die Daten werden regelmäßig aktualisiert und können eingesehen bzw. geharvestet werden. Enthalten sind zwei verschiedene Metadatenformate: zum einen eine sehr reduzierte Anzeige zur Identifikation der Objekte mit Dublin Core, zum anderen LIDO (Lightweight Information Describing Objects) für deskriptive Metadaten.

Die Metadaten stehen Ihnen zu der Lizenz CC0 1.0 zur Verfügung.

Sie können nun auf die OAI-Schnittstelle des Städel Museums zugreifen, bitte speichern Sie sich diesen Link für zukünftige Nutzung.

OAI des Städel Museums

Was ist LIDO?

LIDO ist ein von der Arbeitsgruppe CIDOC (International Committee for Documentation) von ICOM (International Council of Museums) ausgehendes XML-basiertes Metadatenformat und Harvesting-Schema. Es soll international helfen, Museumsmetadaten in ein einheitliches Ausgabeformat zu gießen und so das Datensharing und Harvesting zu vereinheitlichen. Hier werden die Metadaten in eventbasierten Wraps sortiert.

Interessierte können sich eine detaillierte Dokumentation von LIDO anschauen, Beispieldatensätze der Sammlung mit In-line-Kommentaren herunterladen oder im Bereich „Details Metadaten“ nachschlagen. Zur Validierung des LIDO-Schemas laden Sie sich die entsprechende XSD-Datei herunter.

OAI-Harvester: Funktionen und Parameter

Um große Mengen an Daten aus der OAI zu extrahieren, muss der OAI-Nutzer einen OAI-Harvester implementieren, der sich mittels rekursiver Schleife durch die Ergebnisse crawlt.

Die OAI-Schnittstelle ist HTTP-basiert und unterstützt TLS / SSL. Sie verwendet den GET-Befehl um XML-Dokumente zu erstellen und kann per HTTP-Client angesprochen werden. Z.B.:

curl "https://sammlung.staedelmuseum.de/api/oai?verb=Identify"

Die OAI hat verschiedene Unterseiten, die mithilfe der Oberfläche angesprochen werden können. Zum Verfeinern der Ergebnisse können diese mit verschiedenen Parametern kombiniert werden.

 

Alle Seiten und Parameter im Überblick

Identify

/api/oai?verb=Identify

Allgemeine Informationen zur OAI-Schnittstelle und dem zugehörigen Repositorium, also dem Städel Museum.

ListRecords

/api/oai?verb=ListRecords

Listet alle in der OAI vorliegenden Datensätze auf, der zugehörige Befehl ist verb=ListRecords.

Zum Selektieren und Ansprechen der großen Ergebnismenge können verschiedene Parameter verwendet werden:

  • Der Zeitstempel (siehe Abschnitt „Details Metadaten“) lässt sich mittels from / until ansprechen. Dadurch können z. B. alle Datensätze gefunden werden, die in einem gewissen Zeitraum aktualisiert wurden. Der Zusatz &from=2020-05-01 liefert folglich alle Ergebnisse, die nach dem 01.05.2020 aktualisiert worden sind.

  • Die Ergebnismenge kann ebenso mithilfe der unter ListSets genannten Parameter eingeschränkt werden.

  • Da auf einer Ergebnisseite immer nur 1000 Datensätze angezeigt werden, findet sich am Ende einer jeden Ergebnisseite das zugehörige resumptionToken für die nächsten 1000 Ergebnisse. Das resumptionToken wiederholt die eingegebenen Parameter und erhöht den Offset-Wert. Bsp.:

    &resumptionToken={"format":"lido","from":"2020-05-01T00:00:00Z","until":"2020-05-03T17:18:41Z","offset":100,"set":"scope:major"}
    

    Ein Harvester muss also mithilfe einer rekursiven Schleife das am Ende der Ergebnisse befindliche resumptionToken an verb=ListRecords anhängen, um auf die nächste Seite zu kommen. Wenn kein resumptionToken mehr zu finden ist, endet die Schleife.

Beispielhafte Anfragen:

/api/oai?verb=ListRecords&metadataPrefix=lido&until=2020-05-01
/api/oai?verb=ListRecords&metadataPrefix=lido&from=2019-12-01&until=2020-05-01
/api/oai?verb=ListRecords&resumptionToken={"format":"lido","from":"2019-08-08T09:32:15Z","until":"2019-12-16T17:18:41Z","offset":1500}
/api/oai?verb=ListRecords&metadataPrefix=lido&set=scope:major &until=2020-05-01

ListSets

/api/oai?verb=ListSets

Hier finden sich alle vorliegenden Unterdatensets, die eine eingeschränkte Auswahl an Datensätzen ausgeben. Der Parameter set gibt an, in welchem Set die Auswahl stattfindet.

  • &set=scope:major enthält alle Hauptwerke der einzelnen Sammlungsbereiche.

  • &set=scope:graphics enthält alle Werke der Graphischen Sammlung, insbesondere des DFG-Projekts zur Erfassung der Handzeichnungen.

ListMetadataFormats

/api/oai?verb=ListMetadataFormats

In der Schnittstelle finden sich unterschiedliche Datenformate für die Anzeige der Metadaten. Der Parameter metadataPrefix bestimmt, welches Metadatenformat ausgegeben wird.

  • &metadataPrefix=oai_dc gibt eingeschränkte Daten in Dublin Core aus. Das Format dient der Identifikation und Wiedergabe grober Metadaten.

  • &metadataPrefix=lido gibt Daten in LIDO aus, hier sind alle deskriptiven Metadaten enthalten, siehe Abschnitt „LIDO“ bzw. „Details Metadaten“.

ListIdentifiers

/api/oai?verb=ListIdentifiers

Listet alle in der OAI vorhandenen Identifier auf und ermöglicht so das Harvesten der IDs des gesamten Bestandes. Auch für die IDs kann das resumptionToken relevant werden, um alle Ergebnisse harvesten zu können. Mehr Informationen zu dem Parameter finden sich unter „ListRecords“.

GetRecord

/api/oai?verb=GetRecord

Zuletzt gibt es die Möglichkeit, einen spezifischen Datensatz direkt anzusprechen, und zwar mithilfe des Parameters &verb=GetRecord. Hierfür muss hinter das metadataPrefix der OAI-Identifier des Objektes angeschlossen werden, also z. B. &identifier=oai%3ADE-MUS-048017%3A1694&

Doppelpunkte im Identifier werden in der URL durch %3A ersetzt.

Beispielhafte Anfragen:

/api/oai?verb=GetRecord&metadataPrefix=lido&identifier=oai%3ADE-MUS-048017%3A2442

Details und Besonderheiten der Metadaten

  • Der OAI-Identifier identifiziert jedes Objekt mithilfe der ISIL-Nummer des Städel Museums DE-MUS-048017 und der Objektnummer des einzelnen Kunstwerkes. Somit wird ein international eindeutiger Identifikator für jedes Objekt geschaffen, z. B. „DE-MUS-048017:2442“.

    Dieser Identifikator findet sich erstens im Header jedes Objektes als <identifier>, zweitens in der <lido:lidoRecID> und drittens in der <lido:objectPublishedID>.

  • Der <datestamp> eines Objektes gibt an, wann es das letzte Mal aktualisiert wurde. So können z. B. alle Datensätze gefunden und geharvestet werden, die seit der letzten Extrahierung geändert wurden (siehe Parameter von ListRecords im Abschnitt „OAI-Harvester“).

  • Die Objektnummer des Objektes bildet den eindeutigen Identifikator des Objektes im Städel. Sie findet sich in der <lido:workID lido:type="Objekt ID"> und ist ein Bestandteil des OAI-Identifiers.

  • Einige Sammlungswerke haben eine von der Objektnummer abweichende Inventarnummer (die auf die Inventarisierung der Bestände zurückgeht). Diese Nummer bildet keinen eindeutigen Identifikator des Werkes im Haus, sondern lediglich innerhalb eines Sammlungsbestandes. Sie findet sich in <lido:workID lido:type="Inventarnummer">.

  • Der Permalink zu einem Objekt in der Digitalen Sammlung des Städel Museums findet sich in der <lido:objectWebResource> des <lido:relatedWorksWrap>. Dieser besteht immer aus https://www.staedelmuseum.de/go/ds/ und der Objektnummer des Werks (ohne Leerzeichen oder Punkte).

  • Die Abbildung zum Datensatz findet sich in der <lido:linkResource> innerhalb des <lido:resourceWrap>. Sie steht zur Lizenz CC BY-SA 4.0 zur Verfügung. Bitte kennzeichnen Sie das Bild mit folgender Angabe „CC BY-SA 4.0 Städel Museum, Frankfurt am Main“.

  • Zur bestmöglichen Einbindung und Nachnutzung sind die Abbildungen vor dem Alphakanal freigestellt oder im Fall der Graphischen Sammlung rechteckig im Bereich der Unterlage beschnitten.

  • Die Metadaten liegen in deutscher und englischer Sprache vor, diese können anhand der Marker xml:lang="de" und xml:lang="en" separat genutzt werden.

  • LIDO Daten sind in Events gegliedert. <lido:eventSet> haben verschiedene <lido:eventType>, die angeben, zu welchem Bereich die nachfolgenden Informationen gehören.

    • Das <lido:eventSet> mit <lido:eventType> „Work conception“ liefert Informationen über die Entstehung eines Objektes.

    • Im <lido:eventSet> mit <lido:eventType> „Acquisition“ finden sich Informationen über den Erwerb des Objektes.

    • Im <lido:eventSet> mit <lido:eventType> „Designing“ finden sich Informationen über die Erfindung des Motivs (falls es sich um eine Kopie/Nachahmung handelt oder z. B. eine Vorzeichnung existiert).

  • Elemente, die mit <lido:display…> beginnen, vereinen Inhalte aus mehreren Einzelfeldern, die zur besseren Anzeige zusammengeführt wurden. Für die korrekten, in den Normdaten angegebenen Informationen, nutzen Sie bitte die einzelnen Felder.

  • Einige Objekte weisen mehrere Künstler auf, das können Kollaborationen von Künstlern sein, aber auch ehemalige Zuschreibungen des Objektes, die nicht mehr gültig sind. Es ist also auf den <lido:attributionQualifierActor> zu achten, sobald mehrere <lido:eventActor> existieren.

  • Um die Metadaten zu vereinheitlichen (dies betrifft insbesondere Personennamen, Geografika und sonstige Schlagwörter) wurden sie vielerorts mit Links zur GND (Gemeinsame Normdatei) der DNB (Deutsche Nationalbibliothek) versehen. Diese sind an der lido:source="https://d-nb.info/ zu erkennen und geben nachfolgend den Link zum entsprechenden Eintrag in der Normdatei an.

  • Die Schlagworte der Digitalen Sammlung finden sich im <lido:objectRelationWrap> und lassen sich in folgende Kategorien unterteilen:

    • Das <lido:subjectConcept> mit der <lido:conceptID> „Motivgattung“ gibt einen gattungsähnlichen Begriff an und bildet die oberste Kategorie, in welche ein Werk eingeordnet wird.

    • Der nächste Schritt ist das <lido:subjectConcept> mit der <lido:conceptID> „Motiv“, das verschiedene allgemeine Motive des Objektes angibt.

    • Im <lido:subjectConcept> mit der <lido:conceptID> „Bildelement“ finden sich bis ins Detail alle auf dem Objekt dargestellten Elemente.

    • Bei <lido:subjectConcept> mit einer <lido:conceptID> mit der Angabe „https://iconclass.org/[...]“ handelt es sich um einen Begriff der Iconclass. Die Iconclass ist ein Klassifizierungssystem zur inhaltlichen Erschließung und Erfassung von Bildinhalten. Hier werden ganze Objektgattungen in einer ID zusammengefasst. Dabei steht die IconclassID „25I1“ mit der Verlinkung https://iconclass.org/25I1 beispielsweise für Stadtansichten.

    • In <lido:subjectActor> finden sich auf dem Objekt dargestellte Personen (z. B. biblische Personen).

  • Bei mehrteiligen Werken (z. B. Altäre, Serien, Reihen) verweisen die jeweiligen Einzeldatensätze auf einen Dachdatensatz und umgekehrt. Diese Relationen finden sich unter <lido:relatedWorksWrap>. Dort wird zu jedem einzelnen Werk <lido:relatedWork> sowohl der Permalink der Digitalen Sammlung <lido:objectWebResource> als auch seine <lido:objectID> angezeigt. In <lido:relatedWorkRelType> wird die Art der Relation beschrieben, z. B. „Altar“, „Flügel Innenseite“, „Rückseite“ etc.