...Warum nicht gleich Wikidata?

Aus Mediathek des IKB

Wechseln zu: Navigation, Suche
Poster "... warum nicht gleich Wikidata?!" für DHD2017 in Bern, Datei:Poster DHD2017a.pdf

Wikidata als "Meta-Normdaten" und zentrale Referenzdatenbank für Kulturerbe-Information

Wikidata weil es...

... mit sprachunabhängigen IDs arbeitet

... als Normdatensatz fungiert (LOD, Semantic Web etc.)

... mehr Kunstwerke (Tendenz steigend) enthält als jedes andere Normdatenrepositorium (GND, CONA, RKD)

... freie Daten liefert (CC0)

... von NutzerInnen selbst erweitert werden kann!

... es nachhaltiger ist, Daten zentral zu speichern

Was fehlt?

  • Einfache Tools für Abfrage und Harvesting von Daten
  • Einfache Templates für Datenerstellung und -import
  • Applikationen wie Game-Umgebungen zum Crowd-Sourcing
  • Upload von Daten zu Bau- und Kunstwerken organisieren (=Zahl der "Normdaten"-IDs vergrößern; Zusammenarbeit mit Initiativen u./o. Organisation eigener Initiativen wie sum of all paintings)


Wer hat Kompetenz, Lust und Zeit, hier etwas voranzubringen?

Mail an georg.schelbert[at]hu-berlin.de oder eine eigene Initiative starten und bekanntgeben.

Materialien

Interview auf dem Wikimedia-Blog

Interview, erschienen am 21.8.2017, auf dem Wikimedia-Blog (deutsch/englisch)

Text zum Poster aus dem Abstractband DHd2017

Das digitale Bildformat verleiht analogen Bildsammlungen eine zweite Existenz. Insbesondere aber schafft die Verbindung des digitalen Formats mit dem Internet einen weitgehend raumunabhängigen universellen Bilderpool, der die kaum fassbare Menge der Produktion überhaupt erst sichtbar werden lässt. Die Mediathek des Instituts für Kunst- und Bildgeschichte der HU besitzt eine umfangreiche Sammlung historischer Fotografien und Diapositive, die derzeit in einem Projekt digital erschlossen wird (Förderung 1.1.-31.12.2016 durch digis - Servicestelle Digitalisierung Berlin). Diese wissenschaftliche Lehrsammlung eines traditionsreichen kunsthistorischen Universitätsinstituts, bestehend aus zwischen ca. 1890 und 1970 hergestellten Glasdias im Format 8,5 x 10cm ist auch hinsichtlich ihres Umfangs von etwa 60.000 Stück herausragend. Einerseits spiegelt die Sammlung Interessensschwerpunkte großer, an der Berliner Universität lehrender Fachgelehrter wie Heinrich Wölfflin, Adolph Goldschmidt, Wilhelm Pinder und Richard Hamann wider, andererseits repräsentiert sie den gesamten, an der Universität über Jahrzehnte hinweg geformten Kanon der Kunstgeschichte, der inzwischen auch zu allgemeinem Bildungsgut geworden ist. Damit ist diese Sammlung ein typisches Beispiel eines kunsthistorischen Bildbestandes, der sich dadurch auszeichnet, dass er vor allem Repräsentationen von Werken beinhaltet, die als solche bereits vielfach identifiziert und erschlossen sind. Aus diesem Grund besteht die Aufgabe zunächst darin, die Bilddatei mit bereits vorhandenen Wissensbeständen zu verbinden. Auch die vielen jüngeren Ansätze zum Umgang mit digitalen Bildern - Automatische Bilderkennung, Folksonomy- Tagging, Festlegung von Metadatenstandards einschließlich der Verwendung von Vokabularen und Klassifikationen, Aufbau von Normdatenrepositorien oder die Verwendung von Georeferenzen - haben gezeigt, dass diese Ansätze jeweils allein kaum befriedigende Ergebnisse liefern. Vielmehr kann der komplexen Gesamtheit des Bildes wohl nur die Verbindung mehrerer Methoden gerecht werden. Zugleich wird auch deutlich, dass weiterhin die Verbindung der Bilddateien mit (nach wie vor in Textform codierten) Inhaltskonzepten eine zentrale Aufgabe bleiben wird.

Der Beitrag wird sich auf die Frage konzentrieren, wie diese Inhaltskonzepte in möglichst pragmatischer Weise bereitgestellt werden können. Hier stellen sich Fragen der Standardisierung beziehungsweise des Einsatzes von sogenannten Normdaten. Im Bereich der sogenannten Normdaten gibt es für Kunstwerke – im Unterschied etwa zu Personen – kaum ein flächendeckendes Angebot. Es ist auch kaum anzunehmen, dass die hierfür zuständigen Institutionen – in Deutschland etwa die DNB – dem Bedarf werden ausreichend nachkommen können. Artefakte sind gegenüber Personennormdaten aufgrund ihrer Vielgestaltigkeit grundsätzlich schwerer zu handhaben und, je nach Definition, was alles als verzeichniswürdiges Kunstwerk zu verstehen ist, unter Umständen weitaus umfangreicher in der Anzahl. Auch dort wo sich einschlägige Institutionen der Aufgabe angenommen haben, bleibt das entweder auf die nationale Dimenion beschränkt (etwa mit den Datenbanken Merimee oder Joconde in Frankreich, oder dem RKD in den Niederlanden), oder droht unweigertlich unausgewogen und fragmentarisch zu bleiben (CONA – The Cultural Objects Name Authority des Getty Research Institute). Das Deutsche Dokumentatonszentrum für Kunstgeschichte, Foto Marburg, hat zwar vielfach die Bedeutung von Werknormdaten unterstrichen, jedoch bislang keinen Vorschlag für deren Bereitstellung gemacht. Nach heutigem Ermessen kann wohl auch nicht davon ausgegangen werden, dass es möglich oder sinnvoll ist, ein vollständiges Referenzrepositorium aller Bau- und Kunstwerke anzustreben. Wenn man von dieser Annahme ausgeht, dann ist es aber geradezu notwendig, dass jederzeit kurzfristig Datensätze für jeweils benötigte Kunstwerke erzeugt werden können.

Hierfür bietet sich ein Datenrepositorium an, das von der Wikipedia-Community seit 2012 parallel zur Wikipedia aufgebaut wird. Dabei ist für die folgenden Überlegungen grundlegend, dass Wikipedia-Artikel zwar in der Regel einem Wikidata-Datensatz zugeordnet sind, dass Wikidata-Datensätze jedoch auch ohne Wikipedia-Artikel existieren können und somit auch nicht den von der Wikipedia geforderten Relevanzkriterien entsprechen müssen. Auch die – im Forschungskontext oft problematischen .- Aspekte der inhaltlichen Aktualität und Gültigkeit der Wikipedia-Artikel spielt keine Roll. Wikidata beschränkt sich auf die Speicherung von atomaren Statements, die in beliebiger Zahl, in beliebiger Reihenfolge und mit der Möglichkeit der Neudefinition von Aussageparametern im Prinzip von jeder Person erstellt werden können. Dabei steht – ebenso wie in unserem Anwendungsszenario – bei Wikidata der Gedanke der Identifizierung im Vordergrund, indem möglichst viele bereits bestehende „Identifiers“ anderer Referenzrepositorien eingegeben werden. Die Tatsache der Vielzahl solcher Repositorien (die im Bibliotheksbereich mit der VIAF-Initiative zusammengefasst werden) relativiert den im Deutschen üblichen Begriff der Normdaten ebenso wie den im Englischen üblichen des Authority File. Beide Begriffe gehen von der normativen Rolle einer Nationalbibliothek bei der Ansetzung von Personennamen und Schlagwortsystematiken aus. Im Fall von Kunstwerken ist ein normativer Ansatz, der über die bloße Bezeichnung hinausgeht (und etwa Zuschreibung, Datierung, Stilzugeörigkeit etc. festlegen wollte), eher schädlich als nützlich. Vielmehr geht es um die Identifizierung der Werke und deren Verfügbarmachung für weitere Bildrepositorien und dergleichen. Diese Funktion erfüllt Wikidata, wobei die zusätzlichen inhaltlichen Statements je nach Umständen durchaus verwendet werden können.

Wikidata kann also als eine Art Meta-Referenzrepositorium fungieren, das zudem Skalierbarkeit im kollektiven Zugriff, Internationalität und Vielsprachigkeit, sowie nicht zuletzt Nachhaltigkeit durch eine große Community bietet. Zu berücksichtigen sind freilich auch die offenen Fragen, etwa danach, welche Probleme in der Benutzbarkeit der Daten sich aufgrund der unsystematischen Struktur und der grundsätzlich nicht festgelegten Entwicklungsoptionen ergeben können. Als Beispiel wird hierzu ein laufendes Digitalisierungsprojekt für die genannte historische Glasdiasammlung an der Humboldt- Universität als Poster vorgestellt, an dem die genannten Aspekte dargestellt werden können.