Content area
Semantic Web ist mittlerweile kein neuer Begriff in der Bibliothekswelt. Er bezeichnet die dritte Stufe in der Entwicklung des World Wide Web - man bezeichnet es auch als Web von Daten (im Gegensatz zum Web von Dokumenten - Web "1.0" und dem sozialen Web - Web "2.0").1 Im Semantic Web geht es darum, die Bedeutung von Information für Computer "verstehbar", verwertbar zu machen. Informationen sollen für Maschinen interpretierbar und automatisch weiter verarbeitbar aufbereitet werden. Semantisch bezieht sich h ier also n icht auf das "Verstehen" im Sinne des menschlichen Verstandes.
Die allgemeine Definition des Semantic Web liest sich so: "The Semantic Web is about two things. It is about common formats for integration and combination of data drawn from diverse sources, where on the original Web mainly concentrated on the interchange of documents. It is also about language for recording how the data relates to real world objects. That allows a person, or a machine, to start off in one database, and then move through an unending set of databases which are connected not by wires but by being about the same thing.ccl
"The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries. It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners. It is based on the Resource Description Framework (RDF)."2"
Eine wahrscheinlich bessere Bezeichnung für das Semantic Web ist Linked Data, weil sie wesentlich klarer ausdrückt, worum es dabei geht - nämlich einen Wechsel von einem Dokumentenzentrierten zu einem Datenzentrierten Web. Linked Data ist der Versuch, beliebige Daten in definierten Formaten zu veröffentlichen und für die Weiterverarbeitung zur Verfügung zu stellen.4 Im Falle der Bibliotheken geht es darum, Katalogdaten ebenso wie die Daten aus den diversen Normdateien aufzubereiten und in der sogenannten Linked Data Cloud verfügbar zu machen. Einige Bibliotheken (im deutschsprachigen Bereich z.B. die UB Mannheim, das HBZ und erst kürzlich die Bayrische Staatsbibliothek; im englischsprachigen Bereich die British Library und im französischen Sprachraum vor allem die Bibliothèque nationale de France) haben diesen Schritt bereits getan. Bei den Normdaten gibt es Veröffentlichungen der Library of Congress mit ihren authority files und durch die Deutsche Nationalbibliothek, die derzeit ganz aktuell die neue Gemeinsame Normdatei (GND) als Linked Data aufbereitet5 und demnächst veröffentlichen wird.
Interessant werden diese Konzepte für die Bibliothekswelt auch im Zusammenhang mit den Veränderungen, die derzeit im Bereich der bibliothekarischen Regelwerke (Stichwort: RDA), im Zusammenhang mit FRBR6 und im Rahmen von Überlegungen zu einem "Nachfolgeformat" für MARC stattfinden. Im Zentrum der Überlegungen steht die Kritik am Konzept des record-definierten Formates (MARC, MAB): "My message here is that we need to be creating data, not records, and that we need to create the data first, then build records with it for those applications where records are needed."7
Gradmann nennt ebenfalls 6 "gute" Gründe,8 warum das Bibliothekswesen sich mit dem Semantic Web beschäftigen sollte:
1. weil es sonst andere tun
2. um nicht im unguten Sinne museal zu werden
3. weil zumindest Bibliotheken nach Einführung von RDA gar nicht mehr anders können!
4. weil Kultureinrichtungen auf Basis des Semantic Web ihren Benutzern attraktive und neuartige Funktionen anbieten können
5. weil sie einen spezifischen Beitrag zum Semantic Web leisten können
6. damit sie auch in Zukunft überhaupt noch wahr- und ernstgenommen werden, und zwar als Teile von ,Wissensarchitekturen'
Bereits zum dritten Mal fand Ende November die Konferenz Semantic Web in Bibliotheken (SWIB) - dieses Mal in Hamburg - statt.
Die Konferenz 2011 selbst bot erstmals am ersten Tag die Möglichkeit, an Workshops teilzunehmen. Deren Themen reichten von einem Einführungsworkshop für Newcomer bis zu hochspezialiserten Workshops (etwa: An Introduction to Memento and Open Annotation als spezieller Anwendungsfall von Linked Data). Die beiden darauffolgenden Konferenztage waren dicht gepackt mit Vorträgen, die einen intensiven Einblick in Aktivitäten im Bereich von Linked Data und dem Semantic Web gaben.
Am ersten Vortragstag selbst standen Referate im Mittelpunkt, die sich mit allgemeinen Aspekten von Linked Data beschäftigten bzw. einige mögliche konkrete Anwendungen von Bibliotheksdaten in der Linked Data Cloud beschäftigten. Herausgreifen möchte ich den Vortrag von Magnus Pfeffer (Hochschule der Medien Stuttgart) zum Thema Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen und jenen von Markus Geipel (Deutsche Nationalbibliothek) und Adrian Pohl (HBZ)zu dem Projekt culturegraph.org - Aufbau eines Hubs für Linked Library Data.
Magnus Pfeffer untersucht in einem längeren Projekt mögliche Anwendungsfälle für Ausleihedaten aus Bibliothekssystemen als Linked Data. Vorgestellt wurde im Vortrag der statistische Vergleich von Bibliotheken.
Culturegraph.org ist ein Linked-Open-Data-Service, dessen Zielsetzung die einheitliche, verlässliche und persistente Referenzierbarkeit von kulturellen Erzeugnissen ist. Der Dienst wird derzeit in Kooperation zwischen der Deutschen Nationalbibliothek und dem H BZ entwickelt. Als offene Dienstplattform soll Culturegraph.org die Möglichkeit bieten, Metadaten abzugleichen und Äquivalenzen zu berechnen. Die Ergebnisse werden frei verfügbar nach den Linked-Open-Data Standards angeboten. In weiteren Ausbaustufen sollen Normdaten hinzukommen und mit weiteren für Kultureinrichtungen relevanten Datenquellen verknüpft werden.
Im Mittelpunkt der Vorträge des zweiten Konferenztages stand das wissenschaftliche Publikationswesen (v.a. natürlich das System der wissenschaftlichen Fachjournale). Auch hierfür sollen zwei Vorträge (der erste und der letzte des Tages) paradigmatisch hervorgehoben werden. In seinem Eröffnungsvortrag Tipping the Sacred Cow: Thinking Beyond the Journal System sprach Herbert van de Sompel (Los Alamos) darüber, wie sehr das System der wissenschaftlichen Publikationen selbst ein Jahrzehnt nach dem Entstehen von E-Journals weiterhin auf den Publikationsmechnismen der Printzeitschriften beruht. Dennoch sind nunmehrZeichen zu erkennen, dass semantische Technologien eine immer wichtigere Rolle zu spielen beginnen. Beispiele für solche Anwendungen sind derzeit noch weitgehend experimentell und ihre Verbreitung wird sicherlich noch einige Jahre dauern; dennoch sind erste Ergebnisse schon auszumachen.
Ein ähnliches Thema behandelte Björn Brembs (Berlin) in seinem Vortrag What needs to happen in a scholarly publishing reform? Auch sein Ausgangspunkt war das weitgehend unveränderte Publikationssystem der Fachzeitschriften, das er als defekt bezeichnete. Defekt in mehreren Hinsichten: angefangen von den einfachen Funktionalitäten über Fragen der Zugänglichkeit bis zu Kosten/Nutzen-Abschätzungen. Brembs fragte in seinem Vortrag, welche Möglichkeiten hin zu einem modernen, den Ansprüchen der Wissenschaftler entsprechenden, IT-basierten Entwicklung es gäbe. Er brach eine Lanze für Open Access aus Sicht eines Naturwissenschaftlers und meinte, dass die (Universitäts-)Bibliotheken eine entscheidende Rolle bei der Änderung des Publikationswesens spielen könnten: "Creating a world-wide, peer-reviewed, open access, federated digital library of science is exactly the kind of task any modern university library should dream of taking part in. This digital utopia is exactly what scientists today are in desperate need of and libraries would be able to del iver."
Die Konferenz war inhaltl ich intensiv, m it sehr vielen H ighl ights bei den Vorträgen und insgesamt gesehen ein lohnender "Ausflug" in die Welt des Semantic Webs. Klar wurde dabei aber auch, wie weit die Bibliotheken in Österreich noch von einer intensiveren Beschäftigung mit dem Thema entfernt sind! Es gibt nur wenige Arbeiten aus Österreich, die sich mit diesem Thema in einer auf die Bibliothekswelt bezogenen Art beschäftigen. Erwähnenswert ist in diesem Zusammenhang ist die Arbeit von Ulrike Krabo, einer ehemaligen Mitarbeiterin derOBVSG.
Dennoch wird sich auch hier demnächst etwas tun. Eine geplante Arbeitsgruppe an derOBVSG wird sich mit dem Thema Linked Data beschäftigen. Ihre erste Aufgabe wird es wohl sein, ein strategisches Konzept zu entwickeln, wie das Thema an den österreichischen Bibliotheken etabliert werden kann und welche konkreten Schritte zu planen sein werden.
1 Zur Problematik dieser Bezeichnungen siehe auch Stefan Gradmann, Warum sollten sich kulturelle Einrichtungen mit dem Semantic Web beschäftigen? http://www.swib09.de/vortraege/20091124 gradmann.pdf
2 http://www.w3.org/2001/sw/
3 Ebd.
4 Adrian Pohl und Felix Ostrowski (2010): ,Linked Data' - und warum wir uns im hbz-Verbund damit beschäftigen. Preprint. Erschienen in B.I.T. Online, 13/3, S. 259-268. - http://www.hbz-nrw.de/dokumentencenter/ produkte/lod/aktuell
5 Alexander Hafner: Die CND und ihr Wegin das Semantic Web - http://www. slideshare.net/ah641054/die-gnd-und-ihr-weg-in-das-semantic-web
6 Siehe dazu auch Verena Schaffner: FRBR in MAB2 und Primo - ein kafkaesker Prozess? Möglichkeiten der FRBRisierung von MAB2-Datensätzen in Primo, exemplarisch dargestellt an Datensätzen zu Franz Kafkas "Der Process", 2011 -http://hdl.handle.net/10760/16193
7 Karen Coyle: Bibliographie Framework: RDFand Linked Data - http://kcovle. blogspot.com/2012/01 /bibliographic-framework-rdf-and-linked. html
8 Siehe Anm. 1.
9 Ulrike Krabo, Consuming Library Linked Data: ein Prototyp einer Linked Data Webapplikation, 2011 - http://hdl.handle.net/10760/15991
Dr. Wolfram Seidler
Universitätsbibliothek Wien - ubw:innovation
A-1010 Wien, Dr. Karl Lueger Ring 1
E-Mail: [email protected]
Copyright Vereinigung Oesterreichischer Bibliothekarinnen und Bibliothekare (VÖB) Jun 2012