AutorInnen: Tobias Chromy, Bernhard Hampel-Waffenthal, Diana Lambert
Zu den Hauptaufgaben von » Ariadne, der Frauen- und Genderabteilung der Österreichischen Nationalbibliothek, gehört das inhaltliche Erschließen jener Literatur, die im weitesten Sinne für das Feld der Frauen- und Geschlechterforschung relevant ist.[1] Im Fokus steht dabei die unselbstständige sowie graue Literatur, deren Inhalte durch die Verwendung eines eigenen frauen- und genderspezifischen Schlagwortvokabulars sichtbar und zugänglich gemacht werden. Was an dieser Stelle als bibliothekarische Praxis selbstverständlich klingt, basiert tatsächlich auf einer relativ jungen Errungenschaft, deren Geschichte eng mit Ariadne selbst verbunden ist.
Der SAR-Index
Als Ariadne 1992 ihre Arbeit aufnahm, waren die etablierten Dokumentationssprachen im Bibliothekswesen durch eine androzentristische Perspektive gekennzeichnet. Innerhalb der herkömmlichen Systeme fehlte es an Möglichkeiten, Objekte frauen- und geschlechtergerecht beziehungsweise fachspezifisch zu erschließen.
Bereits Ende der 1970er-Jahre brachte die Auseinandersetzung mit dieser Problematik in den USA die ersten Frauenthesauri hervor; der erste deutschsprachige Frauenthesaurus, der Feministische Thesaurus[2], wurde dann 1994 von Alice Schwarzer und Ursula Scheu vom » FrauenMediaTurm in Köln vorgelegt. Als Mitglied der Vernetzungsinitiative » frida war Ariadne an der kooperativen Erarbeitung eines österreichspezifischen Frauenthesaurus, thesaurA[3], beteiligt, der nur zwei Jahre später veröffentlicht wurde. Dieser wurde jedoch nicht mehr kooperativ, sondern von den einzelnen Mitgliedern in ihren jeweiligen lokalen Systemen entsprechend weiterentwickelt.
Ariadne baute auf dieser Grundlage kontinuierlich ihr eigenes Vokabular auf: den Schlagwort-Index Ariadne (SAR-Index). Dieser zählt aktuell knapp 16.000 Eintragungen, davon gut 6.000 Personen, über 250 Körperschaften und mehr als 9.000 Sachschlagwörter. Letztere weisen hierarchische, äquivalente und assoziative Relationen sowie fast 7.500 fremdsprachige Begriffe auf und stellen damit ein thesaurisches Begriffsnetz dar.
SAR goes GND?
Seit der Umstellung der Österreichischen Nationalbibliothek auf das Bibliothekssystem Alma im Januar 2018 steht der SAR-Index nur mehr als statisches, nicht integrierbares Referenzwerkzeug für Ariadne auf einer ÖNB-internen Website zur Verfügung. Da seitdem die Einführung neuer Deskriptoren in den SAR-Index nicht mehr möglich ist, besteht das Bedürfnis einer Überführung in aktiv verwaltete Systeme. Hier setzt das Projekt SAR goes GND an. Ziel ist dabei die Untersuchung einer Überführung des SAR-Index in die GND, sowohl hinsichtlich der technischen Möglichkeiten als auch in Hinblick auf theoretisch-inhaltliche Konsequenzen für die Arbeit von Ariadne.
Bereits nach der ersten Sichtung der Daten des SAR-Index wurde die Notwendigkeit offenkundig, die enthaltenen Normdatensätze für die weitere Bearbeitung in zwei Gruppen aufzuteilen. Personen- und Körperschaftsdatensätze wurden hierbei der Gruppe der "eindeutig" definierbaren Schlagwörter zugeordnet, da sie eindeutige Identifizierungscharakteristika besitzen, wie etwa einen Namen, ein Geburts- oder Gründungsjahr. Die Sachschlagwörter als zweite Gruppe gestalten sich hingegen mehr- bzw. vieldeutig, da der jeweilige Sachbegriff nicht nur als einzelnes Wort inhaltlich definiert wird, sondern durch seine Beziehungen zu anderen Sachbegriffen in ein komplexes Bedeutungsnetz eingebunden ist.
Die qualitativen Implikationen einer Überführung letzterer Gruppe erforderten demgemäß eine Untersuchung, die diese Aspekte berücksichtigt. Es wurden acht beispielhafte Sachschlagwörter ausgewählt, die nicht in der GND vorkommen, um die Bedeutungsverschiebung greifbar zu machen, die sich aus der Auflösung der Deskriptoren des SAR-Index in jene der GND ergeben würde. Hierbei wurde ein vierteiliges Schema angewendet, das eigens dafür konzipiert wurde. Dieses Schema lässt sich am Beispiel des Sachbegriffs Androzentrismus veranschaulichen[4]:
Abb. 1: Normdatensatz Androzentrismus im SAR-Index
Zunächst liefert eine wissenschaftlich Definition des Begriffs eine Diskussionsgrundlage. Androzentrismus als Konzept beschreibt dabei „die Männerzentriertheit gesellschaftlicher Strukturen“[5], wobei die männliche Erfahrungswelt gesellschaftlich als Norm gesetzt ist, das Weibliche folglich lediglich als Abweichung dieser Norm erfahrbar ist.
In einem zweiten Schritt wurde die Relevanz des Begriffs sowohl als fachspezifisches Schlagwort anhand des » META-Katalogs sowie als wissenschaftlicher Begriff anhand ausgewählter Referenzliteratur[6] dokumentiert.
Ausgehend hiervon wurde die Ansetzung des Begriffs im SAR-Index zunächst mit zwei anderen feministischen Thesauri, dem » Women's Thesaurus des » Atria Institute on gender equality and women's history (NL) sowie dem » FrauenMediaThesaurus des FrauenMediaTurm in Köln (DE) verglichen. Aus dem Vokabular der GND wurden ähnliche Begriffe herangezogen, in welche der untersuchte Deskriptor „aufgelöst“ werden müsste. In Fall des Androzentrismus wären das: Patriarchat, Männlichkeitskult, Frauenfeindlichkeit und Sexismus[7]. Dies sind Begriffe, die in der Ansetzung von Androzentrismus im SAR-Index als assoziierte Begriffe definiert sind. Ebenfalls wurde die GND-Systematik der Deskriptoren sowie definierte Verweise berücksichtigt.
Eine abschließende Untersuchung ergab, dass die GND keine adäquaten Sachbegriffe aufweist, die sich sinngemäß mit der Definition oder der Ansetzung in den untersuchten frauen- und genderspezifischen Thesauri decken. Eine Überführung würde also zu einer Reduzierung der Sichtbarkeit von Objekten führen, die mit dem Sachschlagwort Androzentrismus zu fassen wären.[8]
Während die Untersuchung der Sachschlagwörter die sich ergebenden Bedeutungsverschiebungen einer Überführung problematisiert, kann in Bezug auf die Personen- und Körperschaftsschlagwörter von einer relativ komplikationsfreien Übertragung der Datensätze in die GND ausgegangen werden. Folglich stand die Untersuchung der technischen und praktischen Möglichkeiten zur Überführung dieser Gruppe im Fokus, konkret das automationsunterstützte Matching der Datensätze. Für diese Zwecke wurde früh » OpenRefine als geeignetes Werkzeug bestimmt; um damit arbeiten zu können, mussten die Daten jedoch erst noch aufbereitet werden.
Der SAR-Index selbst liegt im » Aleph-Sequential-Format (ASEQ) vor. Um die für ein Matching relevanten Felder und Daten extrahieren zu können, war eine mehrstufige Bearbeitung nötig. Diese bestand in einem ersten Schritt aus einer möglichst verlustfreien Konvertierung von ASEQ nach (newline-delimited) » JSON, um in einem weiteren Schritt mittels eines eigens dafür geschriebenen Python-Skripts die Extraktion der relevanten Entitätstypen und MARC-Felder in eine vereinfachte, für den Import in OpenRefine geeignete JSON-Datei vornehmen zu können. Für den ersten Schritt wurde das im Rahmen des LibreCat-Projekts entwickelte » Catmandu verwendet, welches ein passendes Modul zum Parsen des ASEQ-Formats enthält und in Perl geschrieben ist. Um die Trennung zwischen den Datensätzen korrekt durchzuführen, musste allerdings der Quellcode des Parsers noch modifiziert bzw. korrigiert werden. Die resultierenden JSON-Daten konnten daraufhin in OpenRefine importiert werden, das sich für den Abgleich sogenannter Reconciliation Services bedient, d.h. eigens spezifizierter API-Schnittstellen, wie sie z.B. die » Iobid für die GND anbietet.
Abb. 2: Start eines Datenabgleichs in OpenRefine über die Spalte für Personennamen
Neben der Haupteintragung, also Personen- oder Körperschaftsname, konnten dabei auch Geburts- und Sterbedatum beziehungsweise Gründungs- und Auflösungsdatum als weitere Spalten zur Verfeinerung der zu identifizierenden Matches hinzugezogen werden. Der automatisierte Abgleich der Datensätze resultierte in einem Scoring, bei welchem Datensätze mit einer hohen Konfidenz automatisch zugeordnet werden können. Die restlichen Datensätze werden mit Vorschlägen nicht ausreichender Konfidenz angereichert. Aus diesen Vorschlägen musste dann unter hohem Zeitaufwand eine Entscheidung über die Zuordenbarkeit der einzelnen Vorschläge getroffen werden oder eine weitere manuelle Suche erfolgen.
Abb. 3: Manuelle Suche nach direkten Matches nach unzureichenden Vorschlägen
Lösungsansätze für Ariadne
Das Matching der Personen- und Körperschaftsschlagworte ergab, dass 736 Personen sowie 48 Körperschaften neu in der GND anzusetzen wären. Zusätzlich wurden die Ergebnisse als .xlsx-Dateien exportiert, welche die Informationen aus den abgeglichenen GND-Datensätzen jenen des SAR-Index tabellarisch gegenüberstellt. So können etwaige Informationsdifferenzen erkannt und nachgetragen werden. Angesichts der relativ überschaubaren Zahl an neu anzusetzenden Datensätzen empfiehlt das Projektteam Ariadne diese manuell in der GND nachzutragen.
Die Untersuchung der Sachschlagwörter ergab, dass eine Überführung in die GND mit einem erheblichen Informationsverlust verbunden wäre, zudem ist mit einer Einschränkung der Möglichkeiten zur fachgerechten Sacherschließung zu rechnen und damit einer Verringerung der Sichtbarkeit frauen- und genderspezifischer Inhalte. In weiterer Folge erscheint es dem Projektteam sinnvoll, sich mit externen Thesaurus-Management-Tools zur aktiven Aufbereitung, weiteren Verwaltung und Pflege des Ariadne-(Sach-)Schlagwortvokabulars auseinanderzusetzen, wie sie von anderen frauen- und genderspezifischen Informations- und Dokumentationseinrichtungen – u.a. Atria Institute on gender equality and women's history – bereits eingesetzt werden.[9]
Abschließend wollen wir als AutorInnen dieser Projektarbeit festhalten, dass der SAR-Index als historische Quelle fast 30 Jahre frauen- und geschlechterspezifische Beschlagwortung im deutschsprachigen Raum dokumentiert. Wir sprechen uns für die Sicherstellung und Archivierung des SAR-Index als gesamtes Werk aus.
Über die AutorInnen: Tobias Chromy ist Politikwissenschaftler und wissenschaftlicher Bibliothekar. Bernhard Hampel-Waffenthal ist Medientechniker, Webentwickler und wissenschaftlicher Bibliothekar. Diana Lambert ist bildende Künstlerin und wissenschaftliche Bibliothekarin.
Literatur:
Becker, Ruth, Beate Kortendiek (Hg.) (2010): Handbuch Frauen- und Geschlechterforschung. Theorie, Methoden, Empirie. Wiesbaden: VS Verlag für Sozialwissenschaften.
Chromy, Tobias, Bernhard Hampel-Waffenthal, Diana Lambert (2019): SAR goes GND. Wien: Österreichische Nationalbibliothek.
Kortendiek, Beate, Birgit Riegraf, Katja Sabisch (Hg.) (2019): Handbuch Interdisziplinäre Geschlechterforschung. Wiesbaden: Springer Fachmedien.
[1] Siehe Ariadne Artikel-Portal: www.onb.ac.at/forschung/ariadne-frauendokumentation/bestandsrecherche/artikel-portal (Zugriff: 7.1.2020)
[2] Scheu, Ursula, Alice Schwarzer (Hg.) (1994): Feministischer Thesaurus. Köln: FrauenMediaTurm.
[3] Klösch-Melliwa, Helga, Angelika Zach (1996): thesaurA. Österreichischer Frauenthesaurus. Wien: Österreichische Staatsdruckerei.
[4] vgl. Chromy, Tobias et al. (2019): SAR goes GND. Wien: Österreichische Nationalbibliothek, S. 10–24 (A.1).
[5] vgl. Chromy, Tobias et al. (2019): SAR goes GND. Wien: Österreichische Nationalbibliothek, S. 10 (A.1.1.).
[6] Folgende Publikationen dienten als Referenzliteratur: Becker, Ruth, Beate Kortendiek (Hg.) (2010): Handbuch Frauen- und Geschlechterforschung. Theorie, Methoden, Empirie. Wiesbaden: VS Verlag für Sozialwissenschaften. Kortendiek, Beate, Birgit Riegraf, Katja Sabisch (Hg.) (2019): Handbuch Interdisziplinäre Geschlechterforschung. Wiesbaden: Springer.
[7] vgl. Chromy, Tobias et al. (2019): SAR goes GND. Wien: Österreichische Nationalbibliothek, S. 18–22 (A.1.3).
[8] vgl. Chromy, Tobias et al. (2019): SAR goes GND, Wien: Österreichische Nationalbibliothek, S. 23–24 (A.1.4)
[9] vgl. Schenk, Jasmin (2018): Konzept zur Entwicklung eines gendersensiblen Thesaurus. Köln: Institut für Informationswissenschaft der TH Köln, S. 50–61, 76–83.
Aufgrund von Veranstaltungen wird der Prunksaal am Donnerstag, 24. Oktober bereits um 18 Uhr, am Freitag, 1. November bereits um 16 Uhr und am Donnerstag, 14. November bereits um 18 Uhr geschlossen.
Die Lesesäle am Heldenplatz bleiben am Samstag, den 2. November, geschlossen.