Autor: Paul Sommersguter
Im Oktober 2018 startete die Österreichische Nationalbibliothek ihre erste Crowdsourcing-Kampagne „Österreich aus der Luft“. Die neue Initiative setzt auf das Wissen von vielen, um es in weiterer Folge anderen Menschen zugänglich zu machen. In der mittlerweile über einjährigen Laufzeit der Kampagne wurde von der Crowdsourcing-Community eine große Zahl an Beiträgen geleistet: über 165.000 Kategorien, Tags und Verortungen sind für einen Bildbestand eingelangt, der ein idyllisches Österreich in den 1930er-Jahren zeigt. Zeit, eine Zwischenbilanz zu ziehen.
Nach der außerordentlich erfreulich – und für uns, als Projektteam, durchaus überraschend – hohen Anzahl an Beiträgen konnten wir den aktivsten TeilnehmerInnen Ende November 2019 ein persönliches Dankeschön in unserem ersten Crowdsourcing-Treffen aussprechen. Viele sind der Einladung in die Österreichische Nationalbibliothek gefolgt, darunter auch einer der Top 3-BenutzerInnen. Eine Begegnung, die uns als Projektteam viel Freude bereitet hat.
Nach einer exklusiven Führung durch den Prunksaal von Mag. Heide Darling wurden die TeilnehmerInnen von Generaldirektorin Dr. Johanna Rachinger willkommen geheißen. Im darauffolgenden Vortrag von Mag. Michaela Pfundner konnte man Wissenswertes über die facettenreichen Bestände der Sammlung Bildarchiv und Grafiksammlung erfahren. Das Crowdsourcing-Projektteam präsentierte anschließend Hintergrundinformationen über die Crowdsourcing-Initiative, über die Entstehung der Plattform sowie über erste Ergebnisse aus der Kampagne „Österreich aus der Luft“. Im Zuge der Auswertung dieser Ergebnisse ist das Projektteam auf viele interessante und auch einige kuriose Erkenntnisse gestoßen.
Die ersten Ergebnisse
Abb. 1: Ein Sinnbild dafür, dass sehr viel geleistet wurde: Verortungen von Luftbildern, die auf der Startseite der Crowdsourcing-Kampagne gezeigt werden.
Crowdsourcing stützt sich auf das Wissen vieler. Doch welches Wissen wurde eingebracht? Dies lässt sich gut anhand der einzelnen Aufgaben und anhand der Statistiken zu BenutzerInnen illustrieren.
Unsere BenutzerInnen
Abb. 2: Die drei hauptbeitragenden BenutzerInnen tragen die Nicknames „ClaudiaSbg“, „seinerzeitung“ und „Genius Loci“. Die Top 10 haben je mehr als 1.000 Beiträge geleistet.
Insgesamt haben sich mehr als 1.850 BenutzerInnen für die Crowdsourcing-Initiative der Österreichischen Nationalbibliothek registriert. Mit Stand Anfang Dezember 2019 haben sich drei Beitragende als die aktivsten herauskristallisiert. Die UserInnen „ClaudiaSbg“, „seinerzeitung“ und „Genius Loci“ haben 5.555, 5.554, bzw. 4.703 Beiträge geleistet. Ein interessantes Detail ist hier, dass die ersten beiden Plätze nur durch exakt einen Beitrag getrennt sind.
Die weiteren BenutzerInnen mit den Nicknames „E. Reisner“, „Carl“, „H. Falke“, „Ulan“, „Helmut Luftikus“, „viehhaus“ und „Heinz“ bilden die Top 10 der Crowdsourcing-Initiative. Die ersten 10 BenutzerInnen haben alle mehr als 1.000 Beiträge geleistet.
Unsere Aufgaben
Für die einzelnen Aufgaben konnte das Projektteam auch detailliertere Auswertungen herausarbeiten. Von Interesse war die Frage, wie hoch der Anteil einzelner Aufgaben an den insgesamt geleisteten Beiträgen war:
Weitere 2 % entfielen auf die im Sommer 2019 publizierte erste Qualitätssicherungsaufgabe „Verortung überprüfen“.
Aufgabe: Kategorisieren
In dieser ersten Aufgabe steht eine grobe inhaltliche Einteilung der Bilder im Vordergrund. Diese Kategorien wurden vom Projektteam festgelegt, sie können von BenutzerInnen nicht verändert werden. BenutzerInnen wurden u. a. gefragt, welche Landschaft, welche Bebauung und grob, welchen Naturraum sie auf den Bildern ausmachen können.
Am häufigsten, bezogen auf ganz Österreich, wurden die Begriffe „Panorama“, „Wiese“ und „Wald“ vergeben (je mindestens 10.000 Nennungen), am wenigsten oft die Begriffe „Fluss“, „Einzelobjekt“ und „See“ (je unter 4.000 Nennungen).
Diese Statistiken können genauer auf einzelne Bundesländer heruntergebrochen werden. Natürlich sind diese Zahlen stark davon abhängig, welche Motive auf den Bildern zu sehen sind. So wurde z. B. die Kategorie „dicht bebaut“ am öftesten für Bilder, die das Burgenland zeigen, vergeben – dies konnten wir anhand einer kleinen Stichprobe gut verifizieren. Die Kategorie „See“ wiederum wurde am öftesten Bildern, die Kärntner Landschaftsaufnahmen abbilden, zugeteilt. Wenig überraschend wurde das Attribut „gebirgig“ am häufigsten jenen Bildern, die Tirol zeigen, zugeordnet.
Abb. 3: Beispiele für Bilder, bei denen die Kategorisierung eindeutig ausgefallen ist: „dicht bebaut“ für eine dörfliche Szenerie im Burgenland, „gebirgig“ für eine Landschaft in Tirol, „See“ für eine Aufnahme aus Kärnten.
Aufgabe: Tagging
In der Aufgabe „Tagging“ steht die Vergabe von Stichwörtern und Ortsnamen im Vordergrund. Die am häufigsten benutzten Stichwörter sind „Haus“ (954 Nennungen), „Kirche“ (752 Nennungen) und „Straße“ (499 Nennungen). Am öftesten wurden die Orte „Bregenz“ und „Wien“ genannt (je mindestens 300 Nennungen). Die häufige Nennung von „Bregenz“ ist ein gutes Beispiel dafür, dass die Crowdsourcing-Initiative selbst von den Rückmeldungen der BenutzerInnen bereichert wird: So hat der Algorithmus, der aus einem Pool das nächste, passende Bild berechnet, sehr oft ein Foto aus Vorarlberg ausgewählt (ein Umstand, der dem Projektteam rückgemeldet und mittlerweile angepasst wurde).
Stichwörter, die BenutzerInnen vorgeschlagen werden, stammen aus einer Untermenge der Gemeinsamen Normdatei[i] sowie aus der Datenbank GeoNames[ii]. Werden BenutzerInnen in dieser Begriffsliste nicht fündig, ist es möglich, dass sie einen eigenen Begriff beitragen, um spezifischeres Wissen in die Initiative einzubringen.
Zur Verteilung zwischen den freien Schlagwörtern und Normdaten lässt sich folgendes feststellen: 73 % der gewählten Begriffe in dieser Aufgabe stammen aus Normdaten. Immerhin 27 % sind in diesem Sinne nicht „normiert“ und werden in der noch bevorstehenden Aufgabe „Tags überprüfen“ einer höheren Anzahl an Überprüfungen genügen müssen.
Aufgabe: Verorten
In der Aufgabe „Verorten“ steht das „Einzeichnen“ von Bildern auf einer Landkarte im Mittelpunkt. Hier ist es einerseits möglich, in der GeoNames-Datenbank zu suchen oder manuell einen Kartenmarker auf einer Landkarte zu platzieren. Das Verhältnis zwischen manuell gesetzten Pins und der Suche in der GeoNames-Datenbank liegt – für das Projektteam sehr überraschend und erfreulich – bei 71 % zu 29 %. Daraus lässt sich schließen, dass ein Kartenmarker oftmals nach einem Suchergebnis noch präzisiert worden ist – ein Indiz dafür, dass die Crowd sehr genau gearbeitet hat.
Nächste Schritte
Die Crowdsourcing-Initiative, die von den Österreichischen Lotterien finanziell unterstützt wird, entwickelt sich stetig weiter. Neben laufenden Software-Verbesserungen, die im Sinne einer nachhaltigen Entwicklung durchgeführt werden, begleitet mittlerweile auch ein eigener » Crowdsourcing-Blog die Kampagne mit Hintergrundinformationen. Eine weitere Crowdsourcing-Kampagne, die historische Bilder aus dem Nachlass von Fritz Wejrowksy zeigt, befindet sich bereits in der Umsetzung und wird im kommenden Jahr online gehen.
Mitmachen: Die Crowdsourcing-Initiative lädt auf » crowdsourcing.onb.ac.at alle Interessierten sehr herzlich zum Mitmachen ein. Der neue Crowdsourcing-Blog ist via » crowdsourcing.onb.ac.at/blog/ erreichbar.
Über den Autor: Paul Sommersguter ist Projektmanager und User Experience Designer an der Österreichischen Nationalbibliothek, Abteilung für Forschung und Entwicklung. Das Projektteam Crowdsourcing zeichnet für Konzeption, Gestaltung und Umsetzung sowie laufende Betreuung des Crowdsourcing-Portals verantwortlich und besteht weiters aus dem Softwareentwickler Stefan Frühwirth und der Kommunikationsexpertin Ting Chung.
[i] Gemeinsame Normdatei, Deutsche Nationalbibliothek
[ii] Geonames.org: Webservice für Geographika
Aufgrund von Veranstaltungen wird der Prunksaal am Donnerstag, 24. Oktober bereits um 18 Uhr, am Freitag, 1. November bereits um 16 Uhr und am Donnerstag, 14. November bereits um 18 Uhr geschlossen.
Die Lesesäle am Heldenplatz bleiben am Samstag, den 2. November, geschlossen.