News

Presseaussendung: Start des Europeana Newspapers Projekts (01. Juli 2012)

Bildtext

Im Rahmen des Europeana Newspapers Projekts machen siebzehn europäische Partnerinstitutionen in den nächsten drei Jahren mehr als 18 Millionen Zeitungsseiten über das Online-Portal Europeana zugänglich. Europeana bildet ein zentrales Verzeichnis von über 23 Millionen digitalisierten Büchern, Gemälden, Filmen, Ausstellungsstücken sowie Archivalien aus ganz Europa.

Das Europeana Newspapers Projekt wird gefördert vom Competitiveness and Innovation Framework Program 2007-2013 der Europäischen Kommission und wird über The European Library digitalisierte Zeitungsbestände zusammenstellen und diese technisch aufbereitet präsentieren.

Das Hauptziel des Projekts besteht darin, den Nutzern die Zeitungsinhalte über einen Content Browser mit spezieller Suchoberfläche direkt zugänglich zu machen. Der Content Browser wird in das Europeana Portal integriert und das Suchen nach einzelnen Wörtern oder nach Wortfolgen innerhalb der Zeitungstexte ermöglichen. Dies geht weit über die Suchmöglichkeiten herkömmlicher Bibliothekskataloge hinaus, in denen normalerweise nur anhand des Datums oder des Zeitungstitels gesucht werden kann. Der direkte Zugriff auf die digitalisierten Zeitungsinhalte erspart den Nutzern zudem den Gang in Sonderlesesäle, in denen historische Zeitungen für gewöhnlich nur unter strengen Nutzungsbedingungen bereitgestellt werden.

Das Projekt konzentriert sich auf die spezifischen technischen Herausforderungen bei der Aufbereitung digitalisierter Zeitungen wie Optical Character Recognition (OCR), Optical Layout Recognition (OLR), named entity recognition (NER), Artikelsegmentierung sowie der Klassifizierung von Seiten. OCR bezeichnet die elektronische Umwandlung gescannter Texte in maschinen-lesbare Zeichen. OLR ermöglicht die Identifizierung und Trennung einzelner Artikel auf einer gescannten Zeitungsseite mit mehreren Artikeln. Durch NER können die Zeitungstexte nach normierten Einheiten wie Personennamen, Körperschaften oder Geographika durchsucht werden.

Im Rahmen des Projekts werden außerdem die Qualität der genannten technischen Verfahren evaluiert sowie Empfehlungen für die Umwandlung lokaler Metadaten in das Europeana Data Model entwickelt, indem ein Netzwerk aus privaten und öffentlichen Einrichtung aufgebaut wird.

Das Europeana Newspapers Projekt wird von der Staatsbibliothek – Preußischer Kulturbesitz koordiniert. Aktuelle Informationen werden unter www.europeana-newspapers.eu bereitgestellt. Für weitere Informationen wenden Sie sich bitte über info@europeana-newspapers.eu an Hans-Jörg Lieder oder Thorsten Siegmann an der Staatsbibliothek zu Berlin.

Projektpartner:

Staatsbibliothek zu Berlin                                             National Library of the Netherlands
National Library of Estonia                                           Österreichische Nationalbibliothek
University of Helsinki, National Library of Finland              Staats- und Universitätsbibliothek Hamburg
National Library of France                                            National Library of Poland
CCS Content Conversion Specialists GmbH                     LIBER Foundation
National Library of Latvia                                             National Library of Turkey
University of Beograd                                                 Universität Innsbruck
Dr. Friedrich Tessmann Library                                     The British Library
University of Salford                                                   The European Library

Europeana in Kürze:

Europeana ist eine mehrsprachige online zugängliche Sammlung von mehreren Millionen digitalisierten Objekten aus europäischen Museen, Bibliotheken, Archiven und Filmsammlungen.

Aktuell ermöglicht Europeana den Zugang zu über 23 Millionen Büchern, Filmen, Gemälden, Museumsobjekten und Archivalien aus 2.200 europäischen Kulturinstitutionen.

www.europeana.eu

 IMPACT (30.08.2011)

 

Die Österreichische Nationalbibliothek veranstaltet gemeinsam mit der Bayrischen Staatsbibliothek einen IMPACT Demo Day, an dem Ergebnisse und Software-Werkzeuge aus dem EU-Projekt IMPACT vorgeführt und durch die TeilnehmerInnen getestet werden können. Ziel des Projekts ist die Optimierung von Werkzeugen im Rahmen eines Digitalisierungsworkflows, von der Bildoptimierung über die automatische Texterkennung (OCR) bis zur Nachbearbeitung der digitalisierten historischen Texte. Die Veranstaltung findet am 11. Oktober an der Bayerischen Staatsbibliothek in München statt. Für weitere Informationen besuchen Sie die Seminarseite des Münchener Digitalisierungszentrums der Bayrischen Staatsbibliothek.

Im Rahmen der Fortbildungsreihe Brain-Pool der Österreichischen Nationalbibliothek findet am 29. September ein Seminar zum Thema „Texterkennung (OCR) mit historischen Texten“ statt. Dr. Sven Schlarb und Mag. (FH) Gerd Zechmeister aus der Abteilung Forschung und Entwicklung werden den TeilnehmerInnen Problemstellungen und Herausforderungen bei der Digitalisierung und Volltexterzeugung näherbringen und diese anhand verschiedener Werkzeuge zur Bildvorverarbeitung und –optimierung bzw. Texterkennung veranschaulichen. Darüberhinaus können mitgebrachte Scans von Textdokumenten besprochen, mit den Tools bearbeitet und analysiert werden. Nähere Infos finden Sie auf der Kursseite des Brain-Pool.

TELplus (28.01.2010)

Im Rahmen des TELplus-Projekts wurden ca. 500.000 Seiten aus ANNO und ALEX im Volltext durchsuchbar gemacht. Diese werden über das Online-Portal der europäischen Nationalbibliotheken The European Library zugänglich sein.
Ab sofort können diese 500.000 Seiten im Rahmen eines Testbetriebs auch über die Website der Österreichischen Nationalbibliothek durchsucht werden.

Über diesen Link können die Stenographischen Protokolle des Abgeordnetenhauses des Reichrates von 1879 bis 1918 durchsucht werden. Ausserdem ist über diesen Link eine Suche im Volltext ausgewählter Zeitungen (Wiener Zeitung: 1908 - 1922, Pester Lloyd, Reichspost, Montagszeitung: 1908 - 1910) möglich.

Forschung und Entwicklung

Abteilungsleiter
Mag. Max Kaiser
Josefsplatz 1
A-1015 Wien
(+43 1) 534 10-370

max.kaiser@onb.ac.at


last update 03.04.2013