Herausforderungen und Standards
Definition
Archivierung elektronischer Medien heißt: „Die langfristige Benutzbarkeit digitaler Ressourcen unter Beachtung ihrer Authentizität, Integrität und Funktionalität“.
Langfristige Benutzbarkeit: Die Einschätzung, wie lange elektronische Dokumente benutzbar bleiben bzw. erhalten werden können, kann nicht exakt vorhergesagt werden. Umso wichtiger ist, dass jede Generation Sorge für die Erhaltung der Informationen trägt.
Authentizität: Wer garantiert und wie garantiert man, dass das Dokument auch nach 10 Jahren noch das originale ist bzw. wie garantiert man, dass das Dokument nicht schon während des Einlangens ins Archiv manipuliert wurde? Technische Lösungen dafür sind u.a. die Digitale Signatur bzw. als einfachere Methode ein Prüfsummenvergleich mittels eines MD5-Schlüssels.
Integrität und Funktionalität meint Information darüber, wie die Dokumente miteinander in Verbindung stehen und welche Funktionalitäten eingebettet sind (z.B. Hypertextualität).
Persistent Identifier
Um den dauerhaften Zugriff auf ein digitales Dokument zu gewährleisten, wäre die Vergabe eines Persistent Identifiers für dessen Adressierung einzuführen. Voraussetzung für eine Standortreferenz ist die Kenntnis des Speicherorts des digitalen Objekts.
Der Persistent Identifier wird über ein zentrales verteiltes Verzeichnis aufgelöst, in dem die Pfade zu jeder eindeutigen Einheit aktuell gehalten werden (resolving Dienst).
Derzeit werden zwei Mechanismen erprobt. Auf der einen Seite Document Object Identifier (DOI), welche hauptsächlich von Verlagen verwendet werden, um Publikationen über Verlagsgrenzen hinweg eindeutig identifizieren zu können.
Im Rahmen eines Projekts an der Deutschen Bibliothek in Frankfurt wird alternativ zum DOI das System von URNs (Uniform Resource Names) als Persistent Identifier erprobt. Die URN-Registrierung erfolgt zusammen mit einem Standarddatensatz von Metadaten.
Verlässliche Digitale Archive (Trusted Digital Repositories)
- Mit dem "Trusted Digital Repositories" - Report der RLG/OCLC Group existiert ein Leitfaden, der die wesentlichen Kriterien eines digitalen Archivs herausgearbeitet hat.
- Kompatibilität mit dem OAIS-Modell
- Übernahme der Verantwortung durch die Organisation
- Wirtschaftliche und finanzielle Grundlagen müssen gegeben sein
- Sicherheit in Technologie und Verfahren
- Rechenschaft über Verfahren kann abgelegt werden
Strategien zur Langzeiterhaltung digitaler Objekte
1. Migration / Datenkonversion
Die Langzeitarchivierung erfolgt durch Migration der betreffenden Objekte von einer Hard-/Softwareumgebung in eine andere bzw. neue. Im einfachsten Fall bedeutet dies nur die Kopie von einem Speichermedium auf ein anderes, wobei die betreffenden Objekte unverändert bleiben. Dabei ist grundsätzlich immer mit Datenverlusten zu rechnen, weil eine hundertprozentige Migration in der Praxis sich häufig genug als nicht durchführbar erweist. Wichtig dabei ist der sog. „technology watch“, also den Zeitpunkt zu erkennen, an dem eine Technologie obsolet und durch eine neue ersetzt wird, bzw. zu registrieren, wann gewisse Daten nicht mehr lesbar bzw. benutzbar sind.
2. Emulation
Bei diesem Modell handelt es sich um eine bislang weitgehend hypothetische Konzeption: Zusammen mit den digitalen Objekten werden in Form von Metadaten zugleich auch alle Daten und Informationen archiviert, die gegebenenfalls erforderlich sind, um digitale Objekte unter einer neuen Systemumgebung zusammen mit den dafür nötigen - und gleichfalls in unveränderter Form archivierten - Anwendungsprogrammen benutzen zu können. Auf die neue Hardware- und Betriebssystemumgebung setzt man dann Emulationssoftware auf, die die "alte" Hard- und Softwareumgebung imitiert bzw. emuliert. Allerdings muss bei diesem Ansatz dahingestellt bleiben, wie im einzelnen die Emulationssoftware in der Zukunft beschaffen sein muss, um dieses Ziel zu erreichen, wenn sich Hardware- und Systemumgebungen immer weiter voneinander entfernen. Den für eine erfolgreiche Emulation benötigten Informationen sind dabei kaum Grenzen gesetzt. Im Extremfall wären so z.B. sogar Schalt- und Konstruktionspläne eines CD-ROM-Spielers zu archivieren.
Open Archival Information System (OAIS)
Das Referenzmodell für den Aufbau eines Archivs ist das Open Archival Information System (OAIS). OAIS wurde von einer Initiative der International Standards Organization (ISO) entwickelt und vom CCSDS (Consultative Committee for Space Data Systems) koordiniert.
Ein OAIS ist ein Archiv, das
- eine Organisation von Menschen und Systemen ist und das verantwortlich ist
- für die Aufbewahrung von analogen und digitalen Objekten
- über lange Zeiträume und
- die Verfügbarmachung dieser Informationen für eine bestimmte Nutzergemeinschaft.
Es tritt mit dem Anspruch an, den Funktionsumfang eines Archivsystems für
beliebige Daten vollständig zu beschreiben. Dazu gehören:
- die Herstellung der Interoperabilität von OAIS-konformen Archiven
- die Sicherung der dauerhaften Benutzbarkeit der archivierten Daten
- die Anwendung von Verfahren zur Langzeiterhaltung
- das Management von archivierungsrelevanten Metadaten
- deren sichere Unterbringung in Speichersystemen
- der Transfer und die Aufnahme von Daten in das Archiv
Die Struktur eines OAIS beinhaltet die Trennung von Datenarchivierung, Informations- und Metadatenverwaltung und den Schnittstellen nach außen.