KOOP-LITERA. Portal der österreichischen Literaturarchive
 
 
KOOP-LITERA   Explore   Datenpools   Standards   Archivpraxis   Projekte   Termine   Mailingliste  
KOOP-LITERA > Standards
 

Standards

Regelwerke Regelwerke  |  Datenformate Datenformate  |  Konkrete Anwendungen Konkrete Anwendungen
Netzwerkprotokolle / Abfrage Sprachen Netzwerkprotokolle / Abfrage Sprachen  |  Standards fuer Workflows Standards für Workflows
Standardisierungskoerperschaften Standardisierungskörperschaften
 

Datenformate und Auszeichnungsstandards[in Arbeit; Stand: 20.4.2012]

Spezifische Datenformate Spezifische Datenformate  |  Allgemeine Auszeichnungssprachen Allgemeine Auszeichnungssprachen
Auszeichnungs- und Formatierungssprachen Auszeichnungs- und Formatierungssprachen  |  Multimediaformate Multimediaformate
Zeichensysteme Zeichensysteme  |  Adressierungs- und Identifierformate Adressierungs- und Identifierformate

Spezifische Datenformate

Metadata Object Description Schema (MODS)
Von der Library of Congress in Zusammenarbeit mit dem MARC Standard Office entwickeltes XML-Format für die bibliographische Metadaten. MODS formuliert eine Position zwischen der Komplexität von MARC und der Simplizität von Dublin Core. Im Unterschied zu MARC sind die Elemente nicht mit Zahlencodes, sondern in englischer Sprache benannt. Zur Konvertierung zwischen MARC, DC und MODS stellt die LoC eine Reihe von XSLT-Skripten zur Verfügung.
Urheber: Library of Congress (LoC)
Website: http://www.loc.gov/standards/mods/

Metadata Authority Description Schema (MADS)
Ist ein XML-Format für Normdateien (Personen, Körperschaften und Schlagwörtern). MADS ist eine Ergänzung zu MODS, um die in MODS verwendeten Normdateien zu beschreiben.
Urheber: LoC
Website: http://www.loc.gov/standards/mads/

Metadata Encoding & Transmission Standard (METS)
Ist ein XML-Format für die Beschreibung von digitalen Objekten und Metadaten.
Urheber: LoC
Website: http://www.loc.gov/standards/mets/

Encoded Archival Description (EAD)
Encoded Archival Description ist ein dokumentarischer XML-Standard zur Beschreibung von Findbüchern und anderen Findhilfen in Archiven, Museen und Bibliotheken, der von der Library of Congres herausgegeben wird. Eine erste Version wurde 1995 an der University of California, Berkeley in Form einer Dokumenttypdefinition (DTD) für SGML entwickelt. Die aktuelle Version (EAD 2002) entstand in Zusammenarbeit mit der Society of American Archivists. Neben einer DTD, die auch für XML verwendbar ist, gibt es für XML ein XML Schema und ein RELAX-NG-Schema.
Urheber: LoC
Website: http://www.loc.gov/ead/

Encoded Archival Context-Corporations, Persons, Families (EAC-CPF)
EAC-CPF wird verwendet, um einerseits Normansetzungsformen sowie weitere Varianten von Namen und deren Nutzungszeiten zu verwalten und um dazu andererseits weitere Informationen, etwa zur Biographie einer Person oder zur Entwicklung einer Provenienzstelle zu erfassen. Diese Informationen können mit Normansetzungsdateien, wie sie in Bibliotheken üblich sind, oder mit EAD-Findbüchern verknüpft werden.
Urheber: Staatsbibliothek zu Berlin
Website: http://www.library.yale.edu/eac/

NISO Metadata for Images in XML (MIX)
Unter der Führung der LoC und dem MARC Standard Office wird ein XML-Schema für eine Gruppe von technischen Datenfelder entwickelt, das für die Verwendung von Digitalen Bilder Sammlungen vorgesehen ist.
Urheber: LoC
Website: http://www.loc.gov/standards/mix/

Maschinelles Austauschformat für Bibliotheken (MAB2)

Das Datenformat MAB (Maschinelles Austauschformat für Bibliotheken) ermöglicht den Austausch aller im Bibliotheksbereich erzeugten Daten (bibliographische Daten, Norm- und Lokaldaten). Mit der Weiterentwicklung von MAB zu einem allgemeinen Kommunikationsformat ergaben sich neue Anforderungen. 1995 verabschiedete daher der MAB-Ausschuß die neue Formatversion MAB2. Sie enthält alle erforderlichen inhaltlichen, strukturellen und technischen Erweiterungen, um MAB auch als Austauschformat in Online-Umgebungen einsetzen zu können. Zuständig für die Pflege und Weiterentwicklung ist der MAB-Ausschuß. Die Federführung liegt bei der Deutschen Nationalbibliothek. Für die Katalogisierung von Nachlaß- und Autographenbeständen ist MAB2 insofern relevant, als die Datenstruktur, die das Regelwerk RNA (Regeln zur Erschließung von Nachlässen und Autographen) vorgibt, in MAB2 verankert ist.

MARC21 / MARCXML, UNIMARC

Preservation Metadata: Implementation Strategies (PREMIS)
PREMIS ist der Name einer internationalen Arbeitsgruppe, die von 2003 bis 2005 von OCLO und RLG gefördertt wurde. Dies AG verfasst einen Bericht mit dem Namen PREMIS (Data Dictionary for Preservation Metadata), der sowohl ein Data Dictionary als auch Informationen zu Langzeitarchivierungsmetadaten enthält. Die LoC unterhält ein Schema für die Darstellung von PREMIS in XML.
Urheber: LoC
Website: http://www.loc.gov/standards/premis/

Technical Metadata for Text (textMD)
textMD ist ein XML-Standard für technische Metadaten für digitale Objekte, die auf Texten basieren. Es wird häufig als eine Erweiterung des XML-Schemas im Rahmen von METS verwendet. Es kann jedoch auch als eigenständiges Dokument verwendet werden.
Urheber: LoC
Website: http://www.loc.gov/standards/textMD/

audioMD und videoMD
audioMD und videoMD sind XML-Schema für technische Metadaten für digitale Audio- und Videobjekte.
Urheber: LoC
Website: http://www.loc.gov/standards/amdvmd/

Analyzed Layout and Text Object (ALTO)
ALOT ist ein ein XML-Schema für technische Metadaten zur Beschreibung von Layout und Inhalt von physischeen Text-Ressourcen wie zum Beispiel Buch- oder Zeitungsseiten. Es wird verwendet innerhalb von METS, es kann aber auch alleine und unabhängig von METS verwendet werden.
Urheber: LoC
Website: http://www.loc.gov/standards/alto/

VRA Core
VRA Core wird als Standard zur Beschreibung von visuellen Objekten wie deren Abbildungen, die diese dokumentieren. Der Standard ist darauf ausgerichtet, diese beiden Objekttypen (Original und Abbildung) zueinander in Relation zu setzen.
Urheber: LoC
Website: http://www.vraweb.org/projects/vracore4/

PND-BEACON
BEACON ist ein sehr einfaches Dateiformat, mit dem Links auf Webseiten angegeben werden können, die Inhalte zu bestimmten Normdaten bieten. Derzeit wird das Format vor allem für Personen genutzt, die mittels ihrer PND-Nummer identifiziert werden. Es eignet sich in seiner jetzigen Form aber auch zur Verwendung für Körperschaften und Schlagwörtern unter Verwendung von GKD, bzw. SWD-Nummern.
Wikipedia-Info: http://de.wikipedia.org/wiki/Wikipedia:BEACON

OAI-DC/PMH
Darunter versteht man OAI Protocol für Metadata Harvesting. Es ist sehr niederschwellig und dient der Suche in Repositorien, die ihre Daten mittels strukturierter Metadaten anbieten.
Urheber: OAI
Website: http://www.openarchives.org/OAI/openarchivesprotocol.html

OAI-ORE
Unter dem Namen OAI Object Reuse and Exchange (OAI-ORE) werden in der Open Archives Initiative momentan (2007) ergänzend zu OAI-PMH Verfahren geschaffen, um die Binnenstruktur digitaler Objekte in Repositories und die Verknüpfungen zwischen ihnen abzubilden. Ein Dokument kann aus verschiedenen Versionen und Formaten bestehen (Volltext in PDF und HTML, Metadaten in RDF etc.), aus verschiedenen Teilen bestehen (Kapitel, Bilder, Dateien etc.) und Verknüpfungen zu anderen Dokumenten besitzen (Übersetzung, Zitation, Versionierung etc.). Die Grundidee von OAI-ORE besteht darin, diese Binnenstruktur eines Dokumentes maschinenlesbar in einer Resource Map abzubilden und verfügbar zu machen. Mit OAI-ORE soll auch das Wiederverwenden und veränderte Zusammensetzen von publizierten Inhalten vereinfacht werden, wie es beispielsweise im Rahmen Sozialer Software üblich ist.

TEI-P5 Guidelines for Electronic Text Encoding and Interchange
Datenelemente für die Codierung natürlichsprachiger Texte werden in den Guidelines definiert und erläutert. Sie sind in Modulen zusammengefasst, aus denen man sich für eine konkrete Anwendung eine DTD oder ein XML-Schema im Sinne eines Datenformats generieren lassen kann. Werkzeuge sind XSLT-Stylesheets für die Umwandlung in HTML, LaTeX und XSL:FO sowie Online-Dienste für die Umwandlung in weiter Formate. Erwähnenswert sind das Module für die Beschreibung von Handschriften sowie das für Namen, Daten, Personen und Orte.
Urheber: Text Encoding Initiative
Website: http://www.tei-c.org/index.xml

 

Allgemeine Auszeichnungssprachen

Standard Generalized Markup Language (SGML)
Die Standard Generalized Markup Language (SGML) ist der Standard zur Beschreibung von Dokumenten der International Standardization Organization (ISO), der als ISO 8879 im Jahr 1986 veröffentlicht wurde. Ziel ist es, die Struktur des Inhalts eines Dokuments von seiner layoutorientierten Erscheinungsform zu trennen. Damit wird der Schwerpunkt bei der Formatierung von Dokumenten weg vom typografischen Layout hin zur logischen und strukturellen Auszeichnung eines Dokuments verlegt. Daraus resultiert Hard- und Software-Unabhängigkeit und Publikation der Daten auf unterschiedlichen Medien.

Extensible Markup Language (XML)
Die Extensible Markup Language (XML), die auf der Grundlage der Standard Generalized Markup Language (SGML) entwickelt wurde, ist eine Metasprache und hat sich als Format für strukturierte Dokumente etabliert. XML ist W3C-Standand und somit firmen- und plattformunabhängig. Es bietet die Möglichkeit, anwendungsabhängig Datenstrukturen zu definieren und auszutauschen. Obwohl als Standard für den Dokumentenaustausch gedacht, wird XML heute vorwiegend ganz allgemein als Methode zur Strukturierung von Daten eingesetzt.

ISO2709

TeX

 

Auszeichnungs- und Formatierungssprachen

HTML, XHTML

RDF/XML

CSS

XSLT

XSL:FO

OWL

FOAF

SKOS

FOAF

RTF

LaTeX

TuStep, TXStep

 

Multimediaformate

Eine Orientierung zu Aspekten der Langzeitarchivierung zu geben ist jenseits des Rahmens dieser Standards-Liste. Aber auch für Publikumsangebote im Rahmen des Katalogs oder der Präsentation digitalisierter Materialien entstehen Fragen nach geeigneten Formaten, da oft Alternativen zur Auswahl stehen.

PDF, PDF/a

FLAC

MP4

MP3

GIF

TIFF

JPEG

PNG

 

Zeichensysteme

Unicode (ISO 10646)

ANSEL

"ANSI"

"ASCII"

BIG5

EBCDIC

ISO 5426 (MAB2)

 

Adressierungs- und Identifierformate

Uniform Ressource Locator (URL)

Internationalized Resource Identifiers (IRI)

Uniform Resource Identifiers (URI)