Standards
Regelwerke |
Datenformate |
Konkrete Anwendungen
Netzwerkprotokolle / Abfrage Sprachen |
Standards für Workflows
Standardisierungskörperschaften
Datenformate und Auszeichnungsstandards[in Arbeit; Stand: 20.4.2012]
Spezifische Datenformate |
Allgemeine Auszeichnungssprachen
Auszeichnungs- und Formatierungssprachen |
Multimediaformate
Zeichensysteme |
Adressierungs- und Identifierformate
Spezifische Datenformate
Metadata Object Description Schema (MODS)
Von der Library of Congress in Zusammenarbeit mit dem MARC Standard Office entwickeltes XML-Format für die bibliographische Metadaten. MODS formuliert eine Position zwischen der Komplexität von MARC und der Simplizität von Dublin Core. Im Unterschied zu MARC sind die Elemente nicht mit Zahlencodes, sondern in englischer Sprache benannt. Zur Konvertierung zwischen MARC, DC und MODS stellt die LoC eine Reihe von XSLT-Skripten zur Verfügung.
Urheber: Library of Congress (LoC)
Website: http://www.loc.gov/standards/mods/
Metadata Authority Description Schema (MADS)
Ist ein XML-Format für Normdateien (Personen, Körperschaften und Schlagwörtern). MADS ist eine Ergänzung zu MODS, um die in MODS verwendeten Normdateien zu beschreiben.
Urheber: LoC
Website: http://www.loc.gov/standards/mads/
Metadata Encoding & Transmission Standard (METS)
Ist ein XML-Format für die Beschreibung von digitalen Objekten und Metadaten.
Urheber: LoC
Website: http://www.loc.gov/standards/mets/
Encoded Archival Description (EAD)
Encoded Archival Description ist ein dokumentarischer XML-Standard zur Beschreibung von Findbüchern und anderen Findhilfen in Archiven, Museen und Bibliotheken, der von der Library of Congres herausgegeben wird. Eine erste Version wurde 1995 an der University of California, Berkeley in Form einer Dokumenttypdefinition (DTD) für SGML entwickelt. Die aktuelle Version (EAD 2002) entstand in Zusammenarbeit mit der Society of American Archivists. Neben einer DTD, die auch für XML verwendbar ist, gibt es für XML ein XML Schema und ein RELAX-NG-Schema.
Urheber: LoC
Website: http://www.loc.gov/ead/
Encoded Archival Context-Corporations, Persons, Families (EAC-CPF)
EAC-CPF wird verwendet, um einerseits Normansetzungsformen sowie weitere Varianten von Namen und deren Nutzungszeiten zu verwalten und um dazu andererseits weitere Informationen, etwa zur Biographie einer Person oder zur Entwicklung einer Provenienzstelle zu erfassen. Diese Informationen können mit Normansetzungsdateien, wie sie in Bibliotheken üblich sind, oder mit EAD-Findbüchern verknüpft werden.
Urheber: Staatsbibliothek zu Berlin
Website: http://www.library.yale.edu/eac/
NISO Metadata for Images in XML (MIX)
Unter der Führung der LoC und dem MARC Standard Office wird ein XML-Schema für eine Gruppe von technischen Datenfelder entwickelt, das für die Verwendung von Digitalen Bilder Sammlungen vorgesehen ist.
Urheber: LoC
Website: http://www.loc.gov/standards/mix/
Maschinelles Austauschformat für Bibliotheken (MAB2)
Das Datenformat MAB (Maschinelles Austauschformat für Bibliotheken) ermöglicht den Austausch aller im Bibliotheksbereich erzeugten Daten (bibliographische Daten, Norm- und Lokaldaten). Mit der Weiterentwicklung von MAB zu einem allgemeinen Kommunikationsformat ergaben sich neue Anforderungen. 1995 verabschiedete daher der MAB-Ausschuß die neue Formatversion MAB2. Sie enthält alle erforderlichen inhaltlichen, strukturellen und technischen Erweiterungen, um MAB auch als Austauschformat in Online-Umgebungen einsetzen zu können. Zuständig für die Pflege und Weiterentwicklung ist der MAB-Ausschuß. Die Federführung liegt bei der Deutschen Nationalbibliothek. Für die Katalogisierung von Nachlaß- und Autographenbeständen ist MAB2 insofern relevant, als die Datenstruktur, die das Regelwerk RNA (Regeln zur Erschließung von Nachlässen und Autographen) vorgibt, in MAB2 verankert ist.
MARC21 / MARCXML, UNIMARC
Preservation Metadata: Implementation Strategies (PREMIS)
PREMIS ist der Name einer internationalen Arbeitsgruppe, die von 2003 bis 2005 von OCLO und RLG gefördertt wurde. Dies AG verfasst einen Bericht mit dem Namen PREMIS (Data Dictionary for Preservation Metadata), der sowohl ein Data Dictionary als auch Informationen zu Langzeitarchivierungsmetadaten enthält. Die LoC unterhält ein Schema für die Darstellung von PREMIS in XML.
Urheber: LoC
Website: http://www.loc.gov/standards/premis/
Technical Metadata for Text (textMD)
textMD ist ein XML-Standard für technische Metadaten für digitale Objekte, die auf Texten basieren. Es wird häufig als eine Erweiterung des XML-Schemas im Rahmen von METS verwendet. Es kann jedoch auch als eigenständiges Dokument verwendet werden.
Urheber: LoC
Website: http://www.loc.gov/standards/textMD/
audioMD und videoMD
audioMD und videoMD sind XML-Schema für technische Metadaten für digitale Audio- und Videobjekte.
Urheber: LoC
Website: http://www.loc.gov/standards/amdvmd/
Analyzed Layout and Text Object (ALTO)
ALOT ist ein ein XML-Schema für technische Metadaten zur Beschreibung von Layout und Inhalt von physischeen Text-Ressourcen wie zum Beispiel Buch- oder Zeitungsseiten. Es wird verwendet innerhalb von METS, es kann aber auch alleine und unabhängig von METS verwendet werden.
Urheber: LoC
Website: http://www.loc.gov/standards/alto/
VRA Core
VRA Core wird als Standard zur Beschreibung von visuellen Objekten wie deren Abbildungen, die diese dokumentieren. Der Standard ist darauf ausgerichtet, diese beiden Objekttypen (Original und Abbildung) zueinander in Relation zu setzen.
Urheber: LoC
Website: http://www.vraweb.org/projects/vracore4/
PND-BEACON
BEACON ist ein sehr einfaches Dateiformat, mit dem Links auf Webseiten angegeben werden können, die Inhalte zu bestimmten Normdaten bieten. Derzeit wird das Format vor allem für Personen genutzt, die mittels ihrer PND-Nummer identifiziert werden. Es eignet sich in seiner jetzigen Form aber auch zur Verwendung für Körperschaften und Schlagwörtern unter Verwendung von GKD, bzw. SWD-Nummern.
Wikipedia-Info: http://de.wikipedia.org/wiki/Wikipedia:BEACON
OAI-DC/PMH
Darunter versteht man OAI Protocol für Metadata Harvesting. Es ist sehr niederschwellig und dient der Suche in Repositorien, die ihre Daten mittels strukturierter Metadaten anbieten.
Urheber: OAI
Website: http://www.openarchives.org/OAI/openarchivesprotocol.html
OAI-ORE
Unter dem Namen OAI Object Reuse and Exchange (OAI-ORE) werden in der Open Archives Initiative momentan (2007) ergänzend zu OAI-PMH Verfahren geschaffen, um die Binnenstruktur digitaler Objekte in Repositories und die Verknüpfungen zwischen ihnen abzubilden. Ein Dokument kann aus verschiedenen Versionen und Formaten bestehen (Volltext in PDF und HTML, Metadaten in RDF etc.), aus verschiedenen Teilen bestehen (Kapitel, Bilder, Dateien etc.) und Verknüpfungen zu anderen Dokumenten besitzen (Übersetzung, Zitation, Versionierung etc.). Die Grundidee von OAI-ORE besteht darin, diese Binnenstruktur eines Dokumentes maschinenlesbar in einer Resource Map abzubilden und verfügbar zu machen. Mit OAI-ORE soll auch das Wiederverwenden und veränderte Zusammensetzen von publizierten Inhalten vereinfacht werden, wie es beispielsweise im Rahmen Sozialer Software üblich ist.
TEI-P5 Guidelines for Electronic Text Encoding and Interchange
Datenelemente für die Codierung natürlichsprachiger Texte werden in den Guidelines definiert und erläutert. Sie sind in Modulen zusammengefasst, aus denen man sich für eine konkrete Anwendung eine DTD oder ein XML-Schema im Sinne eines Datenformats generieren lassen kann. Werkzeuge sind XSLT-Stylesheets für die Umwandlung in HTML, LaTeX und XSL:FO sowie Online-Dienste für die Umwandlung in weiter Formate. Erwähnenswert sind das Module für die Beschreibung von Handschriften sowie das für Namen, Daten, Personen und Orte.
Urheber: Text Encoding Initiative
Website: http://www.tei-c.org/index.xml
Allgemeine Auszeichnungssprachen
Standard Generalized Markup Language (SGML)
Die Standard Generalized Markup Language (SGML) ist der Standard zur Beschreibung von Dokumenten der International Standardization Organization (ISO), der als ISO 8879 im Jahr 1986 veröffentlicht wurde. Ziel ist es, die Struktur des Inhalts eines Dokuments von seiner layoutorientierten Erscheinungsform zu trennen. Damit wird der Schwerpunkt bei der Formatierung von Dokumenten weg vom typografischen Layout hin zur logischen und strukturellen Auszeichnung eines Dokuments verlegt. Daraus resultiert Hard- und Software-Unabhängigkeit und Publikation der Daten auf unterschiedlichen Medien.
Extensible Markup Language (XML)
Die Extensible Markup Language (XML), die auf der Grundlage der Standard Generalized Markup Language (SGML) entwickelt wurde, ist eine Metasprache und hat sich als Format für strukturierte Dokumente etabliert. XML ist W3C-Standand und somit firmen- und plattformunabhängig. Es bietet die Möglichkeit, anwendungsabhängig Datenstrukturen zu definieren und auszutauschen. Obwohl als Standard für den Dokumentenaustausch gedacht, wird XML heute vorwiegend ganz allgemein als Methode zur Strukturierung von Daten eingesetzt.
ISO2709
TeX
Auszeichnungs- und Formatierungssprachen
HTML, XHTML
RDF/XML
CSS
XSLT
XSL:FO
OWL
FOAF
SKOS
FOAF
RTF
LaTeX
TuStep, TXStep
Multimediaformate
Eine Orientierung zu Aspekten der Langzeitarchivierung zu geben ist jenseits des Rahmens dieser Standards-Liste. Aber auch für Publikumsangebote im Rahmen des Katalogs oder der Präsentation digitalisierter Materialien entstehen Fragen nach geeigneten Formaten, da oft Alternativen zur Auswahl stehen.
PDF, PDF/a
FLAC
MP4
MP3
GIF
TIFF
JPEG
PNG
Zeichensysteme
Unicode (ISO 10646)
ANSEL
"ANSI"
"ASCII"
BIG5
EBCDIC
ISO 5426 (MAB2)
Adressierungs- und Identifierformate
Uniform Ressource Locator (URL)
Internationalized Resource Identifiers (IRI)
Uniform Resource Identifiers (URI)
|