Unterabschnitte
Mit dem Dublin Core Metadatenstandard (1), geschaffen
auf einem Workshop 1995 zu Metadaten in Dublin, Ohio, besteht ein de facto Standard von Informationen zu verschiedenartigsten
Ressourcen. Das Ziel der Dublin Core Metadata Initiative (DCMI),
bestehend aus Bibliothekaren, Informatikern, Textkodierern und
Mitgliedern einer Museumsgesellschaft (3), lag in der
Bestimmung einer standardisierten Kernmenge von Meta-Daten-Typen, die
zur Archivierung von Dokumenten benutzt werden können, insbesondere in
Bibliotheken und vergleichbaren Archiven und dadurch zum Beschreiben,
Verfeinern sowie eine exaktere Suche vernetzter Ressourcen (sprich:
Daten/Dokumente/Tools etc.) dienen sollten (2).
Dabei werden zwei verschiedene Arten von Metadaten unterschieden:
- Der standardisierte unqualifizierte Dublin Core
Metadatensatz besteht aus 15 Elementen, die optional und beliebig oft
wiederholbar sind.
- Durch zusätzliche Bestimmungen werden diese Metadaten zu qualifizierten Metadaten.
Als Kernelemente wurden die folgenden 15 Elemente festgelegt, wobei
die Unterklassifizierung nach (5) erfolgt:
- Inhalt:
- Titel der Ressource: title
- Beschreibung der Ressource (in Textform): description
- Verwandte Ressourcen: relation
- Abdeckung: coverage
- Quelle der Ressource: source
- Art des Ressource (kontrolliertes Vokabular): type
- Thema der Ressource: subject
- Verwertungsrechte:
- Personen, die zur Ressource beigetragen haben: contributor
- Autor der Ressource: creator
- Herausgeber der Ressource: publisher
- Urheber- und Verwendungsrechte: rights
- Instanz:
- Sprache der Ressource: language
- Identifikator des Ressource (z.B. ein URI): identifier
- Format des Ressource (z.B. Mime Type): format
- Datum der Ressource (Datum, das mit der Ressource in Zusammenhang
steht): date
Durch Attribute können Metadaten zusätzlich spezifiziert werden, wofür es drei Spezifikationsklassen gibt:
- Element Refinement:
- durch nähere Spezifikation der unqualifizierten DC Daten wird die Semantik der Elemente näher bestimmt,
- Encoding Scheme:
- Hinweise, die die Interpretation des Elementinhaltes ermöglichen,
- Normative reference:
- Referenz zum entsprechenden Standard.
Als Repräsentationsformat für qualifiziertes DC ist RDF vorgesehen (siehe http://www.dublincore.org/documents/2002/05/15/dcq-rdf-xml/)
Dublin Core Metadaten sind für geschriebene Dokumente zur Katalogisierung und Aufnahme in Bibliotheken und Archive entwickelt worden. Für linguistische Korpora sind die Kategorien nicht genau genug spezifiziert:
- Mehrsprachige Dokumente können mit den Kernelementen nur
unzureichend beschrieben werden, da die verschiedenen Sprachen zwar
aufgelistet, der Status und die verschidensprachigen Segmente aber
nicht klassifiziert werden.
- Beim Datum des Dokuments kann nicht hinreichend zwischen
Veröffentlichungsdatum, Druckdatum, Entstehungsdatum,
etc. unterschieden werden,
- die Kategorie Abdeckung(coverage) ist sehr vage gehalten,
Es gibt zwar verschiedenste Erweiterungen zu Dublin Core für
verschiedene Zwecke, allerdings gibt es Inkompatibilitäten der
Erweiterungen, so dass ein Metadatenstandard für Sprachressourcen zwar
eine Abbildung auf DC haben sollte (für passende Elemente), aber
ansonsten nicht als standardisierte Erweiterungen zu DC anzugeben ist.
Erweiterungen zur Spezifizierung und zur Definition anderer Metadaten,
die die DCMI selbst vorgeschlagen haben, sind unter anderem:
- Zielgruppe: audience
- Alternativer Titel: alternative
- Inhaltsangabe: tableOfContents
- Zusammenfassung: abstract
- Entstehungsdatum: created
- Gültigkeit(-szeitraum): valid
- Verfügbarbkeit(-szeitraum): available
- Ausagebedatum: issued
- Änderungsdatum: modified
- Größe: extent
- Medien, in denen das Dokument vorliegt (z.B. CD, Buch, Folie, Video): medium
- Abwandlung von einem anderen Dokument: isVersionOf
- Vom Ausgangsdokument abgewandelte Version: hasVersion
- Ersatzdokument: isReplacedBy
Thorsten Trippel
2003-12-08