Unterabschnitte

1 Dublin Core Metadatensatz

Mit dem Dublin Core Metadatenstandard (1), geschaffen auf einem Workshop 1995 zu Metadaten in Dublin, Ohio, besteht ein de facto Standard von Informationen zu verschiedenartigsten Ressourcen. Das Ziel der Dublin Core Metadata Initiative (DCMI), bestehend aus Bibliothekaren, Informatikern, Textkodierern und Mitgliedern einer Museumsgesellschaft (3), lag in der Bestimmung einer standardisierten Kernmenge von Meta-Daten-Typen, die zur Archivierung von Dokumenten benutzt werden können, insbesondere in Bibliotheken und vergleichbaren Archiven und dadurch zum Beschreiben, Verfeinern sowie eine exaktere Suche vernetzter Ressourcen (sprich: Daten/Dokumente/Tools etc.) dienen sollten (2).

Dabei werden zwei verschiedene Arten von Metadaten unterschieden:

  1. Der standardisierte unqualifizierte Dublin Core Metadatensatz besteht aus 15 Elementen, die optional und beliebig oft wiederholbar sind.
  2. Durch zusätzliche Bestimmungen werden diese Metadaten zu qualifizierten Metadaten.

1 Unqualifizierte Dublin Core Metadaten

Als Kernelemente wurden die folgenden 15 Elemente festgelegt, wobei die Unterklassifizierung nach (5) erfolgt:
  1. Inhalt:
    1. Titel der Ressource: title
    2. Beschreibung der Ressource (in Textform): description
    3. Verwandte Ressourcen: relation
    4. Abdeckung: coverage
    5. Quelle der Ressource: source
    6. Art des Ressource (kontrolliertes Vokabular): type
    7. Thema der Ressource: subject
  2. Verwertungsrechte:
    1. Personen, die zur Ressource beigetragen haben: contributor
    2. Autor der Ressource: creator
    3. Herausgeber der Ressource: publisher
    4. Urheber- und Verwendungsrechte: rights

  3. Instanz:
    1. Sprache der Ressource: language
    2. Identifikator des Ressource (z.B. ein URI): identifier
    3. Format des Ressource (z.B. Mime Type): format
    4. Datum der Ressource (Datum, das mit der Ressource in Zusammenhang steht): date

2 Qualifizierte Dublin Core Metadaten

Durch Attribute können Metadaten zusätzlich spezifiziert werden, wofür es drei Spezifikationsklassen gibt:
Element Refinement:
durch nähere Spezifikation der unqualifizierten DC Daten wird die Semantik der Elemente näher bestimmt,
Encoding Scheme:
Hinweise, die die Interpretation des Elementinhaltes ermöglichen,
Normative reference:
Referenz zum entsprechenden Standard.

Als Repräsentationsformat für qualifiziertes DC ist RDF vorgesehen (siehe http://www.dublincore.org/documents/2002/05/15/dcq-rdf-xml/)

3 Grenzen des Dublin Core Metadatensatz für linguistische Korpora

Dublin Core Metadaten sind für geschriebene Dokumente zur Katalogisierung und Aufnahme in Bibliotheken und Archive entwickelt worden. Für linguistische Korpora sind die Kategorien nicht genau genug spezifiziert:

Es gibt zwar verschiedenste Erweiterungen zu Dublin Core für verschiedene Zwecke, allerdings gibt es Inkompatibilitäten der Erweiterungen, so dass ein Metadatenstandard für Sprachressourcen zwar eine Abbildung auf DC haben sollte (für passende Elemente), aber ansonsten nicht als standardisierte Erweiterungen zu DC anzugeben ist.

Erweiterungen zur Spezifizierung und zur Definition anderer Metadaten, die die DCMI selbst vorgeschlagen haben, sind unter anderem:

  1. Zielgruppe: audience
  2. Alternativer Titel: alternative
  3. Inhaltsangabe: tableOfContents
  4. Zusammenfassung: abstract
  5. Entstehungsdatum: created
  6. Gültigkeit(-szeitraum): valid
  7. Verfügbarbkeit(-szeitraum): available
  8. Ausagebedatum: issued
  9. Änderungsdatum: modified
  10. Größe: extent
  11. Medien, in denen das Dokument vorliegt (z.B. CD, Buch, Folie, Video): medium
  12. Abwandlung von einem anderen Dokument: isVersionOf
  13. Vom Ausgangsdokument abgewandelte Version: hasVersion
  14. Ersatzdokument: isReplacedBy

Thorsten Trippel 2003-12-08