2 OLAC-Metadatensatz

Die Open Language Archives Community (OLAC) (siehe 9), gegründet 1999 von Sprachverarbeitern, stellt eine Erweiterung des DC-Metadatensatzes und eine Möglichkeit der Einbettung von DC Elementen in ein einheitliches Katalogformat in XML zur Verfügung. Das hinter dem Konzept stehende Ziel von OLAC ist es, eine weltweite virtuelle Bibliothek von Sprachressourcen einzurichten, bzw. eine Infrastruktur für Sprachressourcen zu entwickeln.

Um eine konstante Beschreibung verschiedener Archive sicherzustellen, werden die Werte bestimmter Metadatenelemente durch den Gebrauch eines kontrollierten Vokabulars festgelegt.

Der OLAC Metadatensatz besteht aus allen Elementen des Dublin Core Metadatensatzes, erweitert diesen aber durch zusätzliche Verfeinerungen und Qualifikationen, womit er aus 23 Elementen besteht, die optional und beliebig oft wiederholbar sind.

Die OLAC Metadatenelemente sind:

  1. Contributor: Name des oder der Mitwirkenden bzw. Mitverantwortlichen
  2. Coverage: räumliche Position (Datum oder Ortsstrecke)
  3. Creator: Person, Organisation, Service/Verantwortlicher für den Textinhalt
  4. Date: ISO-Wert eines Datums (z.B.: Entstehungsdatum)
  5. Description: Beschreibung des Dokumentes durch Inhaltsverzeichnisse, Auszüge...
  6. Format: Format der Ressource und als Verfeinerung der DC Daten:
    1. Format.cpu: identifiziert den Mediatyp (z.B. XML)
    2. Format.encoding: identifiziert das Kodierschema des Dokumentes
    3. Format.markup: identifiziert das Markupschema des Dokumentes
    4. Format.os: identifiziert das Operating System bzw. die Software
    5. Format.sourcecode: identifiziert die Programmiersprache des Dokumentes
  7. Identifier: Bezeichner/Hinweis (z.B.: URI/URL)
  8. Language: benutzte Sprache der Ressource

  9. Publisher: Verleger o. Organisation/Verantwortlicher für die Veröffentlichung

  10. Relation: Verbindung zu anderen Ressourcen/Referenz durch URL- Adressen
  11. Rights: Eigentumsrechte wie z.B. copyright/Verantwortlicher für Textinhalt
  12. Source: Quellenangabe (falls bekannt)
  13. Subject: Thema/Inhalt der Ressource und als Verfeinerung der DC Daten:
    1. Subject.language: Identifikator der Inhaltssprache
  14. Title: meist durch einen Namen gekennzeichneter Titel
  15. Type: Genre des Inhalts. Als Verfeinerung der DC Daten:
    1. Type.functionality: funktionelle Einordnung des Dokuments
    2. Type.linguistic: linguistische Einordnung des Dokumenttyps

Der OLAC Metadatensatz besitzt insgesamt 5 Attribute (siehe 8)

  1. variabel einzusetzende Attribute:
    1. refine: verwendet ein Element das Attribut refine, werden die möglichen Werte des Elements näher bestimmt.
    2. code: wird zum Erhalten und Übertragen von bestimmten Werten benutzt. Dieses Attribut wird immer dann angewendet, wenn es sich um exakte Werte handelt (formale Darstellung).
    3. scheme: bei kontrolliertem Vokabular. Dieses Attribut gibt dabei einen Verweis auf das Vokabular an.
    4. lang: spezifiziert die Sprache des jeweiligen Elementes. Die Ausgangssprache ist Englisch (en). Bei einem Sprachwechsel oder in mehrsprachigen Dokumenten verwendet man dieses, auf alle Elemente anwendbare Attribut.
  2. ein Attribut, das ein festgelegtes, auf jedes Element zutreffendes bzw. anwendbares Attribut ist langs: im Unterschied zum lang Attribut muss langs für alle Elemente des OLAC Metadatensatzes verwendet werden, um die Sprache der Metadaten zu spezifizieren und damit den Wortschatz zu steuern.

Um die Zusammenhänge zwischen den Elementen und den Attributen besser zu veranschaulichen, dient Graphik 1. Sie beschreibt, welche Attribute von einem Element genutzt werden (können), wobei die Reihenfolge der Elemente arbiträr ist.

Abbildung: Darstellung des OLAC Metadatensatzes, langs nicht extra aufgeführt
\includegraphics[width=\textwidth]{olac_meta_attrib}

Thorsten Trippel 2003-12-08