Die Open Language Archives Community (OLAC) (siehe 9),
gegründet 1999 von Sprachverarbeitern, stellt eine Erweiterung des
DC-Metadatensatzes und eine Möglichkeit der Einbettung
von DC Elementen in ein einheitliches Katalogformat in XML zur Verfügung. Das hinter
dem Konzept stehende Ziel von OLAC ist es, eine weltweite virtuelle
Bibliothek von Sprachressourcen einzurichten, bzw. eine Infrastruktur
für Sprachressourcen zu entwickeln.
Um eine konstante Beschreibung verschiedener Archive sicherzustellen, werden
die Werte bestimmter Metadatenelemente durch den Gebrauch eines
kontrollierten Vokabulars festgelegt.
Der OLAC Metadatensatz besteht aus allen Elementen des
Dublin Core Metadatensatzes, erweitert diesen aber durch zusätzliche
Verfeinerungen und Qualifikationen, womit er aus 23
Elementen besteht, die optional und beliebig oft
wiederholbar sind.
Die OLAC Metadatenelemente sind:
- Contributor: Name des oder der Mitwirkenden bzw. Mitverantwortlichen
- Coverage:
räumliche Position (Datum oder Ortsstrecke)
- Creator:
Person, Organisation, Service/Verantwortlicher für den
Textinhalt
- Date:
ISO-Wert eines Datums (z.B.: Entstehungsdatum)
- Description:
Beschreibung des Dokumentes durch Inhaltsverzeichnisse, Auszüge...
- Format: Format der Ressource und als Verfeinerung der DC Daten:
- Format.cpu: identifiziert den Mediatyp (z.B. XML)
- Format.encoding: identifiziert das Kodierschema des Dokumentes
- Format.markup: identifiziert das Markupschema des Dokumentes
- Format.os: identifiziert das Operating System bzw. die Software
- Format.sourcecode: identifiziert die Programmiersprache des Dokumentes
- Identifier: Bezeichner/Hinweis (z.B.: URI/URL)
- Language: benutzte Sprache der Ressource
- Publisher: Verleger o. Organisation/Verantwortlicher für die Veröffentlichung
- Relation: Verbindung zu anderen Ressourcen/Referenz durch URL- Adressen
- Rights: Eigentumsrechte wie z.B. copyright/Verantwortlicher für Textinhalt
- Source: Quellenangabe (falls bekannt)
- Subject: Thema/Inhalt der Ressource und als Verfeinerung der DC Daten:
- Subject.language: Identifikator der Inhaltssprache
- Title: meist durch einen Namen gekennzeichneter Titel
- Type: Genre des Inhalts. Als Verfeinerung der DC Daten:
- Type.functionality: funktionelle Einordnung des Dokuments
- Type.linguistic: linguistische Einordnung des Dokumenttyps
Der OLAC Metadatensatz besitzt insgesamt 5 Attribute (siehe 8)
- variabel einzusetzende Attribute:
- refine: verwendet ein Element das Attribut refine,
werden die möglichen Werte des Elements näher bestimmt.
- code: wird zum Erhalten und Übertragen von bestimmten
Werten benutzt. Dieses Attribut wird immer dann angewendet, wenn es sich um
exakte Werte handelt (formale Darstellung).
- scheme: bei kontrolliertem Vokabular. Dieses Attribut gibt dabei einen Verweis auf das Vokabular an.
- lang: spezifiziert die Sprache des jeweiligen Elementes. Die
Ausgangssprache ist Englisch (en). Bei einem Sprachwechsel oder in
mehrsprachigen Dokumenten verwendet man dieses, auf alle Elemente
anwendbare Attribut.
- ein Attribut, das ein festgelegtes, auf jedes Element
zutreffendes bzw. anwendbares Attribut ist
langs: im Unterschied zum lang Attribut muss langs für alle Elemente des OLAC Metadatensatzes verwendet werden,
um die Sprache der Metadaten zu spezifizieren und damit den
Wortschatz zu steuern.
Um die Zusammenhänge zwischen den Elementen und den Attributen besser
zu veranschaulichen, dient Graphik 1. Sie beschreibt,
welche Attribute von einem Element genutzt werden (können), wobei die
Reihenfolge der Elemente arbiträr ist.
Abbildung:
Darstellung des OLAC Metadatensatzes, langs nicht extra aufgeführt
![\includegraphics[width=\textwidth]{olac_meta_attrib}](img2.png) |
Thorsten Trippel
2003-12-08