In der ISLE Metadata Inititiative (IMDI) werden Metadaten für
multimodale Korpora spezifiziert (siehe 6), die sowohl zur
Katalogisierung als auch zur Information des Nutzers benutzt
werden. Dazu werden die Metadaten zunächst in Katalog- (catalogue) und
Sitzungs- (session) Metadaten unterschieden.
Katalogmetadaten dienen der Katalogisierung von Ressourcen in
Archiven, wodurch allgemeine Zusammenfassungen, Inhaltsbeschreibungen
und Verwertungsrechte besonderes Gewicht haben. Da in IMDI
Vorkehrungen zur Internationalisierung und Distribuierung von
multimedialen Ressourcen getroffen werden, findet man Kategorien zur
geographischen Einordnung und beteiligten Medien.
Die Katalogmetadatenkategorien sind:
- Name
- Title
ID
- Description
- Subject Langauge
- Document Language
Location
- Location: Continent
- Location: Country
- Location: Region
- Location: Address
- Content type
- Format
- Format: Text
- Format: Audio
- Format: Video
- Quality
- Quality: Audio
- Quality: Video
- Smallest Annotation Unit
- Application
- Date
- Project
- Publisher
- Authors
- Size
- Distribution Form
- Access
- Pricing
Als Session wird ein Primärdatum mit dazugehörigen Informationen
bezeichnet, etwa eine Aufnahme mit Annotationen. Folgende Metadaten werden unterschieden:
- Session: allgemeine Informationen zum Korpus auf der Session Ebene:
- Schlüsselwort für die Session : Session.Name
- Titel der Session: Session.Title
- Datum der Primärdatenerstellung: Session.Date
- Ort der Primärdatenerstellung mit kontrolliertem Vokabular zur eindeutigen Zuordnung (Kontinent, Land, Gebiet): Session.Location
- Beschreibung in Textform: Session.Description
- Erweiterungen als Attribut Wert Paare: Session.Keys
- Informationen über das Projekt, im Rahmen dessen das Korpus erstellt wurde mit folgenden Bestandteilen:
- Projekt-Schlüsselwort: Project.Name
- Projekt-Titel: Project.Title
- Identifikator: Project.Id
- Informationen um das Projekt zu erreichen: Project.Contact
- Beschreibung des Projekts: Project.Description
- Information zum Erfasser der Daten:
- Erfassende Person: Collector.Name
- Kontaktinformation: Collector.Contact
- Beschreibung: Collector.Description
- der Inhalt wird durch die folgenden Bereiche angegeben:
- Kommunikationskontext mit Informationen zum
- Interaktionstyp: Content.CommunicationContext.Interactivity
- Inszenierung der Kommunikation:
Content.CommunicatonContext.PlanningType
- Art der Beteiligung des Aufnehmenden: Content.CommunicationContext.Involvement
- Art der Kommunikation (Genre) mit Informationen zur
- Interaktion :
Content.Genre.Interactional
- Diskurs:
Content.Genre.Discursive
- Durchführung:
Content.Genre.Performance
- Aufgabentyp: Content.Task
- enthaltende Modalitäten: Content.Modalities
- Informationen zu den verwendeten Sprachen mit
- Name: Content.Langugages.Language
- Beschreibung: Content.Langugages.Description
- freie Beschreibung: Content.Description
- Erweiterungen in Attribut-Wert-Form: Content.Keys
- Teilnehmer
- freie Beschreibung der Teilnehmer: Content.Description
- Informationen zu den einzelnen Teilnehmern, jeweils mit Angaben zu:
- Funktion des Teilnehmers: Participant.Type
- in der Session benutzter Name des Teilnehmers: Participant.Name
- Name des Teilnehmers: Participant.FullName
- Identifikator: Participant.Code
- Liste der Sprachen des Teilnehmers, Muttersprache in
initialer Position: Participant. Language
- Ethnie: Participant.EthnicGroup
- Alter: Participant.Age
- Geschlecht: Participant.Sex
- Bildung: Participant.Education
- Angabe, ob der Name ein Klarname ist: Participant.Anonymous
- freie Beschreibung: Participant.Description
- Erweiterungen in Attribut-Wert-Form: Content.Keys
- Ressourcen, die zur Session gehören, nämlich:
- Medien Datei mit
- URL: MediaFile.ResourceLink
- Größe:
MediaFile.Size
- Art: MediaFile.Type
- Format: MediaFile.Format
- Qualität: MediaFile.Quality
- Aufnahmebedingungen: MediaFile.RecordingConditions
- Position auf dem Trägermedium: MediaFile.Position
- Rechte an den Mediendateien: MediaFile.Access
- freie Beschreibung:
MediaFile.Description
- Annotationseinheiten mit
- URL: AnnotationUnit.ResourceLink
- Link zur Medien Datei:
AnnotationUnit.MediaResourceLink
- Annotierer:
AnnotationUnit.Annotator
- Annotationsdatum: AnnotationUnit.Date
- Annotationstyp: AnnotationUnit.Type
- Annotationsformat: AnnotationUnit.Format
- Kodierungsschema:
AnnotationUnit.ContentEncodeing
- Zeichenkodierung:
AnnotationUnit.CharacterEncoding
- Zugangsberechtigung:
AnnotationUnit.Access
- Sprache der Annotation:
AnnotationUnit.Language
- Anonymisierung des Annotierers:
AnnotationUnit.Anoynmous
- freie Beschreibung:
AnnotationUnit.Description.
- Quelle mit
- Identifikator: Source.Id
- Quellenformat:
Source.Format
- Qualität:
Source.Quality
- Position
auf dem Medium:
Source.Position
- Zugangsberechtigung:
Source.Access
- freie Beschreibung: Source.Description
- (De-) Anonymisierungsschlüssel mit
- Aufbewahrungsort oder -datei:
Anonymous.ResourceLink
- Zugangsberechtigung: Anonymous.Access
- Referenzen auf Notizen und Veröffentlichungen, die mit der Quelle in Zusammenhang stehen: References.Description
Im Unterschied zu den anderen Metadatenstandards, die nur auf
Archivebene ansetzen, werden von IMDI auch Metadaten auf der
Session-Ebene zur Verfügung gestellt. Unter Session wird dabei eine
Aufnahmeeinheit verstanden, analog zu einem Signalsegment ohne
zusätzliche Schnitte.
Besonders fällt beim IMDI Ansatz eine erste Öffnung des geschlossenen
Metadatensystems auf, in dem an bestimmten Stellen kontextbezogene,
eigene Metadatenklassen über Attribut-Wert-Paare definiert werden
können.
Außerdem zeichnet sich dieser Ansatz dadurch aus, dass insbesondere
den Bedürfnissen mehrsprachiger Korpora mit verschiedenen Medien
Rechnung getragen wird. Damit dieser Metadatensatz auch für andere
Zwecke nutzbar bleibt, sind alle Elemente bis auf Name
optional, wobei zur Archivierung und dem effektiven und variablen
Zugriff möglichst viele Angaben gemacht werden sollten.
Im IMDI Formalismus wird nicht sauber zwischen Annotationsebenen und
Sessions getrennt. So ist etwa die Angabe des Annotierers auf Session
Ebene angelegt. Es mag zwar sinnvoll erscheinen, alle Annotierer, die
an einer Session arbeiten, allgemein in einer Session zu beschreiben,
insbesondere wenn ein Annotierer mehrere Annotationsebenen bearbeitet
und sich die Informationen zu der Person während der Bearbeitung nicht
ändern; allerdings liegt das Problem darin, dass mehrere
Annotierer auf verschiedenen Annotationsebenen auf den gleichen Daten
arbeiten können. In diesem Fall muss eine Referenz von den Ebenen zur Liste der
Annotierer geschaffen werden. Dies kann bis auf das
individuelle Segment Anwendung finden, wenn auf einer Ebene von
mehreren Personen annotiert wird.
Thorsten Trippel
2003-12-08