4 IMDI

In der ISLE Metadata Inititiative (IMDI) werden Metadaten für multimodale Korpora spezifiziert (siehe 6), die sowohl zur Katalogisierung als auch zur Information des Nutzers benutzt werden. Dazu werden die Metadaten zunächst in Katalog- (catalogue) und Sitzungs- (session) Metadaten unterschieden.

Katalogmetadaten dienen der Katalogisierung von Ressourcen in Archiven, wodurch allgemeine Zusammenfassungen, Inhaltsbeschreibungen und Verwertungsrechte besonderes Gewicht haben. Da in IMDI Vorkehrungen zur Internationalisierung und Distribuierung von multimedialen Ressourcen getroffen werden, findet man Kategorien zur geographischen Einordnung und beteiligten Medien.

Die Katalogmetadatenkategorien sind:

  1. Name
  2. Title ID
  3. Description
  4. Subject Langauge
  5. Document Language Location
    1. Location: Continent
    2. Location: Country
    3. Location: Region
    4. Location: Address
  6. Content type
  7. Format
    1. Format: Text
    2. Format: Audio
    3. Format: Video
  8. Quality
    1. Quality: Audio
    2. Quality: Video
  9. Smallest Annotation Unit
  10. Application
  11. Date
  12. Project
  13. Publisher
  14. Authors
  15. Size
  16. Distribution Form
  17. Access
  18. Pricing

Als Session wird ein Primärdatum mit dazugehörigen Informationen bezeichnet, etwa eine Aufnahme mit Annotationen. Folgende Metadaten werden unterschieden:

  1. Session: allgemeine Informationen zum Korpus auf der Session Ebene:
    1. Schlüsselwort für die Session : Session.Name
    2. Titel der Session: Session.Title
    3. Datum der Primärdatenerstellung: Session.Date
    4. Ort der Primärdatenerstellung mit kontrolliertem Vokabular zur eindeutigen Zuordnung (Kontinent, Land, Gebiet): Session.Location
    5. Beschreibung in Textform: Session.Description
    6. Erweiterungen als Attribut Wert Paare: Session.Keys
  2. Informationen über das Projekt, im Rahmen dessen das Korpus erstellt wurde mit folgenden Bestandteilen:
    1. Projekt-Schlüsselwort: Project.Name
    2. Projekt-Titel: Project.Title
    3. Identifikator: Project.Id
    4. Informationen um das Projekt zu erreichen: Project.Contact
    5. Beschreibung des Projekts: Project.Description

  3. Information zum Erfasser der Daten:
    1. Erfassende Person: Collector.Name
    2. Kontaktinformation: Collector.Contact
    3. Beschreibung: Collector.Description

  4. der Inhalt wird durch die folgenden Bereiche angegeben:
    1. Kommunikationskontext mit Informationen zum
      1. Interaktionstyp: Content.CommunicationContext.Interactivity
      2. Inszenierung der Kommunikation: Content.CommunicatonContext.PlanningType
      3. Art der Beteiligung des Aufnehmenden: Content.CommunicationContext.Involvement
    2. Art der Kommunikation (Genre) mit Informationen zur
      1. Interaktion : Content.Genre.Interactional
      2. Diskurs: Content.Genre.Discursive
      3. Durchführung: Content.Genre.Performance
    3. Aufgabentyp: Content.Task
    4. enthaltende Modalitäten: Content.Modalities
    5. Informationen zu den verwendeten Sprachen mit
      1. Name: Content.Langugages.Language
      2. Beschreibung: Content.Langugages.Description
    6. freie Beschreibung: Content.Description
    7. Erweiterungen in Attribut-Wert-Form: Content.Keys

  5. Teilnehmer
    1. freie Beschreibung der Teilnehmer: Content.Description
    2. Informationen zu den einzelnen Teilnehmern, jeweils mit Angaben zu:
      1. Funktion des Teilnehmers: Participant.Type
      2. in der Session benutzter Name des Teilnehmers: Participant.Name
      3. Name des Teilnehmers: Participant.FullName
      4. Identifikator: Participant.Code
      5. Liste der Sprachen des Teilnehmers, Muttersprache in initialer Position: Participant. Language
      6. Ethnie: Participant.EthnicGroup
      7. Alter: Participant.Age
      8. Geschlecht: Participant.Sex
      9. Bildung: Participant.Education
      10. Angabe, ob der Name ein Klarname ist: Participant.Anonymous
      11. freie Beschreibung: Participant.Description
      12. Erweiterungen in Attribut-Wert-Form: Content.Keys
  6. Ressourcen, die zur Session gehören, nämlich:
    1. Medien Datei mit
      1. URL: MediaFile.ResourceLink
      2. Größe: MediaFile.Size
      3. Art: MediaFile.Type
      4. Format: MediaFile.Format
      5. Qualität: MediaFile.Quality
      6. Aufnahmebedingungen: MediaFile.RecordingConditions
      7. Position auf dem Trägermedium: MediaFile.Position
      8. Rechte an den Mediendateien: MediaFile.Access
      9. freie Beschreibung: MediaFile.Description

    2. Annotationseinheiten mit
      1. URL: AnnotationUnit.ResourceLink
      2. Link zur Medien Datei: AnnotationUnit.MediaResourceLink
      3. Annotierer: AnnotationUnit.Annotator
      4. Annotationsdatum: AnnotationUnit.Date
      5. Annotationstyp: AnnotationUnit.Type
      6. Annotationsformat: AnnotationUnit.Format
      7. Kodierungsschema: AnnotationUnit.ContentEncodeing
      8. Zeichenkodierung: AnnotationUnit.CharacterEncoding
      9. Zugangsberechtigung: AnnotationUnit.Access
      10. Sprache der Annotation: AnnotationUnit.Language
      11. Anonymisierung des Annotierers: AnnotationUnit.Anoynmous
      12. freie Beschreibung: AnnotationUnit.Description.

    3. Quelle mit
      1. Identifikator: Source.Id
      2. Quellenformat: Source.Format
      3. Qualität: Source.Quality
      4. Position auf dem Medium: Source.Position
      5. Zugangsberechtigung: Source.Access
      6. freie Beschreibung: Source.Description
    4. (De-) Anonymisierungsschlüssel mit
      1. Aufbewahrungsort oder -datei: Anonymous.ResourceLink
      2. Zugangsberechtigung: Anonymous.Access
  7. Referenzen auf Notizen und Veröffentlichungen, die mit der Quelle in Zusammenhang stehen: References.Description

Im Unterschied zu den anderen Metadatenstandards, die nur auf Archivebene ansetzen, werden von IMDI auch Metadaten auf der Session-Ebene zur Verfügung gestellt. Unter Session wird dabei eine Aufnahmeeinheit verstanden, analog zu einem Signalsegment ohne zusätzliche Schnitte.

Besonders fällt beim IMDI Ansatz eine erste Öffnung des geschlossenen Metadatensystems auf, in dem an bestimmten Stellen kontextbezogene, eigene Metadatenklassen über Attribut-Wert-Paare definiert werden können.

Außerdem zeichnet sich dieser Ansatz dadurch aus, dass insbesondere den Bedürfnissen mehrsprachiger Korpora mit verschiedenen Medien Rechnung getragen wird. Damit dieser Metadatensatz auch für andere Zwecke nutzbar bleibt, sind alle Elemente bis auf Name optional, wobei zur Archivierung und dem effektiven und variablen Zugriff möglichst viele Angaben gemacht werden sollten.

Im IMDI Formalismus wird nicht sauber zwischen Annotationsebenen und Sessions getrennt. So ist etwa die Angabe des Annotierers auf Session Ebene angelegt. Es mag zwar sinnvoll erscheinen, alle Annotierer, die an einer Session arbeiten, allgemein in einer Session zu beschreiben, insbesondere wenn ein Annotierer mehrere Annotationsebenen bearbeitet und sich die Informationen zu der Person während der Bearbeitung nicht ändern; allerdings liegt das Problem darin, dass mehrere Annotierer auf verschiedenen Annotationsebenen auf den gleichen Daten arbeiten können. In diesem Fall muss eine Referenz von den Ebenen zur Liste der Annotierer geschaffen werden. Dies kann bis auf das individuelle Segment Anwendung finden, wenn auf einer Ebene von mehreren Personen annotiert wird.

Thorsten Trippel 2003-12-08