Theorie und Design multimodaler Lexika (B3)

Allgemeine Angaben

Antragsteller
Prof. Dr. Dafydd Gibbon
Dr. Ulrike Gut
Fakultät für Linguistik und Literaturwissenschaft
Universität Bielefeld
33501 Bielefeld
Tel.
0521/106-3510
Fax.
0521/106-6008
Email:
gibbon@spectrum.uni-bielefeld.de
gut@spectrum.uni-bielefeld.de

Thema

Im Projekt wird das übergeordnete Ziel verfolgt, in der Domäne paralleler Informationsmodi, einschließlich multimodaler Informationen, zur Integration lexikontheoretischer, lexikologischer und lexikographischer Ansätze in Computerlinguistik und Sprachtechnologie beizutragen. Insbesondere soll eine generische Spezifikation abstrakter Datenmodelle für die Makro-, Meso- und Mikrostrukturen lexikalischer Wissensbasen und Datenbanken auf der Basis von Attribut-Wert- und Vererbungs-basierter Lexikonformalismen in Relation zu neueren Textauszeichnungsmodellen vorgenommen werden. Hierzu werden zunächst dialogische multimediale Corpora mit parallelen Annotationsverbänden (annotation graphs) versehen und am Beispiel dreier typologisch verschiedener Sprachen (jeweils eine Betonungs-, eine Tonakzent und eine Tonsprache), die parallele prosodische und multimodale Informationskanäle unterschiedlich nutzen, modelliert. Multimodale Lexika werden dann als Generalisierungen über multimodale Annotationsverbände definiert. Konkretes Ziel des Projekts ist die Entwicklung theoretisch und empirisch fundierter Modellierungskonventionen sowie eines Prototyplexikons für multimodale lexikalische Informationen.

Kennwort

MODELEX

Fachgebiete und Arbeitsrichtung

Linguistik, Computerlinguistik, Sprachdokumentation, Texttechnologie

Voraussichtliche Gesamtdauer

Das Forschungsprojekt ist Teil der Forschergruppe "Texttechnologische Informationsmodellierung"; als deren Gesamtdauer sind 72 Monate vorgesehen.

Antragszeitraum

36 Monate

Beginn der Förderung

Geplant: 3. Quartal 2001

Zusammenfassung

Trotz der zentralen Rolle des Lexikons in der Sprachtheorie wie auch in deskriptiver und angewandter Linguistik und den Sprachtechnologien ist die Metatheorie des Lexikons noch sehr unterentwickelt. Das Lexikon wird im Kontext dieses Projekts auf zwei Ebenen definiert:

  1. LexikoDok: auf der metagrammatischen Ebene als ein komplexes Zeichengebilde, der als Dokumenttyp charakterisiert wird, mit einer Dokumentsyntax, die durch eine Inhaltsemantik und eine Ausdruckssemantik interpretiert wird;
  2. LexikonObj auf der grammatischen Ebene als Beschreibung von strukturellen, inhaltlichen und medialen (phonetischen und graphischen) Eigenschaften von (elementaren und partiell kompositionellen) lexikalischen Einheiten.

Für metagrammatische und objektsprachliche Zeichen wird eine abstrakte Strukturebene und zwei Interpretationsfunktionen als ein semiotisches Semantikpaar angenommen. Um Verwechslungen zu vermeiden, wird einerseits die Bezeichnung inhaltliche Interpretation statt (objekt-)semantische Interpretation, andererseits die Bezeichnung mediale (statt phonetische) Interpretation für die Ausdruckssemantik verwendet. Im Projekt wird vorwiegend auf die Ausdruckssemantik als mediale Interpretation fokussiert, sowohl (1) auf der Ebene des Dokumenttyp LexikonDok (z.B. die mediale Interpretation als Buchlexikon, als textuelles Hyperlexikon oder als multimediale Enzyklopädie) als auch (2) auf der Ebene der Sprachbeschreibung LexikonObj (z.B. eine mediale Interpretation als Abbildung auf Gesten, wie etwa in der Artikulatorischen Phonologie, die Korrelate in der akustischen Domäne und/oder in den visuellen und taktilen Domänen haben). In beiden Fällen wird der Begriff Semantik im modelltheoretischen Sinne sowohl in der Inhalts- als auch in der Ausdrucksinterpretation verwendet, um die Abbildung abstrakter strukturbildender Objekte einerseits auf eine inhaltliche Objektdomäne, andererseits auf mediale - phonetische und graphische - Domänen zu erfassen.

Die empirische Grundlage bilden drei typologisch unterschiedliche Sprachen: eine Betonungssprache, Englisch; eine Tonakzentsprache, Japanisch (in einer späteren Phase); eine Tonsprache, Anyi. Diese Sprachen unterscheiden sich stark nicht nur im für die Sprachtypologie zentralen Bereich der Morphosyntax sondern auch in den parallelen Informationskanälen der Prosodie und der lexikalisierten visuellen Gestik.