| Up to Reports | MODELEX Homepage | Allgemeine Angaben | Stand der Forschung und eigene Vorarbeiten | Ziele und Methoden | Arbeitsprogramm | Literatur |
Im Projekt wird das übergeordnete Ziel verfolgt, in der Domäne paralleler Informationsmodi, einschließlich multimodaler Informationen, zur Integration lexikontheoretischer, lexikologischer und lexikographischer Ansätze in Computerlinguistik und Sprachtechnologie beizutragen. Insbesondere soll eine generische Spezifikation abstrakter Datenmodelle für die Makro-, Meso- und Mikrostrukturen lexikalischer Wissensbasen und Datenbanken auf der Basis von Attribut-Wert- und Vererbungs-basierter Lexikonformalismen in Relation zu neueren Textauszeichnungsmodellen vorgenommen werden. Hierzu werden zunächst dialogische multimediale Corpora mit parallelen Annotationsverbänden (annotation graphs) versehen und am Beispiel dreier typologisch verschiedener Sprachen (jeweils eine Betonungs-, eine Tonakzent und eine Tonsprache), die parallele prosodische und multimodale Informationskanäle unterschiedlich nutzen, modelliert. Multimodale Lexika werden dann als Generalisierungen über multimodale Annotationsverbände definiert. Konkretes Ziel des Projekts ist die Entwicklung theoretisch und empirisch fundierter Modellierungskonventionen sowie eines Prototyplexikons für multimodale lexikalische Informationen.
MODELEX
Linguistik, Computerlinguistik, Sprachdokumentation, Texttechnologie
Das Forschungsprojekt ist Teil der Forschergruppe "Texttechnologische Informationsmodellierung"; als deren Gesamtdauer sind 72 Monate vorgesehen.
36 Monate
Geplant: 3. Quartal 2001
Trotz der zentralen Rolle des Lexikons in der Sprachtheorie wie auch in deskriptiver und angewandter Linguistik und den Sprachtechnologien ist die Metatheorie des Lexikons noch sehr unterentwickelt. Das Lexikon wird im Kontext dieses Projekts auf zwei Ebenen definiert:
Für metagrammatische und objektsprachliche Zeichen wird eine abstrakte Strukturebene und zwei Interpretationsfunktionen als ein semiotisches Semantikpaar angenommen. Um Verwechslungen zu vermeiden, wird einerseits die Bezeichnung inhaltliche Interpretation statt (objekt-)semantische Interpretation, andererseits die Bezeichnung mediale (statt phonetische) Interpretation für die Ausdruckssemantik verwendet. Im Projekt wird vorwiegend auf die Ausdruckssemantik als mediale Interpretation fokussiert, sowohl (1) auf der Ebene des Dokumenttyp LexikonDok (z.B. die mediale Interpretation als Buchlexikon, als textuelles Hyperlexikon oder als multimediale Enzyklopädie) als auch (2) auf der Ebene der Sprachbeschreibung LexikonObj (z.B. eine mediale Interpretation als Abbildung auf Gesten, wie etwa in der Artikulatorischen Phonologie, die Korrelate in der akustischen Domäne und/oder in den visuellen und taktilen Domänen haben). In beiden Fällen wird der Begriff Semantik im modelltheoretischen Sinne sowohl in der Inhalts- als auch in der Ausdrucksinterpretation verwendet, um die Abbildung abstrakter strukturbildender Objekte einerseits auf eine inhaltliche Objektdomäne, andererseits auf mediale - phonetische und graphische - Domänen zu erfassen.
Die empirische Grundlage bilden drei typologisch unterschiedliche Sprachen: eine Betonungssprache, Englisch; eine Tonakzentsprache, Japanisch (in einer späteren Phase); eine Tonsprache, Anyi. Diese Sprachen unterscheiden sich stark nicht nur im für die Sprachtypologie zentralen Bereich der Morphosyntax sondern auch in den parallelen Informationskanälen der Prosodie und der lexikalisierten visuellen Gestik.