| Up to Reports | MODELEX Homepage | Allgemeine Angaben | Stand der Forschung und eigene Vorarbeiten | Ziele und Methoden | Arbeitsprogramm | Literatur |
Ziel des Projekts ist die Entwicklung eines theoretisch und empirisch fundierten Modellierungskonzepts für multimodale lexikalische Informationen. Daraus werden drei Einzelaufgabenbereiche abgeleitet, die sich am Dreikomponentenmodell, das im Kontext des heutigen Forschungsstands als Bezugsmodell entwickelt wurde, orientieren:
Funktionale Spezifikation:
1. Systematische stufenweise Erfassung der Modellierungskonventionen eines multimodalen Lexikons unter Berücksichtigung des Ansatzes des dynamischen lexikalistischen Lexikonmodells für die drei ausgewählten Sprachen Englisch, Anyi (und in einer späteren Phase Japanisch).
2. Formalisierung der Modellierungskonventionen.
3. Charakterisierung des matching-game-Szenarios in Absprache mit den Partnerprojekten.
Design:
1. Planung und Erstellung eines geeigneten multimodalen Corpus, zunächst für eine Sprache (Englisch), dann für die weiteren Sprachen.
2. Spezifikation der Makrostruktur eines multimodalen Lexikons aufgrund einer Typisierung der im Corpus vorkommenden lexikalischen Einheiten unterschiedlichen Ränge.
3. Spezifikation einer für ein multimodales Lexikon geeigneten Mikrostruktur.
4. Spezifikation der Grundkonventionen für die Entwicklung einer Mesostruktur durch manuelle und maschinelle Generalisierungsverfahren.
5. Spezifikation der Datenstrukturen und Algorithmen für Akquisition und Zugriff auf die drei Strukturtypen.
Implementierung:
Die Kategorie Implementierung bezieht sich hier nicht nur auf Systemimplementierung sondern auch auf die Erstellung von Entwicklungsressourcen wie Corpus, Metadaten, Werkzeuge.
1. Metadaten: Erstellung und Testen einer XML-DTD für Lexikon-Metadaten und eines Werkzeugs zur Erfassung von Metadaten.
2. Corpus-Aufbau und Erstellung einer XML-DTD für Corpusdatenbanken, einschließlich etikettierte normalisierte Transkriptionen.
3. Erstellung und Testen von Makrostruktur und Mikrostruktur eines Lexikons in DATR.
4. Abbildung auf eine XML-DTD für die partielle Makrostruktur und Mikrostruktur des Lexikons.
5. Entwicklung einer Mesostruktur des Lexikons für die Rangstufe "Wort" in einem operationalen Attribut-Wert-Formalismus in Absprache mit den Partnern, und deren Spezifikation als XML-DTD.
6. Erweiterung der Makrostruktur auf weitere Ränge und Iteration über die bisher charakterisierten Schritte.
In Übereinstimmung mit den Projektpartnern werden folgende Methoden im Kontext der beschriebenen Ziele eingesetzt:
1. Korpusentwurf, -erstellung und -analyse
Der empirische Ausgangspunkt für das Projekt ist ein multimodales Corpus digitaler, transkribierter und etikettierter Daten von matching-game-Dialogen, das in Absprache mit Partnerprojekten entworfen und erstellt wird. Die visuelle Modalität auf der Objektebene wird zunächst - aus Gründen der Zeitökonomie - mit (statischen) digitalen Fotoaufnahmenserien dokumentiert, die in einer späteren Phase in Zusammenarbeit mit den Partnerprojekten auf Videoaufnahmen erweitert wird. Auf der Metaebene wird die akustische Modalität u.a. durch Audiokonkordanzen zu den Daten, die visuelle Modalität durch Signalvisualisierungen mit verschiedenen Signaltransformationen repräsentiert. Die in Gibbon et al. (1997) und Gibbon et al. (2000) definierten Standards werden eingehalten, um die Verwendbarkeit der Daten durch andere Projekte sicherzustellen.
2. Formale Modellierung
Zur Formulierung von Mikro-, Meso- und Makrostrukruren eines Lexikons wird zunächst ein Attribut-Wert-Formalismus mit Vererbungsmechanismen eingesetzt. Dabei wird in Zusammenarbeit mit den anderen Projekten auf die Komplexität der darin modellierten Beschreibungssprachen geachtet. Für die wortlexikalische Modellierung dürften - außer bei der semantischen Interpretation komplexer Wörter - nach dem heutigen Stand der Wissenschaft reguläre Grammatiken genügen. Fokussiert werden insbesondere constraints über Mikrostrukturen; zum Einsatz kommen - zumindest in der ersten Phase - bekannte und u.U. nicht-monotone Vererbungs- und Unifikationsmechanismen.
3. Entwicklung von aufgabenspezifischen Repräsentationsformaten
In Zusammenarbeit mit den Partnerprojekten werden Abbildungen von getesteten operationalen formalen Lexika in geeignete XML-Beschreibungen bzw. deren DTDs entsprechend anerkannten Standards entwickelt. Für das Projekt ist wichtig, zwischen einem Formalismus für operationalisierte Lexikonmodelle (z.B. ein Attribut-Wert-Formalismus mit Vererbung), einem Formalismus für die Lexikonauszeichnung (z.B. XML) und einem Formalismus für die Lexikonimplementierung (z.B. Prolog, Scheme, C++) zu unterscheiden.
4. Prototyp-Implementierung
Die Implementierung und Evaluation des Forschungsprototyps, entsprechend den gegebenen Spezifikationen, hat im wesentlichen die Aufgaben,
zu testen. Auf die Entwicklung eines vorproduktartigen Lexikons etwa in C++ wird in diesem Stadium verzichtet, weil es im Projekt um das Testen generischer Lexikonkonzepte und -repräsentationen geht. Kernkriterium für den Erfolg der Lexikonspezifikation wird die Erstellung von operationalisierten Lexikonmodellen sein, die in den Partnerprojekten genutzt werden können.