next up previous contents
Next: Usage Up: No Title Previous: Contents

Allgemeine Beschreibung

Die Beta-Version des wortgraphenorientierten Standardfilters für die VERBMOBIL-Transliterationen wird mit diesem Entwurf für ein VERBMOBIL TechDok ausgeliefertgif. Die Beta-Version wird als ` trlfilter Version 1.0 August 1995' gekennzeichnet.

Der Filter stellt eine operationale Definition der orthographisch basierten Inhalte der VERBMOBIL-Wortgraphen und des Lexikons für den Forschungsprototypen dar. Er ist als Abbildung zwischen der Corpusnotation der Transliterationen (vgl. [3]) und der Lexikonnotation der Wortgraphen und des Lexikons (vgl. [1]) definiert.

Bei allen VERBMOBIL-Evaluationen soll die für die Wortlistenerstellung zugrundegelegte Parametrisierung des Wortfilters mit Versionsnummer explizit angegeben werden, z.B.:

trlfilter -wig (Version 1.1)

Der Code des Filter-Scripts (z.Zt. im wesentlichen `gawk'-Anwendungen) befindet sich im Anhang.

Anwender in den Bereichen Spracherkennung, Wortgrapherstellung, Lexikon werden gebeten, den Filter zu untersuchen und Modifikationsvorschläge

bis 25. August 1995

an die Autoren zurückzumelden.

Nach eventuell noch fälligen Modifikationen wird der Filter für den allgemeinen Gebrauch mit der Kennzeichnung ` trlfilter Version 1.1 September 1995' freigegeben.

Die von den Partnern zu beantwortende wichtigste Frage ist folgende:

Welche der angebotenen Parametrisierungen ist als Standardparametrisierung zu definieren (z.B. die Default-Parametrisierung, die Parametrisierung, die zur Erzeugung der Probewortliste verwendet wurde, usw.)?

Insbesondere sind folgende Partner angesprochen:

  1. Entwickler der Spracherkennungskomponenten
  2. Entwickler von Sprachmodellen
  3. Evaluierer der Spracherkenner
  4. Entwickler von Syntaxparsern
  5. Entwickler von Komponenten zur lexikalischen Semantik und zur Domänenmodellierung

Nach einer Beschreibung des Filters in den nächsten Absätzen werden Korrekturvorschläge für die Transliterationen vorgeschlagen, die während der Filterentwicklung entstanden sind. Zum Schluß wird ein Probewortschatz aus den CDROMs definiert und mit einer definierten Parametrisierung erzeugt.



Dafydd Gibbon
Fri Sep 1 19:46:49 MET DST 1995