Die Beta-Version des wortgraphenorientierten Standardfilters für
die VERBMOBIL-Transliterationen wird mit diesem Entwurf für ein VERBMOBIL
TechDok ausgeliefert
. Die Beta-Version wird
als ` trlfilter Version 1.0 August 1995' gekennzeichnet.
Der Filter stellt eine operationale Definition der orthographisch
basierten Inhalte der VERBMOBIL-Wortgraphen und des Lexikons
für den Forschungsprototypen dar. Er ist als Abbildung zwischen der
Corpusnotation der Transliterationen
(vgl. [3]) und der Lexikonnotation der Wortgraphen und
des Lexikons (vgl. [1]) definiert.
Bei allen VERBMOBIL-Evaluationen soll die für die Wortlistenerstellung zugrundegelegte Parametrisierung des Wortfilters mit Versionsnummer explizit angegeben werden, z.B.:
trlfilter -wig (Version 1.1)
Der Code des Filter-Scripts (z.Zt. im wesentlichen `gawk'-Anwendungen)
befindet sich im Anhang.
Anwender in den Bereichen Spracherkennung, Wortgrapherstellung, Lexikon werden gebeten, den Filter zu untersuchen und Modifikationsvorschläge
bis 25. August 1995
an die Autoren zurückzumelden.
Nach eventuell noch fälligen Modifikationen wird der Filter für den
allgemeinen Gebrauch mit der Kennzeichnung ` trlfilter Version 1.1
September 1995' freigegeben.
Die von den Partnern zu beantwortende wichtigste Frage ist folgende:
Welche der angebotenen Parametrisierungen ist als Standardparametrisierung zu definieren (z.B. die Default-Parametrisierung, die Parametrisierung, die zur Erzeugung der Probewortliste verwendet wurde, usw.)?
Insbesondere sind folgende Partner angesprochen:
Nach einer Beschreibung des Filters in den nächsten Absätzen werden Korrekturvorschläge für die Transliterationen vorgeschlagen, die während der Filterentwicklung entstanden sind. Zum Schluß wird ein Probewortschatz aus den CDROMs definiert und mit einer definierten Parametrisierung erzeugt.