Werden keine Parameter angegeben, wird eine Defaulttransformation der
Transliterationen durchgeführt. Die auf dem DFKI-Server abgelegte
Probewortliste ubi.cdwortlisten1.0 wurde nicht mit der
Defaulttransformation sondern mit der Parametrisierung trlfilter -wig
erstellt.
Die Defaulttransformation ist folgendermaßen definiert:
<JAP>
bzw. <ENG>. Die Originalturns werden in eine gesonderte Ausgabedatei mit
der Extension .ng geschrieben.
newTurnID G142A_BAC000 )
<NIB>:<#Klicken>)<Husten>)<UNK>:*einteigige)<;T>ay)abh=)
(@ ), ( @))
+/ /+)
/-)
<: :>)
<;T>)
<%>, %)
<A>, <P>,
<Z>)
$U-$S-$A-Reise' als ein Kompositum statt
wie bisher als zwei Simplizia und ein Kompositum `$U $S $A-Reise'
(vgl. [3], [2])
_)
<"ahm>
"ahm)
An- und Abreise
An-und-AbreiseBu"s- und Bettag
Bu"s-und-BettagChristi Himmelfahrt
Christi-HimmelfahrtM"arz- oder Aprilh"alfte
M"arz-oder-Aprilh"alfteMaria Himmelfahrt
Maria-HimmelfahrtMari"a Himmelfahrt
Mari"a-HimmelfahrtSeptember- und Oktobertermine
September-und-Oktobertermineen gros
en_grosf"unfzehn- und sechzehnte
f"unfzehn-und-sechzehnte heut
heutesollt
solltezweihundertdrei
zweihundert dreiopen end
open_endn047Tag
guten Tagen bloc
en_blocRichhard
Richard
Anmerkung zu den Korrekturen: Die oben aufgelisteten Fälle beziehen sich auf CDROM 1.0.3 bis CDROM 3. Für spätere CDROMs wurden keine Einzellösungen vorgenommen.
Anmerkung zu den Komposita: Anhand der Wortliste können die Komposita (auch die ad-hoc-Komposita bzw. die elliptischen Konjunktionskomposita) unabhängig von dieser Darstellung für die Spracherkennung bzw. für die linguistische Analyse bei Bedarf weiter zerlegt werden.