Next: References
Up: No Title
Previous: Defaulttransformation
Zusätzlich werden für verschiedene Anforderungen einzelner Projektpartner
Parameter angeboten, die im folgenden erläutert werden.
- -a
- Spitze Klammern um Häsitationspartikeln werden nicht
entfernt
sonst: Spitze Klammern werden entfernt
- -g
- Nichtwörter:
- nonverbale Produktionen, außer Häsitationspartikeln, werden entfernt
(z.B. <Husten>)
- nichtartikulatorische Geräusche werden entfernt
(z.B. <#Klicken>)
- Auf Wortebene werden entfernt:
- Neologismen (z.B.
*einteigige)
- Wortformen, die techn. Abbrüche enthalten (z.B.
<;T>ay)
- Wortfragmente (z.B.
abh=)
sonst: Bildung von Klassen:
<NIB> nichtartikulatorische Geräusche, nonverbale Produktionen,
<UNK> Neologismen, techn. Abbrüche, Wortfragmente
- -h
- Erstellung eines Headers in den Ausgabedateien
(die Sequenz `
##' dient als Kommentarzeichen zwecks leichter Entfernung):
## Eingabepfad:
## Ausgabepfad:
## Bearbeitete Datei:
## Bearbeitungsdatum:
## Verwendete Parameter:
- -i
- TurnIDs werden gelöscht
sonst: Bildung neuer TurnIDs aus Dateinamen und TurnID
- -p
- Interpunktionszeichen werden nicht gelöscht
sonst: Interpunktionszeichen werden gelöscht
- -r
- Ambige reduzierte Wortformen werden gekennzeichnet
(Bsp. auf'm
auf einemVdem, d.h. `einem oder dem')
sonst: ambiges 'm bzw. ambiges 'n werden durch den
entsprechenden bestimmten Artikel ersetzt
- -s
- Ersetzt alle Buchstabiersequenzen durch die Klassenbezeichnung
<SPELL>.
sonst: keine Ersetzung
- -t
- Turns werden vollständig gelöscht, wenn sie
-
- Abbrüche (
/-)
-
- Wiederaufnahmen (
+/ /+)
-
- techn. Abbrüche (
<;T>)
-
- Wortfragmente (
=)
-
- Neologismen (
*)
-
- Generalisierungen der Klasse
<UNK>
enthalten.
sonst: Löschen der Markierungen bzw. Klassenbildung über Fragmenten und
Wortformen, die technische Abbrüche enthalten
- -u
- Unterbrochene Wortformen werden vollständig entfernt
sonst: Löschen des Unterstrichs als Markierung
- -w
- Unterbrochene Wortformen werden zusammengefügt, wenn
notwendig werden Geräusche zwischen den Wortteilen gelöscht
(Bsp. statt_ +/f=/+ <h"as> _findet
stattfindet)
sonst: Löschen des Unterstrichs als Markierung
- -?
- Help message
- -R <RefFile>
- Jeder Turn wird der entsprechenden Audiodatei zugeordnet. Der Verweis auf
die Audiodatei wird dem Sprecherbeitrag als Kommentar vorangestellt.
(z.B. %TURN: g271a/g271a000.a16)
sonst: TurnId aus Dateinamen und TurnID
- Es werden Zeilen mit maximaler Länge von 80 Zeichen erstellt.
sonst: Eine Zeile mit unbeschränkter Länge
- Klassenbildung
<NIB> umfaßt nonverbale Produktionen, Häsitationspartikeln und
nichtartikulatorische Geräusche.
<UNK> umfaßt technische Abbrüche, Wortfragmente, Unwörter und
Neologismen
sonst: <NIB> umfaßt nur nonverbale Produktionen und
nichtartikulatorische Geräusche
- Buchstabiersequenzen werden nicht verändert.
sonst: Buchstabiersequenzen werden auf Buchstabierkomposita abgebildet
- Betrifft die unter Punkt 16 genannten Defaulttransformationen:
en bloc, en gros und open end werden nicht verändert.
sonst: en gros
en_gros
sinst: en bloc
en_bloc
sinst: open end
open_end
- -m
- Es wird die Klasse
<HUM> gebildet, die nonverbale
Produktionen und Häsitationspartikeln umfaßt. In diesem Fall beschreibt die
Klasse <NIB> nur nichtartikulatorische Geräusche.
Anmerkung zu den Parametern:
Einige Parameter schließen sich gegenseitig aus bzw. müssen mit anderen
Parametern kombiniert werden.
-
- -u und -w schließen sich gegenseitig aus, da sie
unterschiedliche Bearbeitungsformen reduzierter Wortformen darstellen.
-
- -t und -g bedingen sich gegenseitig:
Im Fall, daß -t und -g beide angegeben sind, werden Turns, in
denen Neologismen, Fragmente oder Wortformen mit techn. Abbrüchen auftreten,
vollständig gelöscht.
Ist nur -g angegeben, werden nur die entsprechend
markierten Formen entfernt. Da -t die weitergehende Operation ist, wird
-g nur dann vollständig abgearbeitet, wenn -t nicht angegeben
ist. Dementsprechend wird -t nur dann korrekt abgearbeitet, wenn -g
angegeben worden ist.
-
- -R und -m:
Der Parameter -m kann nur zur Erzeugung von Referenzdateien
angewendet werde. -m ermöglicht, bezogen auf die Referenzdateien, eine
feinere Klasseneinteilung für artikulatorische Geräusche.
Next: References
Up: No Title
Previous: Defaulttransformation
Daniela Steinbrecher
Wed Dec 20 14:53:20 MET 1995