Next: Korrekturen zu den
Up: No Title
Previous: Defaulttransformation
Zusätzlich werden für verschiedene Anforderungen einzelner Projektpartner
Parameter angeboten, die im folgenden erläutert werden.
- -a
- Spitze Klammern um Häsitationspartikeln werden nicht entfernt
sonst: Spitze Klammern werden entfernt
- -g
- Nichtwörter:
- nonverbale Produktionen, außer Häsitationspartikeln, werden entfernt
(z.B. <Husten>)
- nichtartikulatorische Geräusche werden entfernt
(z.B. <#Klicken>)
- Auf Wortebene werden entfernt:
- Neologismen (z.B.
*einteigige)
- Wortformen, die techn. Abbrüche enthalten (z.B.
<;T>ay)
- Wortfragmente (z.B.
abh=)
sonst: Bildung von Klassen:
<NIB> nichtartikulatorische Geräusche, nonverbale Produktionen,
<UNK> Neologismen, techn. Abbrüche, Wortfragmente
- -h
- Erstellung eines Headers in den Ausgabedateien
(die Sequenz `
##' dient als Kommentarzeichen zwecks leichter Entfernung):
## Eingabepfad:
## Ausgabepfad:
## Bearbeitete Datei:
## Bearbeitungsdatum:
## Verwendete Parameter:
- -i
- TurnIDs werden gelöscht
sonst: Bildung neuer TurnIDs aus Dateinamen und TurnID
- -p
- Interpunktionszeichen werden nicht gelöscht
sonst: Interpunktionszeichen werden gelöscht
- -r
- Ambige reduzierte Wortformen werden gekennzeichnet
(Bsp. auf'm
auf einemVdem, d.h. `einem oder dem')
sonst: ambiges 'm bzw. ambiges 'n werden durch den entsprechenden
unbestimmten Artikel ersetzt
- -s
- Ersetzt alle Buchstabiersequenzen durch die Klassenbezeichnung
<SPELL>.
sonst: keine Ersetzung
- -t
- Turns werden vollständig gelöscht, wenn sie
-
- Abbrüche (
/-)
-
- Wiederaufnahmen (
+/ /+)
-
- techn. Abbrüche (
<;T>)
-
- Wortfragmente (
=)
-
- Neologismen (
*)
-
- Generalisierungen der Klasse
<UNK>
enthalten.
sonst: Löschen der Markierungen bzw. Klassenbildung über Fragmenten und
Wortformen, die technische Abbrüche enthalten
- -u
- Unterbrochene Wortformen werden vollständig entfernt
sonst: Löschen des Unterstrichs als Markierung
- -w
- Unterbrochene Wortformen werden zusammengefügt, wenn
notwendig werden Geräusche zwischen den Wortteilen gelöscht
(Bsp. statt_ +/f=/+ <h"as> _findet
stattfindet)
sonst: Löschen des Unterstrichs als Markierung
- -?
- Help message
Anmerkung zu den Parametern:
Einige Parameter schließen sich gegenseitig aus bzw. müssen mit anderen
Parametern kombiniert werden.
-
- -u und -w schließen sich gegenseitig aus, da sie
unterschiedliche Bearbeitungsformen reduzierter Wortformen darstellen.
-
- -t und -g bedingen sich gegenseitig:
Im Fall, daß -t und -g beide angegeben sind, werden Turns, in
denen Neologismen, Fragmente oder Wortformen mit techn. Abbrüchen auftreten,
vollständig gelöscht.
Ist nur -g angegeben, werden nur die entsprechend
markierten Formen entfernt. Da -t die weitergehende Operation ist, wird
-g nur dann vollständig abgearbeitet, wenn -t nicht angegeben
ist. Dementsprechend wird -t nur dann korrekt abgearbeitet, wenn -g
angegeben worden ist.
Next: Korrekturen zu den
Up: No Title
Previous: Defaulttransformation
Dafydd Gibbon
Fri Sep 1 19:46:49 MET DST 1995