next up previous contents
Next: References Up: No Title Previous: Defaulttransformation

Parameter

Zusätzlich werden für verschiedene Anforderungen einzelner Projektpartner Parameter angeboten, die im folgenden erläutert werden.

-a
Spitze Klammern um Häsitationspartikeln werden nicht entfernt
sonst: Spitze Klammern werden entfernt
-g
Nichtwörter:
-h
Erstellung eines Headers in den Ausgabedateien (die Sequenz `##' dient als Kommentarzeichen zwecks leichter Entfernung):
## Eingabepfad:
## Ausgabepfad:
## Bearbeitete Datei:
## Bearbeitungsdatum:
## Verwendete Parameter:
-i
TurnIDs werden gelöscht
sonst: Bildung neuer TurnIDs aus Dateinamen und TurnID
-p
Interpunktionszeichen werden nicht gelöscht
sonst: Interpunktionszeichen werden gelöscht
-r
Ambige reduzierte Wortformen werden gekennzeichnet
(Bsp. auf'm auf einemVdem, d.h. `einem oder dem')
sonst: ambiges 'm bzw. ambiges 'n werden durch den entsprechenden bestimmten Artikel ersetzt
-s
Ersetzt alle Buchstabiersequenzen durch die Klassenbezeichnung <SPELL>.
sonst: keine Ersetzung
-t
Turns werden vollständig gelöscht, wenn sie
Abbrüche (/-)
Wiederaufnahmen (+/ /+)
techn. Abbrüche (<;T>)
Wortfragmente (=)
Neologismen (*)
Generalisierungen der Klasse <UNK>

enthalten.
sonst: Löschen der Markierungen bzw. Klassenbildung über Fragmenten und Wortformen, die technische Abbrüche enthalten
-u
Unterbrochene Wortformen werden vollständig entfernt
sonst: Löschen des Unterstrichs als Markierung
-w
Unterbrochene Wortformen werden zusammengefügt, wenn notwendig werden Geräusche zwischen den Wortteilen gelöscht
(Bsp. statt_ +/f=/+ <h"as> _findet stattfindet)
sonst: Löschen des Unterstrichs als Markierung
-?
Help message
-R <RefFile>

  1. Jeder Turn wird der entsprechenden Audiodatei zugeordnet. Der Verweis auf die Audiodatei wird dem Sprecherbeitrag als Kommentar vorangestellt.
    (z.B. %TURN: g271a/g271a000.a16)
    sonst: TurnId aus Dateinamen und TurnID
  2. Es werden Zeilen mit maximaler Länge von 80 Zeichen erstellt.
    sonst: Eine Zeile mit unbeschränkter Länge
  3. Klassenbildung
    <NIB> umfaßt nonverbale Produktionen, Häsitationspartikeln und nichtartikulatorische Geräusche.
    <UNK> umfaßt technische Abbrüche, Wortfragmente, Unwörter und Neologismen
    sonst: <NIB> umfaßt nur nonverbale Produktionen und nichtartikulatorische Geräusche
  4. Buchstabiersequenzen werden nicht verändert.
    sonst: Buchstabiersequenzen werden auf Buchstabierkomposita abgebildet
  5. Betrifft die unter Punkt 16 genannten Defaulttransformationen:
    en bloc, en gros und open end werden nicht verändert.
    sonst: en gros en_gros
    sinst: en bloc en_bloc
    sinst: open end open_end
-m
Es wird die Klasse <HUM> gebildet, die nonverbale Produktionen und Häsitationspartikeln umfaßt. In diesem Fall beschreibt die Klasse <NIB> nur nichtartikulatorische Geräusche.

Anmerkung zu den Parametern: Einige Parameter schließen sich gegenseitig aus bzw. müssen mit anderen Parametern kombiniert werden.
-u und -w schließen sich gegenseitig aus, da sie unterschiedliche Bearbeitungsformen reduzierter Wortformen darstellen.
-t und -g bedingen sich gegenseitig:
Im Fall, daß -t und -g beide angegeben sind, werden Turns, in denen Neologismen, Fragmente oder Wortformen mit techn. Abbrüchen auftreten, vollständig gelöscht.
Ist nur -g angegeben, werden nur die entsprechend markierten Formen entfernt. Da -t die weitergehende Operation ist, wird -g nur dann vollständig abgearbeitet, wenn -t nicht angegeben ist. Dementsprechend wird -t nur dann korrekt abgearbeitet, wenn -g angegeben worden ist.
-R und -m:
Der Parameter -m kann nur zur Erzeugung von Referenzdateien angewendet werde. -m ermöglicht, bezogen auf die Referenzdateien, eine feinere Klasseneinteilung für artikulatorische Geräusche.



next up previous contents
Next: References Up: No Title Previous: Defaulttransformation



Daniela Steinbrecher
Wed Dec 20 14:53:20 MET 1995