next up previous
Next: 29.11.2001: Endliche Automatenreguläre Up: Einführung in die Computerlinguistik Previous: Repräsentation und Verarbeitung morphologischer

22.11.2001: (Gruppenarbeit & Berichte: Wortmodelle mit endlichen Automaten)

Formalismen:

Das inzwischen klassisch gewordene Modell für die operationale Modellierung der Morphologie (und der Phonologie) ist der endliche Automat (finite state automaton) und eine generalisierte Form des endlichen Automaten, die endliche Maschine (finite state transducer, finite state machine).

Eine Vorschau auf die formalen Grundlagen befindet sich an folgenden Stellen:

Überblick über relevante Formalismen

endliche Automaten

Beispiel eines deterministischen endlichen Automaten

Graph- und Tabellen-Notationen für endliche Automaten

Eine interaktive FSA-Demo befindet sich hier.

Aufgabe:

  1. Erstellung einer Wortliste von ca. 10 bis 20 komplexen Wörtern.
  2. Zerlegung der Wörter in Präfix-, Wurzel- und Suffix-Morpheme
  3. Klassifikation der Morpheme nach ihrer wortbildenden Funktion (z.B. bei Suffixen: Abbildung von Verben auf Substantive, von Substantiven auf Adjektive)
  4. Design eines endlichen Automaten, um die Elemente der Wortliste zu beschreiben und auf andere, mögliche Wörter zu verallgemeinern.

Es ist relativ einfach, den DATR-Formalismus zum Formulieren und Testen von deterministischen endlichen Automaten zu verwenden:

Reguläre Sprache a*b

Q0:
  <a> == Q0
  <b> == Qn
  <>  == rejected.

Qn:
  <b> == accepted.

Es gibt allerdings bei DATR eine Einschränkung, die hier nicht behandelt wird. Oder kann jemand sie herausfinden?

Zum Testen kann das DATR scratchpad verwendet werden.



Dafydd Gibbon, Wed Feb 12 10:50:41 MET 2003 Automatically generated, links may change - update every session.