next up previous
Next: GeneralisierungDifferenz, Unifikation, Typ-Vererbung Up: Dafydd GibbonFormale Methoden Previous: Eine einfache KF-AVM-Grammatik

Eine koindizierte KF-AVM-Grammatik

Spezifikation der Grammatik

Die kontextfreie Unifikations-Grammatik reicht für viele Anwendungen, aber sie reicht nicht aus, um alle Generalisierungen auszudrücken, die aufgrund linguistischer Kriterien über natürliche Sprachen gemacht werden können.

Wie eine kontextsensitive Grammatik entwickelt werden kann, wird durch ein Vergleich mit den bisher behandelten AWS deutlich:

Kontextfreie Grammatiken können Abhängigkeiten zwischen Teilketten einer Kette darstellen, die durch Bäumgraphen visualisiert werden können. Baumgraphen werden wiederum zur Visualisierung von nicht-koindizierten gerichteten azyklischen Graphen (DAGs) verwendet. Per Analogieschluss kann man vermuten, dass komplexere Grammatiken und die von ihnen beschriebenen Generalisierungen über Strukturen durch Koindizierung dargestellt werden können.

Im folgenden Beispiel wird ein Koindizierungsmechanismus anhand einer kontextfreien Grammatik eingeführt. Um eine volle kontextsensitive Grammatik darzustellen, ist eine zusätzliche Operation erforderlich, die Indizes in einer Struktur weiterpropagiert (wie z.B. die Head Feature Convention in HPSG). Diese Operation wird hier nicht eingeführt.

Eine koindizierte Unifikationsgrammatik

In dieser Grammatik wurden einige Vereinfachungen vorgenommen, z.B. sind Optionen (Disjunktionen) nicht berücksichtigt.

Die Indizierungsstrategie ist ein wenig anders als beispielsweise in der Literatur:

  1. Die Koindizierung wird in HPSG durch einfache Zahlen oder Buchstaben vorgenommen, was eher an Programmiersprachen oder uninterpretierte Logiken erinnert.
  2. In PATR-II werden Attribut-Pfade verwendet, eine sehr elegante, aber doch recht platzaufwendige Methode.

Diese Grammatik hat folgende besondere Eigenschaften:

  1. Die einzelnen AWS entsprechen in etwa einzelnen Grammatikregeln.
  2. Komplexe Strukturen werden durch Unifizierbarkeit eines komplexen Attribut-Wertes mit einer anderen AWS in der Grammatik.
  3. Die Koindizierung wird durch Werte von Attributen angegeben, die in einer Index-Liste deklariert werden.
  4. Gemeinsame Teilstrukturen sind diejenigen, die durch Werte in der Index-Liste angegeben sind.

Es gibt eben viele Wege, die nach Rom führen. Beispielsweise verwendet die Programmiersprache Prolog eine andere Strategie, in der alle Attribute durch feste Positionen in einem Termvektor dargestellt werden, nicht durch Attributnamen und ungeordneten AWS.

Index-Liste

Die Indexliste ent hält nur einen Wert:

{  subjinfl  }

Dieser Name bezeichnet den Index, der gemeinsame Teilstrukturen bei Subjektnomina und Verben gewährleistet.

Morphosyntax

Die morphosyntaktischen Kongruenz-Constraints, also Flexionsbedingungen z.B. für Subjektnomina und Verben, werden genau wie Grammatikregeln durch AWS dargestellt und unterliegen denselben Unifikationsbedingungen:

Jede Kategorie mit einem Attribut, dessen Wert mit der subinfl-Kategorie unifizierbar ist, teilt den Wert der subinfl-Kategorie als gemeinsame Teilstruktur, weil diese Kategorie in der Index-Liste aufgeführt ist.

Dies gilt nicht für den Wert nouninfl, der nicht in der Index-liste ist. Dieser Wert bezeichnet lediglich die Flexionsattribute, die jedes Nomen hat. Dieser Wert gehört nicht zu den gemeinsamen Teilstrukturen, wenngleich die Ähnlichkeit aller Nomen in dieser Hinsicht durch die Unifizierbarkeit des agr-Wertes der subinfl-Kategorie mit der nouninfl-Kategorie.

{   tex2html_wrap_inline4633, tex2html_wrap_inline4635   }

Syntax

Ein Constraint, um Kongruenzwerte innerhalb von Nominalphrasen und Verbalphrasen weiter zu Propagierten (wie z.B. das Head-Feature-Principle in anderen Unifikationsgrammatiken, fehlt noch in dieser Grammatik.

Daher werden getrennte Kategorien - nicht sehr elegant - für Subjekt- und Objekt-Nominalphrasen eingeführt, um die Konstruktion der Grammatik nicht zu sehr zu verkomplizieren. Der Preis, der dafür bezahlt werden muss, ist die Vermehrung der Kategorien.

{   tex2html_wrap_inline4637, tex2html_wrap_inline4639, tex2html_wrap_inline4641, tex2html_wrap_inline4643, tex2html_wrap_inline4645, tex2html_wrap_inline4647, tex2html_wrap_inline4649   }

Lexikon

Die Struktur des Lexikons unterscheidet sich in nichts von der Struktur der morphosyntaktischen Constraints und der Syntaxregeln. Die Lexikoneinträge werden ebenfalls durch Unifikation mit einem Grammatikwert eingesetzt.

Beim Lexikon werden zur Illustration Optionen als Wertereihen eingeführt.

{   tex2html_wrap_inline4651, tex2html_wrap_inline4653, tex2html_wrap_inline4655, tex2html_wrap_inline4657   }

Eine durch die Grammatik beschriebene, instantiierte Struktur

Die ähnlichen und gemeinsamen Strukturen, die die Grammatik enthält, werden in folgender Gesamtstruktur so aufgelöst, wie sie für die korrekte Einsetzung von lexikalischen Einheiten benötigt werden.

Zu dieser Struktur passt keine der angegebenen lexikalischen Einheiten, weil diese die 3. Person erfordern würden. In diesem Beispiel sind Subjekt und Verb in der 1. Person Plural, das Objekt in der 2. Person Singular. Subjekt und Objekt erfordern also Personalpronomina. Wie bereits notiert, ist die Propagierung solcher Constraints innerhalb von Kategorien noch nicht definiert.

Die AWS könnte also einen Satz wie wir besuchen dich beschreiben, mit Person-, Numerus-, und Kasus-Flexion bei Substantiven, sowie Zeitform-, Aspekt-, und Aktionsart-Flexion bei Verben.

tex2html_wrap_inline4659

Ableitung einer Struktur

Die Ableitungsstrategie ist top-down, wie bei der Ableitung von Sätzen mit einer kontextfreien Grammatik, mit folgendem Verfahren:

  1. Angabe der Start-Kategorie (entsprechend dem Startsymbol).
  2. Suche der entsprechenden Attribut-Wert-Struktur in der Grammatik (entsprechend einer Grammatikregel).
  3. Auswertung aller Attribut-Wert-Paare in der gefundenen Attribut-Wert-Struktur, indem für jedes Attribut aus einer Menge von Werte-Optionen ein Wert ausgewählt wird:

Die Reihenfolge der Auswertung der Attribut-Wert-Paare ist Auswertung einer Verkettungsregel in einer formalen Grammatik, vollkommen gleichgültig und muss, im Gegensatz zur Ableitung mit einer verkettenden formalen Grammatik, nicht angegeben werden. In dieser Ableitung ist die Auswertungsreihenfolge beispielsweise konsistent rechts-links, hätte aber eine beliebige andere sein können. Die Verkettung von Werten ist also nicht eine allgemeine Eigenschaft des Formalismus, sondern muss als Operation explizit angegeben werden. Dieser Schritt wird aber hier nicht gemacht.

Schritte in der Auswertung des Satzes (ohne dadurch aufgebaute AWMs):

Process AVM: tex2html_wrap_inline4637

Satzkonstituenten - VP:

Expand AVP: tex2html_wrap_inline4663

VP:

Process AVM: tex2html_wrap_inline4649

VP-Konstituenten - Verb:

Expand AVP: tex2html_wrap_inline4667

Expand AVP: tex2html_wrap_inline4669

Satzkonstituenten - Objekt-NP:

Process AVM: tex2html_wrap_inline4645

Expand AVP: tex2html_wrap_inline4673

Objekt-NP ist eine NP:

Process AVM: tex2html_wrap_inline4647

Expand AVP: tex2html_wrap_inline4677

Expand AVP: tex2html_wrap_inline4679

Expand AVP: tex2html_wrap_inline4681

Auswertung des cat-Attributs der NP in der Objekt-NP:

Expand AVP: tex2html_wrap_inline4683

Flexionskategorien der Objekt-NP:

Expand AVP: tex2html_wrap_inline4685

Process AVM: tex2html_wrap_inline4635

Expand AVP: tex2html_wrap_inline4689

Expand AVP: tex2html_wrap_inline4691

Expand AVP: tex2html_wrap_inline4693

Expand AVP: tex2html_wrap_inline4695

Auswertung des cat-Attributs der Objekt-NP:

Expand AVP: tex2html_wrap_inline4697

Ko-indizierte Kongruenzkategorien (subjinfl) für VP:

Expand AVP: tex2html_wrap_inline4699

Process AVM: tex2html_wrap_inline4633

Expand AVP: tex2html_wrap_inline4685

Process AVM: tex2html_wrap_inline4635

Expand AVP: tex2html_wrap_inline4689

Expand AVP: tex2html_wrap_inline4691

Expand AVP: tex2html_wrap_inline4693

Expand AVP: tex2html_wrap_inline4713

Auswertung des cat-Attributs der VP:

Expand AVP: tex2html_wrap_inline4715

Expand AVP: tex2html_wrap_inline4717

Satzkonstituenten: Subjekt-NP:

Process AVM: tex2html_wrap_inline4643

Expand AVP: tex2html_wrap_inline4673

Subjekt-NP ist eine NP:

Process AVM: tex2html_wrap_inline4647

Expand AVP: tex2html_wrap_inline4677

Expand AVP: tex2html_wrap_inline4679

Expand AVP: tex2html_wrap_inline4681

Auswertung des cat-Attributs der NP in der Subjekt-NP:

Expand AVP: tex2html_wrap_inline4683

Ko-indizierte Kongruenzkategorien (subjinfl) für Subjekt-NP:

Expand AVP: tex2html_wrap_inline4699

Expand AVP: tex2html_wrap_inline4735

Auswertung des cat-Attributs der Subjekt-NP:

Expand AVP: tex2html_wrap_inline4737

Auswertung des cat-Attributs des Satzes:

Expand AVP: tex2html_wrap_inline4739

Zur Diskussion:

Diese Ableitungsschritte wurden top-down, depth-first, rechts-links durchgeführt. Wie beim kontextfrien, nicht-koindizierten Beispiel, hätten die Schritte auch in jeder beliebigen anderen Reihenfolge durchgeführt werden können, solange kein Rekursionsschritt übersprungen wird.

Welche AVMs entstehen aus dem Start-AWM beim angewendeten Verfahren nach den einzelnen Schritten? (Vgl. das Beispiel der Ableitung bei der nicht-koindizierten Grammatik.)


next up previous
Next: GeneralisierungDifferenz, Unifikation, Typ-Vererbung Up: Dafydd GibbonFormale Methoden Previous: Eine einfache KF-AVM-Grammatik

Dafydd Gibbon, Thu Jul 3 20:58:05 MEST 2003 Automatically generated, links may change - update every session.