next up previous
Next: Formale Grammatiken: Wiederholung und Up: Dafydd GibbonFormale Methoden Previous: Gerichtete azyklische Graphen und

Gemeinsame Teilstrukturen, Unifikation

Gemeinsame Teilstrukturen (Koreferenz, re-entrancy)

Werte von Attributen in einer Attribut-Wert-Struktur wurden bisher als Konstanten angegeben, die als Eigenschaften interpretiert werden können, die Äquivalenzklassen über eine Grundmenge von Objekten, Ereignissen usw., definieren und zusammen mit den anderen Werten des Attributs eine Partition der Grundmenge definieren). Die Konstanten Werte von Attributen zwei Formen annehmen können:

Die Attribut-Wert-Strukturen, die auf diese Weise definiert werden, können durch Baumgraphen definiert werden (und können, nebenbei, damit auch prinzipiell durch kontextfreie Grammatiken, d.h. von Typ-2-Grammatiken in der Chomsky-Hierarchie) beschrieben werden.

Für die Beschreibung einiger Eigenschaften natürlicher Sprachen sind aber komplexere Strukturen geeignet, die nicht mehr mit Baumgraphen darstellbar sind.

Beispiel Subjekt-Verb-Kongruenz:

Welche der folgenden Sätze sind im Deutschen grammatikalisch?

  1. Die Tische bist wunderbar.
  2. Die Tische ist wunderbar.
  3. Die Tische sind wunderbar.
  4. Der Tisch bist wunderbar.
  5. Der Tisch ist wunderbar.
  6. Der Tisch sind wunderbar.
  7. Du bist wunderbar.
  8. Du ist wunderbar.
  9. Du sind wunderbar.

Es gibt offenbar eine Abhängigkeit über die Äste des Syntaxbaums hinweg, die die Verwendung bestimmter Formen beim Nomen und beim Verb von den morphosyntaktischen Kategorien Person und Numerus abhängig macht, die man folgendermaßen in Regeln fassen kann:

Eine bessere Möglichkeit ergibt sich mit Attribut-Wert-Strukturen, wenn man einfach feststellt, daß Subjekt und Verb beide die Attribute Person und Numerus gemeinsam haben, und zwar jeweils mit identischen Werten.

Die Verwendung einer gemeinsamen Struktur hat in der Literatur verschiedene Namen, z.B.:

Wenn die gleichen Teilstrukturen einfach wiederholt werden, führt dies zu einer recht unübersichtlichen Merkmalsstruktur, die auf Einhaltung der Kongruenzbedingung ad hoc geprüft werden muss:

tex2html_wrap_inline4325

Die relevanten Regeln können aber sehr elegant einfach durch eine Art von Variablen dargestellt werden, die einmal einen Wert zugewiesen bekommt, der an einer Stelle in der AW-Struktur auftritt, und dann an anderen Stellen in der AW-Struktur verwendet werden kann. Dabei bleibt der einmal zugewiesene Wert erhalten:

tex2html_wrap_inline4437

Die Notation für diese Variable heißt in der Literatur boxed integer oder boxed index, also ``eingerahmte Ganzzahl'' bzw. ``eingerahmter Index''.

(N.B.: Manchmal wird auch die leere AW-Struktur als ``Variable'' bezeichnet, diese - ganz andere - Bedeutung des Begriffs ``Variable'' wird jedoch hier nicht verwendet.)

In diesem Fall könnte die Wertzuweisung zur Variablen entweder beim Prädikat oder beim Subjekt vorgenommen werden, dann könnte die übergeordnete Angabe des Attributs AGR entfallen:

tex2html_wrap_inline4439

Dadurch ergibt sich eine noch einfachere Repräsentation, wie sie in der Literatur oft zu finden ist. Welche Repräsentation gewählt wird, hängt von weiteren Annahmen über die Rolle von Attributen in der Grammatik zusammen, die in diesem Kontext eher nebensächlich sind.

Anmerkung: Die Reihenfolge der Attribute in einer AW-Struktur ist grundsätzlich undefiniert, also völlig egal. Eine solche Struktur kann als Mobile visualisiert werden:

Bild: Mobile

 

 

(Danke, Yahoo shopping!)

 

In diesen AW-Strukturen wird also nichts über die Reihenfolge der Satzglieder ausgedrückt. Die Reihenfolge wird in modernen Grammatiken durch eine andere Operation getrennt ausgedrückt, die später behandelt wird. Grammatiken, die die Unterscheidung zwischen hierarchischen Strukturen und linearer Reihenfolge machen, heißen ID/LP-Grammatiken; Beispiele sind HPSG (Head-driven Phrase Structure Grammar) und LFG (Lexical Functional Grammar) (s. Literaturliste, 12).

zur Diskussion:

  1. Wie werden diese AW-Strukturen graphisch als DAG dargestellt?
  2. Bauen Sie doch mit Ihrem Nachbarn oder Ihrer Nachbarin (oder nachher mit Ihren jüngeren Verwandten) ein Mobile zur Visualisierung dieser Beispiele...

Anwendungen von koreferenten Merkmalsstrukturen

Beispiele für moderne Grammatikansätze, die diese Art der Formalisierung verwenden, sind HPSG (Head-driven Phrase Structure Grammar) und LFG (Lexical Functional Grammar) (s. Literaturliste, 12).

Kompatibilität

Subsumtion, vgl. 3.5, definiert eine Relation der Kompatibilität zwischen einer kleineren, allgemeineren AW-Struktur und einer größeren, spezifischeren AW-Struktur. Eine informelle Analogie besteht zwischen Oberbegriff und Unterbegriff:

Der Begriff Hund subsumiert die Begriffe Pudel, Terrier, Dackel, Rottweiler, Chihuahua.

Diese Begriffe können detailliert anhand von AW-Strukturen definiert werden, für die AW-Strukturen gilt dann das Gleiche: die allgemeinere Merkmalsstruktur subsumiert das spezifischere.

Die Subsumtion ist eine partielle Ordnung: sie gilt nicht für beliebige AW-Strukturen.

Es gibt zwei Fälle, für die die Subsumtion nicht gilt:

Kompatible aber unterschiedliche AW-Strukturen:

tex2html_wrap_inline4341

tex2html_wrap_inline4343

Diese beiden AW-Strukturen sind kompatibel, obwohl keine die andere subsumiert. Es ist unerheblich, ob die eine spezifischer ist als die Andere: Die verschiedenen Attribute drücken orthogonale - unabhängige - Informationsarten aus.

Widersprüchliche AW-Strukturen:

tex2html_wrap_inline4341

tex2html_wrap_inline4347

Dieser Fall ist anders gelagert. Die Werte von gleichen Attributen (genauer gesagt: von gleichen Pfaden) sind verschieden, also werden sie als Eigenschaften definiert, die zwei verschiedene Äquivalenzklassen in einer Partition charakterisieren. Damit definieren sie verschiedene Mengen und sind nicht kompatibel sondern widersprüchlich.

 

Unifikation

Die beiden Fälle sind noch in einer anderen Weise anders gelagert. Bei den kompatiblen Strukturen gibt es eine dritte AW-Struktur, die von beiden subsumiert wird:

tex2html_wrap_inline4349

Es gilt also

tex2html_wrap_inline4343  tex2html_wrap_inline4353  tex2html_wrap_inline4349

und

tex2html_wrap_inline4341  tex2html_wrap_inline4353  tex2html_wrap_inline4349

Wenn die spezifischere AW-Struktur noch spezifischer wäre, d.h. AW-Paare enthalten würde, die nicht in den beiden anderen allgemeineren AW-Strukturen schon enthalten wäre, würde die Subsumtionsrelation immer noch gelten.

Aber es gibt diesen einen Spezialfall, der hier gezeigt wird, wobei keine weiteren AW-Paare als diejenigen in den allgemeineren AW-Strukturen enthalten sind. Dann ist diese dritte AW-Struktur die allgemeinste (oder auch kleinste) AW-Struktur, die von beiden allgemeineren AW-Strukturen subsumiert wird, die Unifikation dieser beiden allgemeineren AW-Strukturen

Kompakter ausgedrückt:

Die Unifikation von zwei AW-Strukturen A und B ist die kleinste AW-Struktur C, die von A und von B subsumiert wird:

tex2html_wrap_inline4363

Für das bereits verwendete Beispiel gilt also:

tex2html_wrap_inline4349  =  tex2html_wrap_inline4343  tex2html_wrap_inline4369  tex2html_wrap_inline4341

Zur Diskussion:

Wie können DAGs, die diese AW-Strukturen darstellen, so gezeichnet werden, dass die Unifikation C durch übereinanderlegen der beiden Graphen A und B entsteht?

Unifikation von koindizierten Strukturen

Die beiden AW-Strukturen

tex2html_wrap_inline4373

und

tex2html_wrap_inline4439

sind nicht gleich.

Es ist durchaus nicht so, dass die koindizierte AW-Struktur einfach eine Abkürzung für die nicht-koindizierte Struktur darstellt, obwohl informell beide AW-Strukturen gleich interpretierbar zu sein scheinen.

Logischerweise sind die Werte des AGR-Attributs im ersten Fall nur ähnlich, während die Werte im zweiten Fall identisch sind, da die Variablen (die Indizes) exakt denselben Wert haben.

Entsprechend ist die Unifikation bei koindizierten Strukturen anders als bei nicht-koindizierten Strukturen:

Ohne Koindizierung:

tex2html_wrap_inline4377  tex2html_wrap_inline4369  tex2html_wrap_inline4381  =  tex2html_wrap_inline4385

Mit Koindizierung:

tex2html_wrap_inline4377  tex2html_wrap_inline4369  tex2html_wrap_inline4501  =  tex2html_wrap_inline4439

Spezialfälle der Unifikation

Zur Diskussion:

  1. Wie können die beiden Fälle von Unifikation mit und ohne Koindizierung als DAGs dargestellt werden?
  2. Wie können folgende deutsche Nominalphrasen mit AW-Strukturen und Koindizierung beschrieben und mit Unifikation aus den einzlenen Komponenten zusammengebaut werden?

    1. der große Hund
    2. des großen Hundes
    3. die großen Hunde
  3. Wie kann die Grammatikalität bzw. Nicht-Grammatikalität folgender bereits besprochenen Beispiele anhand der Unifikationsoperation erklärt werden?
    1. Die Tische bist wunderbar.
    2. Die Tische ist wunderbar.
    3. Die Tische sind wunderbar.
    4. Der Tisch bist wunderbar.
    5. Der Tisch ist wunderbar.
    6. Der Tisch sind wunderbar.
    7. Du bist wunderbar.
    8. Du ist wunderbar.
    9. Du sind wunderbar.

Zusammenfassung

  1. Ein klassischer Fall für den Einsatz von gemeinsamen Teilstrukturen ist die Subjekt-Verb-Kongruenz.
  2. AW-STrukturen mit gemeinsame Teilstrukturen sind nicht durch Baumgraphen darstellbar, sondern erfordern komplexere Graphen.
  3. Die gemeinsamen Teilstrukturen werden durch eingerahmte Indizes notiert.
  4. Die eingerahmten Indizes können im üblichen Sinn als Variablen interpretiert werden.
  5. Subsumtion ist ein Spezialfall der Kompatibilität von AW-Strukturen.
  6. Die kleinste AW-Struktur, die von zwei AW-Strukturen subsumiert wird, ist der Unifikator dieser AW-STrukturen.
  7. Die Unfikation zweier AW-Strukturen und diese AW-Strukturen selbst sind kompatibel.
  8. Nicht kompatible, also widersprüchliche AW-Strukturen unifizieren nicht, also es gibt für sie keinen Unifikator.

next up previous
Next: Formale Grammatiken: Wiederholung und Up: Dafydd GibbonFormale Methoden Previous: Gerichtete azyklische Graphen und

Dafydd Gibbon, Thu Jul 3 20:58:05 MEST 2003 Automatically generated, links may change - update every session.