next up previous
Next: Formalismus und Interpretation Up: Dafydd GibbonFormale Methoden Previous: Gemeinsame TeilstrukturenUnifikation

Formale Grammatiken: Wiederholung und Erweiterung

Folgende Themen werden wiederholt und um vier Bereiche erweitert:

  1. Weitere Details zur Chomsky-Hierarchie
  2. Merkmalsgrammatiken mit AWS statt atomarer Symbole
  3. ID/LPL-Grammatiken, mit einer Unterscheidung zwischen den hierarchischen syntagmatischen Relationen und den linearen syntagmatischen Relationen in der Konstituentenstruktur.
  4. Anwendung von AWS zur Explikation von Funktionen, insbesondere:
    1. von bestimmten paradigmatischen Relationen, die als Funktionen angesehen werden können,
    2. von hierarchischen syntagmatischen Relationen, die als Funktionen angesehen werden können.

Wir werden uns zunächst auf kontextfreie Grammatiken beschrnken.

Endliche Sprachen

Einige Sprachen sind endlich, d.h. sind durch endliche Mengen von Ketten darstellbar. Möglicherweise wäre eine solche Sprache die Sprache einfacher Wettervorhersagen, oder eine bestimmte Art alltäglicher Kommunikation, die nur aus Floskeln und festen Redewendungen besteht. Oder die Sprache, die die Silben der deutschen Sprache repräsentiert: Silben haben eine definierbare maximale Länge, die Sprache, die sie repräsentiert, muss daher endlich sein.

Eine endliche Sprache kann im Prinzip aufgelistet werden.

Dennoch kann es sinnvoll sein, eine Grammatik und nicht eine Aufzählung zu benutzen, um Ähnlichkeiten zwischen den Sätzen herauszuabstrahieren, und dadurch einerseits interessante Generalisierungen auszudrücken, andererseits, um eine Vereinfachung der Repräsentation zu erzielen.

Die Chomsky-Hierarchie

Die Chomsky-Hierarchie definiert eine Ordnung über Sprachen und Grammatiken, die auf der Komplexität der Grammatiken beruht und auch eine Aussage über die Eignung verschiedener formaler Grammatik- und Sprachtypen für die Beschreibung verschiedener sprachlicher Strukturen.

Informell ausgedrückt reicht die Skala der Komplexität von der Fähigkeit, lineare, flache Strukturen zu beschreiben (Typ-3-Grammatiken) über die Fähigkeit, baumgraphische Strukturen zu beschreiben (Typ-2-Grammatiken) und die Fähigkeit, Graphiken mit Koindizierung zu Beschreibung (Typ-1-Grammatiken) bis hin zu den mächtigsten Grammatiken, die beliebige Strukturen beschreiben können (Typ-1-Grammatiken).

Grammatiken sind in jedem Fall Quadrupel <V,T,P,S> (unterschiedliche Buchstaben werden in der Literatur verwendet):

V:
endliches Vokabular nonterminaler Symbole
T:
endliches Vokabular terminaler Symbole
P:
endliche Menge von Produktionsregeln
S:
Startsymbol

Konventionell werden die Elemente von T mit Kleinbuchstaben, die Elemente von N mit Großbuchstaben dargestellt.

Die Unterschiede zwischen den Grammatiktypen sind in der Definition der Struktur der Produktionsregeln zu finden.

Typ-3-Sprachen und -Grammatiken

Rechtslineare Grammatiken

Die Regelmenge P enthält Regeln folgender Typen:

  1. Terminale Regel: tex2html_wrap_inline4421
  2. Nonterminale Regel: tex2html_wrap_inline4423

Linkslineare Grammatiken

Die Regelmenge P enthält Regeln folgender Typen:

  1. Terminale Regel: tex2html_wrap_inline4421
  2. Nonterminale Tegel: tex2html_wrap_inline4427

Typ-2-Sprachen und -Grammatiken

Allgemeine Typ-2-Sprachen

Die Regelmenge P enthält Regeln folgender Typen:

  1. Nonterminale Regel: tex2html_wrap_inline4429
    1. tex2html_wrap_inline4431
    2. tex2html_wrap_inline4433

Metalineare Grammatiken

Die Regelmenge P enthält Regeln folgender Typen:

  1. Terminale Regel: tex2html_wrap_inline4421
  2. Nonterminale Regel: tex2html_wrap_inline4437
  3. Bedingungen:
    1. tex2html_wrap_inline4439
    2. tex2html_wrap_inline4441

Greibach-Normalform-Grammatiken

Die Regelmenge P enthält Regeln folgender Typen:

  1. tex2html_wrap_inline4443
  2. Bedingung: tex2html_wrap_inline4431

Chomsky-Normalform-Grammatiken

Die Regelmenge P enthält Regeln folgender Typen:

  1. tex2html_wrap_inline4421
  2. tex2html_wrap_inline4429
  3. Bedingungen:
    1. tex2html_wrap_inline4451
    2. tex2html_wrap_inline4453

Typ-1-Sprachen und -Grammatiken

Die Regelmenge P enthält Regeln folgender Typen:

  1. tex2html_wrap_inline4455
  2. tex2html_wrap_inline4457
  3. Bedingungen:
    1. tex2html_wrap_inline4459
    2. tex2html_wrap_inline4433

Typ-0-Sprachen und -Grammatiken

  1. tex2html_wrap_inline4463
  2. Bedingungen:
    1. tex2html_wrap_inline4465
    2. tex2html_wrap_inline4467

Erweiterung 1: ID/LP-Grammatiken

Eine Grammatikregel

tex2html_wrap_inline4469

baut auf 2 Operationen auf:

  1. Konkatenation: LHS und die RHS sind Elemente von V*, T*, oder tex2html_wrap_inline4475, also Ketten, die aus diesen Vokabularen vermittels der Verkettungsoperation (Konkatenationsoperation) definert werden.
  2. Ersetzung: In einer Ableitung wird ein Vorkommen der Kette bzw. des Symbols auf der linken Regelseite durch eine auf der rechten Regelseite definierte Kette oder Symbol ersetzt.

Diese beiden Operationen werden in der Linguistik eingesetzt, um zwei verschiedene syntagmatische Relationen zu modellieren:

  1. "Teil-von"-Relationen, wie z.B. Subjekt eines Satzes:
    In einer aufzählenden Definition: Subjekt(A,B): {<"hans","hans grölt">,<"susi","susi trällert", ...>}
    Diese Relation heißt Immediate Dominance (ID) Relation.
  2. "Vor-nach"-Relationen, die die Reihenfolge der Wörter und Phrasen in einem Satz definieren:
    SOV: (dass) Tom das Buch kaufte.
    SOVV: (dass) Tom das Buch kaufen wollte.
    SVO: Tom kaufte das Buch.
    SVOV: Tom wollte das Buch kaufen.
    VSO: Kaufte Tom das Buch?
    VSOV: Wollte tom das Buch kaufen?
    Diese Relation heißt Linear Precedence (LPL) Relation.

Neuere Grammatiktheorien trennen scharf zwischen diesen beiden Operationen, und ebenso zwischen den beiden linguistischen Interpretationen der Operationen. Grammatiken, die diese Trennung machen, heißen ID/LP-Grammatiken.

Eine kontextfreien Grammatik G mit den Regeln

tex2html_wrap_inline4469
tex2html_wrap_inline4479
tex2html_wrap_inline4481

wäre dann detaillierter anzugeben, z.B. in der Form:

tex2html_wrap_inline4483, tex2html_wrap_inline4485
tex2html_wrap_inline4479
tex2html_wrap_inline4481

Hier wird das Symbol tex2html_wrap_inline4491 verwendet, um eine ungeordnete Reihung zu repräsentieren, und tex2html_wrap_inline4493, um die lineare Präzedenz anzugeben.

Die lineare Präzedenzbedingung stellt eine Art Filter da, der aus allen möglichen Anordnungen nur eine relevante Reihenfolge (oder auch mehrere) herausfiltert.

Auch hier könnte man die Mobile-Analogie verwenden, um die fehlende Anordnung zu illustrieren.

Erweiterung 2: Merkmals-Grammatiken

Die Symbole einer konventionellen formalen Grammatik haben relativ simple linguistische Interpretationen als einfache linguistische Kategorien.

Aber linguistische Kategorien können auch komplex sein, wie z.B. in den Fällen, die durch komplexe Attribut-Wert-Strukturen ausgedrückt werden.

Komplexe Symbole wurden bereits vor knapp 40 Jahren (1965) in die Grammatiktheorie eingeführt, um die komplexen Kategorien und Bedingungen zu beschreiben, unter denen lexikalische Einheiten (Wörter) in Sätzen vorkommen können. Vor allem seit ca. 1980 wird diese Idee zunehmend generalisiert. Grammatiken, die in ihren Regeln komplexe Symbole verwenden, heißen Merkmalsgrammatiken.

Beispiel:

tex2html_wrap_inline4495 tex2html_wrap_inline4497 tex2html_wrap_inline4499

Die bekannte Mobile-artige-Struktur von Attribut-Wert-Strukturen wird hier direkt eingesetzt, um die nichtgeordnete RHS der Regel darzustellen.

Hinzu kommt eine LP-Bedingung, auf die hier nicht weiter eingegangen wird. Eine solche Grammatik ist HPSG, die als letztes Thema besprochen werden soll.

Die Umformulierung als AWS wird konventionell noch weiter getrieben, indem auch die Pfeil-Operation mit einbezogen wird:

tex2html_wrap_inline4501

Effektiv hat man hier eine Unifikation der LHS und der RHS durchgeführt.

Anmerkung zu AWS und linguistischen Relationen

Wenn eine linguistische Relation auch als Funktion definiert werden kann, eignen sich Attribute, um sie auszudrücken.

Hierbei haben sich zwei Einsatzbereiche für Attribute herausgebildet:

Paradigmatische Funktionen:
Attribute, deren Werte mengentheoretisch eine Partition einer Grundmenge von Objekten definieren.
Syntagmatische Funktionen:
Attribute, die Teil-von-Relationen, wie z.B. Satz- und Phrasenfunktionen, definieren.


next up previous
Next: Formalismus und Interpretation Up: Dafydd GibbonFormale Methoden Previous: Gemeinsame TeilstrukturenUnifikation

Dafydd Gibbon, Thu Jul 3 20:58:05 MEST 2003 Automatically generated, links may change - update every session.