next up previous
Next: Gemeinsame TeilstrukturenUnifikation Up: Dafydd GibbonFormale Methoden Previous: Attribut-Wert-Strukturen (AW-Strukturen)

Gerichtete azyklische Graphen und Relationen über AWS

Revision

Bisher wurden, aufbauend auf Formale Methoden 1, folgende zentrale Begriffe eingeführt bzw. verwendet:

Menge
Eigenschaft
Partition
Äquivalenzklasse
Äquivalenzrelation
paradigmatische Relation
Prädikat
Merkmal
Merkmalsbündel
Attribut
Wert
Attribut-Wert-Paar
Attribut-Wert-Struktur
komplexe Attribut-Wert-Struktur

Notationen für Attribut-Wert-Strukturen

Standardnotation

Als Standardnotation für Attribut-Wert-Strukturen wurden umfassende eckige Klammern eingeführt, die daran erinnern, dass Attribut-Wert-Strukturen auch als Matrizen aufgefasst werden können (daher auch die häufige Bezeichnung Attribut-Wert-Matrix, AVM:

Entweder:

tex2html_wrap_inline4195

Oder:

tex2html_wrap_inline4205

Oder:

tex2html_wrap_inline4207

Und komplexe AWS:

tex2html_wrap_inline4201

Entsprechend kommen die Bezeichnungen Merkmalsvektor bzw. Wertevektor in der Literatur häufig vor.

Ein Satzbeispiel

Der Satz "Marko sah Gesine" kann, etwas vereinfachend, folgendermaßen zerlegt werden:

(S (NP Marko) (VP (V sah) (NP Gesine)))

Fß"ur die in Parenthesen wiedergegebene hierarchische Struktur kann in bekannter Weise ein Baumgraph der Konstituenten gezeichnet werden.

Aber in diesen klassischen linguistischen Darstellungen fehlen einige ganz entscheidende Informationen: Die Satzfunktionen, wie Subjekt, Prädikat, Objekt.

Diese Satzfunktionen werden in funktionalen Grammatiken als Attribute formalisiert, und die Konstituentenkategorien als ihre Werte:

tex2html_wrap_inline4211

Zur Diskussion:

  1. Erstellung eines Konstituentenbaums für entsprechend der Klammerung im Beispiel.
  2. Erstellung eines DAG entsprechend der AWS im Beispiel.

Text-Auszeichnungs-Notation

Eine etwas andere Notation wird in einer bekannten Familie von Textrepräsentationssprachen vor, am bekanntesten HTML, wie in folgendem Ausschnitt aus einer Webseite für diese Lehrveranstaltung:

<img
     WIDTH=37
     HEIGHT=24
     ALIGN=BOTTOM
     ALT="next"
     SRC="http://coral.lili.uni-bielefeld.de/icons/latex2html/next_motif.gif"
     >

Zusätzlich zu den Attribut-Wert-Paaren wird der Typ der Attribut-Wert-Struktur angegeben: img, was im Prinzip durch ein Attribute-Wert-Paar "TYPE=img" ausgedrückt werden könnte. Dieses Konstrukt heisst Tag mit Elementnamen und Attribut-Wert-Paaren.

Ein HTML-Element besteht aus einem Anfangs-Tag und einem End-Tag, mit dazwischenliegendem Inhalts-String, z.B.:

<table BORDER=1>
    <tr>
        <td ALIGN=LEFT> Mann </td>
        <td ALIGN=LEFT> Frau</td>
    </tr>
</table>

Neben den den Typ-Namen können die zwischen Anfangs- und End-Tags liegenden Inhalts-Strings ebenfalls als Werte von unbenannten Attributen aufgefasst werden, z.B. "CONTENT=schwarz".

Für diesen HTML-Ausdruck ergäbe sich dann folgende komplexe AWS, mit der man nun attribut-logisch formal präzise umgehen kann:

tex2html_wrap_inline4213

Es kann eine bijektive Funktion definiert werden, die diese beiden Notationen ineinander übersetzt. In diesem Kontext wird bei einer solchen bijektiven Funktion oft von einer verlustfreien Übersetzung von Formaten gesprochen.

Zur Diskussion:

  1. Wie könnte eine solche Funktion aussehen?
  2. Für die Texttechnologen, Computerlinguisten und Informatiker: Wie könnte diese Funktion implementiert werden?

Graphische Notation: gerichtete azyklische Graphen

Für Grammatiken und Automaten und wurde neben den algebraischen Notationen eine formal äquivalente graphische Notation für Übergangsnetzwerke definiert.

In ähnlicher Weise gibt es für die Attribut-Wert-Notation eine graphische Darstellung in der Form der gerichteten azyklischen Graphen (directed acyclic graphs, DAGs). Diese Notation wird intuitiv eingeführt, ohne auf graphtheoretische Grundlagen einzugehen.

Eine Operationalisierung der Funktion, die AWS auf DAGs abbildet, sieht informell so aus:

  1. Weise jedem AWS ein Knoten zu.
  2. Weise jedem atomaren Wert ein Knoten zu.
  3. Für jedes Attribut in jedem AWS,
    1. ausgehend vom Knoten, der dem AWS zugewiesen wurde, zeichne eine Kante,
    2. beschrifte sie mit dem Attributnamen,
    3. beende die Kante beim Knoten, der den Wert des Attributs zugeordnet wurde.

Für die bisherigen Beispiele können auf diese Weise folgende DAGs gezeichnet werden:

tex2html_wrap_inline4195
tex2html_wrap4221

tex2html_wrap_inline4201
tex2html_wrap4223

tex2html_wrap_inline4213
tex2html_wrap4225

Pfade

Ein Pfad in einer AWS ist eine Kette von benachbarten Attributen, wie z.B. im vorausgegangenen Beispiel folgende Ketten:

Allgemeine Definition der Syntax von Pfaden:

Ein Pfad ist die leere Kette (der leere Pfad), ein Attribut, oder ein Pfad verkettet mit einem Attribut (und sonst gar nichts).

Eine weitere Notation für AWS stellt also die Pfadnotation dar, z.B.:

tex2html_wrap_inline4243

Um Abbildungen von AWS zu vereinfachen, wird die Pfadnotation oft mit der Standardnotation gemischt.

Die leere AWS

Die leere AWS, geschrieben [ ], heist auch Variable. Diese Bezeichnung erscheint zunächst zugegebenermaßen etwas obskur, wird aber bei der Besprechung von Operationen über AWS klar.

AWS als partielle Funktion

Eine AWS kann als eine partielle Funktion angesehen werden, die Attributen Werte zuweist, die selbst entweder AWS oder atomar sind. Schematisch:

AWS(attr) = wert
.

Im bisherigen Beispiel stellt die AWS also folgende Funktion (in aufzählender Schreibweise als Relation) dar:

{ < TYPE, table >,
< BORDER, 1 >,
< ROW | TYPE, tr >,
< ROW | CELL | TYPE, td >,
< ROW | CELL | ALIGN, LEFT >,
< ROW | CELL | CONTENT, Mann > }

Das linke Element eines dieser geordneten Paare ist jeweils ein Attribut bzw. ein Pfad, das rechte Element ist ein Wert.

Warum partielle Funktion? Weil in einer AWS nicht alle für diese ASW relevanten Attribute vorkommen müssen.

 

Subsumtion (subsumption)

Unterspezifikation

Ein AWS ist unterspezifiziert, wenn nicht allen Attributen, die für die AWS relevant sind, Werte zugeordnet werden.

Die leere AWS [ ] ist vollständig unterspezifiziert.

Identität

tex2html_wrap_inline4283 und tex2html_wrap_inline4285 sind identisch, wenn beide AWS die gleichen AW-Paare enthälten.

Subsumtion

Allgemein wird die Relation der Subsumtion von AWS informell über den Begriff Information eingeführt:

Wenn tex2html_wrap_inline4283 allgemeiner bzw. weniger informativ als tex2html_wrap_inline4285 ist, dann subsumiert tex2html_wrap_inline4283 tex2html_wrap_inline4285.

Eine einfache formale Definition bezieht sich auf die Pfad-Notation:

tex2html_wrap_inline4283 subsumiert tex2html_wrap_inline4285 (tex2html_wrap_inline4299), wenn die Menge der Attribut-Wert-Paare (bzw. Pfad-Wert-Paare) in tex2html_wrap_inline4283 eine Teilmenge der Attribut-Wert-Paare (bzw. Pfad-Wert-Paare) in tex2html_wrap_inline4285 ist.

N.B.: Die leere AWS [ ] subsumiert alle AWS.

Die Subsumtionsrelation definiert eine partielle Ordnung über AWS und hat daher folgende Eigenschaften:

Reflexivität: Jede AWS subsumiert sich selbst: tex2html_wrap_inline4305

Transitivität: Wenn tex2html_wrap_inline4307 und tex2html_wrap_inline4309, dann tex2html_wrap_inline4311.

Antisymmetrie: Wenn tex2html_wrap_inline4307 und tex2html_wrap_inline4315, dann gilt tex2html_wrap_inline4317

Für die Mathematiker:
Die partielle Ordnung der Subsumtion definiert einen Verband (lattice) dar.

Beispiele für Subsumtion

Gegeben seien folgende AWS (vgl. Carstensen & al., 94f.):

  1. tex2html_wrap_inline4319
  2. tex2html_wrap_inline4321
  3. tex2html_wrap_inline4323

Zur Diskussion:

  1. Welche dieser AWS subsumieren welche anderen?
  2. Wie kann die durch diese Relation definierte partielle Ordnung über AWS graphisch dargestellt werden?
  3. Welche neu zu definierenden AWS würden eine komplexere Verzweigung dieser Graphik erfordern?


next up previous
Next: Gemeinsame TeilstrukturenUnifikation Up: Dafydd GibbonFormale Methoden Previous: Attribut-Wert-Strukturen (AW-Strukturen)

Dafydd Gibbon, Thu Jul 3 20:58:05 MEST 2003 Automatically generated, links may change - update every session.