Bisher wurden, aufbauend auf Formale Methoden 1, folgende zentrale Begriffe eingeführt bzw. verwendet:
Als Standardnotation für Attribut-Wert-Strukturen wurden umfassende eckige Klammern eingeführt, die daran erinnern, dass Attribut-Wert-Strukturen auch als Matrizen aufgefasst werden können (daher auch die häufige Bezeichnung Attribut-Wert-Matrix, AVM:
Entweder:
Oder:
Oder:
Und komplexe AWS:
Entsprechend kommen die Bezeichnungen Merkmalsvektor bzw. Wertevektor in der Literatur häufig vor.
Der Satz "Marko sah Gesine" kann, etwas vereinfachend, folgendermaßen zerlegt werden:
Fß"ur die in Parenthesen wiedergegebene hierarchische Struktur kann in bekannter Weise ein Baumgraph der Konstituenten gezeichnet werden.
Aber in diesen klassischen linguistischen Darstellungen fehlen einige ganz entscheidende Informationen: Die Satzfunktionen, wie Subjekt, Prädikat, Objekt.
Diese Satzfunktionen werden in funktionalen Grammatiken
als Attribute formalisiert, und die Konstituentenkategorien als ihre
Werte:

Zur Diskussion:
Eine etwas andere Notation wird in einer bekannten Familie von Textrepräsentationssprachen vor, am bekanntesten HTML, wie in folgendem Ausschnitt aus einer Webseite für diese Lehrveranstaltung:
<img
WIDTH=37
HEIGHT=24
ALIGN=BOTTOM
ALT="next"
SRC="http://coral.lili.uni-bielefeld.de/icons/latex2html/next_motif.gif"
>
Zusätzlich zu den Attribut-Wert-Paaren wird der Typ der Attribut-Wert-Struktur angegeben: img, was im Prinzip durch ein Attribute-Wert-Paar "TYPE=img" ausgedrückt werden könnte. Dieses Konstrukt heisst Tag mit Elementnamen und Attribut-Wert-Paaren.
Ein HTML-Element besteht aus einem Anfangs-Tag und einem End-Tag, mit dazwischenliegendem Inhalts-String, z.B.:
<table BORDER=1>
<tr>
<td ALIGN=LEFT> Mann </td>
<td ALIGN=LEFT> Frau</td>
</tr>
</table>
Neben den den Typ-Namen können die zwischen Anfangs- und End-Tags liegenden Inhalts-Strings ebenfalls als Werte von unbenannten Attributen aufgefasst werden, z.B. "CONTENT=schwarz".
Für diesen HTML-Ausdruck ergäbe sich dann folgende komplexe AWS, mit der man nun attribut-logisch formal präzise umgehen kann:
Es kann eine bijektive Funktion definiert werden, die diese beiden Notationen ineinander übersetzt. In diesem Kontext wird bei einer solchen bijektiven Funktion oft von einer verlustfreien Übersetzung von Formaten gesprochen.
Zur Diskussion:
Für Grammatiken und Automaten und wurde neben den algebraischen Notationen eine formal äquivalente graphische Notation für Übergangsnetzwerke definiert.
In ähnlicher Weise gibt es für die Attribut-Wert-Notation eine graphische Darstellung in der Form der gerichteten azyklischen Graphen (directed acyclic graphs, DAGs). Diese Notation wird intuitiv eingeführt, ohne auf graphtheoretische Grundlagen einzugehen.
Eine Operationalisierung der Funktion, die AWS auf DAGs abbildet, sieht informell so aus:
Für die bisherigen Beispiele können auf diese Weise folgende DAGs gezeichnet werden:
|
|
|
|
|
|
Ein Pfad in einer AWS ist eine Kette von benachbarten Attributen, wie z.B. im vorausgegangenen Beispiel folgende Ketten:
Allgemeine Definition der Syntax von Pfaden:
Ein Pfad ist die leere Kette (der leere Pfad), ein Attribut, oder ein Pfad verkettet mit einem Attribut (und sonst gar nichts).
Eine weitere Notation für AWS stellt also die Pfadnotation dar, z.B.:
Um Abbildungen von AWS zu vereinfachen, wird die Pfadnotation oft mit der Standardnotation gemischt.
Die leere AWS, geschrieben [ ], heist auch Variable. Diese Bezeichnung erscheint zunächst zugegebenermaßen etwas obskur, wird aber bei der Besprechung von Operationen über AWS klar.
Eine AWS kann als eine partielle Funktion angesehen werden, die Attributen
Werte zuweist, die selbst entweder AWS oder atomar sind.
Schematisch:
Im bisherigen Beispiel stellt die AWS also folgende Funktion (in aufzählender Schreibweise als Relation) dar:
| { | < TYPE, table >, | |
| < BORDER, 1 >, | ||
| < ROW | TYPE, tr >, | ||
| < ROW | CELL | TYPE, td >, | ||
| < ROW | CELL | ALIGN, LEFT >, | ||
| < ROW | CELL | CONTENT, Mann > | } |
Das linke Element eines dieser geordneten Paare ist jeweils ein Attribut bzw. ein Pfad, das rechte Element ist ein Wert.
Warum partielle Funktion? Weil in einer AWS nicht alle für diese ASW relevanten Attribute vorkommen müssen.
Ein AWS ist unterspezifiziert, wenn nicht allen Attributen, die für die AWS relevant sind, Werte zugeordnet werden.
Die leere AWS [ ] ist vollständig unterspezifiziert.
und
sind identisch, wenn beide AWS die gleichen AW-Paare
enthälten.
Allgemein wird die Relation der Subsumtion von AWS informell über den Begriff Information eingeführt:
Wenn
allgemeiner bzw. weniger informativ als
ist, dann subsumiert
.
Eine einfache formale Definition bezieht sich auf die Pfad-Notation:
subsumiert
(
),
wenn die Menge der Attribut-Wert-Paare (bzw. Pfad-Wert-Paare) in
eine Teilmenge der Attribut-Wert-Paare (bzw. Pfad-Wert-Paare) in
ist.
N.B.: Die leere AWS [ ] subsumiert alle AWS.
Die Subsumtionsrelation definiert eine partielle Ordnung über AWS und hat daher folgende Eigenschaften:
Reflexivität: Jede AWS subsumiert sich selbst:
Transitivität: Wenn
und
, dann
.
Antisymmetrie: Wenn
und
, dann gilt
Für die Mathematiker:
Die partielle Ordnung der Subsumtion definiert einen Verband
(lattice) dar.
Gegeben seien folgende AWS (vgl. Carstensen & al., 94f.):
Zur Diskussion: