Das Problem der Redundanz von Metadateninformationen ist in diesem
Report noch nicht betrachtet worden, ist aber relativ zentral:
- In Feldforschungssituationen ist die Eingabe von Metadaten
ohnehin problematisch, da es zeitaufwendig, teuer und lästig- nicht Teil der direkten Korpuserhebung -- ist; die vor Ort Eingabe
ist daher möglichst auf das nNtwendigste zu reduzieren.
- In Laborsituationen ist Redundanz aus Wartungsgründen zu
vermeiden, da Inkonsistenzen auftreten können. Auch hier gilt, dass
redundante Eingaben zeitaufwendig, teuer und unbeliebt sind.
Die Lösung dieses Problems besteht in der Einführung von Inferenzen im
MetaLex-Ansatz.
Dabei gibt es drei verschiedene Klassen von Metadaten:
- Metadaten, die technisch mit einer bestimmten Ebene des Korpus
verbunden sind, etwa Verwertungsrechte, technische Daten zur Aufnahme,
Annotationskonventionen, etc.
- Metadaten, die von untergeordneten Ebenen inferiert werden
können. So kann man etwa eine Liste derjenigen, die zur
Korpuserstellung beigetragen haben, aus den Angaben zum Annotierer auf
unteren Ebenen ableiten.
- Metadaten, die von übergeordneten Strukturen geerbt werden. Z.B. können in der empirischen Feldarbeit die Person des Annotierer
auf verschiedenen Ebenen, Aufnahmeleiters, etc. identisch sein,
wodurch diese Informationen auf einer höheren Ebene angesiedelt werden
können. Es besteht dann allerdings die Notwendigkeit, abweichende
Angaben zuzulassen, etwa die Ergänzung einer weiteren Annotationsebene
durch einen weiteren Annotierer.
Eine Implementierung in DATR ist dabei einfach, die Umsetzung mit
XQuery ist aber angedacht. Näheres ist in (4)
beschrieben.
Thorsten Trippel
2003-12-08