next up previous
Next: 17.01.2002: Gruppenarbeit & Berichte Up: Einführung in die Computerlinguistik Previous: 10.01.2002: Gruppenarbeit & Berichte

15.01.2002: Texttechnologie: Textannotation mit XML

Die Texttechnologie ist eine neuere Richtung der Angewandten Computerlinguistik, die auf Vorarbeiten aufbaut, die auch zur Entwicklung des World-Wide-Web und ihrer heutigen Medienvielfalt führten. Die Ausgangspunkte sind in folgenden Bereichen zu finden:

  1. elektronische Dokumentation,
  2. information retrieval,
  3. Archivierung,
  4. Bibliotheken,
  5. geisteswissenschaftliche Textanalyse.

Die wichtigsten Komponenten der Texttechnologie betreffen folgende Problembereiche:

  1. Formale Modellierung von Texten - Syntax, Semantik, Realisierung
  2. Erstellung von Textcorpora
  3. Annotation von Textcorpora
  4. statistische Analyse von Textcorpora
  5. automatische Generierung von Texten aus Datenbanken
  6. Integration anderer Medien in Texte
  7. Benutzermodellierung (Agents, Avatars, Assistenten,...)
  8. computerlinguistische Grundlagen (Datenstrukturen, Algorithmen)
  9. Programmiertechniken für Sprachen, die Text- und Multimediadokumente unterstützen

Ein Dokumentmodell

tex2html_wrap985


Dafydd Gibbon, Wed Feb 12 10:50:41 MET 2003 Automatically generated, links may change - update every session.