Der Vortrag wird zum Teil =FCber meine aktuelle Arbeit im Rahmen des LS-GRAM
Projekts berichten. Das Projekt steht unmittelbar vor dem End-Term und in
der letzten Zeit waren wir sehr bem=FCht, die Problematik der sogenannten
"messy details" in den Griff zu bekommen.
Das LS-GRAM Projekt arbeitet mit der ALEP Platform, die auch =FCber eine Tex=
t
Handling Komponente verf=FCgt. Wir haben uns auf diese Komponente
konzentriert und sie nach unseren Bed=FCrfnissen konfiguriert. Ein in AWK
geschriebenes Programm wurde in das ALEP System integriert. Mit Hilfe
dieses Programms wurden "messy details" und auch verschiedene Typen von
"fixed phrases" abgefangen und mit tags annotiert, so da=DF sie auf den
weiteren Stufen (syntaktische und semantische Analyse) des Systems
verarbeitet werden k=F6nnen. Als zwischenstufe fungiert die TH-LS (Text
Handling to Linguistic Structures) Komponente, die mit Hilfe von
spezialisierten benutzerdefinierten Regeln eine Abbildung zwischen
Information aus der Text Handling Komponente und partiellen linguistischen
Strukturen definiert.
Diese Strategie hat es uns erlaubt, in einigen F=E4llen, die Anzahl der
Lexikoneintr=E4ge und der Syntaxregeln zu reduzieren, da sie f=FCr die
Behandlung von "messy details" h=F6chstens ungeeignet sind.
Der n=E4chste Schritt meiner Arbeit beschreibt eine Generalisierung dieser
Strategie. Es wurde geschaut, wie existierende lexikalische Ressourcen, die
bereits von einer Korpusanalyse mit Merkmal-Werte Paaren annotiert sind,
indie Grammatikumgebung importiert werden k=F6nnen. Als Beispiel werden die
Eigennamen genommen. Das zugrundenliegende Tagger ist das von Dieter Mass
entwickelte mpro tool, das uns komplexe Information zu Verf=FCgung stellt.
Auf dieser Weise werden korpusbasierte Analyse und unifikationsbasierte
Grammatik
ein bi=DFchen zusammengef=FChrt.