MPI-INF Logo
Campus Event Calendar

Event Entry

What and Who

Integration von korpusbasiertem Wissen in eine unifikationsbasierte Grammatikentwicklung (ALEP)

Thierry Declerck
Univ. Stuttgart, Institut für Maschinelle Sprachverarbeitung
Talk - Computerlinguistik
AG 1, AG 2, AG 3, INET, AG 4, AG 5, D6, RG1, SWS  
AG Audience
English

Date, Time and Location

Thursday, 18 April 96
14:00
60 Minutes
43.1C
+1.01
Saarbrücken

Abstract

Der Vortrag wird zum Teil =FCber meine aktuelle Arbeit im Rahmen des LS-GRAM
Projekts berichten. Das Projekt steht unmittelbar vor dem End-Term und in
der letzten Zeit waren wir sehr bem=FCht, die Problematik der sogenannten
"messy details" in den Griff zu bekommen.
Das LS-GRAM Projekt arbeitet mit der ALEP Platform, die auch =FCber eine Tex=
t
Handling Komponente verf=FCgt. Wir haben uns auf diese Komponente
konzentriert und sie nach unseren Bed=FCrfnissen konfiguriert. Ein in AWK
geschriebenes Programm wurde in das ALEP System integriert. Mit Hilfe
dieses Programms wurden "messy details" und auch verschiedene Typen von
"fixed phrases" abgefangen und mit tags annotiert, so da=DF sie auf den
weiteren Stufen (syntaktische und semantische Analyse) des Systems
verarbeitet werden k=F6nnen. Als zwischenstufe fungiert die TH-LS (Text
Handling to Linguistic Structures) Komponente, die mit Hilfe von
spezialisierten benutzerdefinierten Regeln eine Abbildung zwischen
Information aus der Text Handling Komponente und partiellen linguistischen

Strukturen definiert.
Diese Strategie hat es uns erlaubt, in einigen F=E4llen, die Anzahl der
Lexikoneintr=E4ge und der Syntaxregeln zu reduzieren, da sie f=FCr die
Behandlung von "messy details" h=F6chstens ungeeignet sind.
Der n=E4chste Schritt meiner Arbeit beschreibt eine Generalisierung dieser
Strategie. Es wurde geschaut, wie existierende lexikalische Ressourcen, die
bereits von einer Korpusanalyse mit Merkmal-Werte Paaren annotiert sind,
indie Grammatikumgebung importiert werden k=F6nnen. Als Beispiel werden die
Eigennamen genommen. Das zugrundenliegende Tagger ist das von Dieter Mass
entwickelte mpro tool, das uns komplexe Information zu Verf=FCgung stellt.
Auf dieser Weise werden korpusbasierte Analyse und unifikationsbasierte
Grammatik
ein bi=DFchen zusammengef=FChrt.

Contact

Stephan Buseman
06 81/3 02-52 86
--email hidden
passcode not visible
logged in users only

Tags, Category, Keywords and additional notes

Corinna Johanns DFKI - Deutsches Forschungszentrum fuer
Kuenstliche Intelligenz GmbH, Stuhlsatzenhaus-
weg 3, D-66123 Saarbruecken
and: Universitaet des Saarlandes, Computerlinguistik
D-66041 Saarbruecken

phone Univ.: + 49 (681) 302-4115
phone DFKI: + 49 (681) 302-5282
fax: + 49 (681) 302-4700
http://www.coli.uni-sb.de/~klajic/picture/corinna.gif