MPI-INF Logo
Campus Event Calendar

Event Entry

What and Who

Graphische Modelle und halbüberwachtes Lernen für knifflige Information-Retrieval-Probleme

Prof. Dr. Tobias Scheffer
Humboldt-Universität Berlin
Talk
AG 1, AG 2, AG 3, AG 4, AG 5  
Expert Audience

Date, Time and Location

Thursday, 22 December 2005
10:00
90 Minutes
46.1 - MPII
024
Saarbrücken

Abstract

Das Themenumfeld Information Retrieval ist ein unerschöpflicher Quell

wissenschaftlicher Herausforderungen, deren Bewältigung Erkenntnisgewinn und
zugleich praktischen Nutzen verspricht. Retrieval-Systeme müssen möglichst viel
über ihre Benutzer lernen, um deren Informationsbedürfnisse zu erahnen. Diese
Bedürfnisse sind oftmals in kurzen Texten ausgedrückt und auch der Großteil
zugreifbarer Daten liegt in Textform, in natürlicher Sprache vor. Die
Beurteilung der Relevanz von Dokumenten für Benutzer in deren gegenwärtigem
Kontext erfordert oftmals Wissen über die Bedeutung dieser Texte.

Viele Retrieval-Systeme müssen sich in einer feindseligen Umgebung
zurechtfinden. Lernt etwa ein Spam-Filter ein Modell, das den Aufbau vom Spam
charakterisiert, dann werden die Versender den Aufbau ihrer Mails verändern um
den Filter zu umgehen, sofern der Filter nur hinreichend viele Empfänger
abschirmt. Analog dazu müssen Suchmaschinen die Relevanz von Web-Seiten
beurteilen während deren Betreiber Relevanzmerkmale wie den PageRank gezielt
manipulieren. Autohersteller möchten anhand von Werkstattberichten Trends und
Auswirkungen von Konstruktionsänderungen verfolgen und Serviceprozesse
optimieren während Werkstätten die Durchführung teurerer Reparaturen bevorzugen.

Neue Ergebnisse aus dem maschinellen Lernen liefern Ansätze zur Lösung vieler
dieser Probleme. Diskriminative Lernverfahren können Eigennamen besser erkennen,
Wortfolgen parsieren und Terme in Taxonomien einordnen. Halbüberwachte
Lernverfahren benötigen dafür nur ein oder sehr wenige annotierte
Trainingsbeispiele; neue statistische Modelle charakterisieren vernetzte Texte
und beantworten viele Fragen über Entstehung und Struktur von Textsammlungen.
Einige Herausforderungen des Information Retrieval werfen jedoch neue,
unbeantwortete Fragekomplexe im maschinellen Lernen auf.

Contact

Gerhard Weikum
--email hidden
passcode not visible
logged in users only

Petra Schaaf, 11/21/2005 14:12
Petra Schaaf, 10/25/2005 12:44
Petra Schaaf, 10/21/2005 11:05
Petra Schaaf, 10/13/2005 10:48 -- Created document.