Campus Event Calendar: Prof. Dr. Tobias Scheffer (12/22/2005 in 46.1

Campus Event Calendar

Campus Event Calendar:
- All Upcoming:
  - only for D1
  - only for D2
  - only for INET
  - only for D4
  - only for D5
  - only for D6
  - only for RG1
  - Mailing Lists
  - by Speaker
  - by Type
  - by Category
  - by Title
  - Calendar
  - RSS Feed
- History of Events:

Event Entry

What and Who

Graphische Modelle und halbüberwachtes Lernen für knifflige Information-Retrieval-Probleme

Prof. Dr. Tobias Scheffer

Humboldt-Universität Berlin

Talk

AG 1, AG 2, AG 3, AG 4, AG 5

Expert Audience

Note: We use this to send email in the morning.

Date, Time and Location

Thursday, 22 December 2005

10:00

90 Minutes

46.1 - MPII

024

Saarbrücken

Abstract

Das Themenumfeld Information Retrieval ist ein unerschöpflicher Quell

wissenschaftlicher Herausforderungen, deren Bewältigung Erkenntnisgewinn und
zugleich praktischen Nutzen verspricht. Retrieval-Systeme müssen möglichst viel
über ihre Benutzer lernen, um deren Informationsbedürfnisse zu erahnen. Diese
Bedürfnisse sind oftmals in kurzen Texten ausgedrückt und auch der Großteil
zugreifbarer Daten liegt in Textform, in natürlicher Sprache vor. Die
Beurteilung der Relevanz von Dokumenten für Benutzer in deren gegenwärtigem
Kontext erfordert oftmals Wissen über die Bedeutung dieser Texte.

Viele Retrieval-Systeme müssen sich in einer feindseligen Umgebung
zurechtfinden. Lernt etwa ein Spam-Filter ein Modell, das den Aufbau vom Spam
charakterisiert, dann werden die Versender den Aufbau ihrer Mails verändern um
den Filter zu umgehen, sofern der Filter nur hinreichend viele Empfänger
abschirmt. Analog dazu müssen Suchmaschinen die Relevanz von Web-Seiten
beurteilen während deren Betreiber Relevanzmerkmale wie den PageRank gezielt
manipulieren. Autohersteller möchten anhand von Werkstattberichten Trends und
Auswirkungen von Konstruktionsänderungen verfolgen und Serviceprozesse
optimieren während Werkstätten die Durchführung teurerer Reparaturen bevorzugen.

Neue Ergebnisse aus dem maschinellen Lernen liefern Ansätze zur Lösung vieler
dieser Probleme. Diskriminative Lernverfahren können Eigennamen besser erkennen,
Wortfolgen parsieren und Terme in Taxonomien einordnen. Halbüberwachte
Lernverfahren benötigen dafür nur ein oder sehr wenige annotierte
Trainingsbeispiele; neue statistische Modelle charakterisieren vernetzte Texte
und beantworten viele Fragen über Entstehung und Struktur von Textsammlungen.
Einige Herausforderungen des Information Retrieval werfen jedoch neue,
unbeantwortete Fragekomplexe im maschinellen Lernen auf.

Contact

Gerhard Weikum

--email hidden

System used:

Meeting URL:

Meeting ID:

Passcode:

passcode not visible

Code Visible for:

logged in users only

Petra Schaaf, 11/21/2005 14:12
Petra Schaaf, 10/25/2005 12:44
Petra Schaaf, 10/21/2005 11:05
Petra Schaaf, 10/13/2005 10:48 -- Created document.

Imprint / Impressum | Data Protection / Datenschutzhinweis