MPI-INF Logo
Campus Event Calendar

Event Entry

What and Who

Die Sphere-Search-Suchmaschine zur Graphbasierten Suche auf Heterogenen, Semistrukturierten Daten

Jens Graupmann
Max-Planck-Institut für Informatik - AG 5
Promotionskolloquium
AG 1, AG 2, AG 3, AG 4, AG 5  
Expert Audience

Date, Time and Location

Thursday, 11 May 2006
16:00
-- Not specified --
E1 4
024
Saarbrücken

Abstract

In dieser Arbeit wird die neuartige SphereSearch-Suchmaschine vorgestellt, die ein einheitliches ranglistenbasiertes Retrieval auf heterogenen XML- und Web-Daten ermöglicht. Ihre Fähigkeiten umfassen die Auswertung von vagen Struktur- und Inhaltsbedingungen sowie ein auf IR-Statistiken und einem graph-basierten Datenmodell basierendes Relevanz-Ranking. Web-Dokumente im HTML- und PDF-Format werden zunächst automatisch in ein XML-Zwischenformat konvertiert und anschließend mit Hilfe von Annotations-Tools durch zusätzliche Tags semantisch angereichtert. Die graph-basierte Suchmaschine bietet auf semi-strukturierten Daten vielfältige Suchmöglichkeiten, die von keiner herkömmlichen Web- oder XML-Suchmaschine ausgedrückt werden können: konzeptbewusste und kontextbewusste Suche, die sowohl die implizite Struktur von Daten als auch ihren Kontext berücksichtigt. Die Vorteile der SphereSearch-Suchmaschine werden durch Experimente auf verschiedenen Dokumentenkorpora demonstriert. Diese umfassen eine große, vielfältige Tags beinhaltende, nicht-schematische Enzyklopädie, die um externe Dokumenten erweitert wurde, sowie einem Standard-XML-Benchmark.

Contact

Petra Schaaf
500
--email hidden
passcode not visible
logged in users only

Petra Schaaf, 03/30/2006 13:23
Petra Schaaf, 03/21/2006 14:17 -- Created document.