German English

Innovationslabor: Semantische Integration von Webdaten (WDI-Lab)

Das WDI-Lab ist ein vom BMBF im Rahmen des ForMat-Programms gefördertes Innovationslabor zur semantischen Integration von Webdaten. Nach einer initialen Projektphase erfolgte die Förderzusage für den Vollausbau in Phase 2. Im WDI-Lab sind drei Arbeitsgruppen mit zusammen 10 Mitarbeitern geplant. Die volle Arbeitsfähigkeit des WDI-Labs soll bis Anfang 2010 erreicht werden.

Ziel des von Prof. Rahm geleiteten WDI-Labs ist die Überführung von Forschungsergebnissen zu Integrationstechniken heterogener Webdaten in marktfähige Software-Lösungen. Zahlreiche Anwendungen benötigen einen integrierten Zugang zu Daten und Diensten verschiedenartiger Websites. So sind bei Internetnutzern etwa Portallösungen gefragt, welche einen Preisvergleich über unterschiedliche Produktarten verschiedenster Unternehmen (z.B. Elektronikartikel, Flugreisen, Hotelzimmer, etc.) sowie daran angeschlossene Bestell- bzw. Buchungsmöglichkeiten anbieten. Die Lösung dieser Aufgabe erfordert eine semantische Integration der Daten, d.h. die Informationen der verschiedenen Anbieter müssen trotz unterschiedlicher Repräsentation möglichst vollständig gefunden und aus Anwendungssicht korrekt kombiniert werden. Die Adressierung der genannten Aufgaben erfolgt in derzeitigen Systemlösungen meist durch aufwändige Spezialprogrammierungen, die oft nur eine begrenzte Qualität erreichen. Zudem erfordert dabei jede Änderung an den Schemas oder Schnittstellen einzelner Anbieter eine aufwändige Neuprogrammierung.

Veranschaulichung zweier Anwendungsfälle der semantischen Integration von Webdaten

Zur Beseitigung dieser Schwachstellen werden mächtige Werkzeuge zur weitgehenden Automatisierung von Aufgaben der semantischen Datenintegration benötigt, insbesondere zum Schema/Ontologie-Matching sowie zum Objekt-Matching. Das Projektvorhaben beschäftigt sich mit den Möglichkeiten der Überbrückung dieser Lücke. Die im WDI-Lab verfolgten Lösungsansätze sind vielseitig einsetz- und anpassbar, welche die anfallenden Teilaufgaben zur beschleunigten Lösung weitgehend automatisieren und eine hohe Qualität der integrierten Information gewährleisten. Hierzu werden im WDI-Lab drei Arbeitsgruppen zu folgenden Themen eingerichtet:

  1. AG1: Workflowbasiertes Integrationsframework
  2. AG2: Schema- und Ontologie-Matching
  3. AG3: Objekt-Matching und Dublettenbehandlung

Zu jedem Thema gibt es vielfältige Forschungsergebnisse, auf denen aufgebaut werden kann. Das WDI-Lab wird zudem von einem Mitarbeiter mit betriebswirtschaftlichem KnowHow unterstützt.

Industrie-Workshop (Phase 1, April 2009)

Contact

Prof. Dr. Erhard Rahm,
Dr. Andreas Thor,
Sabine Maßmann
{rahm | thor | massmann}@informatik.uni-leipzig.de

Phone: +49-341 97 32-241
Fax: +49-341 97 32-209
Website: http://dbs.uni-leipzig.de/format

Institut für Informatik
University of Leipzig
PF 100920
04009 Leipzig, Germany