Topic

Clio: A Semi-Automatic Tool for Schema Mapping

Speaker

Prof. Dr. Felix Naumann, Humboldt-Universität, Berlin

Date

Location

Augustusplatz, Interdisziplinäres Zentrum für Bioinformatik

Text

Abstract:

Real-life databases and information sources, such as SwissProt or EMBL, have hundreds of tables and thousands of attributes in complex, disparate structures. As many of these information sources cover the same domain, the need to integrate such data for more insight and broader scope is apparent. This is particularly true for the life sciences domain, where relevant data is spread over hundreds of independent sources. Clio is an information integration tool that semi-automatically defines a mapping from one or more source schemas to a target schema, and generates a set of queries that transform and integrate data from those sources to conform to the target schema. Time permitting, I will show a live demonstration of the tool.

Felix Naumann studierte von 1990 an Wirtschaftsmathematik an der Technischen Universität Berlin und schloss 1997 das Studium mit einem Diplom ab. Als Mitglied des Berlin-Brandenburger Graduiertenkollegs Verteilte Informationssysteme forschte Naumann von 1997 bis 2000 am Lehrstuhl von Prof. Johann-Christoph Freytag an der Humboldt Universität zu Berlin, und promovierte in 2000. Für seine Dissertation erhielt Naumann den Dissertationspreis 2000 der GI. In 2001 und 2002 war er als Forscher am IBM Almaden Research Center im Clio Projekt beschäftigt. Seit 2003 leitet Naumann eine Nachwuchsgruppe an der Humboldt Universität zu Berlin.