Skip to main content

User account menu

  • Log in
DBS-Logo

Database Group Leipzig

within the department of computer science

ScaDS-Logo Logo of the University of Leipzig

Main navigation

  • Home
  • Study
    • Exams
      • Hinweise zu Klausuren
    • Courses
      • Current
    • Modules
    • LOTS-Training
    • Abschlussarbeiten
    • Masterstudiengang Data Science
    • Oberseminare
    • Problemseminare
    • Top-Studierende
  • Research
    • Projects
      • Benchmark datasets for entity resolution
      • FAMER
      • HyGraph
      • Privacy-Preserving Record Linkage
      • GRADOOP
    • Publications
    • Prototypes
    • Annual reports
    • Cooperations
    • Graduations
    • Colloquia
    • Conferences
  • Team
    • Erhard Rahm
    • Member
    • Former employees
    • Associated members
    • Gallery

Data Preparation & Cleaning

Breadcrumb

  • Home
  • Study
  • Sommersemester 2023
  • Data Preparation & Cleaning
  • Data Preparation & Cleaning
Sommersemester 2023
  • Dr. Victor Christen
  • Mittwoch 13:15-14:45, HS20
Wednesday, 12.04.2023

Anmeldung

Die Anmeldung zur Vorlesung, Übung und Klausur erfolgt über AlmaWeb.

  • Achtung: Sie müssen sich für das Modul und die Veranstaltungen (Vorlesung + Übung) anmelden.
  • Bei Fragen und Problemen zur Anmeldung wenden Sie sich bitte immer an das Studienbüro via einschreibung(at)math.uni-leipzig.de

Übersicht

Reale Daten sind unsauber, verteilt und heterogen. Dieser Kurs gibt eine Einführung in die wesentlichen Konzepte von Data Cleaning & Standardisierung sowie der Datenintegration. Ziel der Datenintegration ist die Transformation von Rohdaten in Formate, welche eine umfassende und effiziente Analyse der Daten ermöglichen. Im Kurs werden außerdem die Themen Datenqualität, Datenmanagement und Speicherungsprobleme in Hinblick auf Datenanalyse diskutiert.

Weiter Informationen sowie alle Vorlesungsmaterialien finden Sie im entsprechenden Moodle-Kurs.

Prüfungen

Prüfungstyp Datum Ort
Final Exam (repeated) Monday, December 11, 2023 - 11:30 HS 8

Recent publications

  • 2025 / 9: Generating Semantically Enriched Mobility Data from Travel Diaries
  • 2025 / 8: Slice it up: Unmasking User Identities in Smartwatch Health Data
  • 2025 / 7: MPGT: Multimodal Physics-Constrained Graph Transformer Learning for Hybrid Digital Twins
  • 2025 / 6: Leveraging foundation models and goal-dependent annotations for automated cell confluence assessment
  • 2025 / 6: SecUREmatch: Integrating Clerical Review in Privacy-Preserving Record Linkage

Footer menu

  • Directions
  • Contact
  • Impressum