German English

Data Warehouse und Data Mining Praktikum

Teilnehmerkreis

Master-Studierende der Informatik sowie Interessierte. Die Vergabe der Plätze erfolgt in der Einführungsveranstaltung.

Teilnehmer

Gruppe Matrikel Teilnehmer A Matrikel Teilnehmer B Betreuer
01 3717335 3732033 Sehili
02 3755198 3724646 Sehili
03 3736119 3754434 Sehili
04 3737510 3736658 Sehili
05 3755088 3744230 Christen
06 3721120 3739061 Christen
07 3751804 2527532 Christen
08 3704488 3742778 Franke
09 3709557 3742767 Franke
10 3710120 3729313 Franke

Organisatorische Hinweise

Schwerpunkt

Je nach persönlichen Interessen und Vorkenntnissen bieten wir zwei Schwerpunkte für das Praktikum an:

  • Data Warehousing
    • Realisierung aller Phasen eines Data-Warehouse-Projektes
    • Schwerpunkte: Datenextraktion, Data Cleaning, MDX-Anfragen
    • Framework: Microsoft SQL Server
  • Data Mining
    • Implementierung von Algorithmen aus der Vorlesung “Data Mining”
    • Schwerpunkte: Clustering, Empfehlungssysteme, PageRank, Streams
    • Framework: Apache Spark + MLlib
  • Data Mining in der Praxis
    • Kooperationsprojekt mit dem Masterstudiengang Datenjournalismus
    • Realisierung einer Webapplikation zum Thema “Deutschland-Doppel”
    • Analyse deutscher Städte basierend auf statistischen Daten über die Zeit
    • Schwerpunkte: Realisierung eines ETL-Prozesses, Anwendung von Data Mining Verfahren, wie z.B. Clustering, Web-App Entwicklung

Vorkenntnisse

  • Voraussetzung für die Teilnahme am Praktikum ist die Teilnahme an der Vorlesung “Data Warehousing” bzw. der Besuch der Vorlesung “Data Mining” oder adäquate Kenntnisse.
  • Eine erfolgreiche Absolvierung des Datenbank-Praktikums ist von Vorteil.
  • Kenntnisse der Programmiersprache Java sind obligatorisch.

Ablauf

  • Das Praktikum findet in Gruppen zu je 2 Studierenden statt.
  • Jeder Gruppe bearbeitet die Aufgaben des Praktikums jeweils selbständig.
  • Insgesamt enthält das Praktikum vier Präsenztermin und zwar zur Einführungsveranstaltung sowie zu den drei Testat-Terminen.
  • Das Praktikum setzt sich aus mehreren Teilaufgaben zusammen, welche jeweils mit einem Testat (60 min) abgeschlossen und bewertet werden. Insgesamt gibt es drei Testate.

Testate

Die Testate sind spätestens bis zu folgenden Fristen abzulegen:

  • Testat 1: 29. November 2019
  • Testat 2: 31. Januar 2020
  • Testat 3: 31. März 2020
    • Der Termin für das dritte Testat ist bis spätestens Ende Februar zu vereinbaren!
Die Testat-Termine sind mit Ihrem jeweiligen Betreuer eine Woche im Voraus per E-Mail (oder ggfs. Moodle) zu vereinbaren. Wird ein Termin nicht eingehalten, verfallen die bereits erbrachten Teilleistungen!

Die Gruppen mit dem Schwerpunkt “Data Mining” müssen spätestens 24 Stunden vor Ihrem Testat-Termin Ihre Lösung Ihrem Betreuer per E-Mail zusenden.
Bitte geben Sie im Betreff der E-Mail dmprak sowie Ihre Gruppennummer an. Nehmen Sie dabei Ihren Gruppenpartner mit ins CC.

Anmeldung

Das Praktikum ist kein eigenständiges Modul, sondern es kann als Bestandteil des Vertiefungsmoduls “Moderne Datenbanktechnologien” (10-202-2216) eingebracht werden (siehe auch Modulangebot). Bei Interesse an einer Teilnahme tragen Sie sich dazu in die entsprechende Veranstaltung im Almaweb ein. Bei Fragen und Problemen zur Anmeldung wenden Sie sich bitte immer an das Studienbüro via einschreibung(at)math.uni-leipzig.de. Bitte beachten Sie, dass zur Teilnahme am Praktikum die Anwesenheit zur Einführungsveranstaltung verpflichtend ist.

Vergabe von Leistungspunkten

Zur Erzielung der Leistungspunkte müssen alle drei Testate erfolgreich abgelegt werden. Dabei ist die Anwesenheit beim Testat für alle Gruppenmitglieder verpflichtend. Die Endnote ergibt sich aus dem Durchschnitt der drei Testat-Noten.

Aufgabenstellung

Praktikum