Skip to main content

User account menu

  • Log in
DBS-Logo

Database Group Leipzig

within the department of computer science

ScaDS-Logo Logo of the University of Leipzig

Main navigation

  • Home
  • Study
    • Exams
      • Hinweise zu Klausuren
    • Courses
      • Current
    • Modules
    • LOTS-Training
    • Abschlussarbeiten
    • Masterstudiengang Data Science
    • Oberseminare
    • Problemseminare
    • Top-Studierende
  • Research
    • Projects
      • Benchmark datasets for entity resolution
      • FAMER
      • HyGraph
      • Privacy-Preserving Record Linkage
      • GRADOOP
    • Publications
    • Prototypes
    • Annual reports
    • Cooperations
    • Graduations
    • Colloquia
    • Conferences
  • Team
    • Erhard Rahm
    • Member
    • Former employees
    • Associated members
    • Gallery

Big Data Praktikum

Breadcrumb

  • Home
  • Study
  • Sommersemester 2019
  • Big Data Praktikum

Modul

  • Big Data Praktikum

Semester

Sommersemester 2019

Übersicht

Das Praktikum beinhaltet den Entwurf und die Realisierung einer Anwendung oder eines Algorithmus im Big-Data-Umfeld. In der Regel erfolgt die Implementierung unter Verwendung eines Big-Data-Frameworks, wie z. B. Hadoop, Apache Spark, Apache Flink oder Gradoop erstellt werden soll.

Im einzelnen sind folgende Teilaufgaben zu lösen:

  1. Konzeptioneller Entwurf. Es ist ein Entwurfsdokument anzufertigen, welches konzeptionell den Ablauf und die Architektur ihrer Anwendung darstellt. Im Dokument muss ersichtlich werden, welches Ziel verfolgt wird und welche Aufgaben dafür zu bewältigen sind. Das Dokument soll sich vom Umfang auf ca. 4 Seiten beschränken.
  2. Implementierung. Basierend auf ihrem Entwurf soll die Anwendung realisiert werden. Das Resultat dieser Phase ist ein dokumentiertes, ausführbares Programm.
  3. Abschlusspräsentation Am Ende des Praktikums stellt jede Gruppe ihr Projekt vor, wobei sie ihre Anwendung beschreibt sowie die Resultate präsentiert. Die Dauer der Präsentation soll ca. 15 Minuten betragen.

Anmeldungen und Präsenzveranstaltungen

  • Die Anmeldung zum Praktikum erfolgt über Almaweb.
    • Bei Fragen und Problemen zur Anmeldung wenden Sie sich bitte immer an das Studienbüro via einschreibung(at)math.uni-leipzig.de
  • Einführungsveranstaltung mit Gruppeneinteilung [Folien]
    • Montag 15.04.2019, 11:15 Uhr, Raum S3-14 (Seminargebäude)
  • Vorbesprechung
    • Erstes Treffen für die Konkretisierung des Themas und die ersten Schritte
    • Terminabsprache individuell mit Betreuer.

Testate

Das Praktikum gliedert sich in drei Teile. Nach jeder der drei Teilaufgaben wird ein Testat durchgeführt. Zum erfolgreichen Absolvieren des Praktikums müssen alle drei Testate erfolgreich abgelegt werden. Wird ein Termin nicht eingehalten, verfallen die bereits erbrachten Teilleistungen. Die konkreten Termine für die ersten zwei Testate sind mit dem Betreuer per E-Mail zu vereinbaren. Alle Gruppenmitglieder müssen zu den Testaten anwesend sein und Fragen zum Thema beantworten können. Es gelten die nachfolgenden Fristen:

  • Testat 1 (Entwurf): Ende Mai
  • Testat 2 (Realisierung): Mitte-Ende Juli
  • Testat 3 (Präsentation): Freitag 09.08.2019 um 13:30 Ort: ScaDS (Ritterstr. 9-13 2.OG)

Themen

Bitte vereinbaren Sie zeitnah einen Termin mit Ihrem Betreuer zur Besprechung der ersten Schritte!

Nr.ThemaBetreuerTechnologieMatrikelnr. Studierende
–PPRL–––
01(Incremental) PPRL on FlinkFrankeApache Flink, Java3758169, 3704254
02Cryptanalysis for Bloom-Filter-based PPRLRohdeApache Flink, Java–
03Parallel MP-PPRLSehiliApache Flink, Java2863311, 3728224
–Graphs–––
04Rollup Querying of Ontology GraphsChristenApache Flink, Gradoop–
05Processing and Visualization of Graph StreamsRostApache Flink3744131, 3755286
06Distributed Graph Sampling using Forest FireGomezApache Flink / Gelly / Pregel / Gradoop–
07Representation Learning for GradoopObraczkaApache Flink, Gradoop3755198
08Determination of connectivity in graphsTäschnerApache Flink / Gradoop3709901
–Other–––
09Contour Detection from Aerial Imagery for OpenStreetMapNentwigJOSM Plugin (Java), TensorFlow (Python,C++)3727600, 3739061
10Tweets To Political SentimentsZschacheApache Flink Streaming/Kafka Streams, Neo4j3742778, 3263866
11Traffic Analysis with Deep LearningWilke–3743775, 3716812
12Integration of an ETL Process in Apache AirflowAlkhouriApache Airflow3705682, 3713674
13Security Information and Event ManagementGrimmerDocker, Sysdig, ElasticSearch3478869, 3740164
14Face RecognitionPeukert–3341134, 1181986

Teilnehmerkreis

Master-Studiengänge Informatik. Die Teilnahme erfolgt in 2er-Gruppen, die Teilnehmerzahl ist auf ca. 20 Studierende beschränkt!. Die endgültige Vergabe der Praktikumsplätze erfolgt im Rahmen der Einführungsveranstaltung! Zu beachten ist, dass Studenten, die das Big-Data-Praktikum noch nicht belegt haben, bevorzugt werden.

Erwartete Vorkenntnisse

  • Java-Kentnisse
  • Vorlesung Cloud Data Management und NoSQL-Datenbanken hilfreich
  • Linux-Kenntnisse von Vorteil
  • Git-Kenntnisse von Vorteil

Recent publications

  • 2025 / 9: Generating Semantically Enriched Mobility Data from Travel Diaries
  • 2025 / 8: Slice it up: Unmasking User Identities in Smartwatch Health Data
  • 2025 / 7: MPGT: Multimodal Physics-Constrained Graph Transformer Learning for Hybrid Digital Twins
  • 2025 / 6: Leveraging foundation models and goal-dependent annotations for automated cell confluence assessment
  • 2025 / 6: SecUREmatch: Integrating Clerical Review in Privacy-Preserving Record Linkage

Footer menu

  • Directions
  • Contact
  • Impressum