Zuordnung zum Studiengang:  M.Sc. Informatik
Modulverantwortliche: Univ.-Prof. Dr. phil. Michaela Geierhos
Modultyp: Wahlpflicht
Empfohlenes Trimester: 2
Workload: 180 Std.
- davon Präsenzzeit: 72 Std.
- davon Selbststudium: 108 Std.
ECTS-Punkte: 6

 

Zugehörige Lehrveranstaltungen

Nr. Art Veranstaltungsname Teilnahme TWS
11441 Knowledge Discovery Wahlpflicht 3
11443 SE Research Topics in Data Science Wahlpflicht 3
11444 Big Data Management Wahlpflicht 3
11446 P Data Science Praktikum Wahlpflicht 3
Summe (Pflicht und Wahlpflicht) 6

 

Empfohlene Voraussetzungen

Die Studierenden sollen grundlegende Kenntnisse in Programmierung und Software-Entwurf sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.

 

Qualifikationsziele

Lernziele sind das kompetente Beherrschen grundlegender Verfahren und Methoden sowie ihrer praktischen Anwendung in den unter Inhalte dargestellten Bereichen (siehe nachfolgend).

 

Inhalt

In der Vorlesung „Big-Data-Management“ lernen die Studierenden Architekturen kennen, die für die Erfassung, Verarbeitung und Analyse von Big Data konzipiert sind, wofür sich herkömmliche Datenbanksysteme nicht mehr eignen. In diesem Zusammenhang wird nicht nur die verteilte Big-Data-Infrastruktur behandelt, sondern auch Themen wie Datenstrukturierung, Datensynchronisation/Parallelität und Speicherverwaltung in den Fokus gerückt. In der Übung werden erste Erfahrungen mit Big-Data-Architekturen gemacht.

In der Vorlesung „Knowledge Discovery“ geht es um den Umgang mit heterogenen Datenquellen, deren Kategorisierung sowie deren Analyse. Hierfür werden Methoden wie u.a. Visual Analytics/Knowledge sowie Techniken des Discovery & Data Mining und die explorative Datenanalyse unter Zuhilfenahme von KI-Methoden wie z. B. Machine Learning oder Computational Intelligence vorgestellt und in den Übungen praktisch vertieft.

Im Seminar „Research Topics in Data Science“ werden ausgewählte, aktuelle Methoden aus dem Bereich Data Science, Machine Learning und Deep Learning vorgestellt. Das Seminar soll den Studierenden einen Einblick in State-of-the-Art Forschungsthemen geben. Die behandelten Themen orientieren sich am aktuellen Gartner Hyper Cycle for Artificial Intelligence (wie bspw. Decision Intelligence, Responsible AI, Knowledge Graphs) und dem Gartner Hype Cycle for Emerging Technologies (wie bspw. Self-Supervised Learning, Explainable AI, Social Data).

Im „Data Science Praktikum” wird das in der Theorie gelernte Wissen in einem Projekt praktisch implementiert. Die Studierenden werden in Kleingruppen an einem größeren Projekt im Bereich Data Science arbeiten und dies am Ende des Trimesters präsentieren. Das Projekt umfasst dabei einen gesamten Projektzyklus – von der Idee und Konzeption, über die Datensammlung und deren Aufbereitung bis hin zum Tainieren eines Machine Learning-Modells und Auswertung der Ergebnisse. Das Plenum bietet dabei einen regelmäßigen Austausch und Feedback zwischen den Gruppen. Themen der Projekte beziehen sich auf die kennengelernten Forschungsbereiche aus „Research Topics in Data Science“ und „Methoden der Data Science“. Es wird dringend empfohlen einen der o.g. Kurse besucht zu haben.

 

Leistungsnachweis

Das gesamte Modul wird per Notenschein geprüft, mit Anteilen von je 3 ECTS-LP zu jeder der Vorlesungen (mit Übung) und im Modulprojekt. Die Studierenden können (je nach Angebot) entweder zwei Vorlesungen mit Übungen oder eine Vorlesung mit Übung und ein Modulprojekt einbringen – was insgesamt die 6 ECTS-LP des Moduls ergibt.

 

Literatur

  • Jiawei Han, Micheline Kamber, Jian Pei: Data Mining – Concepts and Techniques, Morgan Kaufmann Publishers, 2011.
  • Martin Ester, Jörg Sander: Knowledge Discovery in Databases – Techniken und Anwendungen, Springer Verlag, 2000
  • Ayodele Oluleye: Exploratory Data Analysis with Python Cookbook, Packt Publishing, 2023.
  • Steffen Herbold: Data-Science-Crashkurs, dpunkt, 2022.

 

Leistungsnachweis

Portfolio mit gleichen Anteilen zu jeder der Vorlesungen (mit Übung), zu jedem Seminar und im Praktikum. Die Studierenden können (je nach Angebot) entweder zwei Vorlesungen mit Übungen (11441 und 11444) oder eine Vorlesung mit Übung (11441 oder 11444) und ein Praktikum (11446) oder eine Vorlesung mit Übung (11441 oder 11444) und ein Seminar (11443) einbringen. Die geforderten Einzelleistungen sind wie folgt:

  • 11441: Schriftliche Klausur von 60 Minuten oder Fachgespräch von 30 Minuten. Die Art der Leistung wird zu Beginn des Moduls bekannt gegeben.
  • 11443: Schriftliche Ausarbeitung, Bearbeitungszeit: 4 Wochen, Umfang 5.000 Wörter.
  • 11444: Schriftliche Klausur von 60 Minuten oder Fachgespräch von 30 Minuten. Die Art der Leistung wird zu Beginn des Moduls bekannt gegeben.
  • 11446: Bearbeitung eines Projektes mit schriftlicher Ausarbeitung, Bearbeitungszeit: 8 Wochen, Umfang 20 Seiten.

 

Verwendbarkeit

Die hier erworbenen Kenntnisse und Fertigkeiten ergänzen die Ausbildung im Bereich der Softwaretechnik um einen Aspekt von hoher praktischer Bedeutung. Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science.

 

Dauer und Häufigkeit

Das Modul dauert 2 bis 3 Trimester und beginnt jedes Jahr im FT.

 

Sonstige Bemerkungen

Die Vorlesungen, Seminare und das Praktikum werden nicht alle jedes Jahr angeboten, aber in jedem Jahr mindestens so viele Lehrveranstaltungen, dass 6 ECTS-Leistungspunkte erreichbar sind. Jeweils zu Beginn des Moduls wird den Studierenden das konkrete Angebot erläutert.