Zugehörige Lehrveranstaltungen
Nr. | Art | Veranstaltungsname | Teilnahme | TWS |
38531 | VÜ | Analyse unstrukturierter Daten | Pflicht | 6 |
Summe (Pflicht und Wahlpflicht) | 6 |
Empfohlene Voraussetzungen
Die Studierenden sollen grundlegende Programmierkenntnisse sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.
Qualifikationsziele
Die Studierenden lernen Herausforderungen und Methoden bei der Informationsbeschaffung und -extraktion kennen und lernen die besprochenen Analyse-Methoden anzuwenden. Sie lernen Verfahren der Analyse unstrukturierter Daten auf konkrete, praxisrelevante Fragestellungen (insbesondere im Bereich Wissensgewinnung) anzuwenden und können für exemplarische Aufgabenstellungen existierende Ansätze beurteilen und Weiterentwicklungen anregen respektive eigenständig umsetzen.
Inhalt
Dieses Modul gibt einen Einblick in die Herausforderungen und Verfahren, die bei der Analyse unstrukturierter Daten zum Einsatz kommen. Unstrukturierte Informationen sind in der Regel sehr textlastig, weshalb viele vorhersagende Analyse-Verfahren den Informationswert dieser Daten nicht nutzen können. Allerdings können textbasierte Medien (E-Mails, Webseiten-Inhalte, Fachartikel, Social Media Beiträge, etc.) u. a. dabei helfen, Trends zu erkennen, Wissen zu gewinnen und Fake News aufzudecken. Hierfür müssen Informationen identifiziert, extrahiert, aufbereitet und interpretiert werden. Die Herausforderung besteht darin, relevante Informationen zu erkennen, aus unstrukturierten Texten zu extrahieren und fehlende Informationen ggf. hinzufügen. In der Veranstaltung werden auch Themen wie die Informationsgewinnung aus unterschiedlichen Quellen sowie Fragen der Qualitätssicherung bei der Datenspeicherung und des Datenmanagements in wissensbasierten Strukturen behandelt.
In der Übung werden theoretische und praktische Fragestellungen gleichermaßen adressiert. Der theoretische Teil dient zur Wiederholung der Vorlesungsinhalte. Im praktischen Teil sind die Studierenden aufgefordert, ausgewählte Verfahren zur Analyse unstrukturierter Daten eigenständig zu implementieren. Für die Übungen sind Programmierkenntnisse erforderlich.
Leistungsnachweis
Schriftliche Prüfung von 60 Minuten oder mündliche Prüfung von 30 Minuten.
Verwendbarkeit
Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science mit Fokus auf die Analyse unstrukturierter Daten.
Dauer und Häufigkeit
Das Modul dauert ein Trimester und beginnt jedes Jahr im HT.