Unser Lehrangebot
Wintertrimester 2025
Information Retrieval
Diese Lehrveranstaltung gibt einen Einblick in die wichtigsten Themen des Information Retrieval. Hierfür werden die Grundlagen der wichtigsten Modelle aus dem Bereich des Information Retrieval vermittelt. Außerdem werden Techniken und Verfahren wie z. B. Term-Gewichtungen, Ähnlichkeitsmaße und Rankingmechanismen, Evaluierungsprinzipien, User Interaction und Feedbackmechanismen sowie Indexierung und computerlinguistische Hilfsmittel für dem Bereich des Information Retrieval detailliert behandelt.
In der Übung werden theoretische und praktische Fragestellungen gleichermaßen behandelt. Der theoretische Teil dient zur Wiederholung der Vorlesungsinhalte. Im praktischen Teil sind die Studierenden aufgefordert, ausgewählte Verfahren aus dem Information Retrieval eigenständig zu implementieren. Für die Übungen sind Programmierkenntnisse erforderlich.
Modulzugehörigkeit: |
|
Veranstaltungsart: |
Vorlesung (4 TWS) + Übung (2 TWS) |
Veranstaltungszeitraum: |
t.b.a. |
Termine: |
t.b.a. |
Dozierende: |
Prof. Dr. Michaela Geierhos (Vorlesung) |
Alle aktuellen Informationen finden Sie auf der Lernplattform ILIAS >
Natural Language Processing
In der Veranstaltung Natural Language Processing lernen die Studierenden zunächst die Grundlagen der natürlichen Sprachen kennen, angefangen bei der Kombination von Lauten bis hin zur Bedeutung von Wörtern, Sätzen und Texten. Basierend auf den Grundlagen werden diverse NLP-Anwendungen vorgestellt.
Die Modellierung dieser Anwendungen erfolgt mithilfe statistischer Ansätze als auch Methoden des Machine Learning / Deep Learning. Alle Themen werden von Übungen begleitet, welche die praktischen Szenarien demonstrieren. Grundkenntnisse in Python werden vorausgesetzt.
Modulzugehörigkeit: |
|
Veranstaltungsart: |
Vorlesung (2 TWS) + Übung (1 TWS) |
Veranstaltungszeitraum: |
13.01.2025 - 24.03.2025 |
Termin: |
Montags, 10:30 - 12:45 Uhr |
Dozentin: |
Alle aktuellen Informationen finden Sie auf der Lernplattform ILIAS >
Semantische Technologien
Die Vorlesung „Semantische Technologien“ gibt einen Einblick in Grundlagen und praktische Anwendungen wissensbasierter Softewarelösung. Sie gibt einen breiten Überblick über den Nutzen und die Möglichkeiten dieser Technologien. Semantische Technologien versetzen uns nicht nur in die Lage, Informationen zu speichern und wiederzufinden, sondern sie gemäß ihrer Bedeutung und Funktion entsprechend auszuwerten, zu verbinden, zu Neuem zu verknüpfen und so flexibel und zielgerichtet anzuwenden.
Modulzugehörigkeit: |
|
Veranstaltungsart: |
Vorlesung (2 TWS) + Übung (1 TWS) |
Veranstaltungszeitraum: |
13.01.2025 - 24.03.2025 |
Termin: |
Montags, 09:45 - 12:00 Uhr |
Dozierende: |
Prof. Dr. Michaela Geierhos (Vorlesung) Jakob Murauer, M.Sc. (Übung) |
Alle aktuellen Informationen finden Sie auf der Lernplattform ILIAS >
Social Media Mining
In der Vorlesung „Social Media Mining“ wird exemplarisch die Entwicklung eines Systems besprochen, welches über soziale Netzwerke direkt oder indirekt an Unternehmen adressierte Meldungen, Nachrichten oder Kommentare erfasst, klassifiziert und auswertet. Hierbei werden Textmining- und Klassifikationsverfahren mit Fokus auf Kurztexten diskutiert und der begleitenden Übung praktisch vertieft.
Modulzugehörigkeit: |
|
Veranstaltungsart: |
Vorlesung (2 TWS) + Übung (1 TWS) |
Veranstaltungszeitraum: |
08.01.2025 - 19.03.2025 |
Termin: |
Mittwochs, 10:30 - 12:00 Uhr |
Dozierende: |
Prof. Dr. Michaela Geierhos (Vorlesung) Falk Maoro, M.Sc. (Übung) |
Alle aktuellen Informationen finden Sie auf der Lernplattform ILIAS >
Übersicht der angebotenen Module
Modul 1144: Knowledge Discovery in Big Data
Zugehörige Lehrveranstaltungen
Nr. | Art | Veranstaltungsname | Teilnahme | TWS |
11441 | VÜ | Knowledge Discovery | Wahlpflicht | 3 |
11443 | SE | Research Topics in Data Science | Wahlpflicht | 3 |
11444 | VÜ | Big Data Management | Wahlpflicht | 3 |
11446 | P | Data Science Praktikum | Wahlpflicht | 3 |
Summe (Pflicht und Wahlpflicht) | 6 |
Empfohlene Voraussetzungen
Die Studierenden sollen grundlegende Kenntnisse in Programmierung und Software-Entwurf sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.
Qualifikationsziele
Lernziele sind das kompetente Beherrschen grundlegender Verfahren und Methoden sowie ihrer praktischen Anwendung in den unter Inhalte dargestellten Bereichen (siehe nachfolgend).
Inhalt
In der Vorlesung „Knowledge Discovery“ geht es um den Umgang mit heterogenen Datenquellen, deren Kategorisierung sowie deren Analyse. Hierfür werden Methoden wie u.a. Visual Analytics/Knowledge sowie Techniken des Discovery & Data Mining und die explorative Datenanalyse unter Zuhilfenahme von KI-Methoden wie z. B. Machine Learning oder Computational Intelligence vorgestellt und in den Übungen praktisch vertieft.
Im Seminar „Research Topics in Data Science“ werden ausgewählte, aktuelle Methoden aus dem Bereich Data Science, Machine Learning und Deep Learning vorgestellt. Das Seminar soll den Studierenden einen Einblick in State-of-the-Art Forschungsthemen geben. Die behandelten Themen orientieren sich am aktuellen Gartner Hyper Cycle for Artificial Intelligence (wie bspw. Decision Intelligence, Responsible AI, Knowledge Graphs) und dem Gartner Hype Cycle for Emerging Technologies (wie bspw. Self-Supervised Learning, Explainable AI, Social Data).
In der Vorlesung „Big DataManagement“ lernen die Studierenden Architekturen kennen, die für die Erfassung, Verarbeitung und Analyse von Big Data konzipiert sind, wofür sich herkömmliche Datenbanksysteme nicht mehr eignen. In diesem Zusammenhang wird nicht nur die verteilte Big-Data-Infrastruktur behandelt, sondern auch Themen wie Datenstrukturierung, Datensynchronisation/Parallelität und Speicherverwaltung in den Fokus gerückt. In der Übung werden erste Erfahrungen mit Big-Data-Architekturen gemacht.
Im „Data Science Praktikum” wird das in der Theorie gelernte Wissen in einem Projekt praktisch implementiert. Die Studierenden werden in Kleingruppen an einem größeren Projekt im Bereich Data Science arbeiten und dies am Ende des Trimesters präsentieren. Das Projekt umfasst dabei einen gesamten Projektzyklus – von der Idee und Konzeption, über die Datensammlung und deren Aufbereitung bis hin zum Tainieren eines Machine Learning-Modells und Auswertung der Ergebnisse. Das Plenum bietet dabei einen regelmäßigen Austausch und Feedback zwischen den Gruppen. Themen der Projekte beziehen sich auf die kennengelernten Forschungsbereiche aus „Research Topics in Data Science“. Es wird dringend empfohlen diesen Kurs zuvor besucht zu haben.
Leistungsnachweis
Das gesamte Modul wird per Notenschein geprüft, mit Anteilen von je 3 ECTS-LP zu jeder der Vorlesungen (mit Übung) und im Modulprojekt. Die Studierenden können (je nach Angebot) entweder zwei Vorlesungen mit Übungen oder eine Vorlesung mit Übung und ein Modulprojekt einbringen – was insgesamt die 6 ECTS-LP des Moduls ergibt.
Verwendbarkeit
Die hier erworbenen Kenntnisse und Fertigkeiten ergänzen die Ausbildung im Bereich der Softwaretechnik um einen Aspekt von hoher praktischer Bedeutung. Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science.
Dauer und Häufigkeit
Das Modul dauert 2 bis 3 Trimester und beginnt jedes Jahr im FT.
Sonstige Bemerkungen
Die Vorlesungen, Seminare und das Praktikum werden nicht alle jedes Jahr angeboten, aber in jedem Jahr mindestens so viele Lehrveranstaltungen, dass 6 ECTS-Leistungspunkte erreichbar sind. Jeweils zu Beginn des Moduls wird den Studierenden das konkrete Angebot erläutert.
Modul 3850: Natural Language Processing
Zugehörige Lehrveranstaltungen
Nr. | Art | Veranstaltungsname | Teilnahme | TWS |
38501 | VÜ | Natural Language Processing | Pflicht | 3 |
38502 | P | Praktikum Natural Language Processing | Pflicht | 3 |
Summe (Pflicht und Wahlpflicht) | 6 |
Empfohlene Voraussetzungen
Die Studierenden sollten Grundkenntnisse in Informatik besitzen, insbesondere Erfahrung mit Algorithmen sowie Programmierkenntnisse in Python haben.
Qualifikationsziele
Ziel der Lehrveranstaltungen dieses Moduls ist es, die Studierenden mit speziellen Techniken des Natural Language Processing vertraut zu machen. Insbesondere sollen die Studierenden dabei lernen, wie Qualität, Zuverlässigkeit und Leistungsfähigkeit komplexer Sprachmodellle durch Auswahl entsprechender Entwicklungs- und Evaluationsmethoden gewährleistet werden können.
Inhalt
Die Studierenden lernen die wichtigsten Phänomene in natürlichen Sprachen auf verschiedenen Granularitätsebenen kennen, angefangen bei der Kombination von Lauten bis hin zur Bedeutung von Wörtern, Sätzen und Texten.
Sie erhalten eine Einführung in die wichtigsten symbolischen und statistischen Ansätze des Natural Language Processing (NLP) zur Modellierung dieser Phänomene. Alle theoretischen Themen werden von Übungen begleitet, die sich mit diesen Phänomenen befassen und die ihre Anwendung in praktischen Szenarien demonstrieren, wie z. B. Rechtschreibkorrektur, automatische Vervollständigung, Schlüsselwortextraktion, Themenerkennung, Erkennung von benannten Entitäten (Eigennamen), Relationsextraktion, Synonymerkennung etc.
Im Praktikum werden die Inhalte der Vorlesung im Rahmen eines exemplarischen NLP-Projekts zur Anwendung gebracht.
Leistungsnachweis
Das gesamte Modul wird per Notenschein geprüft, mit Anteilen von je 3 ECTS zur Vorlesung (mit Übung) und zum Praktikum.
Verwendbarkeit
Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science mit Fokus auf Natural Language Processing.
Dauer und Häufigkeit
Das Modul dauert 2 Trimester und beginnt jedes Jahr im WT.
Modul 3851: Information Retrieval
Zugehörige Lehrveranstaltungen
Nr. | Art | Veranstaltungsname | Teilnahme | TWS |
38511 | VÜ | Information Retrieval | Pflicht | 6 |
Summe (Pflicht und Wahlpflicht) | 6 |
Empfohlene Voraussetzungen
Die Studierenden sollen grundlegende Programmierkenntnisse sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.
Qualifikationsziele
Studierende lernen Aufgabenstellung, Modelle und Methoden des Information Retrieval kennen. Dabei soll die Fähigkeit zur Nutzung und zur Mitwirkung bei der Konzeption und Konfiguration von Suchmaschinenlösungen für Web und Enterprise Search vermittelt werden. Darüber hinaus sollen die Vor- und Nachteile der zugrundeliegenden Konzepte und Modelle sowie der verschiedenen Implementierungstechniken verstanden werden.
Inhalt
Dieses Modul gibt einen Einblick in die wichtigsten Themen des Information Retrieval. Hierfür werden die Grundlagen der wichtigsten Modelle aus dem Bereich des Information Retrieval vermittelt. Außerdem werden Techniken und Verfahren wie z. B. Term-Gewichtungen, Ähnlichkeitsmaße und Rankingmechanismen, Evaluierungsprinzipien, Benutzerinteraktion und Feedbackmechanismen sowie Indexierung und computerlinguistische Hilfsmittel für dem Bereich des Information Retrieval detailliert behandelt.
In der Übung werden theoretische und praktische Fragestellungen gleichermaßen behandelt. Der theoretische Teil dient zur Wiederholung der Vorlesungsinhalte. Im praktischen Teil sind die Studierenden aufgefordert, ausgewählte Verfahren aus dem Information Retrieval eigenständig zu implementieren. Für die Übungen sind Programmierkenntnisse erforderlich.
Leistungsnachweis
Schriftliche Prüfung von 60 Minuten oder mündliche Prüfung von 30 Minuten.
Verwendbarkeit
Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglichen den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science mit Fokus aus Information Retrieval.
Dauer und Häufigkeit
Das Modul dauert ein Trimester und beginnt jedes Jahr im WT.
Modul 3852: Anwendungsgebiete der Data Science
Zugehörige Lehrveranstaltungen
Nr. | Art | Veranstaltungsname | Teilnahme | TWS |
38521 | VÜ | Sentiment Analysis | Wahlpflicht | 3 |
38522 | VÜ | Social Media Mining | Wahlpflicht | 3 |
38523 | VÜ | Semantische Technologien | Wahlpflicht | 3 |
38524 | PRO | Modulprojekt Anwendungsgebiete der Data Science | Wahlpflicht | 3 |
Summe (Pflicht und Wahlpflicht) | 6 |
Empfohlene Voraussetzungen
Die Studierenden sollen grundlegende Kenntnisse in Programmierung und Software-Entwurf sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.
Qualifikationsziele
Die Studierenden lernen Herausforderungen und Methoden beim Text Mining kennen und lernen die besprochenen Techniken anzuwenden. Zudem lernen sie theoretische Ansätze auf konkrete, praxisrelevante Fragestellungen zu übertragen. Für exemplarische Aufgabenstellungen können die Studierenden bestehende methodische Ansätze beurteilen und Weiterentwicklungen anregen respektive eigenständig umsetzen. Sie können begründet argumentieren und eine von ihnen selbstständig gefundene Lösung vertreten und reflektiv bewerten.
Inhalt
In der Vorlesung „Sentiment Analysis“ soll die schon umfangreiche Forschungsliteratur zum Opinion Mining aufgearbeitet werden. Dabei reichen die Ansätze von der Text- bis zur Wortebene, die Aufgaben sind das Erkennen von Subjektivität vs. Objektivität, das Bestimmen der Perspektive von Autoren, das Extrahieren ihrer Meinung. Datenquellen können Review-Seiten aus dem Internet sein, Blog-Posts und -kommentare, Nachrichten auf Twitter, gesprochene Sprache usw.
In der Vorlesung „Social Media Mining“ wird exemplarisch die Entwicklung eines Systems besprochen, welches über soziale Netzwerke direkt oder indirekt an Unternehmen adressierte Meldungen, Nachrichten oder Kommentare erfasst, klassifiziert und auswertet. Hierbei werden Textmining- und Klassifikationsverfahren mit Fokus auf Kurztexten diskutiert und der begleitenden Übung praktisch vertieft.
Die Vorlesung „Semantische Technologien“ gibt einen Einblick in Grundlagen und praktische Anwendungen wissensbasierter Softewarelösung. Sie gibt einen breiten Überblick über den Nutzen und die Möglichkeiten dieser Technologien. Semantische Technologien versetzen uns nicht nur in die Lage, Informationen zu speichern und wiederzufinden, sondern sie gemäß ihrer Bedeutung und Funktion entsprechend auszuwerten, zu verbinden, zu Neuem zu verknüpfen und so flexibel und zielgerichtet anzuwenden.
Im Modulprojekt setzen sich Studierende unter Anleitung selbständig mit Texten und Aufgaben zum Modulthema auseinander und präsentieren ihre Ergebnisse geeignet in mündlicher und/oder schriftlicher Form. Zu Beginn des Modulprojekts werden die geplanten Einzelthemen angekündigt und festgelegt, in welcher Form die Ergebnisse zu präsentieren sind.
Leistungsnachweis
Das gesamte Modul wird per Notenschein geprüft, mit Anteilen von je 3 ECTS-LP zu jeder der Vorlesungen (mit Übung) und im Modulprojekt. Die Studierenden können (je nach Angebot) entweder zwei Vorlesungen mit Übungen oder eine Vorlesung mitÜbungen und ein Modulprojekt einbringen – was insgesamt die 6 ECTS-LP des Moduls ergibt.
Verwendbarkeit
Die hier erworbenen Kenntnisse und Fertigkeiten ergänzen die Ausbildung im Bereich der Softwaretechnik um einen Aspekt von hoher praktischer Bedeutung. Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science.
Dauer und Häufigkeit
Das Modul dauert 1-2 Trimester und beginnt jedes Jahr im HT.
Sonstige Bemerkungen
Die Vorlesungen und das Praktikum werden nicht alle jedes Jahr angeboten, aber in jedem Jahr mindestens so viele Lehrveranstaltungen, dass 6 ECTS-Leistungspunkte erreichbar sind. Jeweils zu Beginn des Moduls wird den Studierenden das konkrete Angebot erläutert.
Modul 3853: Analyse unstrukturierter Daten
Zugehörige Lehrveranstaltungen
Nr. | Art | Veranstaltungsname | Teilnahme | TWS |
38531 | VÜ | Analyse unstrukturierter Daten | Pflicht | 6 |
Summe (Pflicht und Wahlpflicht) | 6 |
Empfohlene Voraussetzungen
Die Studierenden sollen grundlegende Programmierkenntnisse sowie ein Grundverständnis von Algorithmen und Datenstrukturen haben.
Qualifikationsziele
Die Studierenden lernen Herausforderungen und Methoden bei der Informationsbeschaffung und -extraktion kennen und lernen die besprochenen Analyse-Methoden anzuwenden. Sie lernen Verfahren der Analyse unstrukturierter Daten auf konkrete, praxisrelevante Fragestellungen (insbesondere im Bereich Wissensgewinnung) anzuwenden und können für exemplarische Aufgabenstellungen existierende Ansätze beurteilen und Weiterentwicklungen anregen respektive eigenständig umsetzen.
Inhalt
Dieses Modul gibt einen Einblick in die Herausforderungen und Verfahren, die bei der Analyse unstrukturierter Daten zum Einsatz kommen. Unstrukturierte Informationen sind in der Regel sehr textlastig, weshalb viele vorhersagende Analyse-Verfahren den Informationswert dieser Daten nicht nutzen können. Allerdings können textbasierte Medien (E-Mails, Webseiten-Inhalte, Fachartikel, Social Media Beiträge etc.) u. a. dabei helfen, Trends zu erkennen, Wissen zu gewinnen und Fake News aufzudecken. Hierfür müssen Informationen identifiziert, extrahiert, aufbereitet und interpretiert werden. Die Herausforderung besteht darin, relevante Informationen zu erkennen, aus unstrukturierten Texten zu extrahieren und fehlende Informationen ggf. hinzufügen. In der Veranstaltung werden auch Themen wie die Informationsgewinnung aus unterschiedlichen Quellen sowie Fragen der Qualitätssicherung bei der Datenspeicherung und des Datenmanagements in wissensbasierten Strukturen behandelt.
In der Übung werden theoretische und praktische Fragestellungen gleichermaßen adressiert. Der theoretische Teil dient zur Wiederholung der Vorlesungsinhalte. Im praktischen Teil sind die Studierenden aufgefordert, ausgewählte Verfahren zur Analyse unstrukturierter Daten eigenständig zu implementieren. Für die Übungen sind Programmierkenntnisse erforderlich.
Leistungsnachweis
Schriftliche Prüfung von 60 Minuten oder mündliche Prüfung von 30 Minuten.
Verwendbarkeit
Die Teilnahme an den Lehrveranstaltungen dieses Wahlpflichtmoduls ermöglicht den Studierenden die Übernahme einer Master-Arbeit im Bereich Data Science mit Fokus auf die Analyse unstrukturierter Daten.
Dauer und Häufigkeit
Das Modul dauert ein Trimester und beginnt jedes Jahr im HT.