4213 Privacy Preserving Machine Learning
HT (ab 2025), MSc Cyber-Sicherheit
6 ECTS, Vorlesung + Seminar
Link zur Veranstaltung in ILIAS - TBA
Die aktuellen Fortschritte in der KI und im maschinellen Lernen ermöglichen es uns, bestimmte Aufgaben zu automatisieren oder die erzielten Ergebnisse zu verbessern. Die Verarbeitung personenbezogener Daten ohne geeignete Sicherheitsmaßnahmen kann jedoch auch zur unerwünschten Offenlegung sensibler Informationen führen. Modelle des maschinellen Lernens enthalten nämlich oft genaue Informationen über einzelne Datenpunkte, die zum Training der Modelle verwendet wurden. Wir müssen also die Privatsphäre der Personen schützen und gleichzeitig versuchen, den Nutzen des maschinellen Lernmodells zu maximieren.
Dieser Kurs beginnt mit einer kurzen Darstellung der Nachteile klassischer Datenanonymisierungsverfahren und zeigt auf, wie maschinelle Lernmodelle sensible Informationen über einzelne Datenpunkte preisgeben können. Dies bildet die Grundlage für differential privacy, eine mathematische Definition der Privatsphäre, die uns einen algorithmischen Rahmen für die Entwicklung praktischer datenschutzfreundlicher Algorithmen für Datenanalyse und maschinelles Lernen bietet. Wir einführen die formale Definition der differential privacy, analysieren ihre wichtigsten Eigenschaften und konzentrieren uns dann auf praktische Implementierungen. Zu diesem Zweck stellen wir die wichtigsten Bausteine für die Konstruktion privater Algorithmen für maschinelles Lernen vor. Schließlich stellen wir Anwendungen für privates föderiertes Lernen dar, bei dem mehrere Datenbesitzer zusammenarbeiten, um ein Modell zu trainieren, ohne ihre Daten zu teilen.
In dem Seminar können die Studierenden aktuelle differential privacy und federated learning Architekturen implementieren und evaluieren. Darüber hinaus werden die Studierende aktuelle Herausforderungen des datenschutzgerechten maschinellen Lernens analysieren, evaluieren und diskutieren, um neue Lösungen zu finden. Dafür werden sie fachliche Literatur und aktuelle Veröffentlichungen recherchieren.