• Erkennung von Buchstaben mit Faltungsnetzwerken

    Faltungsnetzwerke eignen sich sehr gut zur Klassifikation von Bildern. Im Rahmen einer Bachelorarbeit erzeugen Sie einen Trainingsdatensatz in Form von Bildern zur Erkennung von Kleinbuchstaben des Alphabets und kümmern sich um die Konzeption und Umsetzung eines CNN zur Klassifikation der Bilder.
  • Klassifikation von Audiodateien mit Hilfe von Faltungsnetzwerken

    Zeitabhängige Audiodaten lassen sich mit Hilfe einer Zeit-Frequenz-Transformation in Frequenzdaten überführen. Aufgabe in dieser Bachelorarbeit ist es, Audiodateien so in Bilder zu transformieren, dass damit eine Klassifikation nach Musikgruppe oder Genre möglich wird.
  • Handschrifterkennung mit rekurrenten neuronalen Netzen

    Bei einer Handschrifterkennung geht es um die automatische Identifizierung und Umwandlung von handgeschriebenen Zeichen oder Texten in maschinenlesbaren Text. Aufgabe in dieser Bachelorarbeit ist es znächst, einen Trainingsdatensatz mit handgeschriebenem Text zu erzeugen. Dabei soll die zeitliche Abfolge der Schreibbewegung erfasst werden. Anschließend soll ein rekurrentes neuronales Netz (RNN) zur Erkennung der Handschrift konzipiert und umgesetzt werden.
  • LSTM zur Vorhersage von Börsenkursen

    Börsenkurse sind typische Beispiele von Zeitreihendaten, die häufig unerwarteten Schwankungen unterliegen. Aufgabe der Bachelorarbeit ist es, mit Hilfe eines LSTM die Börsenkurse einzelner Unternehmen vorherzusagen. Dabei sollen historische Kursdaten verwendet werden, um zukünftige Preisbewegungen vorherzusagen.
  • Word2Vec-Modell zum Word-Embedding

    Word2Vec ist ein bekanntes Modell zur Repräsentation von Tokens in einem hochdimensionalen reellen Vektorraum. Aufgabe der Bachelorarbeit ist es, ein solches Modell für deutschsprachige Tokens zu entwickeln.
  • RNN vs. LSTM am Beispiel einer Reber-Grammatik

    Eine Reber-Grammatik ist ein spezieller endlicher Automat, mit dem gültige Zeichenketten erzeugt werden können. Aufgabe der Bachelorarbeit ist es, auf Basis eines selbst erzeugten Trainingsdatensatzes mit sehr langen Zeichenketten ein RNN bzw. LSTM zu trainieren, welches das nächste Zeichen vorhersagt. Ein abschließender Vergleich der Güte der beiden Ansätze bietet sich an.
  • Sportdatenanalyse mit Floodlight

    Floodlight ist ein Tool zur Analyse von Spiel- und Leistungsdaten aus verschiedenen Sportarten, das im Rahmen eines Förderprojekts an der Sporthochschule Köln entwickelt wird. Aufgabe der Bachelorarbeit ist es, das Tool hinsichtlich der Eignung für KI-Methoden zu untersuchen. Insbesondere sollen räumliche und zeitliche Analysemöglichkeiten untersucht werden.
  • Learning Nuggets für maschinelles Lernen

    Learning Nuggets sind kurze Lerneinheiten zur Unterstützung der Lehre. Aufgabe der Bachelorarbeit ist es, ein Learning Nugget Ihrer Wahl in Form eines Lehrvideos im Umfeld der künstlichen Intelligenz zu erzeugen.
  • DBSCAN-Algorithmus zur Clusteranalyse

    Die Clusteranalyse zählt zu den Verfahren des nicht-überwachten Lernens. Eine Möglichkeit, Daten in Gruppen aufzuteilen besteht darin, Bereiche zu identifizieren, in denen Punkte konzentriert auftreten und diese von Bereichen mit anderen konzentrierten Daten zu trennen. Dabei werden Punkte gruppiert, die in der Nachbarschaft zueinander liegen. Als kleine Einleitung siehe das Vorlesungs-Video aus der Universität Bochum.

    Aufgabe ist es, das Verfahren mathematisch zu notieren und am Rechner anhand von Beispielen umzusetzen. Dabei sollen Stärken und Schwächen des Verfahrens praktisch untersucht werden.

  • Lineare Diskriminanzanalyse

    Die lineare Diskriminanzanalyse ist eines der ältesten immer noch gebräuchlichen Verfahren zur Klassifikation, behandelt somit Fragen des überwachten Lernens. Objekte, die als k-dimensionale metrische Merkmale gegeben sind, sind einer Klasse zugeordnet worden. Auf Grundlage dieser Zuordnung soll eine Funktion festgelegt werden, die nicht-zugeordnete Objekte einer Klasse zuweisen kann. Bei der linearen Diskriminanzanalyse werden die Daten auf Basis normalverteilter Klassen linear getrennt. Als kleine Einleitung siehe das folgende Vortrags-Video.

    Aufgabe ist es, den mathematischen Hintergrund des Verfahrens zu beschreiben und anhand eines Beispiels am Rechner umzusetzen. Dabei soll auch auf Schwierigkeiten bei nicht linear trennbaren Daten eingegangen werden.