Dipl.-Informatiker Thomas Bohne
Wissenschaftlicher Mitarbeiter
Lehre
HT 10 Seminar | Seminar Data Recovery and Information Visualization [Borghoff] |
HT 10 Übung | Einführung in die Informatik I [Schmitz] |
WT 11 Übung | Einführung in die Informatik II [Schmitz] |
HT 11 Seminar | Text Data Mining [Borghoff] |
HT 11 Übung | Einführung in die Informatik I [Schmitz] |
Studentische Arbeiten
Dipl. Inf. Thomas Bohne
» Bachelor- und Masterarbeiten
» Kompetenztraining
» Allgemeine Hinweise
Zu vergebende Bachelor- und Masterarbeiten
Schlüsselwort Extraktion in Twitter Feeds
In Twitter können Nutzer Nachrichten bis zu 140 Zeichen verfassen und veröffentlichen. Ziel dieser Arbeit ist die Anwendung eines schnellen Schlüsselwort Extraktionsalgorithmus auf Twitter-Feeds. Dabei soll die Länge des betrachteten Textstücks variiert werden und Zusatzinformationen wie HashTags und Weblinks in die Extraktion mit einfließen.
Schlüsselwort-Extraktionsalgorithmen
Automatische Schlüsselwort Extraktion wird dem Forschungsgebiet Text Data Mining zugeordnet. Extrahierte Schlüsselworte können dem Leser einen Abriss des Inhaltes eines Dokumentes vermitteln sowie bei der Kategorisierung von Dokumenten hilfreich sein. In Ihrer Arbeit beschreiben Sie die Grundlagen des Forschungsgebietes Information Retrieval und gehen dabei auf Textextraktionsverfahren ein. Sie implementieren einen gegebenen Schlüsselwortextraktionsalgorithmus in Java sowie in Haskell. Bei der Implementierung nutzen Sie die für die jeweilige Sprache typischen Sprachkonstrukte. Anschließend führen Sie einen Laufzeittest mit beiden Anwendungen durch und werten die Ergebnisse aus.
Voraussetzungen: gute Java/Haskell Kenntnisse
Schlüsselwort-Extraktion im Browser
Um Texte von Webseiten schnell zu erfassen oder Tagging von Inhalten zu unterstützen, sollen beim Betrachten einer Webseite Schlüsselworte eingeblendet werden. Sie beschreiben die Grundlagen von Textextraktion sowie die Anwendung und Bedeutung von Tags im Web. Ziel Ihrer Arbeit ist die Implementierung einer JavaScript-Anwendung zur Schlüsselwortextraktion in Webbrowsern. Anschließend messen Sie die Laufzeit Ihrer Anwendung für verschiedene Szenarios und werten das Ergebnis aus.
Voraussetzungen: gute JavaScript Kenntnisse
Realisierung einer Tag Cloud auf dem IPad
Tag Clouds haben im Web 2.0 eine große Verbreitung gefunden, jedoch beschränken sich ihre Einsatzgebiete nicht nur auf das Web. Im Text Data Mining können Tag Clouds die Schlagwörter eines Dokumentes visualisieren und dabei dem Betrachten den Rückschluss auf den Inhalt des betrachteten Textabschnitts ermöglichen. Sie sollen in dieser Arbeit eine App auf dem IPad entwickeln, die Schlüsselworte zu einem Abschnitt eines Dokumentes visualisiert. Ein Extraktionsalgorithmus für die Schlüsselworte wird dabei bereitgestellt.
Voraussetzungen: Kenntnisse IPad App Programmierung
Arbeiten im Rahmen des Kompetenztrainings
Arbeiten für ein Kompetenztraining werden auf Nachfrage vergeben.
Allgemeine Hinweise
Die Prüfungsordnung sowie die Modulhandbücher finden Sie auf der Seite des Instituts.
Forschung
Dipl. Inf. Thomas Bohne
Forschung
- Keyword Extraction and Burst Detection
- Heuristic Measures for Text Analysis
- Visualization Techniques for Textual Data
Konferenzen:
- Bohne, T., Borghoff, U. M.
Detecting Information Structures in Texts
In: Lecture Notes in Computer Science; LNCS'2013; status: submitted - Bohne, T., Borghoff, U. M.
Data Fusion: Boosting Performance in Keyword Extraction.
In: Proc. 20th Annual IEEE International Conference and Workshops on the Engineering of Computer Based Systems (ECBS), 2013. Phoenix, AZ, pp. 166-173 - Bohne, T., Borghoff, U. M.
Beyond Frequency: Structural Analysis of Texts
In: Proc. 14th Int. Conf. on Computer-Aided System Theory (Eurocast 2013) - Bohne, T., Rönnau, S., Borghoff, U. M.
Efficient Keyword Extraction for Meaningful Document Perception.
In: Hardy, M. (ed.): Proc. 11th ACM Symp. on Document Engineering (DocEng 2011), Mountain View, CA, USA, September 19-22, 2011. New York: ACM, ISBN 978-1-4506-0863-2, pp. 185-194