Diploma Thesis DIP-3352

BibliographyLange, Simon: Interaktiver Ansatz für die visuelle Analyse von Textdokumenten basierend auf der Word-Cloud-Visualisierungstechnik.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Diploma Thesis No. 3352 (2013).
106 pages, german.
CR-SchemaH.3.3 (Information Search and Retrieval)
H.5.2 (Information Interfaces and Presentation User Interfaces)
I.2.7 (Natural Language Processing)
Abstract

Das Konzept der Word-Cloud hat sich während des vergangenen Jahrzehnts im Internet etabliert und erfreut sich großer Popularität. Hinsichtlich der visuellen Analyse können Word-Clouds hilfreich sein, um dem Analysten einen ersten Eindruck vom Inhalt eines Textes zu vermitteln. Jedoch sind die Funktionalitäten herkömmlicher Word-Clouds stark beschränkt, da ihr primärer Fokus üblicherweise der Ästhetik gilt. Basierend auf der Word-Cloud-Idee wird in dieser Arbeit eine Visualisierung entwickelt, die eine Reihe interaktiver Funktionalitäten zur Unterstützung der visuellen Analyse von Textdokumenten anbietet. Hierbei werden Techniken der maschinellen Sprachverarbeitung mit Visualisierungs- und Interaktionsansätzen verknüpft, um einen komplett neuen Ansatz der visuellen Analyse zu ermöglichen. Um diesen Ansatz auf die Probe zu stellen sowie Feedback und Verbesserungsvorschläge zu erhalten, wurde im Anschluss an die Implementierung eine Nutzerstudie mit dem entstandenen Programm durchgeführt. Das Resultat dieser qualitativen Evaluation bestätigte die intuitive Bedienbarkeit und den Nutzen hinsichtlich bestimmter Aufgaben der visuellen Analyse von Textdokumenten. Unter anderem ist es möglich, ein beliebiges englischsprachiges Textkorpus mithilfe dieses Programms nach Wortarten oder Kategorien wie beispielsweise Personen oder Orten zu filtern und daraus eine Word-Cloud zu generieren. Darüber hinaus können explorativ Zusammenhänge zwischen einzelnen oder mehreren Wörtern ermittelt und in der Word-Cloud visualisiert werden. Neben diesen und vielen weiteren linguistischen Analysetechniken stehen dem Anwender eine Vielzahl interaktiver Einstellungsmöglichkeiten hinsichtlich der Word-Cloud zur Verfügung, die ihn bei einer visuellen Analyse unterstützen.

Full text and
other links
PDF (37856598 Bytes)
Department(s)University of Stuttgart, Institute of Visualisation and Interactive Systems, Visualisation and Interactive Systems
Superviser(s)Lohmann Steffen; Heimerl Florian
Entry dateJanuary 30, 2013
   Publ. Computer Science