Bachelorarbeit BCLR-2019-28

Bibliograph.
Daten
Werner, Peter: Automatische Zusammenfassung eines Newsletters mithilfe von Text-Mining.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Bachelorarbeit Nr. 28 (2019).
103 Seiten, deutsch.
Kurzfassung

In der heutigen Zeit stehen große Informationsmengen in Form von digitalisierten Texten zur Verfügung. Allerdings sind diese meist unsortiert abgelegt und das Auffinden bestimmter Texte, sowie das Gewinnen eines Überblicks über den vorliegenden Datenbestand, geht mit großem manuellem Aufwand einher. Im Rahmen dieser Arbeit wurde ein Prototyp für ein System entwickelt, das den Menschen durch automatische Kategorisierung, Zusammenfassung und Erfassung von Eckdaten bei diesen Aufgaben unterstützen soll. Für die Kategorisierung wurde der Online-Hierarchical-Dirichlet-Process (oHDP) zur Erkennung latenter Themen, für die Zusammenfassung der TextRank-Algorithmus und für die Erfassung der Eckdaten ein naiver Bayes-Klassifikator eingesetzt. Als Informationsbestand dienten dazu Artikel aus wöchentlich veröffentlichten Newslettern. Die anschließende Evaluation des Prototyps zeigt, dass er Nutzern helfen kann, einen Überblick über die Informationen zu erhalten. In Zukunft sind aber noch weitere Verbesserungen nötig, um das System produktiv einzusetzen.

Abteilung(en)Universität Stuttgart, Institut für Softwaretechnologie, Software Engineering
BetreuerWagner, Prof. Stefan; Ebert, Verena; Vehlow, Dr. Corinna; Black, Melanie
Eingabedatum7. August 2019
   Publ. Informatik