Bachelor Thesis BCLR-2021-47

BibliographyBantel, Linus: Quantifizierung der Ähnlichkeit von Daten mit Hilfe neuronaler Netze.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Bachelor Thesis No. 47 (2021).
48 pages, german.
Abstract

In den letzten Jahren stieg die Menge, sowie die Heterogenität an Daten immer weiter an. Dieser Trend ist exponentieller Natur und es ist anzunehmen, dass dieser auch in Zukunft weiter steigen wird. Umso wichtiger ist es, Data-Scientisten und Domänenexperten bei der Analyse der Daten zu unterstützen, da es bei steigender Datenmenge für Analysten immer schwieriger wird, eine Überblick über die Daten zu behalten. Dies ist für aussagekräftige Analysen von fundamentaler Bedeutung. In dieser Arbeit wird daher SDRank vorgestellt, die Daten anhand ihrer semantischen Ähnlichkeit quantifiziert um so ein Ranking für den Nutzer zu erstellen. Ähnlich zu klassischen Suchmaschinen wie bspw. Google soll dies verhindern, dass Anwender alle - und damit auch für ihre Analysen irrelevanten - Daten sichten müssen. Stattdessen soll SDRank ihren Anwendern ein schnelles Überblicken der vorhandenen Daten erlauben um Analysen aufgrund größerer Datengrundlagen statistisch aussagekräfter zu gestalten sowie wertvolle Zeit und Resourcen in nachfolgende Schritte der Analyse investieren zu können. Um SDRank auf Effektivität und Effizienz zu prüfen, wurde eine prototypische Implementierung erstellt. Die Evaluation zeigt dabei auf, dass mit SDRank neben aussagekräftigen Rankings auch eine Berechnung in Echtzeit möglich ist.

Full text and
other links
Volltext
Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Superviser(s)Mitschang, Prof. Bernhard; Behringer, Michael; Fritz, Manuel
Entry dateOctober 11, 2021
New Report   New Article   New Monograph   Computer Science