Bachelorarbeit BCLR-2021-47

Bibliograph.
Daten
Bantel, Linus: Quantifizierung der Ähnlichkeit von Daten mit Hilfe neuronaler Netze.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Bachelorarbeit Nr. 47 (2021).
48 Seiten, deutsch.
Kurzfassung

In den letzten Jahren stieg die Menge, sowie die Heterogenität an Daten immer weiter an. Dieser Trend ist exponentieller Natur und es ist anzunehmen, dass dieser auch in Zukunft weiter steigen wird. Umso wichtiger ist es, Data-Scientisten und Domänenexperten bei der Analyse der Daten zu unterstützen, da es bei steigender Datenmenge für Analysten immer schwieriger wird, eine Überblick über die Daten zu behalten. Dies ist für aussagekräftige Analysen von fundamentaler Bedeutung. In dieser Arbeit wird daher SDRank vorgestellt, die Daten anhand ihrer semantischen Ähnlichkeit quantifiziert um so ein Ranking für den Nutzer zu erstellen. Ähnlich zu klassischen Suchmaschinen wie bspw. Google soll dies verhindern, dass Anwender alle - und damit auch für ihre Analysen irrelevanten - Daten sichten müssen. Stattdessen soll SDRank ihren Anwendern ein schnelles Überblicken der vorhandenen Daten erlauben um Analysen aufgrund größerer Datengrundlagen statistisch aussagekräfter zu gestalten sowie wertvolle Zeit und Resourcen in nachfolgende Schritte der Analyse investieren zu können. Um SDRank auf Effektivität und Effizienz zu prüfen, wurde eine prototypische Implementierung erstellt. Die Evaluation zeigt dabei auf, dass mit SDRank neben aussagekräftigen Rankings auch eine Berechnung in Echtzeit möglich ist.

Volltext und
andere Links
Volltext
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Systeme, Anwendersoftware
BetreuerMitschang, Prof. Bernhard; Behringer, Michael; Fritz, Manuel
Eingabedatum11. Oktober 2021
   Publ. Informatik