Master Thesis MSTR-2023-98

BibliographyBiester, Fabian: Automatisierte Ontologie-Generierung für maschinelles Lernen zur Fehlererkennung in IoT-Daten.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Master Thesis No. 98 (2023).
75 pages, german.
Abstract

Maschinelles Lernen spielt eine immer größere Rolle in allen Bereichen des Lebens, von Business-Entscheidungen bis zu Industrie 4.0. Künstliche Intelligenz (KI) erfordert eine hohe Datenqualität während des Trainings, um eine gute Leistung zu erzielen. Dank datenreinigungsorientierter Ansätze, die auf funktionalen Abhängigkeiten basieren und aus einem Kontextmodell (Ontologie) extrahiert werden, lässt sich die Datenqualität erhöhen. Die Erstellung von Kontextmodellen ist jedoch aufwendig, teuer und erfordert Fachexperten auf dem Gebiet. Um diesen Aufwand zu reduzieren, schlägt diese Arbeit einen Ansatz zur automatischen Generierung von Kontextmodellen mit Hilfe von Large Language Models für unbekannte Datensätze vor. Der Ansatz umfasst mehrere Schritte, darunter die Klassifizierung des Datensatzes, die Extraktion oder Mapping von Modellen und die abschließende Generierung vom Kontextmodell. Ein Prototyp wurde implementiert und anhand von drei Datensätzen (IoT, Krankenhaus, Industrie 4.0) evaluiert. Die Evaluation zeigt, dass der vorgeschlagene Ansatz ähnliche Datenbereinigungsraten wie manuell erstellte Kontextmodelle erreicht.

Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Superviser(s)Schwarz, Prof. Holger; Del Gaudio, Daniel
Entry dateApril 8, 2024
   Publ. Institute   Publ. Computer Science