Bachelor Thesis BCLR-2020-104

BibliographyVu, Tuan Nam: Minimierung von Labeling Bias während der Labelkategorisierung.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Bachelor Thesis No. 104 (2020).
57 pages, german.
Abstract

Machine Learning Modelle werden zunehmend für Entscheidungen eingesetzt, die das Leben von Menschen beeinflussen. Jedoch können diese Modelle Verzerrungen aufweisen, sodass bestimmte Menschengruppen benachteiligt werden. Für das Trainieren der Modelle werden Trainingsdaten verwendet, welche aus Datenpunkte bestehen, die für die zu vorhersagende Variable bereits das richtige Ergebnis enthalten. Diese nennt man auch Labels. Dabei kann es sein, dass die verwendeten Trainingsdaten bereits Verzerrung enthalten und diese auf das Modell weitergeführt wird. Ein weiteres Problem entsteht, falls eine Klassifizierung durchgeführt werden soll, aber die Labels numerisch sind, sodass eine Transformation von numerischen zu ordinalen Labels erforderlich ist. Daher wurden in dieser Arbeit Konzepte für diese Transformation erarbeitet, wobei zusätzlich die Verzerrung minimiert werden soll. Die Konzepte wurden implementiert und anschließend anhand der Implementierung an real-existierenden Datensätzen evaluiert und verglichen.

Full text and
other links
Volltext
Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Data Engineering
Superviser(s)Herschel, Prof. Melanie; Oppold, Sarah
Entry dateApril 29, 2021
   Publ. Computer Science