Bachelorarbeit BCLR-2020-104

Bibliograph.
Daten
Vu, Tuan Nam: Minimierung von Labeling Bias während der Labelkategorisierung.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Bachelorarbeit Nr. 104 (2020).
57 Seiten, deutsch.
Kurzfassung

Machine Learning Modelle werden zunehmend für Entscheidungen eingesetzt, die das Leben von Menschen beeinflussen. Jedoch können diese Modelle Verzerrungen aufweisen, sodass bestimmte Menschengruppen benachteiligt werden. Für das Trainieren der Modelle werden Trainingsdaten verwendet, welche aus Datenpunkte bestehen, die für die zu vorhersagende Variable bereits das richtige Ergebnis enthalten. Diese nennt man auch Labels. Dabei kann es sein, dass die verwendeten Trainingsdaten bereits Verzerrung enthalten und diese auf das Modell weitergeführt wird. Ein weiteres Problem entsteht, falls eine Klassifizierung durchgeführt werden soll, aber die Labels numerisch sind, sodass eine Transformation von numerischen zu ordinalen Labels erforderlich ist. Daher wurden in dieser Arbeit Konzepte für diese Transformation erarbeitet, wobei zusätzlich die Verzerrung minimiert werden soll. Die Konzepte wurden implementiert und anschließend anhand der Implementierung an real-existierenden Datensätzen evaluiert und verglichen.

Volltext und
andere Links
Volltext
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Systeme, Data Engineering
BetreuerHerschel, Prof. Melanie; Oppold, Sarah
Eingabedatum29. April 2021
   Publ. Informatik