Diplomarbeit DIP-2989

Bibliograph.
Daten
Thom, Dennis: Kompressionsbasierte Mustererkennung auf Bildern.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Diplomarbeit Nr. 2989 (2010).
168 Seiten, deutsch.
CR-Klassif.I.5.3 (Pattern Recognition Clustering)
I.5.4 (Pattern Recognition Applications)
E.4 (Data Coding and Information Theory)
H.1.1 (Systems and Information Theory)
Kurzfassung

Die Kompressionsdistanz stellt eine universelle Metrik zur numerischen Operationalisierung der Ähnlichkeit beliebiger Datenobjekte dar. Sie basiert auf der Annahme, dass sich zwei Datensequenzen genau dann besonders ähnlich sind, wenn sich aus einer gemeinsamen Kompression dieser Sequenzen mit einem effektiven Kompressionsverfahren eine messbare Verbesserung in Form einer geringeren Kompressionsgröße gegenüber der isolierten Kompression erzielen lässt. Obschon sich mit diesem einfachen Distanzmaß erstaunliche Resultate auf den Gebieten der Mustererkennung und Klassifikation von Prosatexten, Musikstücken oder auch Gendaten erzielen lassen, sind deutliche Grenzen seiner Leistungsfähigkeit bei der Analyse kontinuierlicher und inhärent mehrdimensionaler Datenstrukturen feststellbar. In dieser Arbeit werden speziell für den Bereich graphischer Daten die wesentlichen Probleme und Einschränkungen erörtert, mit denen die Kompressionsdistanz zu kämpfen hat. Darauf aufbauend werden verschiedene Lösungsansätze vorgestellt und evaluiert, welche ihre Leistungsfähigkeit auf diesem Gebiet verbessern sollen. Auf Basis der gewonnenen Erkenntnisse werden dann Überlegungen zu einer verallgemeinerten Berechnung der Kompressionsdistanz als Explikation des intuitiven Begriffs der Beschreibungsähnlichkeit von Datenobjekten angestellt.

Volltext und
andere Links
PDF (8941083 Bytes)
Zugriff auf studentische Arbeiten aufgrund vorherrschender Datenschutzbestimmungen nur innerhalb der Fakultät möglich
Abteilung(en)Universität Stuttgart, Institut für Visualisierung und Interaktive Systeme, Visualisierung und Interaktive Systeme
BetreuerKlenk Sebastian
Eingabedatum7. Juli 2010
   Publ. Informatik