Diploma Thesis DIP-2989

BibliographyThom, Dennis: Kompressionsbasierte Mustererkennung auf Bildern.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Diploma Thesis No. 2989 (2010).
168 pages, german.
CR-SchemaI.5.3 (Pattern Recognition Clustering)
I.5.4 (Pattern Recognition Applications)
E.4 (Data Coding and Information Theory)
H.1.1 (Systems and Information Theory)
Abstract

Die Kompressionsdistanz stellt eine universelle Metrik zur numerischen Operationalisierung der Ähnlichkeit beliebiger Datenobjekte dar. Sie basiert auf der Annahme, dass sich zwei Datensequenzen genau dann besonders ähnlich sind, wenn sich aus einer gemeinsamen Kompression dieser Sequenzen mit einem effektiven Kompressionsverfahren eine messbare Verbesserung in Form einer geringeren Kompressionsgröße gegenüber der isolierten Kompression erzielen lässt. Obschon sich mit diesem einfachen Distanzmaß erstaunliche Resultate auf den Gebieten der Mustererkennung und Klassifikation von Prosatexten, Musikstücken oder auch Gendaten erzielen lassen, sind deutliche Grenzen seiner Leistungsfähigkeit bei der Analyse kontinuierlicher und inhärent mehrdimensionaler Datenstrukturen feststellbar. In dieser Arbeit werden speziell für den Bereich graphischer Daten die wesentlichen Probleme und Einschränkungen erörtert, mit denen die Kompressionsdistanz zu kämpfen hat. Darauf aufbauend werden verschiedene Lösungsansätze vorgestellt und evaluiert, welche ihre Leistungsfähigkeit auf diesem Gebiet verbessern sollen. Auf Basis der gewonnenen Erkenntnisse werden dann Überlegungen zu einer verallgemeinerten Berechnung der Kompressionsdistanz als Explikation des intuitiven Begriffs der Beschreibungsähnlichkeit von Datenobjekten angestellt.

Full text and
other links
PDF (8941083 Bytes)
Access to students' publications restricted to the faculty due to current privacy regulations
Department(s)University of Stuttgart, Institute of Visualisation and Interactive Systems, Visualisation and Interactive Systems
Superviser(s)Klenk Sebastian
Entry dateJuly 7, 2010
   Publ. Computer Science