Abstract: Eines der zentralen Themen in der Computer Vision (Computersehen) ist, ein Bild in semantisch sinnvolle Bereiche zu unterteilen, also eine Segmentierung des Bildes zu finden. In der Grundlagenforschung stellt das Verfahren des Meanshifts von Comaniciu und Meer \cite{1000236} einen verbreiteten und erfolgreichen Algorithmus dar, welcher für die Segmentierung von Bildern verwendet wird. Hierbei werden die Merkmale eines Pixels in einem mehrdimensionalen Raum von Vektoren repräsentiert und aufgrund der Dichteverteilung und zugehörenden Maxima zu Segmenten zusammengefasst. Außerdem wird auf ein anschließendes Region-Merging eingegangen, welches die erstellten Segmente des Meanshift-Algorithmus durch konstante Segmente ersetzt. Dadurch wird die Segmentierung sichtbar und nochmals deutlicher dargestellt. Aufbauend auf diesem Verfahren wird in der vorliegenden Arbeit der Meanshift um ein affines Modell erweitert, um mögliche Verbesserungen der Segmentierung zu erforschen. Ein Beispiel der Anwendung wäre die Erkennung von Farbverläufen und die Segmentierung von Objekten.
Hierfür werden die Merkmale der Pixel im mehrdimensionalen Raum mit einer Funktion auf ihre Ähnlichkeit getestet und somit gegebenenfalls anders zusammengefasst als im herkömmlichen Meanshift. In dieser Arbeit wird ein Ansatz gewählt, welcher die Position, also Koordinatenmerkmale, wie beim herkömmlichen Meanshift berechnet, den Grauwert jedoch mit einer erzeugten Ebene und demnach einer linearen Funktion in Abhängigkeit zu Nachbarn setzt. Diese Ebene soll die Ähnlichkeit zweier benachbarter Pixel beeinflussen, sodass Pixel entlang der Ebene als sehr ähnlich erkannt werden. Die Wahl dieser Funktion ist ausschlaggebend für die Funktionsweise der Distanzberechnung und somit ebenfalls für das Segmentieren von Farbverläufen und anderen Mustern.
Es gibt zwei verschiedene Ansätze das affine Ähnlichkeitsmodell in den Meanshift einfließen zu lassen, wobei beide ihre Vor- und Nachteile in der Segmentierung verschiedener Voraussetzungen haben. Die Berechnung der Ebene ist in beiden Ansätzen unterschiedlich, wodurch das Erstellen der bestmöglichen Segmentierung von der Wahl des Ansatzes abhängig ist.
Außerdem wird auf eine Erweiterung des Region-Mergings eingegangen, welche ebenfalls das affine Ähnlichkeitsmodell beinhaltet. Es ersetzt die konstanten Segmente des ursprünglichen Region-Merging durch affine Segmente. Die damit erstellten und angepassten Segmente stellen, abhängig von der Struktur, ein besseres Ergebnis dar.
|