Diplomarbeit DIP-2359

Bibliograph.
Daten
Pfahl, Timo: Entwicklung von Verfahren zur Cluster-Bildung in einem Informationsgraphen für die Vorabübertragung von Webseiten..
Universität Stuttgart : Sonderforschungsbereich SFB 627 (Nexus: Umgebungsmodelle für mobile kontextbezogene Systeme), Diplomarbeit Nr. 2359 (2005).
107 Seiten, deutsch.
CR-Klassif.H.3.3 (Information Search and Retrieval)
E.1 (Data Structures)
F.2.2 (Nonnumerical Algorithms and Problems)
KeywordsHoarding; Cluster; Vorabübertragung
Kurzfassung

Aus unserem täglichen Leben sind mobile Endgeräte wie Mobiltelefone oder PDAs nicht mehr wegzudenken. Durch die zunehmende Verbreitung von Funknetzen ist der mobile Zugriff auf das Internet mit solchen Geräten an immer mehr Orten möglich. Von einer flächendeckenden Versorgung ist man jedoch noch weit entfernt. Eine Möglichkeit, dem Benutzer auch in Zeiten ohne Netzanbindung den Zugriff auf Inhalte des Internets bieten zu können, besteht darin, Webseiten in Phasen guter Netzanbindung vorab auf das Endgerät zu übertragen. Die Herausforderung dieser Vorgehensweise, im englischen Hoarding genannt, liegt darin, eine gute Vorhersage über zu erwartendes Benutzerverhalten zu treffen. Hierzu wird das vergangene Benutzerverhalten beobachtet und ausgewertet. Auf Basis dieser Auswertung erfolgt dann eine Vorhersage über das zukünftig erwartete Verhalten.

Im Rahmen dieser Arbeit wird ein solches Verfahren zur Vorhersage zukünftigen Zugriffsverhaltens auf Webseiten erarbeitet. In einem existierenden Verfahren wird das vergangene Zugriffsverhalten verschiedener Benutzer in einer Graphstruktur repräsentiert. Die Auswahl der Webseiten erfolgt dann durch eine Traversierung des Graphen nach dem Tiefen- oder Breitensuchprinzip. In dieser Arbeit wird ein Verfahren erstellt, das durch Clusterbildung jene Webseiten in diesem Graphen zu Informationseinheiten zusammenfasst, zwischen denen eine semantische Beziehung besteht. Das bedeutet, dass wenn eine Webseite eines Clusters aufgerufen wird, es sehr wahrscheinlich ist, dass auch auf die anderen enthaltenen Seiten zugegriffen wird. Um den Speicherplatz der Endgeräte effizienter zu nutzen, werden Cluster dann entweder komplett oder gar nicht vorab übertragen. Dadurch wird erwartet, dass eine bessere Auswahl der vorab zu übertragenden Webseiten getroffen wird.

Die Idee hinter der Clusterbildung basiert darauf, dass Benutzer beim Durchsuchen des Internets häufig eine Folge von Webseiten aufrufen, bis die gesuchte Information gefunden wurde. Dies ermöglicht eine Unterteilung der Seiten in so genannte Navigations- und Inhaltsseiten. Auf Basis dieser Unterteilung werden dann im Graphen Pfade von Webseiten gesucht, die eine solche Suche repräsentieren. Die einzelnen Seiten eines solchen so genannten Suchpfades werden dann zu einem Cluster zusammengefasst.

Es wird gezeigt, dass durch die Clusterbildung und -bewertung eine sehr viel bessere Vorhersage über zukünftiges Benutzerverhalten getroffen werden kann. Auf Basis von Bewertungsmetriken, die zur Ermittlung der Zufriedenheit der Benutzer dienen, werden bis zu dreimal bessere Ergebnisse erzielt als für das existierende Tiefen- und Breitensuchverfahren.

Volltext und
andere Links
PDF (1768295 Bytes)
Zugriff auf studentische Arbeiten aufgrund vorherrschender Datenschutzbestimmungen nur innerhalb der Fakultät möglich
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Systeme, Verteilte Systeme
Projekt(e)SFB-627, A2 (Universität Stuttgart, Institut für Parallele und Verteilte Systeme, Verteilte Systeme)
Eingabedatum17. Februar 2006
   Publ. Abteilung   Publ. Institut   Publ. Informatik