Schritt 2: Erstellung eines sehr schnell durchsuchbaren Datenbestands
für die in den jeweiligen Web-Seiten enthaltenen Wörter
(mittels einer Information-Retrieval-Komponente).
Dazu müssen die vom Web-Robot-Komponente ermittelten Dokumente
analysiert und in eine Form gebracht werden ,
die dann in einer
schnell durchsuchbaren Datenstruktur
für nachfolgende Suchanfragen abgelegt werden.
Die meisten Retrieval-Modelle heutiger Suchmaschinen basieren auf dem
Vektorraum-Modell , das sowohl die vom Web-Robot
gelieferten Dokumente als auch die Suchanfrage als Vektor (in einem
n-dimensionalen Raum) auffasst.
Schritt 3: Abgleich der Suchanfrage (ein oder mehrere Wörter in Form eines
Booleschen Ausdrucks ) eines Benutzers
mit der in Schritt 2 aufgebauten Datenstruktur und Rückgabe der
(vermutlich) übereinstimmenden Dokumente - sortiert nach deren Relevanz.