[an error occurred while processing this directive]
Bild mit Unilogo
homeicon uni sucheicon suche siteicon sitemap kontakticon kontakt impressicon impressum
unilogo Universität Stuttgart 
Institut für Formale Methoden der Informatik

Abteilung Sichere und Zuverlässige Softwaresysteme

[an error occurred while processing this directive] englishicon
 

Hauptseminar im Wintersemester 06/07

Inside Google - Algorithmen für Suchmaschinen

(Javier Esparza, Stefan Kiefer, Michael Luttenberger, Dirk Nowotka, Stefan Schwoon, Dejvuth Suwimonteerabuth)



Vorbesprechung: Montag, den 24.07.06, um 17:15 Uhr im Raum 0.108
Seminar-Termin: Montag, 09:45-11:15 Uhr im Raum 0.363


Kontaktperson: Dirk Nowotka


Inhalt

Suchmaschinen wie Google werden täglich zum Finden von Informationen im Internet eingesetzt. Dieses Hauptseminar beschäftigt sich mit Algorithmen, die Suchmaschinen-Betreiber einsetzen können, um verschiedene Funktionalitäten von Suchmaschinen bereitzustellen.

Folgende Themengebiete werden behandelt:

  • Textsuche: Wie kann man ein Muster (z.B.ein Suchwort) in einem längeren Text (z.B. Webseiten) auffinden?
  • Ranking: Wie sortiert Google Treffer nach Relevanz?
  • Semantik: Wie kann man die Hyperlink-Struktur des WWW nutzen, um sog. Web-Communities, also Webseiten mit verwandtem und verlinktem Inhalt, zu identifizieren? Kann man so auch z.B. Synonyme ermitteln?
  • Sampling: Wie findet man eine repräsentative Auswahl von Webseiten?
  • Kompression: Wie kann man die gesammelten Daten geeignet komprimieren?
  • Rank Aggregation: Wie können Meta-Suchmaschinen die Ranking-Ergebnisse anderer Suchmaschinen kombinieren?

  Datum Thema Vortragende/r Betreuung
  I 16.10.06 Einführungstreffen (LaTeX-Quellen) Dirk Nowotka  
16.10.06 Markov-Ketten Javier Esparza  
     Ranking (Übersichtsartikel)    
  II 23.10.06 PageRank Grundlagen Sergej Bors Michael Luttenberger
  III 30.10.06 Effiziente Berechung v. PageRank entfällt Michael Luttenberger
  IV 06.11.06 HITS entfällt Stefan Schwoon
  V 13.11.06 SALSA Igor Neyman Stefan Schwoon
  VI 20.11.06 Page Quality Alexandros Panagiotidis Javier Esparza
  VII 27.11.06 Rank Aggregation entfällt Dejvuth Suwimonteerabuth
     Text Matching    
  VIII 04.12.06 Exact Text Matching Jing Zhou Dirk Nowotka
  IX 11.12.06 Approximate Text Matching Valeri Schneider Dirk Nowotka
  X 18.12.06 Suffix Trees Serguei Telejnikov Stefan Schwoon
  XI 15.01.07 Document Clustering Annette Hamm Dejvuth Suwimonteerabuth
     Weitere Themen    
  XII 22.01.07 Web Communities Changsheng Qian Javier Esparza
  XIII 29.01.07 Uniform Sampling entfällt Stefan Kiefer
  XIV 05.02.07 Caching entfällt Stefan Kiefer

Richtlinien für Seminarteilnehmer