Bachelorarbeit BCLR-2016-16

Bibliograph.
Daten
Bernhardt, Alexander: Fokussiertes Webcrawling auf Basis von Aktivem Lernen.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik, Bachelorarbeit (2016).
37 Seiten, deutsch.
CR-Klassif.H.3.3 (Information Search and Retrieval)
I.7.2 (Document Preparation)
I.7.5 (Document Capture)
Kurzfassung

In dieser Bachelorarbeit wird der Frage nachgegangen, inwieweit es möglich ist, Informationen zu einem bestimmten Themengebiet aus dem World Wide Web zu extrahieren, die den Vorstellungen eines Benutzers entsprechen und zugleich keine enorme Datenmenge angesammelt wird. Um dies herauszufinden wurde ein fokussierterWebcrawler entwickelt, der um eine Nutzerschnittstelle erweitert wurde, damit das Paradigma Aktives Lernen umgesetzt werden konnte und somit die Klassifizierung zusätzlich gesteuert werden kann. Anhand von durchgeführten Experimenten wurde das entwickelte System evaluiert. Dazu wurde eine Datenmenge an Webseiten durch einen Benutzer manuell klassifiziert und anschließend versucht, durch die Konfiguration von dem Threshold-Parameter, die identische Datenmenge zu erzielen. Eine Konfiguration ergab nahezu das angestrebte Ziel und zeigte somit, dass Aktives Lernen in Verbindung mit der Klassifizierung von Webseiten durchaus sinnvoll ist.

Volltext und
andere Links
PDF (765940 Bytes)
Zugriff auf studentische Arbeiten aufgrund vorherrschender Datenschutzbestimmungen nur innerhalb der Fakultät möglich
Abteilung(en)Universität Stuttgart, Institut für Maschinelle Sprachverarbeitung
BetreuerPadó, Prof. Sebastian, Klinger, Dr. Roman
Eingabedatum26. September 2018
   Publ. Informatik