Artikel in Tagungsband INPROC-2017-18

Bibliograph.
Daten
Kiefer, Cornelia: Die Gratwanderung zwischen qualitativ hochwertigen und einfach zu erstellenden domänenspezifischen Textanalysen.
In: B. Mitschang et al. (Hrsg): GI-Edition Lecture Notes in Informatics Datenbanksysteme für Business, Technologie und Web (BTW 2017) Workshopband.
Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik.
S. 99-104, deutsch.
Bonn: Gesellschaft für Informatik, März 2017.
Artikel in Tagungsband (Workshop-Beitrag).
CR-Klassif.H.3 (Information Storage and Retrieval)
KeywordsTextanalyse, Datenqualität, Analysequalität, überwachte maschinelle Lernverfahren, Textanalyse in den Geisteswissenschaften
Kurzfassung

Die Textanalyse ist zu einem entscheidenden Werkzeug in verschiedenen Domänen wie den Geisteswissenschaften, Naturwissenschaften sowie auch in der Industrie geworden. Eine der größten Herausforderungen bei domänenspezifischen Textanalyseprojekten besteht darin, das Wissen aus den Bereichen IT und Text Mining mit dem Wissen aus der Domäne zusammenzubringen. Viele Textanalysetoolkits werden deshalb speziell für den Gebrauch durch Domänenexperten ohne oder mit wenig IT und Textanalysewissen vereinfacht. In diesem Beitrag diskutieren wir, inwiefern diese Vereinfachungen zu Qualitätsproblemen bei der Analyse von unsauberen Daten führen können.

Volltext und
andere Links
Link zum Workshopband
Link zum Paper
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Systeme, Anwendersoftware
Projekt(e)GSaME-NFG
Eingabedatum3. April 2017
   Publ. Abteilung   Publ. Institut   Publ. Informatik