Article in Proceedings INPROC-2017-18

BibliographyKiefer, Cornelia: Die Gratwanderung zwischen qualitativ hochwertigen und einfach zu erstellenden domänenspezifischen Textanalysen.
In: B. Mitschang et al. (ed.): GI-Edition Lecture Notes in Informatics Datenbanksysteme für Business, Technologie und Web (BTW 2017) Workshopband.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology.
pp. 99-104, german.
Bonn: Gesellschaft für Informatik, March 2017.
Article in Proceedings (Workshop Paper).
CR-SchemaH.3 (Information Storage and Retrieval)
KeywordsTextanalyse, Datenqualität, Analysequalität, überwachte maschinelle Lernverfahren, Textanalyse in den Geisteswissenschaften
Abstract

Die Textanalyse ist zu einem entscheidenden Werkzeug in verschiedenen Domänen wie den Geisteswissenschaften, Naturwissenschaften sowie auch in der Industrie geworden. Eine der größten Herausforderungen bei domänenspezifischen Textanalyseprojekten besteht darin, das Wissen aus den Bereichen IT und Text Mining mit dem Wissen aus der Domäne zusammenzubringen. Viele Textanalysetoolkits werden deshalb speziell für den Gebrauch durch Domänenexperten ohne oder mit wenig IT und Textanalysewissen vereinfacht. In diesem Beitrag diskutieren wir, inwiefern diese Vereinfachungen zu Qualitätsproblemen bei der Analyse von unsauberen Daten führen können.

Full text and
other links
Link zum Workshopband
Link zum Paper
Department(s)University of Stuttgart, Institute of Parallel and Distributed Systems, Applications of Parallel and Distributed Systems
Project(s)GSaME-NFG
Entry dateApril 3, 2017
   Publ. Department   Publ. Institute   Publ. Computer Science