Diploma Thesis DIP-1715

BibliographyBreitenbücher, Mark: Datenbasierte Methoden der Sprachsynthese.
University of Stuttgart, Faculty of Computer Science, Diploma Thesis No. 1715 (1999).
81 pages, german.
CR-SchemaI.2.7 (Natural Language Processing)
H.3.2 (Information Storage)
G.3 (Probability and Statistics)
KeywordsSprachsynthese; Festival; TTS-Synthese; datenbasierte Verfahren; Uni Selection; Lautdauer
Abstract

Diese Arbeit beschäftigt sich mit der Anwendung von datenbasierten Methoden in der Sprachsynthese. Im Gegensatz zu regelbasierten Verfahren, die Theorien aus der Linguisik bzw. Phonetik implementieren, werden die Modelle bei datenbasierten Methoden, wie der Name schon sagt, auf natürlichsprachlichen Daten tainiert. Zu diesem Zweck müssen die Daten entsprechend aufbereitet und für die maschinelle Verarbeitung zur Verfügung gestellt werden.

Im ersten Teil dieser Arbeit wird auf die Prinzipien der Datenerfassung, Datenaufbereitung und Datenhaltung sowie der Konsistenzprüfung eingegangen. Es wird gezeigt, wie man zu einem Sprachkorpus kommt, das als Grundlage für die Erstellung datenbasierter Modelle benötigt wird. Insbesondere wird auch auf die unterschiedlichen Dateiformate sowie deren Möglichkeiten und Grenzen eingegangen.

Der zweite Teil beschäftigt sich mit dem Erstellen datenbasierter Modelle. Und zwar werden ein Lautdauermodell zur Bestimmung der Lautdauer auf Segmentebene sowie ein selektionsbasiertes Syntheseverfahren, welches eine größere Sprachdatenbank verwendet, um daraus ein Sprachsignal zu erzeugen, trainiert.

Full text and
other links
PostScript (4946970 Bytes)
Access to students' publications restricted to the faculty due to current privacy regulations
Entry dateMarch 1, 1999
   Publ. Computer Science