Student Thesis STUD-1553

BibliographySchwarz, Diemo: Einsatzmöglichkeiten Künstlicher Neuronaler Netze zur Klangerkennung.
University of Stuttgart, Faculty of Computer Science, Student Thesis No. 1553 (1996).
81 pages, german.
CR-SchemaI.5.1 (Pattern Recognition Models)
I.2.6 (Artificial Intelligence Learning)
I.2.7 (Natural Language Processing)
KeywordsKlangerkennung; künstliche neuronale Netze; Musikinstrumente; Sprecheridentifikation
Abstract

Die Einsatzmöglichkeiten künstlicher neuronaler Netze zur Klangerkennung wurden in dieser Studienarbeit anhand von zwei Teilaufgaben untersucht: Die Erkennung der Klasse von Musikinstrumenten (z.B. Streicher) und die Sprecheridentifikation am Klang der Stimme.

Dazu wurde ein Versuchssystem entwickelt, das die Aufbereitung und Vorverarbeitung der Audiodaten, die Erzeugung von Trainingsmustern für neuronale Netze, die Durchführung des Trainings mit dem Stuttgarter Neuronale Netze Simulator (SNNS) und die Auswertung der Ergebnisse weitgehend automatisiert.

Mit dem Versuchssystem wurden verschiedene Vorverarbeitungsarten (Fouriertransformation, logarithmiertes Leistungsspektrum, Melscale-Transformation, LPC-Transformation), Netztopologien (Feedforward-Netze, partiell rekurrente Elman-Netze, Time Delay Neural Networks) und Lernverfahren (Backpropagation, Resilient Propagation (RProp)) auf ihre Tauglichkeit zur Klanganalyse hin untersucht.

Bei der Instrumentenerkennung wurden bis zu 94.59% der Testdaten richtig erkannt. Bei der Sprecheridentifikation wurde sowohl bei der textabhängigen als auch bei der textunabhängigen Identifikation eine Erkennungsleistung von 100% erreicht bei einer Datenbasis von 15 Sprechern und Sprecherinnen. Die Sprecheridentifikation unter dem Einfluß von Störgeräuschen erreichte je nach deren Lautstärke 95.51% bzw. 98.44% richtig erkannte Sprecher.

Full text and
other links
PostScript (2360934 Bytes)
Access to students' publications restricted to the faculty due to current privacy regulations
Department(s)University of Stuttgart, Institute of Parallel and Distributed High-Performance Systems, Image Understanding
Entry dateOctober 18, 1996
   Publ. Computer Science