Studienarbeit STUD-1553

Bibliograph.
Daten
Schwarz, Diemo: Einsatzmöglichkeiten Künstlicher Neuronaler Netze zur Klangerkennung.
Universität Stuttgart, Fakultät Informatik, Studienarbeit Nr. 1553 (1996).
81 Seiten, deutsch.
CR-Klassif.I.5.1 (Pattern Recognition Models)
I.2.6 (Artificial Intelligence Learning)
I.2.7 (Natural Language Processing)
KeywordsKlangerkennung; künstliche neuronale Netze; Musikinstrumente; Sprecheridentifikation
Kurzfassung

Die Einsatzmöglichkeiten künstlicher neuronaler Netze zur Klangerkennung wurden in dieser Studienarbeit anhand von zwei Teilaufgaben untersucht: Die Erkennung der Klasse von Musikinstrumenten (z.B. Streicher) und die Sprecheridentifikation am Klang der Stimme.

Dazu wurde ein Versuchssystem entwickelt, das die Aufbereitung und Vorverarbeitung der Audiodaten, die Erzeugung von Trainingsmustern für neuronale Netze, die Durchführung des Trainings mit dem Stuttgarter Neuronale Netze Simulator (SNNS) und die Auswertung der Ergebnisse weitgehend automatisiert.

Mit dem Versuchssystem wurden verschiedene Vorverarbeitungsarten (Fouriertransformation, logarithmiertes Leistungsspektrum, Melscale-Transformation, LPC-Transformation), Netztopologien (Feedforward-Netze, partiell rekurrente Elman-Netze, Time Delay Neural Networks) und Lernverfahren (Backpropagation, Resilient Propagation (RProp)) auf ihre Tauglichkeit zur Klanganalyse hin untersucht.

Bei der Instrumentenerkennung wurden bis zu 94.59% der Testdaten richtig erkannt. Bei der Sprecheridentifikation wurde sowohl bei der textabhängigen als auch bei der textunabhängigen Identifikation eine Erkennungsleistung von 100% erreicht bei einer Datenbasis von 15 Sprechern und Sprecherinnen. Die Sprecheridentifikation unter dem Einfluß von Störgeräuschen erreichte je nach deren Lautstärke 95.51% bzw. 98.44% richtig erkannte Sprecher.

Volltext und
andere Links
PostScript (2360934 Bytes)
Zugriff auf studentische Arbeiten aufgrund vorherrschender Datenschutzbestimmungen nur innerhalb der Fakultät möglich
Abteilung(en)Universität Stuttgart, Institut für Parallele und Verteilte Höchstleistungsrechner, Bildverstehen
Eingabedatum18. Oktober 1996
   Publ. Informatik