Bachelor Thesis BCLR-2022-108

BibliographyCakir, Mehmet: Evaluation von Acoular als Beamforming Software mit dem AMI Korpus.
University of Stuttgart, Faculty of Computer Science, Electrical Engineering, and Information Technology, Bachelor Thesis No. 108 (2022).
68 pages, german.
Abstract

Evaluation von Acoular als Beamforming Software mit dem AMI Korpus

Das Ziel dieser Ausarbeitung besteht darin, die quelloffene Beamforming Software Acoular zu evaluieren. Dazu wird auf die folgende Frage eingegangen: Eignet sich Acoular zur Fokussierung von einzelnen Sprecherstimmen?

Um diese Frage zu beantworten, wurde der Versuch unternommen, einzelne Sprecherstimmen mit Hilfe von Acoular aus bestehenden Meetingaufnahmen zu fokussieren. Hierfür wurde eine Applikation implementiert, welche mit Hilfe von Beamforming-Algorithmen von Acoular die Positionen der einzelnen Sprecher aus Audioabschnitten bestimmte. Das akustische Signal wurde anschließend an den ermittelten Positionen verstärkt und sollte somit eine Fokussierung der Stimme des Sprechers an der ermittelten Position herbeiführen. Die Idee zur Verstärkung des Signals wurde in dieser Ausarbeitung mit einem klassischen Delay-and-Sum Beamforming von Acoular umgesetzt. Bei einem klassischen Delay-and-Sum Beamforming werden zeitlich verschobene akustische Signale ihren Phasenunterschieden entsprechend verzögert und anschließend aufsummiert, um somit gezielt die Signale zu verstärken. Der beschriebene Prozess wurde in der selbst implementierten Applikation umgesetzt. Mit Hilfe dieser Applikation wurden echte Audiodaten ausgewertet, um einzelne Sprecher aus zuvor bestimmten Audioabschnitten zu fokussieren.

Die Ergebnisse der Auswertung zeigen, dass in den ausgewerteten Audioabschnitten die zu fokussierenden Sprecher lauter und klarer zu hören sind als die Nebensprecher, welche allerdings trotz der Fokussierung weiterhin deutlich akustisch hörbar sind. Anhand dieser Ergebnisse lässt sich feststellen, dass die Fokussierung von einzelnen Sprecherstimmen mit Hilfe der Beamforming-Algorithmen von Acoular grundsätzlich möglich ist. Zusammenfassend kann folglich konstatiert werden, dass Acoular grundsätzlich zur Fokussierung einzelner Sprecherstimmen geeignet ist.

Department(s)University of Stuttgart, Institute for Natural Language Processing
Superviser(s)Wokurek, Dr. Wolfgang
Entry dateOctober 24, 2023
New Report   New Article   New Monograph   Computer Science