Not logged in.

Contribution Details

Type Master's Thesis
Scope Discipline-based scholarship
Title Determing the Optimal Number of Vowel Clusters in a Wide Range of Fundamental Frequencies using Unsupervised Learning
Organization Unit
Authors
  • Simon Frischknecht
Supervisors
  • Martin Volk
  • Volker Dellwo
  • Thayabaran Kathiresan
Language
  • English
Institution University of Zurich
Faculty Faculty of Business, Economics and Informatics
Date 2021
Abstract Text Vowel detection is an important field of speech recognition. In this thesis, we focus on clustering, an unsupervised machine learning technique, and evaluate how these methods recognize vowel groups for different fundamental frequencies (fo). We analyze the algorithms from a mathematical and computational point of view. The implementation results for different fo levels up to 1 kHz are described and visualized. We use several internal and external cluster validation criterions to evaluate the outcomes of the clustering, because they are often needed to find the optimal cluster values. We show that certain external validation methods can recover the true number of vowel groups, independent of the fo level, while internal validation methods struggle finding the correct number of groups.
Zusammenfassung Die Erkennung von Vokalen ist ein wichtiges Gebiet in der Spracherkennung. In dieser Arbeit betrachten wir Clustering, eine unüberwachte Methode des maschinellen Lernens. Wir evaluieren, wie diese Methoden Vokalgruppen für unterschiedliche Grundfrequenzen erkennen. Wir analysieren diese Algorithmen von einer mathematischen und rechnerischen Perspektive. Die Resultate für verschiedene Grundfrequenzen bis zu einem kHz werden erläutert und visualisiert. Wir verwenden verschiedene interne und externe Cluster Validierungskriterien, um die Resultate zu evaluieren, da diese häufig benötigt werden, um eine optimale Clusteranzahl zu finden. Wir zeigen, dass gewisse externe Validierungskriterien die wahre Anzahl von Vokalgruppen erkennen können, unabhängig von der Grundfrequenz. Interne Validierungskriterien haben hingegen Schwierigkeiten, die korrekte Anzahl von Vokalgruppen zu finden.
PDF File Download
Export BibTeX