-
-
Erfahrener Benutzer
Roboter Genie
Also vorweg: ich habe keine Ahnung von dem Thema, ich phantasiere nur mal kurz
. Ich könnte mir vorstellen, dass du mit einer Fourier-Analyse als erstem Schritt ganz gut bedient bist. Ich vermute, dass du auch verschiedene Sätze, die von einer Person gesprochen worden sind, dieser Person zuordnen können möchtest. Insofern interessiert dich die Zeitdömane im Detail eher nicht, sondern die spektrale Zusammensetzung der jeweiligen Audiospur. Das Spektrum könnte so eine Art "Fingerabdruck" für eine Person bilden. Über die gewonnenen Spektren müsste man jetzt Statisktik machen und sie irgendwie Clustern bzw. Klassifizieren - im Grunde irgendeine Art Pattern-Matching. Vielleicht funktioniert das sogar mit einem einfachen Perzeptron.
Berechtigungen
- Neue Themen erstellen: Nein
- Themen beantworten: Nein
- Anhänge hochladen: Nein
- Beiträge bearbeiten: Nein
-
Foren-Regeln
Lesezeichen