Okay, da fährst Du aufgrund deines Anwendungsfalls einen anderen Ansatz.
Ich hatte die Idee einen ATV im MORSE Simulator über Stimme zu steuern, das halt auf meinem Lappi und da die Sounds des Sprachmodels welches ich verwende aus Aufnahmen besteht, die auf ähnlicher Hardware aufgenommen wurden, bot es sich an diese Daten zu verwenden und nicht erst ein eigenes Sprachmodell zu entwickeln.
Wobei es noch bessere Daten für eine Alternative gibt aber da wag ich mich im Moment nicht dran.
Hab überings das Problem lokalisiert. Das pocketsphinx_continuous Prog initialisiert sich in der Lautstärke beim ersten Durchlauf anders als das Batch-Prog. Das läßt sich im feat.param File anpassen, bzw. muß man den allerersten Frame halt zweimal durchlaufen lassen, dann verbessert sich dier Erkennungsrate erheblich. (Der Parameter nennt sich "-cmninit 40,3,-1").
Frag mich bitte nicht nach der genauen Bedeutung - ich weiß nur das es jetzt erheblich besser ist
Gruß botty
Lesezeichen