Das System nimmt das Sample nur _einmal_ auf, oder?
Das kann natürlich dann nicht soo toll funktionieren, ne richtige Spracherkennung "lernt" wirklich. Da spricht man die Kommandos zumindest mehrmals, einfach deshalb, weil es kaum jemand schaffen wird, das selbe Wort mehrmals immer wieder ausreichend gleich auszusprechen.
Wenn ich nur ein einziges Sample hab, muss ich das so lange "grob rechnen" bis es so einigermassen funktioniert, einerseits braucht man ne gewisse Unschärfe (sonst wird nur reagiert, wenn das Kommando ganz genau so klingt wie in der Vorlage), andererseits darf es nicht zu unscharf werden (dann wird auf alles reagiert).
Eventuell kann man da aber was machen.
Kann man Samples auch anders einspielen?
Dann könnte man Audacity als Trainer benutzen: das gewünschte Kommando mehrmals aufnehmen, und die Samples übereinander legen. Kann man evtl. noch weiter bearbeiten um typische Merkmale der Lautfolge etwas raus zu arbeiten.
Das dann einspielen.
Es _könnte_ die Erkennung deutlich verbessern, denn ein 25$-System macht ganz sicher nix anderes als grob die Wellenform zu vergleichen.
Je signifikanter die aber ist, umso einfacher gelingt das, schätze ich.
Wäre nen Versuch wert: du hast ja auch ein Sprachmodul. Das sollte in der Lage sein, ein Kommando jedes Mal _exakt_ zu sprechen. Lern damit mal das Spracherkennungsmodul an und schau, wie da die Trefferquote ist. Sollte eigentlich bei annähernd 100% liegen-wenn nich, wäre wohl nen besseres Mikrofon angesagt.
Lesezeichen