Steht auf meiner (ewigen) Wunschliste ;>) oder :-/
Mittlerweile gibt es da einiges an Open Source:

https://github.com/openai/whisper

Wenn man etwas Python kann, sollte das "theoretisch" einfach sein

Es gibt auch was für den RasPi, aber das wird scheinbar schnell kostenpflichtig:

https://picovoice.ai/blog/speech-rec...n-raspberrypi/