Sinnvollerweise legt man sich erstmal eine Art Wörterbuch an, welches die Mimik zu einzelnen Buchstaben und Silben verbindet (Buchstaben zu Anfang, ein Sinnvolles Silbenwörterbuch findet man am besten im Zusammenhang mit einer Sprachsynthese Software, welche i.d.R. auf Silbenwörterbüchern aufsetzt)
Was du für Sprachausgabe brauchst ist eine Sprachsynthese die auch deutsch sinnvollerweise beherrscht und wenn möglich Zugriff auf die Silbenwörterbücher und (live) Satzkonjugation zulässt, damit du einfach für die Satzelemente die passende Mimik darstellen kannst.
Leider ist das nur Jahre altes (Hoch-)Schulwissen und cih selber habe nur einfache Sprachsynthese mit Vocaloid und Microsoft Narrator benutzt, wo es keine API gibt XD
Lesezeichen