- LiFePO4 Speicher Test         
Ergebnis 1 bis 10 von 25

Thema: Stimmen unterscheiden

Hybrid-Darstellung

Vorheriger Beitrag Vorheriger Beitrag   Nächster Beitrag Nächster Beitrag
  1. #1
    HaWe
    Gast
    sollte nur eine Erklärung zur Funktion eines NNs sein, wie man Sprach- und Stimmenerkennung zusammen mit einer FFT damit bearbeiten kann, es war nicht auf dein Marsyas und auch nicht auf deine Pocketsphinx zugeschnitten, mit denen arbeite ich ja nicht.

    Wie wav Daten gesampelt sind, musst du dir wohl noch mal anlesen - das kann ich dir hier nicht in der Kürze eines Posts erklären...
    - Ich glaube, da hast du was grundsätzlich komplett missverstanden: es ist Sampling wie mit einem ADC, das sind natürlich NICHT irgendwelche Frequenzwerte!

  2. #2
    Erfahrener Benutzer Begeisterter Techniker
    Registriert seit
    19.01.2016
    Ort
    Saarbrücken
    Beiträge
    397
    Ich erwähnte ja schon, dass ich mich bislang nie für Audiodaten interessiert habe. Wenn ich da schon den vollen Plan hätte müsste ich ja nicht fragen.

  3. #3
    HaWe
    Gast
    ei, du misst - ganz einfach ausgedrückt - dasselbe, was auch beim Lautsprecher rauskommt:
    ganz primitive (aber schnelle) analoge Spannungs-Änderungen, jeweilige Level gemessen in Volt (verstärkter Micro-Eingang), aber eben blitzschnell gemessen und gespeichert, nichts anderes ist Audio-Sampling.
    Geändert von HaWe (06.07.2016 um 15:29 Uhr)

  4. #4
    Erfahrener Benutzer Begeisterter Techniker
    Registriert seit
    19.01.2016
    Ort
    Saarbrücken
    Beiträge
    397
    Wir haben mal in der Schule ein primitives Mikro gebaut. Das war schon ganz lustig .

  5. #5
    Benutzer Stammmitglied
    Registriert seit
    19.05.2015
    Beiträge
    69
    Hallo hirnfrei,
    Du ich hab mal eine Frage wegen pocketsphinx an Dich.
    Hab das installiert und mir das deutsche Voxforge Sprachmodell herunter geladen. Läuft grundsätzlich auch.
    Worüber ich mich aber wundere ist, dass ich mit pocketsphinx_batch brauchbare Ergebnisse bekomme, wenn ich aber pocketsphinx_continuous mit der selben Sprachdatei benutze quasi nur Unbrauchbares heraus kommt.
    Könntest Du mal schildern, wie Du es benutzt und welche Ergebnisse Du bekommst? - Ähm, vielleicht müßten wir dafür einen neuen Thread machen?

    Gruß botty

  6. #6
    Erfahrener Benutzer Begeisterter Techniker
    Registriert seit
    19.01.2016
    Ort
    Saarbrücken
    Beiträge
    397
    Ein neuer Thread wäre sicher für andere Interessenten besser. Ich denke das dürften noch mehr interessant finden.

    Zu deinem Problem kann ich allerdings wenig sagen, da ich PocketSphinx bisher ausschliesslich als C++ Lib in meinem eigenen Programm mit meinen selbst aufgezeichneten Daten verwende. Da sind die Ergebnisse bisher aber ausreichend. Ich nehme zwar an, dass mit bearbeiteten Daten sich da noch besser arbeiten lassen wird, aber soweit bin ich noch nicht.

    Worte wie Hallo, Auto, Flugzeug usw. erkennt er sehr gut. Aus Frosch wird aber meistens Porsche. Auch Sätze wie "Wie geht es dir" erkennt er recht gut. Ich nehme aber mal an, in der Hauptsache muss die deutsche Datenbank da etwas besser gepflegt werden. Egal wo ich bisher gelesen habe heisst es immer das es auf deutsch ganz ok ist aber man Englisch benutzen soll. Da wird es sich in meinen Augen zu einfach gemacht . Aber da die Datenbank für die Sprache ja selbst angelegt und erweitert werden kann würde ich sagen, dem Missstand kann Abhilfe geschaffen werden.

  7. #7
    Benutzer Stammmitglied
    Registriert seit
    19.05.2015
    Beiträge
    69
    Okay, da fährst Du aufgrund deines Anwendungsfalls einen anderen Ansatz.
    Ich hatte die Idee einen ATV im MORSE Simulator über Stimme zu steuern, das halt auf meinem Lappi und da die Sounds des Sprachmodels welches ich verwende aus Aufnahmen besteht, die auf ähnlicher Hardware aufgenommen wurden, bot es sich an diese Daten zu verwenden und nicht erst ein eigenes Sprachmodell zu entwickeln.
    Wobei es noch bessere Daten für eine Alternative gibt aber da wag ich mich im Moment nicht dran.

    Hab überings das Problem lokalisiert. Das pocketsphinx_continuous Prog initialisiert sich in der Lautstärke beim ersten Durchlauf anders als das Batch-Prog. Das läßt sich im feat.param File anpassen, bzw. muß man den allerersten Frame halt zweimal durchlaufen lassen, dann verbessert sich dier Erkennungsrate erheblich. (Der Parameter nennt sich "-cmninit 40,3,-1").
    Frag mich bitte nicht nach der genauen Bedeutung - ich weiß nur das es jetzt erheblich besser ist

    Gruß botty

Ähnliche Themen

  1. Hackerspace Bremen braucht Stimmen
    Von Manf im Forum Neuigkeiten / Technik-News / Nachrichten / Aktuelles
    Antworten: 29
    Letzter Beitrag: 07.11.2012, 05:02
  2. RN-Contoller Defekt- Spannungen an Pins stimmen nicht - was machen?
    Von clownfish im Forum Schaltungen und Boards der Projektseite Mikrocontroller-Elektronik.de
    Antworten: 4
    Letzter Beitrag: 02.04.2012, 21:46
  3. Rot Grün unterscheiden!?
    Von DanielSan im Forum Sensoren / Sensorik
    Antworten: 8
    Letzter Beitrag: 12.08.2009, 13:44
  4. Stimmen meine AVRDUDE-Befehle?
    Von Zumlin im Forum AVR Hardwarethemen
    Antworten: 2
    Letzter Beitrag: 21.05.2007, 20:22
  5. Da kann doch was net stimmen *grummel* ;o(
    Von sick im Forum Basic-Programmierung (Bascom-Compiler)
    Antworten: 15
    Letzter Beitrag: 30.06.2005, 12:17

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  

Solar Speicher und Akkus Tests