Ich habe Pocketsphinx0.7 auf einer VM unter Debian Squeeze installiert. Dies funktionierte gut und ich kann versuchen, Sprache aus Dateien zu erkennen.Nachdem dies habe ich einige Python-Skripte, die eine Reihe von Dateien, die ich bekam und dann die Wortfehlerrate zu erkennen gebaut. Diese verwenden gstreamer, wie beschrieben in diese Anleitung .
Bislang verwende ich das ursprüngliche hmm, das im pocketsphinx-Tarball enthalten war, ein Wörterbuch, das einfach die Wörter aus meinen Testdaten enthält, und ein optimiertes Sprachmodell, das ich von meinem Professor erhalten habe. Dies sollte funktionieren, da es auch in einem Produktionssystem läuft. Mein Problem ist nun, dass die Erkennungsleistung immer noch furchtbar ist. Ich habe eine Wortfehlerrate (WER) von etwa 85 %.
Was ich wissen möchte, ist, wie ich den WER verbessern kann. Was für Schritte kann ich unternehmen?
Eine andere Sache, die passiert und sich wahrscheinlich auf die Leistung auswirkt, ist, dass pocketsphinx mir mitteilt, dass es keine Berechtigung hat, auf das hmm zuzugreifen, obwohl ich das hmm für das Lesen, Schreiben und Ausführen für jeden zugänglich gemacht habe.
Hat jemand eine Idee, woher das kommen könnte? Ich bin für jede Art von Hilfe dankbar. Wenn Sie weitere Informationen benötigen, lassen Sie es mich bitte wissen.
EDITAR:
Ich habe ein kleines Testset erstellt und pocketsphinx ausgeführt. Hier finden Sie die Dateien und die Ergebnisse. Ich durfte einige Beispiele aus dem ursprünglichen Testsatz geben. Sie finden Sie hier .
Dies sind die schlimmsten Beispiele. Kurze Äußerungen von 1-2 Wörtern funktionieren gut. Es tut mir leid, dass ich bisher noch keine große Testmenge erstellen konnte, meine Zeit ist sehr begrenzt.