5 Stimmen

Pocketsphinx richtig konfigurieren

Ich habe Pocketsphinx0.7 auf einer VM unter Debian Squeeze installiert. Dies funktionierte gut und ich kann versuchen, Sprache aus Dateien zu erkennen.Nachdem dies habe ich einige Python-Skripte, die eine Reihe von Dateien, die ich bekam und dann die Wortfehlerrate zu erkennen gebaut. Diese verwenden gstreamer, wie beschrieben in diese Anleitung .

Bislang verwende ich das ursprüngliche hmm, das im pocketsphinx-Tarball enthalten war, ein Wörterbuch, das einfach die Wörter aus meinen Testdaten enthält, und ein optimiertes Sprachmodell, das ich von meinem Professor erhalten habe. Dies sollte funktionieren, da es auch in einem Produktionssystem läuft. Mein Problem ist nun, dass die Erkennungsleistung immer noch furchtbar ist. Ich habe eine Wortfehlerrate (WER) von etwa 85 %.

Was ich wissen möchte, ist, wie ich den WER verbessern kann. Was für Schritte kann ich unternehmen?

Eine andere Sache, die passiert und sich wahrscheinlich auf die Leistung auswirkt, ist, dass pocketsphinx mir mitteilt, dass es keine Berechtigung hat, auf das hmm zuzugreifen, obwohl ich das hmm für das Lesen, Schreiben und Ausführen für jeden zugänglich gemacht habe.

Hat jemand eine Idee, woher das kommen könnte? Ich bin für jede Art von Hilfe dankbar. Wenn Sie weitere Informationen benötigen, lassen Sie es mich bitte wissen.


EDITAR:

Ich habe ein kleines Testset erstellt und pocketsphinx ausgeführt. Hier finden Sie die Dateien und die Ergebnisse. Ich durfte einige Beispiele aus dem ursprünglichen Testsatz geben. Sie finden Sie hier .
Dies sind die schlimmsten Beispiele. Kurze Äußerungen von 1-2 Wörtern funktionieren gut. Es tut mir leid, dass ich bisher noch keine große Testmenge erstellen konnte, meine Zeit ist sehr begrenzt.

2voto

Nikolay Shmyrev Punkte 24427

Was ich wissen möchte, ist, wie ich den WER verbessern kann. Was für Schritte kann ich unternehmen?

Dieses Problem wird in den Pocketsphinx FAQ beschrieben:

http://cmusphinx.sourceforge.net/wiki/faq#qwhy_my_accuracy_is_poor

Der erste Schritt besteht darin, eine Datenbank mit Prüfmustern zu erstellen

Wenn Sie Hilfe benötigen, um die Genauigkeit zu verbessern, müssen Sie die Datenbank und die Ergebnisse, die Sie suchen, sowie die tatsächlichen Ergebnisse mitteilen. Sie können dies hier oder im Sourceforge-Forum tun. Sie müssen alle Dateien in ein Archiv packen und irgendwo hochladen. Dann können Sie hier einen Link angeben.

Für weitere Informationen siehe

http://cmusphinx.sourceforge.net/wiki/communicate

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X