Ich dachte, ich beantworte diese Frage, da sie ein paar Stimmen hat, obwohl ich aufgrund von Christinas anderen Fragen nicht glaube, dass dies eine brauchbare Antwort für sie sein wird, da ein Sprachmodell mit 50.000 Wörtern mit ziemlicher Sicherheit keine akzeptable Wortfehlerrate oder Erkennungsgeschwindigkeit haben wird (oder höchstwahrscheinlich nicht einmal lange funktionieren wird) mit In-App-Erkennungssystemen für iOS, die dieses Format des Sprachmodells derzeit verwenden, aufgrund von Hardwarebeschränkungen. Ich dachte mir, dass es sich lohnt, dies zu dokumentieren, weil ich denke, dass es für andere hilfreich sein könnte, die eine Plattform verwenden, bei der die Speicherung eines Vokabulars dieser Größe eher eine praktikable Sache ist, und vielleicht wird es auch eine Möglichkeit für zukünftige Gerätemodelle sein.
Es gibt kein mir bekanntes webbasiertes Tool wie das Sphinx Knowledge Base Tool, das einen 50.000 Wörter umfassenden Klartextkorpus verarbeitet und ein ARPA-Sprachmodell liefert. Sie können jedoch ein bereits vollständiges DMP-Sprachmodell mit 64.000 Wörtern erhalten (das mit Sphinx auf der Kommandozeile oder in anderen Plattformimplementierungen auf dieselbe Weise wie eine ARPA-.lm-Datei verwendet werden kann), indem Sie die folgenden Schritte ausführen:
- Laden Sie dieses Sprachmodell von der CMU-Sprach-Website herunter:
http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/HUB4_trigram_lm.zip
In diesem Ordner befindet sich eine Datei namens language_model.arpaformat.DMP, die Ihr Sprachmodell sein wird.
- Laden Sie diese Datei von der CMU-Sprachwebsite herunter, die Ihr Aussprachewörterbuch werden wird:
https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/trunk/pocketsphinx/model/lm/en_US/cmu07a.dic
Konvertieren Sie den Inhalt von cmu07a.dic in Großbuchstaben.
Wenn Sie möchten, können Sie das Aussprachewörterbuch auch verkleinern, indem Sie alle Wörter daraus entfernen, die nicht im Korpus language_model.vocabulary enthalten sind (dies wäre ein Regex-Problem). Diese Dateien sind für die Verwendung mit einem der englischsprachigen Akustikmodelle von Sphinx vorgesehen.
Wenn der Wunsch, ein englisches Sprachmodell mit 50.000 Wörtern zu verwenden, von der Idee geleitet wird, eine Art allgemeine Spracherkennung mit großem Wortschatz durchzuführen, und nicht von der Notwendigkeit, sehr spezifische 50.000 Wörter zu verwenden (z. B. etwas Spezielles wie ein medizinisches Wörterbuch oder eine Kontaktliste mit 50.000 Einträgen), sollte dieser Ansatz diese Ergebnisse liefern, wenn die Hardware damit umgehen kann. Es wird wahrscheinlich einige Sphinx- oder Pocketsphinx-Einstellungen geben, die geändert werden müssen, um die Suche durch diese Größe des Modells zu optimieren.
0 Stimmen
Wollen Sie damit sagen, dass Sie eine Sammlung von englischen Wörtern benötigen?