6 Stimmen

Bibliothek zum Extrahieren von Wörtern (Sprache) aus einem Audiostream?

Ich habe einen Audio-Stream und möchte Wörter (Sprache) daraus extrahieren. Zum Beispiel hätte ich audio.wav würde ich 001.wav, 002.wav, 003.wav usw. erhalten, wobei jedes XXX.wav ein Wort ist.

Ich suche eine Bibliothek oder ein Programm, um dies zu tun - die Plattform spielt keine Rolle, aber ich bevorzuge eine Open-Source-Lösung.

Vielen Dank im Voraus für die Hilfe.

2voto

mattbh Punkte 5120

Nuance, das Unternehmen, das Dragon Naturally Speaking herstellt, hat eine Reihe von Software Development Kits.

Das Audio Mining Kit scheint Ihren Anforderungen zu entsprechen:

Dragon NaturallySpeaking SDK AudioMining ist ein sprecherunabhängiges Spracherkennungs-Toolkit, das die Indizierung von 100 % der Sprachinformationen innerhalb von Audio-Dateien ermöglicht. Die Technologie verwendet hochpräzise Spracherkennung, um Audio-Dateien in XML-Text mit Zeitstempel zu konvertieren. Dies kann mit Standard-Textsuchprodukten integriert werden, um einen schnellen Zugriff auf spezifische Audioinhalte zu ermöglichen.

Das Übertragen von Sprache zu Sprache + Metadaten ist mit Abstand der schwierigste Teil, um es richtig zu machen. Wenn Sie erst einmal über die Sprache + Metadaten verfügen, ist das Extrahieren der Wörter als einzelne Audiodateien viel einfacher.

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X