22 Stimmen

Wie kann ich Inhalte in Audiodateien/Streams suchen?

Ich habe mich immer gefragt, wie viele verschiedene Suchtechniken es gibt, für die Suche nach Text, für die Suche nach Bildern und sogar für Videos.

Ich bin jedoch noch nie auf eine Lösung gestoßen, die nach Inhalten in Audiodateien sucht.

Zum Beispiel: Nehmen wir an, ich habe etwa 200 Podcasts in Form von mp3-, wav- und ogg-Dateien auf meinen PC heruntergeladen. Sie haben alle allgemeine Namen wie podcast1.mp3, podcast2.mp3 usw. Es ist also nicht möglich, den Inhalt zu erkennen, ohne sie tatsächlich anzuhören. Nehmen wir an, ich möchte herausfinden, welche Podcasts über "Spieleprogrammierung" sprechen. Ich möchte, dass die Ergebnisse wie folgt angezeigt werden:

  • Podcast1.mp3 - 3 Ergebnis(se) bei Zeitindex(en) - 0:16:21, 0:43:45, 1:12:31
  • Podcast21.ogg - 1 Ergebnis(se) bei Zeitindex(en) - 0:12:01

Daher meine Fragen:

  • Wie könnte man dieses Problem angehen?
  • Gibt es geeignete Algorithmen, die für diese Aufgabe entwickelt wurden?

Eine Idee, die mir in den Sinn kam, war, dass man eine "Sprache-zu-Text"-Software verwenden könnte, um Transkripte zusammen mit Zeitindizes für jede der Audiodateien zu erhalten und dann das Transkript zu analysieren, um die Ausgabe zu erhalten.

Ich habe dies als eines meiner Hobbyprojekte in Betracht gezogen. Danke!

9voto

Anders Sandvig Punkte 20204

Wenn Sie in einem Audiostrom nach Text suchen wollen (d. h. nach dem, was gesagt wird), müssten Sie ihn mit einer Art Spracherkennungsalgorithmus verarbeiten und den Text als Metadaten zu den Dateien speichern. Bei Videos könnte man auch eine Texterkennung für Text innerhalb des Videos durchführen. Evernote kann dies bereits für Text in Bilddateien, hat aber meines Wissens keine Unterstützung für Audio.

Etwas Ähnliches ist möglich, wenn man mit Audio nach Audio sucht. Ich kenne die Details dieser Algorithmen nicht, aber ich vermute, dass sie eine Art von Frequenzanalyse beinhalten. Shazam nutzt diese Art von Technologie, um Lieder anhand von Audioclips zu identifizieren.

Hier sind einige Wikipedia-Artikel, die nützlich sein könnten:

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X