Ich habe mich immer gefragt, wie viele verschiedene Suchtechniken es gibt, für die Suche nach Text, für die Suche nach Bildern und sogar für Videos.
Ich bin jedoch noch nie auf eine Lösung gestoßen, die nach Inhalten in Audiodateien sucht.
Zum Beispiel: Nehmen wir an, ich habe etwa 200 Podcasts in Form von mp3-, wav- und ogg-Dateien auf meinen PC heruntergeladen. Sie haben alle allgemeine Namen wie podcast1.mp3, podcast2.mp3 usw. Es ist also nicht möglich, den Inhalt zu erkennen, ohne sie tatsächlich anzuhören. Nehmen wir an, ich möchte herausfinden, welche Podcasts über "Spieleprogrammierung" sprechen. Ich möchte, dass die Ergebnisse wie folgt angezeigt werden:
- Podcast1.mp3 - 3 Ergebnis(se) bei Zeitindex(en) - 0:16:21, 0:43:45, 1:12:31
- Podcast21.ogg - 1 Ergebnis(se) bei Zeitindex(en) - 0:12:01
Daher meine Fragen:
- Wie könnte man dieses Problem angehen?
- Gibt es geeignete Algorithmen, die für diese Aufgabe entwickelt wurden?
Eine Idee, die mir in den Sinn kam, war, dass man eine "Sprache-zu-Text"-Software verwenden könnte, um Transkripte zusammen mit Zeitindizes für jede der Audiodateien zu erhalten und dann das Transkript zu analysieren, um die Ausgabe zu erhalten.
Ich habe dies als eines meiner Hobbyprojekte in Betracht gezogen. Danke!