Was ist der aktuelle Stand der Technik bei der Suche nach Geräuschen in der Praxis? Ich bin derzeit aus der Ferne an der Planung einer Webanwendung beteiligt, die unter anderem eine Datenbank mit aufgenommenen kurzen Audioclips (höchstens 3-5 Sekunden, Namen von Personen) enthalten und zugänglich machen soll. Es wurde die Frage aufgeworfen, ob es möglich wäre, eine Suche auf der Grundlage der Spracheingabe des Benutzers zu implementieren. Mein Bauchgefühl sagt mir, dass es eine unmögliche Aufgabe ist, sowohl vom rechnerischen als auch vom algorithmischen Standpunkt aus, besonders in einer Webanwendung (und außerdem wäre es keine Kernfunktion der Anwendung). Mir ist klar, dass es vielleicht eine Reihe von akademischen Projekten gibt und dass es ein gutes Forschungsthema wäre, aber es ist nichts, was in einer mittelgroßen Webanwendung als zusätzliche Funktion implementiert werden könnte. Um meine Behauptungen zu untermauern, habe ich eine halbe Stunde lang gesucht, um nichts Offensichtliches zu übersehen, aber ich konnte wirklich keine guten Quellen finden.
Ich weiß, dass es nicht sehr verantwortungsbewusst ist, eine Frage auf SO zu stellen, ohne mehr Zeit für eigene Nachforschungen aufzuwenden, aber ich habe festgestellt, dass es viel effektiver, präziser und schneller ist, eine Frage auf SO zu stellen, als einfach wahllos zu googeln.