Ich muss einige kurze MP3s automatisch als Teil eines Proof of Concept, an dem ich arbeite, transkribieren. Ich suche derzeit nach Cloud-Lösungen oder Web-API-Diensten, um die MP3 als einfache HTTP-Anfrage zu senden und eine Transkription zurück zu erhalten.Speech Recognition API
Die einzige freie/Open-Source-Lösung, die ich here gefunden habe, aber die Demos scheinen nicht zu funktionieren (zumindest nicht auf den Dateien, die ich transkribieren muss). Ich habe einige Enterprise-Lösungen für Call-Center gefunden, aber bisher kann ich nichts einfach in ein Projekt integrieren.
Gibt es webbasierte Spracherkennungsdienste? Eine, die in der Lage ist, kleines Rauschen herauszufiltern, wäre ein Pluspunkt.
Siehe auch diese Frage: http://stackoverflow.com/questions/3113864/server-side-voice-recognition –