Ich spielte mit der Rede-zu-Text-Demo von IBM Watson unter https://speech-to-text-demo.mybluemix.net/. Ich habe eine Audiodatei mit 2 Lautsprechern hochgeladen. Watson gab transkribierten Text ohne Sprecherkennung zurück. Es gibt keinen Hinweis darauf, welches Wort von welchem Sprecher gesprochen wurde. Unterstützt IBM Watson "Speaker Diarization"/"Speaker Recognition"?Unterstützt IBM Watson "Speaker Diarization"/"Speaker Recognition"?
2
A
Antwort
4
Wir arbeiten an Speaker Diarization. Noch keine ETA, aber hoffentlich wird es bald sein. Wie es heute ist, behandelt der Dienst das Audio, als wäre es derselbe Lautsprecher
1
Nein, tut es leider nicht.
Verwandte Themen
- 1. Projekt Oxford Speaker Recognition- Invalid Audio Format
- 2. Watson Visual Recognition Fehlercode 400
- 3. invalid-API-Schlüssel in Watson Visual Recognition API
- 4. IBM Watson mit Alchemie API
- 5. bekommen Json von IBM Watson
- 6. Welche Regeln gelten für Klassennamen im IBM Watson Visual Recognition Service?
- 7. IBM Watson Speech to Text und webm
- 8. IBM Watson Tone Analyzer API mit Swift
- 9. docker push error für ibm bluemix watson
- 10. Verwendung der Beziehungsextraktion mit IBM Watson?
- 11. train.py Fehler in ibm watson abrufen und Rang Service Setup
- 12. Synonyme funktionieren nicht ibm watson abrufen und Rang
- 13. Mit dem Roboter Pepper mit Watson von IBM
- 14. IBM Watson IoT-Plattform: Fehlende Funktion im Geräteverwaltungs-Framework?
- 15. So erstellen Sie Multiple-Choice-Antwort IBM Watson Dialog?
- 16. IBM Watson Devices HTTP API gibt 403 kontinuierlich
- 17. IBM Watson-Sprach-zu-Text-Audiokonvertierung in der Node.js-Webanwendung
- 18. IBM Watson Dialog API: detaillierte <entityRules> Dokumentation
- 19. IBM Watson IoT-Plattform: historische Daten sind leer
- 20. Fehler beim json von IBM Watson Parsen Python mit
- 21. IBM Watson TextToSpeech Beispiele nicht akzeptieren AUDIO_WAV als content
- 22. Kann ich IBM Watson-Dienste ohne Bluemix verwenden?
- 23. "Bilder klassifizieren" mit Watson-Bilderkennung
- 24. Wie klassifiziere ich Bild mit IBM Visual Recognition API Version 3
- 25. Versucht, Speaker HTML5 Audioplayer zu installieren
- 26. Audio Processing - Tone Recognition
- 27. Speech Recognition API
- 28. Google Speech Recognition API
- 29. Watson Sprachidentifikation
- 30. Pause Intervall für das endgültige Ergebnis IBM Watson Speech to Text