2017-06-15 14 views
-1

Ich versuche, eine Windows-Anwendung in C# Windows-Anwendung zu erstellen, die IBM Watson-Dienst verwenden sollte, um eine Konvertierung von Sprache in Text durchzuführen.C# - Watson - Rede zu Text API

Wie können wir implementieren IBM Watson Speech to Text-API-Dienst https://stream.watsonplatform.net/speech-to-text/api, die Benutzer Stimme hören und den ausgegebenen Text schreiben sollte.

Ich habe viele Artikel gesucht und in all diesen Beispielen wurde .wav (Audio) -Datei als Eingabe übergeben und der Ausgabetext geschrieben.

Ich versuche, diese Sprache zu Text mehr Echtzeit statt eine bestehende oder gespeicherte Audio (. WAV) -Datei übergeben.

Die gleiche Funktionalität kann mit Microsoft.Speech mit Code wie recognizer.SetInputToDefaultAudioDevice() durchgeführt werden. Hier ist der Nachteil, wir müssen den DictationGrammer füttern. Damit die Anwendung die Sprache erkennen und in Text konvertieren kann.

Ist es möglich, eine ähnliche Aufgabe über den Watson API Service zu erledigen?

Antwort

2

Das IBM Watson SDK für .NET hat die Unterstützung für WebSockets, die Ihre Anforderung mehr in Echtzeit zu transkribieren gegen eine Audiodatei hochladen erfüllen würde:

WebSockets enthält einen einzigen Anruf, mit der eine ständige Verbindung herstellt Dienst über das WebSocket-Protokoll.

Das SDK kann here und die spezifischen Details für Sprache in Text innerhalb des SDK gefunden werden kann here finden.