ich eine asynchrone Anforderung an Google Cloud Speech API bin durchführen, und ich weiß nicht, wie das Ergebnis der Operation zu erhalten:Google Speech Recognition API Ergebnis ist leer
Anfrage POST:https://speech.googleapis.com/v1beta1/speech:asyncrecognize
Körper:
{
"config":{
"languageCode" : "pt-BR",
"encoding" : "LINEAR16",
"sampleRate" : 16000
},
"audio":{
"uri":"gs://bucket/audio.flac"
}
}
Welche zurück:
{ "name": "469432517" }
Also, ich eine POST: https://speech.googleapis.com/v1beta1/operations/469432517
Welche zurück:
{
"name": "469432517",
"metadata": {
"@type": "type.googleapis.com/google.cloud.speech.v1beta1.AsyncRecognizeMetadata",
"progressPercent": 100,
"startTime": "2016-08-11T21:18:29.985053Z",
"lastUpdateTime": "2016-08-11T21:18:31.888412Z"
},
"done": true,
"response": {
"@type": "type.googleapis.com/google.cloud.speech.v1beta1.AsyncRecognizeResponse"
}
}
Ich brauche das Ergebnis der Operation zu erhalten: den transkribierten Text.
Wie kann ich das tun?
ich war Senden an asynchrone Operation ein FLAC mit den gleichen Eigenschaften als Sync. Jetzt habe ich die WAV-Datei in RAW konvertiert und funktioniert gut! Siehe die sox-Konvertierung: sox audio.wav -c 1 -r 16000 -b 16 audio.raw – Bruno