3

Die Länge meiner .wav-Datei beträgt nur 4 Sekunden. Auch nach mehreren Wiederholungen und Ausführen in der Cloud bekomme ich ständig folgende Fehlermeldung408 Zeitüberschreitung der Anfrage Microsoft Speech to Text

* upload completely sent off: 12 out of 12 bytes 
    < HTTP/1.1 408 Request timed out (> 14000 ms) 
    < Transfer-Encoding: chunked 
    < Content-Type: text/plain 
    < Server: Microsoft-IIS/8.5 
    < X-MSEdge-Ref: 

Hat jemand dieses Problem konfrontiert? Das ist meine Anfrage

`curl -v "https://speech.platform.bing.com/recognize? 
    scenarios=catsearch&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&locale=en- 
    US&device.os=wp7&version=3.0&format=json&requestid=1d4b6030-9099-12e0-91e4- 
    0800200c9a67&instanceid=1d4b6030-9099-12e0-91e5-0800200c9a68" -H 
    "Authorization: Bearer $1" -H "Content-Type: audio/wav; samplerate=8000" -- 
    data-binary $2` 
+0

Ich habe diese funktioniert durch die Übergabe der Binärdaten im Format "@ test.wav". Aber jetzt bekomme ich diesen Fehler. Verbindung # 0 zum Host rede.platform.bing.com blieb intakt {"version": "3.0", "header": {"status": "error", "Eigenschaften": {"requestid": "6048c0fa-86e2 -4073-993b-63bff15e10b3 "," NOSPEECH ":" 1 "}}} –

Antwort

0

Ich habe das funktioniert. Es gab einige Probleme. Einer war mit der locale, die ich zu en-IN geändert habe. und dann Szenarien = ulm. Dies scheint der Zweck gewesen zu sein. Ich konnte Sprache sehr deutlich erkennen.

+0

Warst du jemals auf ein Problem gestoßen, wo es einfach Timedout? Ich kann meine nicht bekommen * irgendeine * Art von Antwort, es hängt einfach. meine Einstellungen sind https://speech.platform.bing.com/recognize?version=3.0&requestid=5dd196bb-3401-43ff-b23c-754ca159f93f&appID=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=en- IN & device.os = Fenster & Szenarien = ulm & InstanceID = 4cf56c5e-2d4b-4580-9092-385d3ea39cd7 Mit den Header [ "Authorization"] => "Bearer [token]" [ "Content-Type"] => „Audio/wav; samplerate = 16000 " –

+0

Ja viele Male. Ich benutze bis 408 Request Timedout Fehler. Aber jedes Mal stellte sich heraus, dass es ein Problem mit meiner Anfrage war. entweder mit der Nutzlast oder mit den Parametern. Wie übermittelst du die Daten? Versuchen Sie es mit Curl. Auch die Wave-Datei muss in "@ test.wav" dieses Format in Unix-basierten Umgebungen übergeben werden. Übergeben Sie mir die URL mit maskiertem JWT-Token, ich kann ur url mit meinem Token versuchen –

+2

Das gleiche Problem hier. Gibt es noch weitere Szenarien? – wonglik

2

Ich lief auch ein paar Probleme, damit es funktioniert. Das folgende BASH-Skript "bingrec.sh" könnte helfen, es klarer zu machen; Geben Sie Ihren SUBSCRIPTION_KEY & ein, indem Sie SAMPLERATE usw. nach Bedarf anpassen. Wie andere darauf hingewiesen haben, müssen die Ländereinstellungen & auf unterstützte Werte gesetzt werden, und die Instanzen-ID und die Anfrage-ID müssen im GUID-Format vorliegen. Die Audiodatei sollte weniger als 10 Sekunden lang sein und eine Abtastrate von 8000 oder 16000 haben. Auch der curl-Parameter "--data-binary" erfordert ein "@" vor dem Audiodateinamen.

#!/bin/bash 
# Usage: ./bingrec.sh /path/to/file 
# Send audio file $1 through Bing speech recognition API. 
# 
SUBSCRIPTION_KEY=<your-key-here> 
LOCALE=en-US 
SCENARIOS=ulm 
SAMPLERATE=8000 
CODEC=audio/pcm 

TARGET_FILE=$1 
if [ ! -f "$TARGET_FILE" ]; then 
    echo Error: file $TARGET_FILE does not exist! 
    exit 1 
fi 

INSTANCE_ID=`uuidgen` # random GUID for instance 
REQUEST_ID=`uuidgen`  # random GUID for request 
APPID=D4D52672-91D7-4C74-8AD8-42B1D98141A5 # APPID for Bing Speechrec API, don't change 
DEVICE_OS=linux   # arbitraty 
FORMAT=json 

AUTH_TOKEN=`curl -v -X POST "https://api.cognitive.microsoft.com/sts/v1.0/issueToken" -H "Content-type: application/x-www-form-urlencoded" -H "Content-Length: 0" -H "Ocp-Apim-Subscription-Key: ${SUBSCRIPTION_KEY}"` 

curl -v -X POST "https://speech.platform.bing.com/recognize?scenarios=${SCENARIOS}&appid=${APPID}&locale=${LOCALE}&device.os=${DEVICE_OS}&version=3.0&format=${FORMAT}&instanceid=${INSTANCE_ID}&requestid=${REQUEST_ID}" -H "Authorization: Bearer ${AUTH_TOKEN}" -H "Content-type: audio/wav; codec='${CODEC}'; samplerate=${SAMPLERATE}" --data-binary @${TARGET_FILE}