Ich habe viel versucht, das Projekt Oxford Speaker Recognition API (https://dev.projectoxford.ai/docs/services/563309b6778daf02acc0a508/operations/5645c3271984551c84ec6797) zu verwenden.Projekt Oxford Speaker Recognition- Invalid Audio Format
Ich konnte erfolgreich den Ton auf meinem Mikrofon aufnehmen, um es in den erforderlichen WAV (PCM, 16bit, 16K, Mono) zu konvertieren.
Das Problem ist, wenn ich versuche, diese Datei als ein binärer Stream an die API zu buchen, gibt es eine ungültige Audioformatfehlermeldung zurück.
Die gleiche Datei wird von der Demo auf der Website (https://www.projectoxford.ai/demo/SPID) akzeptiert.
Ich benutze Python 2.7 mit diesem Code.
import httplib
import urllib
import base64
import json
import codecs
headers = {
# Request headers
'Content-Type': 'application/octet-stream',
'Ocp-Apim-Subscription-Key': '{KEY}',
}
params = urllib.urlencode({
})
def enroll(audioId):
conn = httplib.HTTPSConnection('api.projectoxford.ai')
file = open('test.wav','rb')
body = file.read()
conn.request("POST", "/spid/v1.0/verificationProfiles/" + audioId +"/enroll?%s" % params, str(body), headers)
response = conn.getresponse()
data = response.read()
print data
conn.close()
return data
Und das ist die Antwort, die ich bekomme.
Bitte, wenn mir jemand sagen kann, was ich vermisse. Ich habe alle Eigenschaften der Audiodatei und die Anforderungen überprüft, die von der API benötigt werden, aber ohne Glück.
Alle Antworten und Kommentare sind willkommen.
Wie haben Sie die Audiodatei konvertiert? Ich habe Probleme bei der Konvertierung .. nicht in der Lage, mit jedem Audio aufgrund der Spezifikationen zu arbeiten ... –
Nevermind einen Konverter gefunden (Bigasoft Total Video Converter 5) –