Ich verwende den Knoten sdk, um das IBM Watson Speech-to-Text-Modul zu verwenden. Nach dem Senden des Audio-Samples und Empfangen einer Antwort sieht der Vertrauensfaktor seltsam aus.Unterschied in der Wortvertrauenswürdigkeit in IBM Watson Speech to text
{
"results": [
{
"word_alternatives": [
{
"start_time": 3.31,
"alternatives": [
{
"confidence": 0.7563,
"word": "you"
},
{
"confidence": 0.0254,
"word": "look"
},
{
"confidence": 0.0142,
"word": "Lou"
},
{
"confidence": 0.0118,
"word": "we"
}
],
"end_time": 3.43
},
...
und
...
],
"alternatives": [
{
"word_confidence": [
[
"you",
0.36485132893469713
],
...
und ich für die Anerkennung bin gefragt mit dieser config:
var params = {
audio: fs.createReadStream(req.file.path),
content_type: 'audio/wav',
'interim_results': false,
'word_confidence': true,
'timestamps': true,
'max_alternatives': 3,
'continuous': true,
'word_alternatives_threshold': 0.01,
'smart_formatting': true
};
Beachten Sie, wie die Vertrauensfaktoren für das Wort "Sie" an beiden Orten unterscheidet. Ist eine dieser Nummern etwas anderes? Was geht hier vor sich?
Was ist die start_time des zweiten "Sie"? Die mit Vertrauen 0.36485132893469713 – lCapp