2016-12-09 4 views
1

Ich verwende den Knoten sdk, um das IBM Watson Speech-to-Text-Modul zu verwenden. Nach dem Senden des Audio-Samples und Empfangen einer Antwort sieht der Vertrauensfaktor seltsam aus.Unterschied in der Wortvertrauenswürdigkeit in IBM Watson Speech to text

{ 
    "results": [ 
    { 
     "word_alternatives": [ 
     { 
     "start_time": 3.31, 
     "alternatives": [ 
     { 
      "confidence": 0.7563, 
      "word": "you" 
     }, 
     { 
      "confidence": 0.0254, 
      "word": "look" 
     }, 
     { 
      "confidence": 0.0142, 
      "word": "Lou" 
     }, 
     { 
      "confidence": 0.0118, 
      "word": "we" 
     } 
     ], 
     "end_time": 3.43 
    }, 
... 

und

... 
], 
"alternatives": [ 
    { 
     "word_confidence": [ 
     [ 
      "you", 
      0.36485132893469713 
     ], 
... 

und ich für die Anerkennung bin gefragt mit dieser config:

var params = { 
    audio: fs.createReadStream(req.file.path), 
    content_type: 'audio/wav', 
    'interim_results': false, 
    'word_confidence': true, 
    'timestamps': true, 
    'max_alternatives': 3, 
    'continuous': true, 
    'word_alternatives_threshold': 0.01, 
    'smart_formatting': true 
    }; 

Beachten Sie, wie die Vertrauensfaktoren für das Wort "Sie" an beiden Orten unterscheidet. Ist eine dieser Nummern etwas anderes? Was geht hier vor sich?

+0

Was ist die start_time des zweiten "Sie"? Die mit Vertrauen 0.36485132893469713 – lCapp

Antwort

1

John, Vertrauenswerte, die in den "word_alternatives" kommen, werden von Verwirrungsnetzwerken abgeleitet und sind auf der Wortebene, während Konfidenzwerte, die in der Liste der "Alternativen" stehen, auf Satzebene über Gitter berechnet werden.

Konfusionsnetzwerke werden aus Gittern abgeleitet, enthalten jedoch eine andere Darstellung des Hypothesenraumes, was erklärt, warum sich die Vertrauenswerte, die von dem einen oder dem anderen stammen, unterscheiden können.

In diesem Fall enthält der Satz nur ein Wort, deshalb ist der Unterschied sehr gut sichtbar.

Verwandte Themen