2017-06-02 3 views
0

Ich bin auf der Suche nach einer Anwendung, die Inventarinformationen für Produkte basierend auf der spezifischen Produktanforderung des Anrufers bekommt. Alle diese Produkte sind alphanumerisch und verwenden keine Wörter, was ein Teil des Problems ist.Neue Twilio-Spracherkennung (Force Alphanumeric, "non-word" Eingabe?)

Während eines Testanruf, bat ich „DBN5009K

In den Protokollen, können Sie sehen, dass es es wie folgt interpretiert:

SpeechResult BBN 5009 okay 

Ich bin nicht für ein perfektes Ergebnis suchen und plante, die Eingabe von Leerzeichen zu scrubben und dann einen Levenshtein-Algorithmus auszuführen, um dem nächsten Objekt zu entsprechen. Wenn das Ergebnis B BN5009 K gewesen wäre, bin ich zuversichtlich, dass ich in der Lage sein würde, es D BN5009K, ohne viel Mühe zu entsprechen. (Es hätte einen Levenshtein-Abstand von 1.) B BN5009 okay wird wahrscheinlich nie richtig übereinstimmen, mit einem Abstand von 5 auf einer Zeichenfolge, die nur 11 Zeichen lang ist.

Kann Twilio gezwungen werden, keine "Wörter" zu verwenden? Kann es mit einem spezifischen Datensatz geeigneter Optionen trainiert werden? Sie nutzen das Training nicht als Marketing-Plus, was es fast immer ist, aber in diesem Fall ist das ein Problem. Irgendwelche Vorschläge? Vielen Dank.

Seth

+0

Wenn Sie mir DBN über das Telefon sagen, kann ich (als Mensch) BBN verstehen. Dann, wie Sie erwarten, dass eine Maschine keine Fehler beim Parsen der Audiodaten macht. Wenn Sie Daten über Sprache eingeben möchten, sollte Ihr "DBN5009K" "Delta Bravo November 5 0 0 9 Kilo" sein. –

+0

stimme ich voll und ganz zu. Der D- und B-Tausch ist jedoch nicht mein Problem. Es ist das K, das für "okay" getauscht wird. Ich kann das erste Problem behandeln, aber nicht das zweite. Deshalb suche ich nach einer Möglichkeit, die Antwort-Engine von Twilio auf Buchstaben und Zahlen zu beschränken. Eine Anrufzeichentypmethode funktioniert möglicherweise besser, aber dies sind einfache Benutzer, die für den Operator nur 0 drücken, wenn sie Wörter für jeden Buchstaben aufstellen müssen, oder die Elementnummer über eine Telefontastatur eingeben. Vielen Dank. – Seth

+0

Es gibt viele Sprach-APIs, die entweder Hinweise oder flexiblere Sprachspezifikationen erlauben, nicht sicher, warum Sie an Twilio gebunden sind. Es wäre sehr schwierig, komplexe Sequenzen genau zu erkennen. –

Antwort

1

Twilio Entwickler Evangelist hier.

Twilio's speech recognition ist gut für Parsing allgemeine Rede als das ist, wofür es trainiert ist. Es ist nicht so gut für das Parsen bestimmter Dinge, wie Sie herausgefunden haben.

Innerhalb der Twilio-Plattform sollten Sie in der Lage sein, den Motor so zu trainieren, dass er Ihre Produkt-IDs erkennt. Dies ist natural language understanding, die bald kommt.

In der Zwischenzeit möchten Sie möglicherweise <Record> und eine Erkennungs-Engine verwenden, die Sie selbst trainieren können. Auch sign up to get updates on Understand.

+0

Vielen Dank. Das ist was ich dachte. Ich freue mich auf das neue Feature. Ich war aufgeregt, als die Spracherkennung angekündigt wurde, ich kann also etwas länger warten. – Seth

-1

Ich glaube, dass Sie programmgesteuert damit umgehen können, indem Sie die Teilzeichenfolge 'OK' des SpeechResult durch 'k' ersetzen, wenn SpeechResult 'OK' enthält.

+0

Es ist eine schlechte Lösung. –