Ich bin auf der Suche nach einer Anwendung, die Inventarinformationen für Produkte basierend auf der spezifischen Produktanforderung des Anrufers bekommt. Alle diese Produkte sind alphanumerisch und verwenden keine Wörter, was ein Teil des Problems ist.Neue Twilio-Spracherkennung (Force Alphanumeric, "non-word" Eingabe?)
Während eines Testanruf, bat ich „DBN5009K“
In den Protokollen, können Sie sehen, dass es es wie folgt interpretiert:
SpeechResult BBN 5009 okay
Ich bin nicht für ein perfektes Ergebnis suchen und plante, die Eingabe von Leerzeichen zu scrubben und dann einen Levenshtein-Algorithmus auszuführen, um dem nächsten Objekt zu entsprechen. Wenn das Ergebnis B BN5009 K gewesen wäre, bin ich zuversichtlich, dass ich in der Lage sein würde, es D BN5009K, ohne viel Mühe zu entsprechen. (Es hätte einen Levenshtein-Abstand von 1.) B BN5009 okay wird wahrscheinlich nie richtig übereinstimmen, mit einem Abstand von 5 auf einer Zeichenfolge, die nur 11 Zeichen lang ist.
Kann Twilio gezwungen werden, keine "Wörter" zu verwenden? Kann es mit einem spezifischen Datensatz geeigneter Optionen trainiert werden? Sie nutzen das Training nicht als Marketing-Plus, was es fast immer ist, aber in diesem Fall ist das ein Problem. Irgendwelche Vorschläge? Vielen Dank.
Seth
Wenn Sie mir DBN über das Telefon sagen, kann ich (als Mensch) BBN verstehen. Dann, wie Sie erwarten, dass eine Maschine keine Fehler beim Parsen der Audiodaten macht. Wenn Sie Daten über Sprache eingeben möchten, sollte Ihr "DBN5009K" "Delta Bravo November 5 0 0 9 Kilo" sein. –
stimme ich voll und ganz zu. Der D- und B-Tausch ist jedoch nicht mein Problem. Es ist das K, das für "okay" getauscht wird. Ich kann das erste Problem behandeln, aber nicht das zweite. Deshalb suche ich nach einer Möglichkeit, die Antwort-Engine von Twilio auf Buchstaben und Zahlen zu beschränken. Eine Anrufzeichentypmethode funktioniert möglicherweise besser, aber dies sind einfache Benutzer, die für den Operator nur 0 drücken, wenn sie Wörter für jeden Buchstaben aufstellen müssen, oder die Elementnummer über eine Telefontastatur eingeben. Vielen Dank. – Seth
Es gibt viele Sprach-APIs, die entweder Hinweise oder flexiblere Sprachspezifikationen erlauben, nicht sicher, warum Sie an Twilio gebunden sind. Es wäre sehr schwierig, komplexe Sequenzen genau zu erkennen. –