2010-12-11 16 views
1

Ist es möglich, eine String-Darstellung dessen zu erhalten, was ein Benutzer in einer VoiceXML-Anwendung gesagt hat? Zum Beispiel, um es in einer Datenbankabfrage zu verwenden.Gesprochene Eingabe als Zeichenfolge erhalten

Die meisten Beispiele, die ich bisher gesehen habe, versuchen einfach, mit einer (xml-) definierten Anzahl von Auswahlen übereinzustimmen. Dies ist ungeeignet, wenn man die Eingabe verwenden möchte, um mit einer Datenbank mit sagen wir> 100k Einträgen übereinzustimmen.

Dank

Antwort

2

Sie können mit Äußerung Attribute des letzten Ergebnisses (VoiceXML specification)

jedoch die gesprochene Eingabe als String bekommen, dann ist das nicht Ihr Problem. Sie möchten eine offene Grammatik oder ein System, das 100K Einträge verarbeiten kann. Das ist ein Artefakt der Erkennungs-Engine, nicht die VoiceXML-Sprache. In der Theorie könnten Sie eine 100K SRGS-Grammatik erstellen. In der Praxis ist das wahrscheinlich viel zu groß, wenn es sich bei allen um eindeutige Eingaben ohne eine sauberere Definition handelt. Sie können dies möglicherweise mit nativen Grammatiken mit Engines wie Nuance tun, entweder mit einer statischen Liste oder Einträgen oder einem statistischen Sprachmodell, das aus Elementkomponenten besteht (vorausgesetzt, sie haben gemeinsame Komponenten).

Sie können Diktiermaschinen betrachten. Ich glaube nicht, dass ich an VoiceXML-Plattformen angeknüpft habe, da sie normalerweise nicht gut auf die normalen VoiceXML-Anwendungsfälle abgestimmt sind und die meisten Diktat-Engines Schulungen und regelmäßige Satzstrukturen benötigen, um Eingaben vollständig zu identifizieren.

Verwandte Themen