Um Freiform-Spracheingabe zu erfassen (anstatt einer definierten Liste möglicher Werte), müssen Sie den Steckplatztyp AMAZON.LITERAL
verwenden. Die Amazon documentation for the Literal slot type beschreibt einen ähnlichen Anwendungsfall, in dem eine Fähigkeit erstellt wird, um einen beliebigen Ausdruck zu nehmen und ihn auf einer Social Media-Website zu veröffentlichen. Dies wird durch die Schaffung einer StatusUpdate Absicht getan:
{
"intents": [
{
"intent": "StatusUpdate",
"slots": [
{
"name": "UpdateText",
"type": "AMAZON.LITERAL"
}
]
}
]
}
Da es den AMAZON.LITERAL
Schlitztyp verwendet, wird diese Absicht in der Lage, jede beliebige Phrase zu erfassen. Um jedoch sicherzustellen, dass die Sprach-Engine einen ordentlichen Job bei der Erfassung von echten Phrasen leistet, müssen Sie eine Vielzahl von Beispiel-Äußerungen bereitstellen, die den Dingen ähneln, die Sie vom Benutzer erwarten.
im beschriebenen Szenario gegeben, dass Sie versuchen, sehr dynamische Sätze zu erfassen, gibt es ein paar Dinge in der Dokumentation, die Sie zusätzliche Gegenleistung geben möchten werden:
Wenn Sie verwenden die AMAZON.LITERAL Typ Freitext mit großen Schwankungen in der Anzahl der Wörter zu sammeln, die in den Schlitz sein könnte, folgendes zu beachten:
- Abdeckung dieses gesamte Spektrum (Minimum, Maximum und alle in b zwischen) erfordern einen sehr großen Satz von Proben. Versuchen Sie, mehrere hundert Samples oder mehr zur Verfügung zu stellen, um alle Variationen in Slot-Wert-Wörtern zu adressieren, wie oben notiert.
- Halten Sie die Phrasen in den Slots kurz genug, dass Benutzer die gesamte Phrase ohne Pause sagen können.
Langwierige gesprochene Eingabe kann zu geringerer Genauigkeit Erfahrungen führen, so vermeiden eine gesprochene Sprache Schnittstelle entwerfen, die mehr als ein paar Worte für einen Slot Wert erfordert. Eine Phrase, die ein Benutzer nicht sprechen kann, ohne anzuhalten, ist zu lang für einen Slot-Wert.
Das heißt, hier ist das Beispiel Beispiel Utterances aus der Dokumentation, wieder:
StatusUpdate das Update veröffentlichen {angekommen | Update}
StatusUpdate veröffentlichen das Update {Abendessen Zeit | Update}
StatusAktualisieren Sie das Update {out at lunch | UpdateText}
... (mehr Beispiele zeigen Sätze wi th 4-10 Wörter)
StatusUpdate das Update veröffentlichen {gehen durch den Supermarkt an diesem Abend stoppen | Update}
Wenn Sie genügend Beispiele für unterschiedliche Längen liefern ein genaues Bild von dem Bereich zu geben, erwartete Benutzeräußerungen, dann ist Ihre Absicht in der Lage, dynamische Phrasen in realen Anwendungsfällen, auf die Sie im Bereich UpdateText
zugreifen können, genau zu erfassen. Auf dieser Grundlage sollten Sie in der Lage sein, eine auf Ihre Bedürfnisse zugeschnittene Absicht umzusetzen.
Hallo Alex, danke für deine Antwort. Es gibt einen eingebauten Befehl, 'Alexa, Simon sagt ...', der wiederholt, was der Sprecher danach sagt. Ich habe mich gefragt, wie die rohe Spracheingabe in diesem Fall gespeichert wird. –
Drittanbieter-Entwickler haben derzeit nicht Zugriff auf alle die Macht von Alexa, können Sie dies in einigen von Amazon Apps wie der Musiksuche sowie einige hochkarätige Apps wie Uber, die den Benutzer Standort, sondern eine allgemeine erhalten können App-Entwickler können nicht. Hoffentlich ändert sich dies in der Zukunft, wenn die Plattform reift. –
Diese Antwort ist nicht wahr - Sie können den Slot-Typ 'AMAZON.Literal' implementieren, der das Erfassen von Freiformeingabe ermöglicht. Sie müssen jedoch eine Vielzahl von Beispieleingaben bereitstellen, um zu trainieren, welche Art von Eingängen zu erwarten sind. –