2010-12-05 9 views

Antwort

6

Sie verwenden ihre eigene API für die Spracherkennung. Bsp .: Senden einer Post-Anfrage an dortige Server.

12

Yup, Chrome macht Spracherkennung über Googles Server. Aber es gibt keinen Grund, dass andere Browser nicht wählen könnten, es anders zu implementieren (zum Beispiel mit Hilfe einiger Spracherkennungsfunktionen im Betriebssystem).

Balu, Ihr Link ist eigentlich ein bisschen veraltet. Der neueste kann Google Vorschlag hier: http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html

Obwohl Spracherkennung hat im Chrome Dev Channel seit einiger Zeit zur Verfügung, es hat nicht noch ausgeliefert, und wir sind noch nicht sicher, wann es ausgeliefert wird. Wir möchten definitiv, dass die Leute mit der API spielen und Feedback dazu geben, aber wir glauben nicht, dass sie schon zur Prime Time bereit ist.

+3

Es gibt ernsthafte Bedenken bezüglich der Privatsphäre hier. –

0

Es gibt auch eine Arbeitsgruppe, die http://www.w3.org/TR/xhtml+voice/ produziert, aber ich glaube nicht, dass dies in jedem Browser außer Opera implementiert ist.

0

Ich habe dies nur auf meinem Chrome Cr-48 bestätigt, es funktioniert.

9

gemäß dem Code sendet die Audiodaten als eine POST-Anforderung an:

https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3 

lm ist grammar in dem Code, xhwhardware_info ist, die nach einem Kommentar ist optional. Das Audio sein speex erscheint, x-speex-mit-header-Byte:

// Encode the frame and place the size of the frame as the first byte. This 
// is the packet format for MIME type x-speex-with-header-byte. 

Es sieht aus wie es ist ziemlich trivial sein würde, den Chrom-Code verwendet in Ihrer eigenen App zu ändern.

Update:

Sie müssen auch eine speech recognition API key zu bekommen und sie sind auf 50 Anfragen pro Tag. Es gibt keine Möglichkeit, diese Grenze zu erhöhen - nicht einmal durch Bezahlung.

+2

Wer weiß, ob es Google gut geht, wenn diese API von irgendjemandem direkt verwendet wird oder wenn es gegen Geschäftsbedingungen verstößt? Vielen Dank. – poshaughnessy

+0

Weiß jemand wie "lm" (Grammatik) Attribut funktioniert? W3C-Entwurf besagt, dass Grammatik jede URL zu GRXML-Datei sein kann, aber es ändert nichts. – hamczu

1

in Text, wird Chrome integrierte Sprachunterstützung durch WebKit hat; Sehen Sie sich einfach die Google-Startseite an (auf der sich jetzt rechts neben dem Suchfeld ein Mikrofon befindet). Ich frage mich jedoch, ob das Chrome-Team an der Omnibox-Sprachunterstützung arbeitet. Schließlich ist Chrome ein WebKit-basierter Browser!

6

Es gibt eine experimentelle Verzweigung von speexenc, die das MIME-Binärformat x-speex-mit-Header-byte codieren kann, auf die QXIP Wiki verwiesen wird und die unter GitHub verfügbar ist. Ist der Job in Ordnung, indem Sie die Größe des Frames als erstes Byte der Pakete festlegen.

+0

Vielen Dank dafür! – David