2012-11-30 11 views
5

Ich habe diesen Leitfaden auf speech recognition gelesen, und es erwähnte, dass ich drei Elemente für die Spracherkennung brauche: Akustisches Modell, Sprachmodell, Phonetisches Wörterbuch.PocketSphinx Python und das akustische Modell einstellen?

Ich wollte mit diesem python demo zu spielen beginnen, die GStreamer vom Mikrofon zu erfassen verwendet und sampeln Audio bis 8 kHz, 16-Bit-PCM.

Ich sehe, dass ich das Sprachmodell und Laut Wörterbuch angeben kann, und ich verwende die eine [provided by CMU]:

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/ 

Aber ich bin verwirrt, wo ich das akustische Modell angeben soll? Hat gstreamer ein eigenes akustisches Modell, das ich implizit verwende? Ich hatte gehofft, das akustische Modell hier für etwas bessere Ergebnisse zu nutzen:

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Acoustic%20Model/ 

(. Tut mir leid, die Hyperlinks Ich kann keine Beiträge mehr als 2 Links mit rep weniger als 10)

Antwort

3

Aber Ich bin verwirrt, wo ich das akustische Modell angeben soll?

Sie können das Modell mit der hmm-Eigenschaft des Elements gstreamer angeben. Genau wie es

asr.set_property('lm', '/home/user/mylanguagemodel.lm') 

in Tutorial ist können Sie verwenden

asr.set_property('hmm', '/home/user/acoustic_model_folder') 

Hat gstreamer sein eigenes akustisches Modell habe ich implizit mit bin?

Ja, standardmäßig verwendet es US-Englisch Modell hub4wsj_sc_8k aus der Verteilung

Verwandte Themen