2016-06-02 10 views
1


Hallo, Leute. (Ist es in Ordnung, dass dieser Satz zu starten?) HTK Werkzeug und Abtastrate

Ich habe versucht, mit HTK-Tool diese Stimme (Wort) Erkennung zu simulieren.
Und ich habe *. Wav-Dateien.
Einige Dateien haben eine Abtastrate von 16 KHz, einige Dateien haben eine Abtastrate von 44,1 KHz.

Und ich mache mfcc-Datei über jede Abtastrate.
Aber ich mache HMM-Modell mit allen (16KHz und 44.1KHz) mfcc-Dateien.

voice_16KHz.wav -> voice_1.mfcc 
voice_44.1KHz.wav -> voice_2.mfcc 
make hmm_model using voice_1.mfcc and voice_2.mfcc 

Ist es in Ordnung, dass HMM-Modell mit Mischen unterschiedlicher Abtastrate machen?

Ich sollte sicherlich Informationen wissen, nicht Vorschlag.

Danke fürs Lesen.

Antwort

1

Ich schlage vor, dass Sie nur für eine Abtastrate gehen. Es funktioniert, aber die Genauigkeit ändert sich und Sie müssen auch die Konfigurationsdetails in der MFCC-Konfigurationsdatei ändern. Downgrade von 44,1 KHz-Dateien auf 16 KHz ist sehr einfach.