0

Ich möchte die Verwendung von Gaussian Mixture-Modelle in Hidden-Markov-Modelle verstehen.Anzahl der Parameter in GMM-HMM

Angenommen, wir haben Sprachdaten und wir erkennen 5 Sprachlaute (die Zustände von HMM sind). Zum Beispiel ist 'X' die Sprachprobe und O = (s, u, h, b, a) (unter Berücksichtigung von Zeichen anstelle von Telefonen nur der Einfachheit halber) HMM-Zustände. Nun verwenden wir das Gauß'sche Mischungsmodell von 3 Mischungen, um die Gauss'sche Dichte für jeden Zustand mit Hilfe der folgenden Gleichung zu schätzen (Sorry kann Bild wegen Reputationspunkten nicht hochladen).

P (X | O) = Summe (i = 1-> 3) w (i) * P (X | mu (i), var (i)) (unter Berücksichtigung univariate Verteilung)

So, Wir lernen zuerst die GMM-Parameter aus den Trainingsdaten mit dem EM-Algorithmus. Dann verwenden Sie diese Parameter zum Erlernen von HMM-Parametern und sobald dies erledigt ist, verwenden wir beide auf Testdaten. In allen lernen wir 3 * 3 * 5 (Gewicht, Mittelwert und Varianz für 3 Mischungen und 5 Zustände) Parameter für GMM in diesem Beispiel. Ist mein Verständnis korrekt?

Antwort

1

Ihr Verständnis ist größtenteils korrekt, jedoch ist die Anzahl der Parameter normalerweise größer. Der Mittelwert und die Varianz sind Vektoren, keine Zahlen. Die Varianz könnte eine Matrix für den seltenen Fall einer vollständigen Kovarianz GMM sein. Jeder Vektor enthält üblicherweise 39 Komponenten für 13 Cepstrum + 13 Deltas + 13 Delta-Deltas.

jedes Handy Also für Sie

39 + 39 + 1 = 79 parameters 

Gesamtzahl der Parameter lernen

79 * 5 = 395 

ist und wird in der Regel Telefon von 3 oder so Staaten zusammensetzt, nicht von einem einzelnen Staat. Sie haben 395 * 3 oder 1185 Parameter nur für GMM. Dann brauchen Sie eine Übergangsmatrix für HMM. Die Anzahl der Parameter ist groß, weshalb für das Training viele Daten benötigt werden.

+0

Nikolay Shmyrev: nur um die Anzahl der Parameter pro Telefon zu klären wird 39 sein (Mittelwert) +39 (Varianz) +1 (?), Was ist 1 für? – suhas

+0

Nikolay Shmyrev: Nur um die Anzahl der Parameter pro Telefon zu klären wird 39 sein (Mittelwert) +39 (Varianz) +1 (?), Was ist 1 für? Auch wäre es nur 79, wenn es eine Gaußsche 1 Mischung ist. Wenn es sich um eine Mischung aus 10 Komponenten handelt, dann wäre die Gesamtzahl der Parameter 10 * 79 pro Telefon (unter Berücksichtigung nur des Einzelzustands). Ich habe recht? – suhas

+0

1 ist für das Gewicht. Sie haben recht, für 10 Mischungen haben Sie 10 * 79 Parameter. –

Verwandte Themen