Ich werde ein Spracherkennungsprogramm basierend auf Hidden-Markov-Modell bauen. Leider weiß ich nicht, wie man eine Eingangs-Tonsequenz erhält und, naja, arbeite damit. Kann mir jemand sagen, wie der allgemeine Ansatz zum Lesen von Werten aus einem Audiodateiformat (d. H. .wav, .mp3, usw.) und dem Schneiden eines Soundtracks in C++ - Stücke aussieht?Eingang für Hidden Markov Modell-basierte Spracherkennungsprogramm
0
A
Antwort
0
Der allgemeine Ansatz besteht darin, einen Eingangston in die Sequenz von Merkmalsvektoren (normalerweise MFCCs) umzuwandeln. Dieser Prozess wird allgemein in CMU Sphinx wiki beschrieben und ausführlich in HTK Book beschrieben. Vielleicht möchten Sie auch den universellen Zweck openSMILE toolkit studieren, um zu sehen, wie es in C++ gemacht wird.
Verwandte Themen
- 1. hidden markov model thresholding
- 2. Hidden Markov Modelle
- 3. Hidden Markov in PyMC3
- 4. Basic Hidden Markov Modell, Viterbi Algorithmus
- 5. Training Hidden Markov Modell in R
- 6. pmtk-3 links-rechts Hidden Markov Modelle
- 7. Hidden Markov Modell - HMM mit Apache Spark
- 8. Hidden-Markov-Modell Mehrere Beobachtungswerte für jeden Zustand
- 9. Was ist der Unterschied zwischen Markov Ketten und Hidden Markov Modell?
- 10. Modellbasierte Teststrategien
- 11. Empfohlene modellbasierte Testwerkzeuge
- 12. Markov Clustering
- 13. Geschäftsbeispiele für die Verwendung von Markov-Ketten?
- 14. Generieren Übergangsmatrix des Vektors für Markov-Kette?
- 15. Markov-Entscheidungsprozess Fragen
- 16. Stepfun Funktion markov
- 17. Markov-Kette. Umsetzung hinzuzufügen Verfahren
- 18. Viewstate oder Hidden
- 19. Wie Markov Chain in C#
- 20. Markov Clustering-Algorithmus in Java
- 21. QValidator für Hex-Eingang
- 22. Winkelformvalidierungsklasse für jeden Eingang
- 23. Eingang für C# geändert?
- 24. Integer-Eingang für Operator
- 25. Federform: Eingang für Nummer
- 26. localStorage für Radio-Eingang?
- 27. Übersetzungsfehler: hidden Symbol `__aeabi_uidiv‘
- 28. Hidden Date Picker
- 29. Silverlight vs Überlauf = „hidden“
- 30. Hidden aspx von TableRow
http://en.cppreference.com/w/cpp/links/libs#Audio – macroland
Es ist besser zu überprüfen, was bestehende Software tut –