2012-04-10 31 views
0

Ich stelle diese Frage als Vorstufe für die Arbeit an einem meiner Spaß-Projekt. Ich denke daran, dies in Python zu kodieren, also denke ich, ich muss mit pyAudio gehen (bitte schlagen Sie mir vor, wenn es andere Bibliotheken als pyAudio gibt). Mein Ziel ist es, ein Programm zu erstellen, das jemandes Stimme aufnehmen kann. Das ist einfach. Wie kann ich jedoch die Stimme des Benutzers identifizieren, nachdem ich seine Stimme in einem/mehreren Samples aufgenommen habe? Was unterscheidet eine Stimme von anderen und wie kann Python implementiert werden, um dies zu erreichen?Verwenden von Python für die Spracherkennung

+2

Einige einfache Spracherkennungsprogramme verwenden MFCCs - siehe [Wikipedia] (http://en.wikipedia.org/wiki/Mel-frequency_cepstrum) und [dies] (http://yaafe.sourceforge.net/) Handbuch/pythonbindings.html). (Ich habe keine Ahnung, ob diese Python-Bibliothek gut ist, ich habe einfach nach Python MFCC gegoogelt). – Richante

Antwort

0

Haben Sie überlegt, eine Spracherkennungs-Engine als Grundlage für Ihr Projekt zu verwenden? Sie können zum Beispiel Python-Code schreiben, um CMU Sphinx (eine BSD-Option) http://sphinx.subwiki.com/sphinx/index.php/Sphinx3_python_quickstart ausführen. Wissen Sie nicht, was Sie mit Ihrem Spaßprojekt beabsichtigen, aber wenn Sie keine Spracherkennungsalgorithmen studieren möchten, könnte dies eine gute Option sein.