2009-12-05 5 views
6

Ich habe von sehr früh an eine schwere bis tiefe Taubheit, aber glücklicherweise kann ich wie eine normale Person sprechen. Mündliche Kommunikation war für mich immer schwierig, da meine Fähigkeit zur Spracherkennung auch beim Lippenlesen beeinträchtigt war. Ich habe die Schule und das College besucht, indem ich nur Bretter, PowerPoint-Folien, Bücher und das Internet gelesen habe. Mir geht es bei meiner jetzigen Software-Entwicklung sehr gut, aber in letzter Zeit habe ich das Gefühl, dass ich mich anstrengen muss, um meine Situation zu verbessern.Wie man eine untrainierte Sprache zum Textkonverter macht?

Untertitel sind mein Lebensretter in diesem Land, um Filme/Shows im Fernsehen zu verstehen, und ich habe das nur in den letzten 7 Jahren genossen (ich bin jetzt 31).

Ich fühle stark die Notwendigkeit für die Fähigkeit, Untertitel im wirklichen Leben zu sehen, wann immer ich mit einer Person, sogar Fremden spreche. Ich möchte einen ungeschulten Sprach-zu-Text-Konverter entwickeln, und zu Beginn muss er nicht einmal genaue Wörter für mich schreiben, nur Hinweise auf Silben/Phonetik werden auch in Ordnung sein.

Ich habe auf diese für eine Weile gegoogled, aber die meisten Ergebnisse sind entweder Text zu Sprache oder halbgebackene Versuche zur Spracherkennung, um Sprachbefehle an einen Computer zu geben. Ich würde gerne ein paar Tipps bekommen, wie ich mit diesem Projekt anfangen soll. Insbesondere brauche ich Schritte, wie mit Audiodateien umzugehen ist und welche Art von Verarbeitung ich machen muss, um die Phonetik so schnell wie möglich zu erreichen.

+1

Paar von großen Links bereits. Danke Leute. Ich muss zuerst ein paar einfache Programme herausfinden und dann darüber nachdenken, eine iPhone-App zu erstellen, damit ich ein Echtzeit-Untertitelungs-Tool haben kann. Long Shot, aber einen Versuch wert. –

+1

Ich bin froh, dass wir dir helfen konnten, Joy. –

+0

Grüßen Sie, Sir, für Ihr mutiges Leben und die Entscheidung, etwas selbst zu tun. –

Antwort

3

Sie möchten vielleicht CMU's Sphinx project betrachten, die Sprache in Echtzeit in Text übersetzt. Sie haben einige demos, um es auszuprobieren.

+0

Es gibt einen Kurs dazu: Sie können hier etwas Material zum Lernen bekommen http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-345-automatic-speech-recognition-spring- 2003/Download-Kurs-Materialien / – saurabheights

1

Werfen Sie einen Blick auf die DSP guide, es geht eher um Low-Level-Sachen, aber Techniken wie Fourier-Transformationen und Filterung sind von großer Bedeutung für die Audio-Verarbeitung. Auch wenn Sie nicht bei Null anfangen, kann es gut sein, die Prinzipien und Anwendungen zu schätzen.

Das heißt, ich wette, dass von Grund auf neu, man etwas schaffen könnte, die Arbeit auseinander einen Basissatz von Sounds mit ein paar Tagen sagen kann ...