2011-01-06 3 views

Antwort

2

pyspeech scheint nur eine Python-Schnittstelle zu den regulären Windows-Sprach-APIs zu sein. Wahrscheinlich würden Sie eine Methode erstellen, um die MP3-Wiedergabe als Audioquelle für diese Sprach-API zu behandeln.

+0

Könnten Sie bitte erklären, wie dieses Detail in voller zu tun? –

+0

Außerdem habe ich einen Mac. Wird das mich davon abhalten, Pyspeech zu benutzen? –

+0

Sie müssten Windows auf Ihrem Mac ausführen. EIne direkt auf der Hardware oder in einer virtuellen Maschine (Parallels, VMWare, etc ..). MacOS unterstützt Windows-APIs nicht (sollte es nicht). Wie es geht, weiß ich nicht. Ich bin kein Win32-Programmierer. Aber da die Windows-APIs eine Audioquelle "hören" sollen, müssen Sie Ihre MP3-Datei programmatisch in ein Audiogerät umwandeln, das die APIs hören würden. –

2

Ich weiß nicht über Pyspeech, aber wenn es ein Python-Wrapper um die Microsoft-Sprach-APIs ist, dann können einige andere Beiträge hilfreich sein.

Microsoft Speech-Engines benötigen keinen Mikrofoneingang. Sie können Audiodateien akzeptieren.

Wenn Sie Transkription durchführen, benötigen Sie eine Diktatgrammatik. Diktatgrammatiken sind in den Clientversionen von Microsoft-Sprachmodulen enthalten, die mit Windows 7 und Vista ausgeliefert werden. Diktatgrammatiken werden auf den von Microsoft bereitgestellten Server-Engines nicht bereitgestellt.

Ein einfaches Beispiel eines Diktat Grammatik in C# mit dem System.Speech Namespace zu verwenden, ist in der Frage Stackoverflow SAPI and Windows 7 Problem