Ich möchte mp3 (Sprache-zu-Text) mit der Pyspeech API transkribieren. Ich weiß nicht, ob das möglich ist.Pyspeech (Python) - Transkribieren mp3-Dateien?
Ist es? Wie?
Ich möchte mp3 (Sprache-zu-Text) mit der Pyspeech API transkribieren. Ich weiß nicht, ob das möglich ist.Pyspeech (Python) - Transkribieren mp3-Dateien?
Ist es? Wie?
pyspeech scheint nur eine Python-Schnittstelle zu den regulären Windows-Sprach-APIs zu sein. Wahrscheinlich würden Sie eine Methode erstellen, um die MP3-Wiedergabe als Audioquelle für diese Sprach-API zu behandeln.
Ich weiß nicht über Pyspeech, aber wenn es ein Python-Wrapper um die Microsoft-Sprach-APIs ist, dann können einige andere Beiträge hilfreich sein.
Microsoft Speech-Engines benötigen keinen Mikrofoneingang. Sie können Audiodateien akzeptieren.
Wenn Sie Transkription durchführen, benötigen Sie eine Diktatgrammatik. Diktatgrammatiken sind in den Clientversionen von Microsoft-Sprachmodulen enthalten, die mit Windows 7 und Vista ausgeliefert werden. Diktatgrammatiken werden auf den von Microsoft bereitgestellten Server-Engines nicht bereitgestellt.
Ein einfaches Beispiel eines Diktat Grammatik in C# mit dem System.Speech Namespace zu verwenden, ist in der Frage Stackoverflow SAPI and Windows 7 Problem
Könnten Sie bitte erklären, wie dieses Detail in voller zu tun? –
Außerdem habe ich einen Mac. Wird das mich davon abhalten, Pyspeech zu benutzen? –
Sie müssten Windows auf Ihrem Mac ausführen. EIne direkt auf der Hardware oder in einer virtuellen Maschine (Parallels, VMWare, etc ..). MacOS unterstützt Windows-APIs nicht (sollte es nicht). Wie es geht, weiß ich nicht. Ich bin kein Win32-Programmierer. Aber da die Windows-APIs eine Audioquelle "hören" sollen, müssen Sie Ihre MP3-Datei programmatisch in ein Audiogerät umwandeln, das die APIs hören würden. –