Pyspeech (Python) - Transkribieren mp3-Dateien?

Ich möchte mp3 (Sprache-zu-Text) mit der Pyspeech API transkribieren. Ich weiß nicht, ob das möglich ist.Pyspeech (Python) - Transkribieren mp3-Dateien?

Ist es? Wie?

Quelle

2011-01-06 Pauly Dee

pyspeech scheint nur eine Python-Schnittstelle zu den regulären Windows-Sprach-APIs zu sein. Wahrscheinlich würden Sie eine Methode erstellen, um die MP3-Wiedergabe als Audioquelle für diese Sprach-API zu behandeln.

Quelle

2011-01-06 03:10:40

Könnten Sie bitte erklären, wie dieses Detail in voller zu tun? –

Außerdem habe ich einen Mac. Wird das mich davon abhalten, Pyspeech zu benutzen? –

Sie müssten Windows auf Ihrem Mac ausführen. EIne direkt auf der Hardware oder in einer virtuellen Maschine (Parallels, VMWare, etc ..). MacOS unterstützt Windows-APIs nicht (sollte es nicht). Wie es geht, weiß ich nicht. Ich bin kein Win32-Programmierer. Aber da die Windows-APIs eine Audioquelle "hören" sollen, müssen Sie Ihre MP3-Datei programmatisch in ein Audiogerät umwandeln, das die APIs hören würden. –

Ich weiß nicht über Pyspeech, aber wenn es ein Python-Wrapper um die Microsoft-Sprach-APIs ist, dann können einige andere Beiträge hilfreich sein.

Microsoft Speech-Engines benötigen keinen Mikrofoneingang. Sie können Audiodateien akzeptieren.

Wenn Sie Transkription durchführen, benötigen Sie eine Diktatgrammatik. Diktatgrammatiken sind in den Clientversionen von Microsoft-Sprachmodulen enthalten, die mit Windows 7 und Vista ausgeliefert werden. Diktatgrammatiken werden auf den von Microsoft bereitgestellten Server-Engines nicht bereitgestellt.

Ein einfaches Beispiel eines Diktat Grammatik in C# mit dem System.Speech Namespace zu verwenden, ist in der Frage Stackoverflow SAPI and Windows 7 Problem

Quelle

2011-01-07 13:46:28

Pyspeech (Python) - Transkribieren mp3-Dateien?

Antwort

Verwandte Themen