1

Ich entwickle eine Anwendung, die Sprache in Text verwendet, um Audio in Text zu transkribieren. Die Genauigkeit ist gering. Einige Sätze haben keine Bedeutung. Gibt es eine Möglichkeit, die Genauigkeit von Sprache zu Text zu verbessern?Genauigkeit der IBM Watson Spracherkennung ist niedrig

Hier ist ein Beispiel:

http://book.vidalab.co/books/alice-in-wonderland

Alice im Wunderland, in Abschnitt 2:

"über zu Hause weißen Bauern gehen diese Weise können Sie Anzeigen sehen" sollte „über zu Hause sein weißen Bauern auf diese Weise sehen Sie Alice“

‚Ratte in weiß zu gehen rot und weiß ‚

‘ sollte‘

„und die weiße Armee versucht, und das Rot auf dem Trice Zwillinge zu gewinnen“ sollte „und die weiße Armee versucht, und die Rote Armee zu gewinnen versucht, um zu gewinnen“

+0

es ist keine AI. Sehen Sie, wie es mit diesem Gedicht umgeht: http://www.waylink-english.co.uk/?page=16100 –

+0

Ich würde nicht erwarten, dass es Gedichte analysiert. Aber mit der Literatur geht es nicht so gut. Vielleicht ist die Literatur auch nicht in Ordnung? –

Antwort

1

Sie verschiedene Dienste versuchen können, zum Beispiel Speechmatics , es immer Lautsprecher nicht sehr gut ist, aber Worte sind viel genauer als von Watson, ist das Ergebnis wie folgt aus:

Credits of Alice in Wonderland by Alice girs Timberg this is a box recording all of her vocal recordings are in the public domain for more information or volunteer. Please visit libber Vox dot org. 
I just listed stage directions read by McKayla Curtis Lewis Carroll. 
Read by Shannon Brown Alice read by Amanda Friday the Red Queen read by Shauna canat White Queen read by Elizabeth Klatt White Rabbit read by Todd Humpty Dumpty read by Jeff Machado written read by Brett Hirsch. 
The Mock Turtle read by Ted the alarm Mad Hatter read by Elliot gage the March Hare by Charlotte Duckett's dormouse read by Kimberly Krauss frog read by Larry Wilson Duchess read by L.A. Cheshire Cat read by Sarah Herschell Tweedle-Dee read. 
By Charlotte Brown. 
Do you do do I read by the sea a solo the King of Hearts read by Ted alarm the Queen of Hearts read by eating Ray Headrick knave by glorious Joe Carter pillar back at 2 loss to spot read by Dave Harris. 
Five Spot read by Dave Harith. Seven of spades read by Dave Hereth end of credits. 

Nachnamen Anerkennung ist sehr komplexe Aufgabe, nicht viele Unternehmen es richtig tun.

0

Es gibt zwei Hauptteile in jedem STT-System: akustisches Modell und Sprachmodell. Der erste handelt von Audio und Lautsprecher und behandelt Dinge wie: Lärm, Aussprache, Akzente und so weiter. Beim Sprachmodell geht es um die Struktur einer bestimmten Sprache und die in der Sprache verwendeten Wörter.

Wenn Sie ein STT testen möchten, verwenden Sie die Aufzeichnungen, die Ihrer Zielsprache so nahe wie möglich kommen. Ein System, das sehr gut für allgemeine Sprache oder zum Beispiel medizinische Transkription funktioniert, kann keine gute Rede in Griff über Archäologie oder Poesie sein.

Verwandte Themen