Spracherkennung mit Tesseract oder abby ocr

-2

Ich habe Bilder von Dokumenten entweder arabisch oder Englisch Text als Bild enthält, ist es irgendwie möglich zu wissen, welche Sprache aus diesem zwei ein BildSpracherkennung mit Tesseract oder abby ocr

Quelle

2016-04-18 saurabhiitr

Grüße, und willkommen auf der Website! Die Frage, die Sie stellen, ist für den Q & A-Stil von StackOverflow etwas zu weit gefasst. Ich empfehle Ihnen sehr, über [wie man eine gute Frage stellt] (http://stackoverflow.com/help/asking) und [die Tour] (http://stackoverflow.com/tour) zu lesen (falls nicht , noch) –

Ich sehe nicht, was diese Frage unklar ist und warum es für das Schließen gewählt wird. Es fragt grundsätzlich nach automatischer Erkennung der Sprache. –

enthalten Ja, es ist möglich. Sie legen zwei mögliche Erkennungssprachen fest ("Englisch", "Arabisch"), führen dann OCR durch und prüfen den erkannten Textzeichensatz. Lateinisches Alphabet zeigt Englisch an.

Quelle

2016-04-19 10:09:03

können Sie mir Beispiel geben –

Für Tesseract: tesseract -l -l-ara/Eingabe.jpg/output.pdf pdf –

Spracherkennung mit Tesseract oder abby ocr

Antwort

Verwandte Themen