2016-04-18 14 views
-2

Ich habe Bilder von Dokumenten entweder arabisch oder Englisch Text als Bild enthält, ist es irgendwie möglich zu wissen, welche Sprache aus diesem zwei ein BildSpracherkennung mit Tesseract oder abby ocr

+2

Grüße, und willkommen auf der Website! Die Frage, die Sie stellen, ist für den Q & A-Stil von StackOverflow etwas zu weit gefasst. Ich empfehle Ihnen sehr, über [wie man eine gute Frage stellt] (http://stackoverflow.com/help/asking) und [die Tour] (http://stackoverflow.com/tour) zu lesen (falls nicht , noch) –

+0

Ich sehe nicht, was diese Frage unklar ist und warum es für das Schließen gewählt wird. Es fragt grundsätzlich nach automatischer Erkennung der Sprache. –

Antwort

0

enthalten Ja, es ist möglich. Sie legen zwei mögliche Erkennungssprachen fest ("Englisch", "Arabisch"), führen dann OCR durch und prüfen den erkannten Textzeichensatz. Lateinisches Alphabet zeigt Englisch an.

+0

können Sie mir Beispiel geben –

+0

Für Tesseract: tesseract -l -l-ara/Eingabe.jpg/output.pdf pdf –

Verwandte Themen