Ich versuche, Bangla-Zeichen aus Bild mit Python zu erkennen, so entschied ich mich zu pytasseract zu verwenden. Zu diesem Zweck i unten Code verwendet haben:Erkennung von Bangla-Zeichen mit pytasseract
import pytesseract
from PIL import Image, ImageEnhance, ImageFilter
im = Image.open("input.png") # the second one
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save('temp2.png')
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
text = pytesseract.image_to_string(Image.open('temp2.png'),lang="ben")
print text
Das Problem ist, dass, wenn ich ein Bild von Englisch Charakter gab erfasst ist. Aber wenn ich schreibe lang="ben"
und Erkennung von Bild von Bengali Zeichen läuft mein Code für endlose Zeit oder wie für immer.
P. S: I bengalische Sprache Zugdaten auf tessdata Ordner heruntergeladen haben, und ich versuche, es in PyCharm zu laufen.
Kann mir jemand helfen, dieses Problem zu lösen?
ich es in Befehl versucht haben, aufgefordert, es funktioniert. Aber der obige Code ist in ** pycharm ** geschrieben. In ** pycharm ** läuft es für unbegrenzte Zeit. –
@pial siehe EDIT oben. – thewaywewere