Ich versuche, eine gescannte Seite in Text zu konvertieren, indem ich sowohl pytasseract als auch tesseract die Befehlszeile unter Ubuntu verwende. Die Ergebnisse sind merklich anders (der Text ist wesentlich besser als die Befehlszeile), und ich kann nicht verstehen, warum. Ich habe mir die Standardwerte für die Parameter angeschaut und versucht, einige der Parameterwerte in der Tesseract-Befehlszeile (wie psm) zu ändern, aber ich kann nicht das gleiche Ergebnis wie in pytasseract erhalten. Aufgrund fehlender Dokumentation in Pytasseract kann ich nicht herausfinden, welche Standardwerte für Parameter verwendet werden.Ergebnisse von pytasseract sind anders als tesseract Befehlszeilenergebnisse
Hier mein pytesseract Code ist print(pytesseract.image_to_string(Image.open('test.tiff'))