2017-08-14 9 views
-1

Als kühlen Seite Projekt versuche ich die gesamten Steuern von einem Bild des Steuerbeleg bezahlt zu extrahieren:Wie Steuern, die mit Python vom Image bezahlt wurden, extrahieren?

Tax Receipt

Ich möchte analysieren dieses Bild (und ähnliche andere) und würde extrahieren möchte der Steuerbetrag.

das ist [383.58,0.53,0.53, 383.58]

Kann jemand geben Sie mir, um loszulegen führt? Ich habe versucht, mit OCR zu beginnen und benutzte einige freie on-line-OCR-Programme und keiner von ihnen scheint, die Daten richtig zu lesen.

Wie wird dieses Problem angegangen? Ich habe bisher Online OCR versucht. Welches sind die Motoren, die für diesen Zweck am besten geeignet sind und was sind die wichtigsten Dinge, die man beachten sollte?

Gibt es gute Bibliotheken in Python, die mir helfen können, anzufangen?

Ich habe Online-Programme mit Tesseract-OCR versucht und sie haben die Zahlen nicht richtig gelesen. Meine Ahnung ist, die Parameter dieser Engine zu basteln, sollte helfen, aber bin verloren, zu versuchen, zu verstehen, welche Parameter helfen könnten und wo ich anfangen soll.

Ich fange gerade mit diesen Dingen an, also versuchend, meinen Weg durch zu finden, ohne notwendigerweise die zugrundeliegenden technischen Details zu verstehen.

+0

OCR ist der Standardweg Text von Bild zu extrahieren. Welche Bibliotheken oder Ressourcen haben Sie ausprobiert? Würde es dir etwas ausmachen, das in deine Frage aufzunehmen? –

+0

"Kann mir jemand Leads geben, um loszulegen?" - viel zu weit, leider. "Ist OCR ein guter Ausgangspunkt?" - auf der Grundlage von Meinungen "Welche Motoren sind für diesen Zweck am besten geeignet und was sind die wichtigsten Dinge, die man beachten sollte?" - auch zu breit. "Gibt es in Python gute Bibliotheken, die mir helfen können, anzufangen?" - Die Abfrage von Bibliotheksempfehlungen ist bei Stack Overflow nicht möglich. – ForceBru

Antwort

Verwandte Themen