2012-11-29 6 views
6

Ich habe ein Android OCR-Tool mit Tesseract nur OCR-Ziffern implementiert. Bis jetzt gibt es eine ziemlich hohe Genauigkeit mit normalen Ziffernschriften. Die Genauigkeit ist jedoch schrecklich, wenn es sich um 7-stellige Ziffern handelt (die auf LCDs gefunden werden).Android Tesseract OCR 7 Segment Ziffern

Ich habe versucht, mein Bild zu schneiden, Whitelist mit 0 bis 9 und auch einige Bildverarbeitung vergeblich. Irgendwelche Ideen da draußen, wie man die Genauigkeit erhöht? Oder vielleicht ein paar Tipps zum Training der spezifischen 7-Segment-Ziffern für Tesseract wird mir definitiv sehr helfen.

Vielen Dank im Voraus.

+0

Ich glaube nicht, dass Sie gute Ergebnisse ohne Umschulung bekommen können. Es wäre schön, wenn es eine öffentlich zugängliche Trainingsdatei für 7-stellige Ziffern gäbe, aber ich konnte keine finden, als ich nachgesehen habe. – rmtheis

+0

Vielen Dank für die Antwort. Ihr Blog hat mir bei meiner Implementierung sehr geholfen. Also, vielen Dank an dich. Ich plane, es zu trainieren und schaue in btteseract für den Boxprozess. Ich werde es sehr schätzen, wenn jemand einige Tipps für den Trainingsprozess teilen kann, weil der offizielle für mich etwas verwirrend ist. – laurie7

+0

Sie können [jTessBoxEditor] (http://vietocr.sourceforge.net/training.html) verwenden, um TIFF/Box-Dateien zu bearbeiten oder zu generieren, die im Training verwendet werden sollen. Es gibt auch ein PowerShell-Skript 'train.ps1', das den Rest des Trainings automatisiert. – nguyenq

Antwort

2

Sie können an traineddata für 7 Segmente finden:

https://github.com/arturaugusto/display_ocr/tree/master/letsgodigital

Es gibt auch eine Probe Python-Code auf dem gleichen Repository.

+0

Können Sie mir sagen, wie trainiert man Tester nur für Ziffern? – malaguna

+0

Ich habe einige Bilder mit einer Schriftart namens "lets go digital" erzeugt, etwas Rauschen mit gimp hinzugefügt, [jTessBoxEditor] (http://vietocr.sourceforge.net/training.html) benutzt, um Box-Daten zu erzeugen und [diese] (https://github.com/this-is-ari/python-testeract-3.02-training) Werkzeug für das Training. Lesen Sie [tesseractocr FAQ] (https://github.com/tesseract-ocr/tesseract/wiki/FAQ) für weitere Details. Ich habe auch die [Trainingsquellen] geteilt (https://github.com/arturaugusto/display_ocr/tree/master/training_source) – art

Verwandte Themen