2013-02-12 3 views
11

Ich versuche Tesseract für eine neue Schriftart zu trainieren, die in meiner Android App verwendet werden kann. Ich muss nur für Ziffern trainieren, also habe ich ein Trainingsbild, eine Box-Datei und eine Unicarset-Datei erstellt.Fehler erhalten: "schlechtes Lesen von inttemp!" Beim Training einer neuen Schriftart in Tesseract 2

Ich habe the training instructions gefolgt, aber wenn ich versuchte, tesseract zu laufen, sagt es, bad read of inttemp!.

Was mache ich falsch? Wie kann ich diesen Fehler diagnostizieren?

+1

Ausbildung sehr schmerzhaft ist. Untersuchen Sie sorgfältig die Protokolle Ihres Trainingsworkflows auf Warnungen und Fehler. Wenn etwas schief geht, sind deine Trainingsdaten nutzlos. – n3utrino

+0

@gabe, können Sie hilfreiche Links vorschlagen? – Dipin

+0

Ich habe viel Zeit in https://groups.google.com/forum/?fromgroups=#!forum/tesseract-ocr verbracht, vielleicht ist das etwas für dich https://gitorious.org/ancient-greek-training-for -testeract/tesstrainingtools – n3utrino

Antwort

0

http://code.google.com/p/tesseract-ocr/issues/detail?id=155

Es stellte sich heraus, tesseract noch im Gange war zurück in die "C: \ Program Files \ Tesseract-OCR" Ordner - auch unter Verwendung der 3.0 Training Exen im Schulungsordner gibt. Es machte keinen Unterschied, wo ich den Befehl ausgeführt habe - rate tesseract ignoriert das, wenn es eine Pfadvariable hat.

Ersetzt alle 3.0 exe- und Trainingsdateien in diesem Ordner. Dropped in den 2.0.4-Dateien und der Befehl extrahieren funktioniert !!! Ich sollte das Problem schneller für alle Arten von Gründen gelöst, aber ..

versuchen diese

http://www.win.tue.nl/~aeb/linux/ocr/tesseract.html

Verwandte Themen