Ich bin auf der Suche nach automatisierten Dateneingabe von vordefinierten Formen, die von Hand ausgefüllt wurden. Die Zeichen sind nicht getrennt, aber die Felder können durch darunter liegende Zeilen oder als Teil einer Tabelle identifiziert werden. Ich weiß, dass handschriftliche OCR immer noch ein Bereich der aktiven Forschung ist, und ich kann eine Operatorüberprüfungsfunktion einschließen, also erwarte ich keine Genauigkeit über 90%.Dateneingabe Automatisierung durch Feldidentifikation und optische Zeichenerkennung (OCR) für Handschrift auf vordefinierten Formularen
Die erste Lösung, an die ich gedacht habe, ist eine Kombination aus OpenCV zur Feldidentifikation (http://answers.opencv.org/question/63847/how-to-extract-tables-from-an-image/) und Tesseract zum Erkennen der Handschrift (https://github.com/openpaperwork/pyocr).
Eine andere möglicherweise einfachere und wirksamere Methode zur Feldidentifikation mit einer vordefinierten Form wäre es, das leere Formular von der ausgefüllten Form zu subtrahieren. Da die Formulare gescannt würden, würde dies wahrscheinlich eine gewisse Positionstoleranz, Rauschreduzierung und Merkmalerkennung erfordern.
Alle Vorschläge oder Kommentare würden sehr geschätzt werden.
können Sie einen Blick auf https://StackOverflow.com/Questions/33452222/detect-table-with-opencv/46806306#46806306 werfen, um eine allgemeine Annäherung zu bekommen – flamelite