Bildregistrierungsalgorithmen/Techniken zur Extraktion von Feldern aus gescannten Dokumenten?

enter image description here Ich versuche, die beste Methode zum extrahieren von handschriftlichen Daten aus einem gescannten Dokument zu ermitteln.Bildregistrierungsalgorithmen/Techniken zur Extraktion von Feldern aus gescannten Dokumenten?

Die handschriftlichen Daten befinden sich in bestimmten umrandeten Bereichen. Ich habe die digitale Version des Dokuments erstellt, und daher kenne ich sowohl die Koordinaten der eingerahmten Bereiche als auch gegebenenfalls zusätzliche Varianten des Dokuments (dh eine Version, die maskiert ist, damit die Felder leichter extrahiert werden können).

Der Grund, warum ich die Felder nicht einfach mit den Koordinaten aus der Dokumentengenerierung extrahieren kann, ist, dass während des Scanvorgangs Verschiebungs-/Skalierungs-/Perspektivänderungen stattfinden, die die Koordinaten für jeden verschieben können einzelne Box anders (das gescannte Dokument hat Eckmarkierungen für die Ausrichtung verwendet, aber auch so häufig unbeabsichtigte Transformationen stattfinden).

Ich nehme an, es gibt zwei Möglichkeiten, dieses Problem zu lösen: Schritt durch die Koordinaten der einzelnen Felder auf der Seite und versuchen, sie mit einer Technik/Algorithmus "zu korrigieren" oder ein ausgefülltes Formular mit einem Leerzeichen zu vergleichen Form (maskiert?) und versuche, die richtigen Felder auf diese Weise zu extrahieren.

Was ist die effizienteste Technik/Algorithmus, um diese Änderungen anzupassen und die Bereiche, die Handschrift enthalten, genau zu extrahieren? Gibt es andere Möglichkeiten?

Quelle

2013-02-12 HipHop-opatamus

Wenn Ihre Box von Linien umgeben ist, können Sie sie leicht durch Korrelation oder auf andere Weise finden (Hough-Transformation usw.). Übrigens, wenn das Bild rotiert werden kann, liefert die Korrelation schlechte Ergebnisse, aber Hough-Transformationen werden Ihnen helfen, den Rotationswinkel zu bestimmen (weil die Hauptlinien in Dokumenten Horizontale und Vertikale sind). Nach der Rotationskorrektur können Sie eine einfache Korrelation mit Etalon finden, um Offset-Koordinaten zu finden. –

Ohne die Form zu sehen, würde ich nur raten. Mein letztes Projekt identifizierte Muster von Punkten. Was praktisch ist Punkte, ist ein Punkt ist ein Punkt, egal, welche Drehung es sitzt. Die Muster von Punkten können Orientierungspunkte bilden, die die Software als Rotationsursprungspunkt verwenden kann. Wenn ein Ursprungspunkt und -winkel bekannt ist, können Regionen leicht extrahiert werden. Das Muster von Punkten kann auch eine Auflösung anzeigen. Ich bin verwirrt, warum Eckpunkte nur bis zu 5 Grad erreichen können. Weit auseinander liegende Marken sollten viel besser sein. –

Durch das Posten einiger Bilder Ihrer Formulare können Sie eine Lösung finden. –

Es gibt viele mögliche techniques, die fast 100% Genauigkeit für Ihr Problem erreichen können.

Folgen Sie einfach den auf dieser Seite beschriebenen Schritten http://www.codeproject.com/Articles/24809/Image-Alignment-Algorithms. Kurz gesagt, Sie berechnen zunächst den optischen Fluss zwischen zwei Bildern und schätzen dann die Transformation, die einen solchen optischen Fluss erzeugt.

Hinweis: Dieser Ansatz funktioniert am besten, wenn übereinstimmende Bilder fast identisch sind.

Quelle

2015-04-02 01:43:48

Bildregistrierungsalgorithmen/Techniken zur Extraktion von Feldern aus gescannten Dokumenten?

Antwort

Verwandte Themen