2010-12-16 7 views
2

Ich möchte die Ergebnisse vergleichen, die ich aus der dreimaligen Ausführung einer OCR auf demselben Dokument erhalte. Gibt es irgendwelche Tools, mit denen ich das erreichen kann?Multi-Entscheidungs-Engine zur Erhöhung der OCR-Genauigkeit

Ich möchte die drei Dokumente vergleichen und basierend auf welche Zeichen sind die gleichen 3/3 mal oder 2/3 mal, erstellen Sie ein viertes Dokument mit der Ausgabe dieser Entscheidung. Ich benutze den Abby Fine Reader, der mir großartige Ergebnisse gebracht hat, aber ich versuche alles zu tun, um 100% zu erreichen.

Ich weiß, Microsoft Word hat eine Funktion "Dokumente vergleichen", und ich würde gerne in der Lage sein, diese Art von Analyse in einem größeren Maßstab mit einem robusten Algorithmus zu tun.

irgendwelche Ideen?

Danke für Ihre Zeit!

Antwort

1

Wenn die Ausgabe eine einfache Textdatei ist, können Sie den Befehl bash diff und ein einfaches Shell-Skript verwenden, um sie zu vergleichen. Sie könnten dann wahrscheinlich ein etwas komplizierteres Shell-Skript verwenden, um die Ausgabedatei zu analysieren und ein endgültiges Dokument zu erstellen.

Verwandte Themen