2008-10-13 9 views
24

Gibt es Open-Source-OCR-Bibliotheken, die in .NET geschrieben sind oder in einer beliebigen Sprache geschrieben sind, aber in einer ASP.NET-Anwendung verwendet werden können?Open Source OCR

Antwort

1

Tesseract OCR wurde von HP und Open Source entwickelt, glaube ich. Ich bin mir nicht sicher, wie gut die Qualität ist.

3

Es gibt Tesseract und obwohl es keine nativen .net-Bindungen hat, ist es ziemlich komplett.

Die "one to watch" ist OCRopus - Eine Google-gesponserte Anstrengung, die noch nicht für die Produktionsarbeit bereit ist.

+1

OCROpus kann die Tesseract-Engine verwenden und führt einige Layout-Analysen und andere Bildvorverarbeitungen durch. – sventechie

2

Für was es wert ist, gibt es auch . Nicht versucht.

1

Wie die anderen schreiben Tesseract ist eine gute Open-Source-OCR-Implementierung.

Obwohl es gut ist, ist es nur eine OCR-Engine. Es macht keine Layout-Erkennung. Wenn Ihre Eingabe kein reiner Text ist, müssen Sie das Layout selbst herausfinden.