Wie OCR eine Tiff-Datei mit Tesseract-Schnittstelle in C#?
Derzeit weiß ich nur, wie man es mit der ausführbaren Datei macht.OCR mit der Tesseract-Schnittstelle
Antwort
Der Quellcode schien auf eine ausführbare Datei ausgerichtet zu sein, Sie müssen möglicherweise ein paar Sachen neu verdrahten, damit es stattdessen als DLL erstellt wird. Ich habe nicht viel Erfahrung mit Visual C++, aber ich denke, es sollte nicht zu schwer mit etwas Forschung sein. Meine Vermutung ist, dass jemand bereits eine Bibliotheksversion erstellt haben könnte, Sie sollten Google ausprobieren.
Sobald Sie Tesseract-OCR-Code in einer DLL-Datei haben, können Sie die Datei dann über Visual Studio in Ihr C# -Projekt importieren und Wrapper-Klassen erstellen und alle Marshalling-Tools für Sie ausführen. Wenn Sie nicht importieren können, können Sie DllImport die Funktionen in der DLL von C# -Code aufrufen.
Dann können Sie sich die ursprüngliche ausführbare Datei ansehen, um Hinweise darauf zu finden, welche Funktionen aufgerufen werden, um ein TIFF-Bild korrekt zu adressieren.
Werfen Sie einen Blick auf tessnet
Dies ist besser als P/Aufruf selbst. –
+1 - Funktioniert ziemlich gut und Sie vergessen DllImports –
Haftungsausschluss: Ich arbeite für Atalasoft
Unsere OCR module supports Tesseract und wenn das gut genug, um nicht beweist, können Sie zu einem besseren Motor-Upgrade und nur eine Zeile Code ändern (Wir bieten eine gemeinsame Schnittstelle für mehrere OCR-Engines).
C# Programm startet tesseract.exe und liest dann die Ausgabedatei von tesseract.exe.
Process process = Process.Start("tesseract.exe", "out");
process.WaitForExit();
if (process.ExitCode == 0)
{
string content = File.ReadAllText("out.txt");
}
entdeckte ich heute, dass EMGU jetzt eine Tesseract Wrapper enthält. Während die Anzahl der nicht verwalteten dlls der opencv-lib etwas abschreckend wirken mag, ist es nichts, was eine schnelle Kopie in Ihrem Ausgabeverzeichnis nicht behebt. Von dort ist der eigentliche OCR-Prozess so einfach wie drei Zeilen:
Tesseract ocr = new Tesseract(Path.Combine(Environment.CurrentDirectory, "tessdata"), "eng", Tesseract.OcrEngineMode.OEM_TESSERACT_ONLY);
this.ocr.Recognize(clip);
optOCR.Text = this.ocr.GetText();
„robomatics“ zusammen a very nice youtube video, die eine einfache, aber effektive Lösung demonstriert.
- 1. Bild schärfen mit OpenCV OCR
- 2. PDF-Text-Extraktionsverfahren mit OCR
- 3. Android OCR App Tesseract mit
- 4. chinesische Zeichenerkennung mit Tesseract OCR
- 5. OCR für bekannte Schriftart
- 6. Zwischenablage Bild OCR MODI.Document
- 7. OCR für Noten
- 8. Tesseract OCR Deutsche Sonderzeichen
- 9. Tesseract-OCR-Benutzermuster
- 10. Java - Text-Extraktion aus PDF mit OCR
- 11. OCR nicht Telefonnummern mit dem Zeichen erkennen (-)
- 12. Tesseract OCR-Ergebnisse mit unscharfem Text verbessern
- 13. Tokenizing ungeteilter Wörter aus OCR mit NLTK
- 14. Tesseract OCR Ausgabewert
- 15. Bildverarbeitung/Superlicht OCR
- 16. Bildverarbeitung für OCR mit Leptonica (inverser Farbtext)
- 17. Wie Tesseract OCR mit Cordova/Phonegap app
- 18. Java OCR Programm mit tesseract in Windows
- 19. ocr und Bildvorverarbeitungstechniken
- 20. 7-Segment-OCR mit Google Cloud Vision
- 21. Spracherkennung mit Tesseract oder abby ocr
- 22. Open Source OCR
- 23. Java OCR-Implementierung
- 24. Reduzieren OCR android App Größe
- 25. OCR-Engines für die Bildschirmlesung
- 26. Microsoft ocr Computer Vision api
- 27. Training Tesseract OCR für Mehrdeutigkeiten
- 28. Tesseract 3 (OCR) - .NET Wrapper
- 29. Pass Bild zu Tesseract.js OCR
- 30. Real Time Image Processing (OCR)
können Sie mir bitte zeigen, wie Sie Tesseract in C# verwenden konnten? – mouthpiec
beliebiger Beispielcode? – Kiquenet