2013-03-27 21 views
15

Ich plane eine App wie Word Lens zu entwickeln. Kann jemand eine gute Bibliothek vorschlagen, die ich benutzen kann? oder irgendeine Technologie hinter der Word Lens App erklären? ist es die Bildanpassung der Rollenzeit oder OCR? Ich kenne einige Bildverarbeitungs-Bibliothek wie OpenCV, Tesseract ... Jede Hilfe wird sehr geschätzt ...Real Time Image Processing (OCR)

Antwort

42

Ich bin einer der Schöpfer von Word Lens. Obwohl es dort einige OCR-Bibliotheken gibt (wie Tesseract), haben wir uns entschieden, unsere eigenen zu erstellen, um bessere Ergebnisse und Leistungen zu erzielen. Unsere allgemeinen Algorithmus geht so:

  1. Kopie des Bildes von der Kamera und erhalten ihre Graustufenkomponente
  2. nivellieren das Bild, so der Text heraus hebt sich deutlich vor dem Hintergrund
  3. Draw-Boxen um Dinge, die aussehen Zeichen & Sätze
  4. OCR: passen Sie die Pixel in jeder Box gegen eine Datenbank von Zeichen - das ist eigentlich ziemlich hart!
  5. sammeln die Zeichen in Worte zu fassen, in einem Wörterbuch nachschlagen (diese zu hart ist, da wird es Fehler in der OCR sein)
  6. die Ergebnisse auf das Bild
passende

Bild ziehen zurück von selbst nicht gut genug, wegen der großen Vielfalt an Schriftarten, Wörtern und Sprachen.

OpenCV ist eine großartige Bibliothek, um mit der Computer Vision im Allgemeinen zu beginnen und zu lernen. Ich würde empfehlen, ihre Beispiele aufzubauen und dort herumzuspielen. Habe Spaß!

+0

Würdest du bessere Ergebnisse erzielen, wenn du 4 und 5 kombinierst? Als ein Außenseiter für OCR scheint es mir, dass Sie Informationen durch "5" verloren haben, die in schwierigen Fällen nützlich sein könnten. –

+1

martin: ganz richtig; zB ist ein 'O' sehr ähnlich wie eine '0', oder sogar eine '8' und ein 'B', also hilft es, Listen von Möglichkeiten zu behalten und sie dann in den folgenden Stufen zu reduzieren, wenn mehr disambiguierende Information verfügbar ist (eine einfache Art von Feedback) –

+0

@jd. Vielen Dank für Ihren Kommentar. Darf ich wissen, wie lange es dauerte, bis Sie Word Lens erstellt haben? Würden Sie bitte gute Tutorials für OCR vorschlagen? –