2012-04-06 1 views
2

Ich habe iPhone App mit OCR-Scan-Funktion entwickelt. Mit Tesseract api, wurde der Text aus dem Bild genommen. Aber jetzt muss ich jeden Text in Bezug auf Name, Adresse, E-Mail, Telefonnummer etc. trennen. Da Visitenkarte Struktur/Format ist nicht spezifisch, es ist ein wenig schwierig zu vermuten.Visitenkarten-Parser. Wie man verwandte Informationen von den Visitenkarten anerkannten Texten extrahiert?

Allerdings nehmen einige Dinge 1) "@" mit String meist E-Mail-ID werden. 2) Alle Ziffern mit geschweiften Klammern oder + Zeichen werden meistens als Telefonnummer angezeigt. aber trotzdem gibt es viele und viele Möglichkeiten.

+0

Mit g8Tesseract, bekam den Text aus dem Bild. Aber wie kann ich jeden Textnamen, Adresse und Bezeichnung trennen? Welchen Prozess verfolgten sie für eine Camcard, eine Bizcamcard oder eine andere App, die im Appstore verfügbar sind? Ich habe viel für R & D versucht, aber keine Verwendung. –

Antwort

4

Sie benötigen die Hilfe von NSLInguisticTagger Klasse. Dies ist Ihre beste Wette, oder Sie müssen ähnliche Logik für jedes Teil wie oben angegeben erstellen.

+0

+1 für diese Klasse, auch heute habe ich etwas neues gelernt :) Schlecht für den Fragesteller ist es nur verfügbar von 5.0 – MrTJ

+0

ok, sieht aus wie ich eigene Logik zum Extrahieren von Informationen aus Visitenkarten-Text schreiben muss, aber gibt es irgendwelche Spezifikationen in Bezug auf Visitenkartenformat (RFC Art der Sache ...) ??? – Matrix

+0

Ich kenne keine bestimmten Visitenkartenformate, aber eine, die ich Ihnen raten kann, ist zu versuchen, QRCode-Scanner in Ihre App zu integrieren, da die meisten Karten in diesen Tagen QRCodes enthalten. –

Verwandte Themen