1

Ich möchte die gesamte Rechnung aus Bildbelegen extrahieren. Ich könnte die gesamten im Bild vorhandenen Daten extrahieren, aber jetzt stößt ich auf das Problem, nur die Informationen zu extrahieren, die ich brauche.ADHoc Information Retrieval

Dies ist das Bild, das ich habe.

enter image description here

Ich bin Einfügen der extrahierten Informationen aus dem Bild

m cm lnnk 3mm: :33; no 1 z m 
x Visut all! ms“; (or nulnunn mfn an an: nan. 



Sub Iota] 19.56 
TOTAL 19.56 
VISA 1956 
Fun 19.56 
D!!! You Know 0 



For ureat-tastlru dessens under 200 
cahries, try our Triple Berry Frozen 
Yogurt Sunda: a dish of Frozen Yogurt. 
or a Vanma rozen Vugurt Done. 

Aus diesen Daten Ich möchte nur die gesamte Rechnung extrahieren. Um das herauszufinden, habe ich herausgefunden, dass ich Ad-hoc-Normalisierung (Adhoc-Abruf) verwenden kann. Kann jemand Einblicke in die Adhoc-Recherche geben? Wenn es andere Möglichkeiten gibt, die Daten aus dem Bild zu extrahieren, lassen Sie es mich bitte tun. Ich verwende Tesseract, um diese Informationen zu extrahieren. Manchmal gibt es keine korrekte Ausgabe. Ich könnte etwas Hilfe bei der Improvisation der Ergebnisse des Tesserakts gebrauchen.

+0

Können Sie ein wenig mehr Informationen hinzufügen? Ist der gewünschte Ausgang "19.56"? Muss dies auf mehreren Rechnungen laufen? – shiri

Antwort

0

Warum benötigen Sie in diesem Fall Ad-hoc-Abfrage? Da Sie das OCR-Ergebnis aus dem Beleg erhalten, können Sie einfach eine normale Textsuche für das Element ausführen, das neben "TOTAL" angezeigt wird.

Es gibt Algorithmen für die Suche nach Bildtexten, aber dies erscheint für eine so einfache Anwendung wie Overkill, es sei denn, es gibt einen guten Grund, dies zu tun.