Ich habe einige Bundes-pdf-Formulare mit gefüllten Daten init. Sagen wir zum Beispiel i765 und ich habe die Daten dieses Formulars in einem Textformat, mit ordnungsgemäß ausgefüllten Details. Wie kann ich die Daten aus diesem Formular mit minimalem Parsing extrahieren? Sagen wir mal, wie kann man ein Skript schreiben, das "Unterschied" identifiziert, was an sich nichts anderes ist als die gefüllte Information.Was ist der beste Weg, um gefüllte Daten aus einem statischen Formular zu extrahieren?
Für zB: Wenn eine Zeile enthält ..
SSN: (Leerzeichen) und die in Form gefüllt tatsächlich hat SSN: ABC @ # 456
so das ausgefüllte Information ist nichts anderes als ABC! @ # 456 was nur ein Unterschied zwischen den Strings ist. Gibt es einen bekannten Ansatz, dem ich folgen kann? Alle Hinweise werden sehr geschätzt.
Wenn Sie Textversionen sowohl Quaders haben und form ausgefüllt, versuchen Sie dies in einer Shell aus: 'diff BlankFile.txt FileWithData .txt'. Gibt das, was Sie brauchen? Wenn ja, schreiben Sie ein Scala-Programm, das über die zwei Textdateien iteriert und die Daten vergleicht. Wenn Sie Schwierigkeiten haben, zeigen Sie Ihre Arbeit hier und wir werden Ihnen helfen. – radumanolescu