Wir haben zwei Arten von DateienWie finden Sie die Unterschiede in großen Textdateien?
einzige große Datei, die einige Datensätze mit einem Buchungscode hat - diese Dateigröße beträgt etwa 20 MB
AMMA-08/17/2017 00.02: 06-EZZE20170819010101
AMMA-08/17/2017 12: 02: 06-EZZE20170819020202
Sets von mehreren Dateien, die wie unten Aufzeichnungen haben - Diese Datei wird um 20K-30K Aufzeichnungen
000003 | EZZE20170819010101 | 16082017 | Hallo michael
000003 | EZZE20170819070707 | 16082017 | Hallo Jackson
Ich habe die unerreichte Datensätze in den separaten Dateien (EZZE20170819020202 und EZZE20170819070707) aufzulisten.
Dateien haben eine riesige Größe und ich muss jeden Datensatz aufteilen, um den CODE zu erhalten, der mit dem CODE in einer anderen Datei abgeglichen wird. Ich mache mir Sorgen über Leistung und CPU-Auslastung.
Gibt es eine Strategie oder eine vorhandene Bibliothek (in Java oder einer anderen Technologie), die ähnliche Funktionen bietet?
20 MB = riesig? Welches OS, wie viel RAM und welche CPU hast du, um die du dir Sorgen machst? Habe gerade versucht, es einfach umzusetzen? –
Askig für Bibliotheken ist off-topic. –
haben Sie Regex versucht? – techprat