Ich habe eine große CSV-Datei mit 4 Feldern für jede Zeile in diesem Format (ID1, ID2, score, Elem) Sortierung:csv-Datei der Merging Linie mit denselben Anfang Feldern und sie durch ihre Länge
HALLO, WORLD, 2323 elem1
GOODBYE, BLUESKY, 3232, elem2
hALLO, Welt, 421, elem3
GOODBYE, BLUESKY, 41134, elem4
ETC ...
Ich mag jede Zeile fusionieren, die die gleichen ID1, ID2 Felder auf der gleiche Linie die Partitur Feld eliminiert hat, was zu:
hallo, Welt, elem1, elem3 .....
GOODBYE, BLUESKY, elem2, elem4 .....
ETC ...
wo jedes Elem aus einer anderen Linie kam mit dem gleichen ID1, ID2. Danach möchte ich die Zeilen auf der Grundlage ihrer Länge sortieren.
Ich habe versucht, Codierung in Java zu tun, ist aber superlow. Ich habe online über AWK gelesen, aber ich kann nicht wirklich eine gute Stelle finden, wo ich seine Syntax für CSV-Dateien verstehen kann. Ich habe diesen Befehl verwendet, wie kann ich ihn an meine Bedürfnisse anpassen?
Ändern Sie "$ 2" zu "$ 4" und das sollte es tun. – jas
Ich möchte auch das zweite Feld abgleichen, welches ist die Syntax für eine zusätzliche Bedingung wie a [$ 1] = a [$ 1]? – Aalto