Ich konnte aus der GNU page of GAWK verstehen, dass es Trennzeichen in Daten mit der FPAT
Variable umgehen kann, aber ich kann nicht durch, wie dies funktioniert. Für eine CSV die FPAT Wert Datei ist:awk FPAT Variable: Arbeiten
FPAT = "([^,]+)|(\"[^\"]+\")"
unter Verwendung der Daten:
abc,"pqr,mno"
Der erste gruppiert Ausdruck dh alles wertet kein Komma, das dann "abc"
als Daten nehmen sollte für die erste scheitern Vorkommen von Komma. Jetzt ist meine Frage, was als nächstes passiert? Wenn der erste gruppierte Ausdruck fehlgeschlagen ist, wird die Regexp mit dem Zeichen oder nach dem Komma fortgesetzt. aber der erste gruppierte Ausdruck ist weiterhin gültig für alle Daten nach dem Komma, so dass es "pqr
als nächste Daten benötigen könnte?
Meine Frage ist, warum würde die Regexp mit dem zweiten Muster beginnen bei ", es kann immer für [^,] gehen, da die Daten nicht Komma. Wie regexp ist gierig es wird nur nach dem ersten Spiel suchen, richtig? Oder geht es am längsten? – ghub24
Danke sudo_O, sehr geschätzt. – ghub24
@ user1844303 es wird am längsten gehen. Ein einfacher Test ist es, die Reihenfolge der 2 regulären Ausdrücke zu wechseln. –