Ich habe Daten in einer CSV-Spalte, die manchmal Kommas und Zeilenumbrüche enthält. Wenn in meinen Daten ein Komma vorhanden ist, habe ich die gesamte Zeichenfolge in doppelte Anführungszeichen eingeschlossen. Wie würde ich die Ausgabe dieser Spalte in eine TXT-Datei analysieren, wobei die Zeilenumbrüche und Kommas berücksichtigt werden.Awk, um CSV-Spalte mit Kommas und Zeilenumbrüchen zu erhalten
Beispieldaten, die nicht mit meinem Befehl funktioniert:
,"This is some text with a , in it.", #data with commas are enclosed in double quotes
,line 1 of data
line 2 of data, #data with a couple of newlines
,"Data that may a have , in it and
also be on a newline as well.",
Hier ist, was ich bisher:
awk -F "\"*,\"*" '{print $4}' file.csv > column_output.txt
Können Sie doppelte Anführungszeichen in Ihrem Feld mit doppelten Anführungszeichen abgefangen haben, und wenn ja, wie werden sie gemerkt, z. '" foo \ "bar" 'oder' "foo" "bar" 'oder etwas anderes? –