Ich habe eine Tab-getrennte Datei, die über 200 Millionen Zeilen hat. Was ist der schnellste Weg in Linux, um dies in eine CSV-Datei zu konvertieren? Diese Datei enthält mehrere Zeilen mit Kopfzeileninformationen, die ich im Laufe der Zeit entfernen muss, aber die Anzahl der Kopfzeilen ist bekannt. Ich habe Vorschläge für sed
und gawk
gesehen, aber ich frage mich, ob es eine "bevorzugte" Wahl gibt.schnellste Weg Tab-getrennte Datei in CSV in Linux konvertieren
Zur Klarstellung, es gibt keine eingebetteten Registerkarten in dieser Datei.
Für csv tsv und eingebettete Begrenzer Probleme finden Sie auch Antworten auf http://stackoverflow.com/questions/13475535/replace-every-comma-not-enclosed-in-a-pair-of-double -quotes-with (auch relevant: http://unix.stackexchange.com/questions/48672/remove-common-between-the-quotes-only-in-a-comma-delimited-file). –