2016-12-18 24 views
1

Ich habe eine sehr große .csv-Datei, die 10 Millionen Zeilen Daten enthält. Die Dateigröße beträgt ca. 250 MB. Jede Zeile enthält drei Werte und sieht wie folgt aus:Wie lösche ich jede X-Zeile einer sehr großen Datendatei?

-9.8199980e-03183, -4,32

ich jede zweite Zeile löschen wollen oder z kopiere jede 10. Zeile direkt in eine neue Datei. Welches Programm soll ich verwenden und können Sie den Code auch posten?

Ich habe es mit Scilab und Excel versucht; Sie konnten die Datei oder nur einen kleinen Teil davon nicht öffnen. Ich kann die Datei in Notepad ++ öffnen, aber wenn ich versuchte, ein Makro aufzuzeichnen und auszuführen, das jede zweite Zeile löscht, stürzte es ab.

+0

Welche Betriebssystem verwenden Sie? – 2ps

Antwort

2

Ich würde Ihnen empfehlen, gawk/awk von here installieren und nutzen Sie die Kraft dieses brillante Werkzeug.

Wenn Sie jede zweite Zeile wollen:

gawk "NR%2" original.csv > new.csv 

Wenn Sie jede 10. Zeile wollen:

gawk 'NR%10==0" original.csv > new.csv 
Verwandte Themen