Ich habe sehr große .csv-Datei, es ist um ein paar GB, ich möchte die ersten paar tausend Zeilen davon lesen. Gibt es eine Methode, dies zu tun?Wie liest man die ersten 1000 Zeilen der .csv-Datei in R?
Antwort
Verwenden Sie das nrows
Argument in read.csv(...)
df <- read.csv(file="my.large.file.csv",nrows=2000)
Es gibt auch einen skip=
Parameter, die read.csv(...)
, wie viele Zeilen erzählt zu überspringen, bevor Sie anfangen zu lesen.
Wenn Ihre Datei so groß ist, können Sie besser die Datei fread(...)
im data.table-Paket verwenden. Die gleichen Argumente.
Überspringen ist nicht sehr hilfreich, wenn die erste Zeile die Zeile der Spaltennamen ist. –
@MatthewLundberg In diesem Fall kann man die erste Zeile mit n = 1 scannen(), dann 'read.csv' mit' skip = 'verwenden und danach die Spaltennamen hinzufügen. –
Wenn Sie unter UNIX oder OS/X sind, können Sie die Befehlszeile verwenden:
head -n 1000 myfile.csv > myfile.head.csv
Dann einfach es in R wie normale lesen.
- 1. Ruby - wie man die ersten n Zeilen aus der Datei in das Array liest
- 2. Wie man die letzten "n" Zeilen der Log-Datei liest
- 3. Wie man Zeilen in Java separat liest
- 4. Wie liest man die Bildschirmpixel?
- 5. Wie liest man eine Teilmenge eines großen Datensatzes in R?
- 6. Wie liest man CSV-Dateien in Matlab wie in R?
- 7. Wie man die ersten n Zeilen in einer Datei verbindet
- 8. Wie liest man die Beizdatei?
- 9. Wie liest man Zeilen von Blöcken in Kabeja?
- 10. Wie liest man die Assemblyversion von assemblyInfo.cs?
- 11. Wie liest man CRU (Climatic Research Unit) in R-Software?
- 12. Wie liest man mehrere .txt-Dateien in R?
- 13. Wie man die Klassifikationsmatrix in WEKA liest
- 14. Wie erhalten Sie die ersten Zeilen in einem R-Datenrahmen, die eine bestimmte Bedingung erfüllen?
- 15. Wie liest man die web.config Einstellungen in der .html Seite?
- 16. Gibt es eine Möglichkeit, die ersten 1000 Zeilen eines Spark Dataframe zu erstellen?
- 17. Wie liest man die composer.lock-Datei?
- 18. In Scala, wie liest man eine einfache CSV-Datei mit einem Header in der ersten Zeile?
- 19. Wie überspringe ich die ersten n Zeilen in SQL-Abfrage
- 20. Wie liest man die letzten n Zeilen aus einer Datei in C
- 21. R wie man Datenspalte in Zeilen mit ersten und zweiten Werten bekommt
- 22. R-Programmierung: Wie ersetzt man die Werte nach Zeilen?
- 23. R - Wie man Zeilen nach Zeilenindex umschaltet
- 24. Wie liest man Daten von Cassandra mit R?
- 25. Wie liest man Zeilen aus mehreren Dateien mit bash?
- 26. Wie liest man Spalten und Zeilen mit C#?
- 27. Wie liest man CPAN Changelogs?
- 28. Wie liest man XMI?
- 29. Pyplot: zeige nur die ersten 3 Zeilen in der Legende
- 30. FastMM4, wie liest man die Protokolldatei?
http://stackoverflow.com/questions/3094866/trimming-a-huge-3-5-gb-csv-file-to-read-into-r?rq=1 –
Ich kam zu dieser Frage wiederholt, wenn schauen, wie man das gleiche Problem löst. Ich würde gerne Lösungen in readr lesen.csv etc. Und von der Anzahl der Treffer, upvotes und Favoriten denke, es wäre sinnvoll, die Frage erneut zu öffnen? – pluke