0
Ich habe eine 3 GB-Datei und pd.read_csv(...)
stürzt mein ipython Notebook so stattdessen habe ich geschrieben (stillos)Wie liest man den ersten Chunk in einem großen Datenrahmen?
df = pd.read_csv("train.csv", chunksize=10**6)
for chunk in df:
print chunk
break
Was ist richtig? Ich möchte nur die ersten Millionen Zeilen sehen.
Was meinst du? Sie benötigen alle 3 Zeilen, um die ersten Millionen Zeilen zu sehen. In der Tat würde ich Ihnen raten, kleinere Stücke zu lesen, weil Disk IO im Allgemeinen langsamer ist als CPU. – Kartik