Bitte versuchen, den Grund des folgenden read_csv Verhalten zu verstehen: Ich versuche, eine große Datei in Stücke zu lesenPandas read_csv seltsame Verhalten
c=1
for chunk in pd.read_csv(filename, chunksize=chunksize):
print 'chunk ', str(c), ' started'
....data normalization....
....saving the transformed data to file....
ich einen Fehler wie diese:
sys:1: DtypeWarning: Columns (...) have mixed types. Specify dtype option on import or set low_memory=False.
chunk 19 started
Traceback (most recent call last):
...
TypeError: unsupported operand type(s) for -: 'str' and 'float'
von dem Fehler kann ich sehen, dass aus irgendeinem Grund bei Chunk 19 Pandas die Float-Daten als String interpretiert, und kann nicht ausführen '-' Operation.
Allerdings, wenn ich 18 Brocken überspringe, und von Brocken 19 beginnt, geht es gut. Intuition sagt, es könnte ein Speicherproblem sein, aber ich würde gerne den Grund verstehen.
Haben Sie versucht, "dingoption angeben" anzugeben? –
z.B. 'dtype = {'Spalte1': np.float64, 'Spalte2: np.int32}' –