Nach CSV-Datei zu lesen mit:Wie man Daten von Datenrahmen entfernen dauerhaft
import pandas as pd
df = pd.read_csv('data.csv')
print df.shape
bekomme ich 99 Zeilen Datenrahmen (Indizes) lang:
(99, 2)
Um Dataframe Bereinigung ich voran gehen und gelten dropna() Methode, die es auf 33 Zeilen reduziert:
df = df.dropna()
print df.shape
welche druckt:
Jetzt(33, 2)
, wenn ich die Spalten iterieren druckt es aus alle 99 Zeilen, wie sie nicht fallen gelassen wurden:
for index, value in df['column1'].iteritems():
print index
was das gibt mir:
0
1
2
.
.
.
97
98
99
Es scheint, die dropna()
einfach gemacht die Daten "versteckt". Diese ausgeblendeten Daten werden zurückgegeben, wenn ich DataFrame iteriere. Wie kann sichergestellt werden, dass die gelöschten Daten aus Dataframe entfernt werden, anstatt nur versteckt zu werden?
Es ist die Indexzeilenbeschriftungen beibehalten, wenn Sie die in zurücksetzen möchten Dann rufen Sie 'reset_index' auf, Sie werden feststellen, dass Ihr Index einige Zeilenwerte nach' dropna' nicht enthält. – EdChum
Sie rocken! Danke für den Tipp! – alphanumeric
Bitte posten Sie es als Antwort, damit wir es bewerten können. – alphanumeric