Ich benutze Pandas 0.18. Ich habe einen Datenrahmen von CSV unter Verwendung pd.read_csv()
geladen, und es sieht so aus, als ob die leeren Zellen in CSV als NaN
im Datenrahmen geladen wurden.Wie nach NaN in String-Spalte in Pandas filtern?
Jetzt möchte ich die Anzahl der Zeilen mit einem leeren Wert in einer bestimmten Spalte finden, aber ich habe Probleme.
Das ist mein Datenrahmen:
ods id provider
0 A86016 NaN emis
1 L81042 463061 NaN
2 C84013 NaN tpp
3 G82228 462941 emis
4 C81083 NaN tpp
Dies ist, was ich von einem df.describe()
erhalten:
ods id provider
count 9897 7186 9022
unique 8066 192 4
top N83028 463090 emis
freq 7 169 4860
ich alle Zeilen erhalten möchten, wo provider
im CSV leer war. Dies ist, was ich versucht habe:
>>> print len(df[df.provider == 'NaN'])
0
>>> print len(df[df.provider == np.nan])
0
ich sehen kann, dass es dort einige NaN
Werte sind (zum Beispiel Zeile 1), so was gibt?
Warum konvertiert Pandas auch leere Werte in String-Spalten wie provider
zu NaN
- wäre es nicht sinnvoller, sie in eine leere Zeichenfolge zu konvertieren?
Dank! Nur noch eine Frage, weißt du, warum Pandas leere Strings als 'NaN' importieren anstatt leere Strings? – Richard