2016-09-18 6 views
0

Ich habe bereits X = X.fillna(X.mean()) verwendet, um die NaN 's zu füllen. Aber ich bekomme immer noch einen FehlerPython/Pandas: Wie fülle ich Leerzeichen innerhalb meines Datenrahmens aus?

"ValueError: Found arrays with inconsistent numbers of samples: [ 7 210]"

wenn ich versuche mein train_test_split.

Ich schaute auf meine X df und es scheint, dass noch Werte fehlen (Leerzeichen).

Wie fülle ich diese Leerzeichen beispielsweise mit dem Mittelwert dieser Spalte?

Antwort

0

Sie können so etwas wie dieses Beispiel:

df = pd.DataFrame({'A': [1,2,3,4,5], 'B': [6,7,8,np.nan,10]}) 
    A  B 
0 1 6.0 
1 2 7.0 
2 3 8.0 
3 4 NaN 
4 5 10.0 

print(df.B.fillna(df['B'].mean())) 
0  6.00 
1  7.00 
2  8.00 
3  7.75 
4 10.00 
Name: B, dtype: float64 
Verwandte Themen