Wie ersetzt man eine Null-Wert-Zelle durch einen anderen Wert in Python-Datenrahmen?

Der Betrieb ist MYSQL Betrieb ähnlich:Wie ersetzt man eine Null-Wert-Zelle durch einen anderen Wert in Python-Datenrahmen?

UPDATE a.tract_201704 SET val_2000=0.91516427*val_2001 WHERE val_2001 IS NOT NULL AND val_2000 IS NULL.

ich eine df von vielen Spalten aufweisen, in der eine Spalte gibt es genannt val_2000, wenn dies einen Nullwert enthält, dann mit 0,91516427 Ich mag diesen Wert ersetzen * val_2001 (Skalarmultiplikation mit der nächsten Zelle).

-Code bisher: (val_2000 hat entweder 100 oder None)

df = pd.read_csv("singleDataFile_header.csv") 

    df_val2001_null = (df[df['val_2000'] != '100.000000000000']['val_2001']) 
    df_val2000_null = (df[df['val_2000'] != '100.000000000000']['val_2000']) 
    df_val2000_null = 0.91516427*df_val2001_null

Aber wie diese Werte von df_val2000_null original df zurück zu setzen überall dort, wo keine Werte in df sind [val_2000]?

Quelle

2017-04-20 Viv

können Sie combine_first verwenden:

df = pd.DataFrame({'val_2000':[np.nan,2,3], 
        'val_2001':[4,5,6]}) 

print (df) 
    val_2000 val_2001 
0  NaN   4 
1  2.0   5 
2  3.0   6 

df['val_2000'] = df['val_2000'].combine_first(0.91516427 * df['val_2001']) 
print (df) 
    val_2000 val_2001 
0 3.660657   4 
1 2.000000   5 
2 3.000000   6

EDIT:

Mögliches Problem ist nan Strings sind, nicht NaN oder in Daten sind einige ungültige Zeichenfolgen.

df = pd.DataFrame({'val_2000':['nan',100,'gggg'], 
        'val_2001':[1,1,1]}) 

print (df) 
    val_2000 val_2001 
0  nan   1 
1  100   1 
2  gggg   1 

df['val_2000'] = pd.to_numeric(df['val_2000'], errors='coerce') 
print (df) 
    val_2000 val_2001 
0  NaN   1 
1  100.0   1 
2  NaN   1 

df['val_2000'] = df['val_2000'].combine_first(0.91516427 * df['val_2001']) 
print (df) 
    val_2000 val_2001 
0 0.915164   1 
1 100.000000   1 
2 0.915164   1

Wenn nur nan:

df = pd.DataFrame({'val_2000':['nan',100,100], 
        'val_2001':[1,1,1]}) 

print (df) 
    val_2000 val_2001 
0  nan   1 
1  100   1 
2  100   1 

df['val_2000'] = df['val_2000'].astype(float) 
print (df) 
    val_2000 val_2001 
0  NaN   1 
1  100.0   1 
2  100.0   1

Quelle

2017-04-20 10:13:59 jezrael

df ['val_2000']. Update (0.91516427 * df ['val_2001']) kann es mit einer where-Klausel aktualisiert werden? – Viv

Es funktioniert nicht, besser ist combinate_first. – jezrael

combine_first bearbeitet val_2000 nur, wenn ein NULL/NONE-Wert vorhanden ist? – Viv

fillna ist das, was Sie suchen: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.fillna.html

df.loc[:, 'val_2000'] = df.val_2000.fillna(0.91516427 * df.val_2001)

Quelle

2017-04-20 10:04:19 Colin

Dies ist die Aktualisierung nicht die ursprüngliche df? Ich kann sie immer noch als leer sehen – Viv

Wie ersetzt man eine Null-Wert-Zelle durch einen anderen Wert in Python-Datenrahmen?

Antwort

Verwandte Themen