2016-09-07 3 views
2

Ich habe einen DatenrahmenFill NaN-Werte

TIMESTAMP P_ACT_KW PERIODE_TARIF P_SOUSCR 
2016-01-01 00:00:00 116 HC 250 
2016-01-01 00:10:00 121 HC 250 
2016-01-01 00:20:00 121 NaN 250 

dieses Datenrahmen zu verwenden, muss ich die NaN-Werte von (HC oder HP) unter dieser Bedingung basiert füllen:

If (hour extracted from TIMESTAMP is in {0,1,2, 3, 4, 5, 22, 23} 

Also ich ersetzen NaN von HC, sonst von HP. Ich habe diese Funktion:

def prep_data(data): 
    data['PERIODE_TARIF']=np.where(data['PERIODE_TARIF']in (0, 1,2, 3, 4, 5, 22, 23),'HC','HP') 
    return data 

Aber ich bekomme diese Fehlermeldung:

ValueError        Traceback (most recent call last) 
<ipython-input-23-c1fb7e3d7b82> in <module>() 
----> 1 prep_data(df_energy2) 

<ipython-input-22-04bd325f91cd> in prep_data(data) 
     1 # Nettoyage des données 
     2 def prep_data(data): 
----> 3  data['PERIODE_TARIF']=np.where(data['PERIODE_TARIF']in (0, 1),'HC','HP') 
     4  return data 

C:\Users\Demonstrator\Anaconda3\lib\site-packages\pandas\core\generic.py 
in __nonzero__(self) 
    890   raise ValueError("The truth value of a {0} is ambiguous. " 
    891       "Use a.empty, a.bool(), a.item(), a.any() or a.all()." 
--> 892       .format(self.__class__.__name__)) 
    893 
    894  __bool__ = __nonzero__ 

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all(). 

Wie kann ich dieses Problem beheben?

Antwort

2

Verwendung isin für die Mitgliedschaft testen:

data['PERIODE_TARIF']=np.where(data['PERIODE_TARIF'].isin([0, 1,2, 3, 4, 5, 22, 23]),'HC','HP') 

in nicht verstehen, wie ein Array von Boolesche Werte zu bewerten, da sie nicht eindeutig wird, wenn Sie mehr als 1 True im Array haben daher den Fehler

+0

Danke, ein weiterer Fehler: TypeError: 'Methode' Objekt ist nicht unterscheidbar – Poisson

+1

Sorry fehlt '()' um den arg, siehe Update – EdChum

+0

Ok, danke, es funktioniert :) – Poisson