2016-07-04 7 views
0

Ich versuche, eine Spalte eines großen Datenrahmens mit ein paar Nan/Inf-Werte in einer der Spalten zu unterteilen.Wie Subset Nan/Inf-Werte in Dato SFrames

Ich habe zum Beispiel so etwas versucht.

df = df[df['a'] == 'NaN'] 

Oder

df = df[df['a'] == 'Inf'] 

Wie verweisen ich diese Art von Werten innerhalb einer Spalte?

Antwort

0

NaN ein spezieller Wert ist. Es ist nichts, nicht einmal selbst. Hier ist eine Möglichkeit von NaN zu filtern:

import math 
df = df[df['a'].apply(lambda x: math.isnan(x))] 

Inf ist ein wenig einfacher:

df = df[df['a'] == float('inf')] 
0

Sie wissen, dass es ein Wörterbuch ist, so dass Sie nicht Verständnis verwenden können, aber Sie können iterieren:

subset = {} 

for d in df: 
    if d['a']=='Nan': 
     subset.update(d) 

print subset