2017-05-04 5 views
1

Ich arbeite an einem Datensatz, der eine große Menge an fehlenden Informationen enthält. Ich verstehe, dass ich FillNA verwenden könnte, aber ich möchte meine Updates auf den Binned-Werten einer anderen Spalte basieren.Pandas Update-Informationen basierend auf Bins/Schneiden

Auswahl der fehlenden Daten:

missing = train[train['field'].isnull()] 

Ist die Daten (das funktioniert richtig):

filter_values = [0, 42, 63, 96, 118, 160] 
labels = [1,2,3,4,5] 
out = pd.cut(missing['field2'], bins = filter_values, labels=labels) 
counts = pd.value_counts(out) 
print(counts) 

nun auf der Grundlage der Bin-Zuweisungen, würde Ich mag das korrekte Behälteretikett setzen, an die missing/train['field'] für alle Daten, die diesem Fach zugeordnet sind.

Antwort

1

IIUC:

Sie müssen nur fillna

train['field'] = train['field'].fillna(out) 
+0

, die es ist. Danke vielmals. Pandas Ich bin so mächtig. – jcuypers

+0

@jcuypers froh, ich könnte helfen! – piRSquared

+0

schaute auf Ihr Profil. beeindruckend. wirklich :-) irgendwelche Tipps für Amateur-Daten und ML enthousiats (Ressourcen)? – jcuypers

Verwandte Themen