Ich arbeite an einem Datensatz, der eine große Menge an fehlenden Informationen enthält. Ich verstehe, dass ich FillNA verwenden könnte, aber ich möchte meine Updates auf den Binned-Werten einer anderen Spalte basieren.Pandas Update-Informationen basierend auf Bins/Schneiden
Auswahl der fehlenden Daten:
missing = train[train['field'].isnull()]
Ist die Daten (das funktioniert richtig):
filter_values = [0, 42, 63, 96, 118, 160]
labels = [1,2,3,4,5]
out = pd.cut(missing['field2'], bins = filter_values, labels=labels)
counts = pd.value_counts(out)
print(counts)
nun auf der Grundlage der Bin-Zuweisungen, würde Ich mag das korrekte Behälteretikett setzen, an die missing/train['field']
für alle Daten, die diesem Fach zugeordnet sind.
, die es ist. Danke vielmals. Pandas Ich bin so mächtig. – jcuypers
@jcuypers froh, ich könnte helfen! – piRSquared
schaute auf Ihr Profil. beeindruckend. wirklich :-) irgendwelche Tipps für Amateur-Daten und ML enthousiats (Ressourcen)? – jcuypers