Angenommen, wir haben eine df:Python-Pandas NA Ersetzen mit dem Median oder Mittelwert einer Gruppe in Datenrahmen
A B
apple 1.0
apple 2.0
apple NA
orange NA
orange 7.0
melon 14.0
melon NA
melon 15.0
melon 16.0
die NA ersetzen, können wir df verwenden [ "B"] fillna (df [. "B"]. Median()), aber es wird NA mit dem Median aller Daten in "B" füllen
Gibt es irgendeine Möglichkeit, dass wir den Median eines bestimmten A verwenden können, um die NA zu ersetzen (wie unten)):
A B
apple 1.0
apple 2.0
apple **1.5**
orange **7.0**
orange 7.0
melon 14.0
melon **15.0**
melon 15.0
melon 16.0
Danke!
warum R markiert? –
'mit (dd, ifelse (is.na (B), ave (B, A, FUN = Funktion (x) Median (x, na.rm = WAHR)), B))' – rawr
Diese Shell hat kein R Tag – hrbrmstr