Sie die index
aus dem Ergebnis der sort_values
zum Indizieren der Gruppe verwenden können:
In [118]:
df = pd.DataFrame(np.random.randn(5,3), columns=list('abc'))
df['group'] = list('aabcc')
df
Out[118]:
a b c group
0 3.260645 -0.636861 0.183312 a
1 -0.409939 1.915902 -2.426166 a
2 -0.522152 1.621288 0.225874 b
3 0.576484 0.499148 -1.037899 c
4 0.626081 0.040262 -1.679669 c
In [128]:
gp = df.groupby('group')['a'].median()
gp
Out[128]:
group
a 1.425353
b -0.522152
c 0.601282
Name: a, dtype: float64
In [134]:
order = gp.sort_values(ascending=False)
order
Out[134]:
group
a 1.425353
c 0.601282
b -0.522152
Name: a, dtype: float64
In [135]:
gp[order.index]
Out[135]:
group
a 1.425353
c 0.601282
b -0.522152
Name: a, dtype: float64
EDIT
Wenn Sie die Sortierreihenfolge auf mittlere Basis verwenden möchten, können Sie die mittlere Spalte hinzufügen zurück zum ursprünglichen df unter Verwendung transform
und sortieren dann das ursprüngliche df:
In [7]:
df['median'] = df.groupby('group')['a'].transform('median')
df
Out[7]:
a b c group median
0 3.260645 -0.636861 0.183312 a 1.425353
1 -0.409939 1.915902 -2.426166 a 1.425353
2 -0.522152 1.621288 0.225874 b -0.522152
3 0.576484 0.499148 -1.037899 c 0.601282
4 0.626081 0.040262 -1.679669 c 0.601282
In [9]:
df.loc[df['median'].sort_values(ascending=False).index]
Out[9]:
a b c group median
1 -0.409939 1.915902 -2.426166 a 1.425353
0 3.260645 -0.636861 0.183312 a 1.425353
4 0.626081 0.040262 -1.679669 c 0.601282
3 0.576484 0.499148 -1.037899 c 0.601282
2 -0.522152 1.621288 0.225874 b -0.522152
Gruppen sind Alpha standardmäßig sortiert. Sie können wählen, nicht wie 'df.groupby (' A ', sort = False) 'zu sortieren, was zu einer etwas besseren Leistung führt. – Alexander
Und es gibt keine Möglichkeit, Gruppen anders zu sortieren? Ich bereite hier einen Boxplot vor, also möchte ich eine Gruppe pro Box haben und trotzdem möchte ich die Position der Boxen auf der x-Achse ändern (genau, ich möchte sie nach 'Wichtigkeit' sortieren, was in dieser Spalte B angegeben ist) – brina
Das bedeutet, dass Sie nach Werten sortieren, wie von @EdChum unten gezeigt. – Alexander