Stellen Sie sich vor, ich habe eine DataFrame
mit Spalten, die nur echte Werte enthalten.Groupby angegebenen Perzentilen der Werte der gewählten DataFrame-Spalte
>> df
col1 col2 col3
0 0.907609 82 4.207991
1 3.743659 1523 6.488842
2 2.358696 324 5.092592
3 0.006793 0 0.000000
4 19.319746 11969 7.405685
I zu gruppierenden durch Quartile (oder jede andere von mir genannte Perzentile) der ausgewählten Spalte (z.B. col1
), einige Operationen an diesen Gruppen durchzuführen. Im Idealfall würde Ich mag, wie etwas zu tun ist:
df.groupy(quartiles_of_col1).mean() # not working, how to code quartiles_of_col1?
Die Ausgabe sollte den Mittelwert von jedem der Säulen für vier Gruppen gibt den Quartile von col1
entsprechen. Ist das mit dem Befehl groupby
möglich? Was ist der einfachste Weg, um es zu erreichen?
Das funktioniert für mich! Brilliante Verwendung von Schnitt! Danke champ – biobirdman
Beispiel hinzugefügt. Es stellt sich heraus, dass Sie auch "include_lowest" auf "True" setzen möchten, da sonst die kleinsten Zahlen übersprungen werden. Bearbeitet. Prost! –