Ich habe einen Datenrahmen, den ich verwende pandas.groupby
für eine bestimmte Spalte und dann aggregierte Statistiken für die produzierten Gruppen (Mittelwert, Median , Anzahl). Ich möchte bestimmte Spaltenwerte als Mitglieder derselben Gruppe behandeln, die von der Gruppe erzeugt werden, und nicht eine eindeutige Gruppe pro eindeutigem Wert in der Spalte, die für die Gruppierung verwendet wurde. Ich habe geschaut, wie ich so etwas erreichen würde.Pandas: Verwenden von Gruppe durch, kombinieren mehrere Spaltenwerte als eine eigenständige Gruppe innerhalb der Gruppe von
Zum Beispiel:
>> my_df
ID SUB_NUM ELAPSED_TIME
1 1 1.7
2 2 1.4
3 2 2.1
4 4 3.0
5 6 1.8
6 6 1.2
Anstatt also das typische Verhalten:
>> my_df.groupby([SUB_NUM]).agg([count])
ID SUB_NUM Count
1 1 1
2 2 2
4 4 1
5 6 2
Ich möchte bestimmte Werte (SUB_NUM in [1, 2]) als eine Gruppe berechnet werden, so dass anstelle etwas wie unten ist produziert:
>> # Some mystery pandas function calls
ID SUB_NUM Count
1 1, 2 3
4 4 1
5 6 2
Jede Hilfe wäre sehr geschätzt, danke!
meinst du wie http://stackoverflow.com/questions/17679089/pandas-dataframe-groupby-two-columns-and- bekommen-zählt? – SGhaleb