Hallo ich in dieser Frage leite, wo meine Datenquelle Ereignisse wie folgt aussieht:GROUPBY Aggregate Methode zurückkehrt NaN immer
event_id device_id timestamp longitude latitude
0 1 29182687948017175 2016-05-01 00:55:25 121.38 31.24
1 2 -6401643145415154744 2016-05-01 00:54:12 103.65 30.97
2 3 -4833982096941402721 2016-05-01 00:08:05 106.60 29.7
ich zu einer Gruppe bin versucht, die Ereignisse durch die device_id und dann die Summe/Mittelwert erhalten/std der Variable über jedes Ereignis mit diesem device_id:
events['latitude_mean'] = events.groupby(['device_id'])['latitude'].aggregate(np.sum)
Aber mein Output ist immer:
event_id device_id timestamp longitude latitude
0 1 29182687948017175 2016-05-01 00:55:25 121.38 31.24
1 2 -6401643145415154744 2016-05-01 00:54:12 103.65 30.97
2 3 -4833982096941402721 2016-05-01 00:08:05 106.60 29.70
3 4 -6815121365017318426 2016-05-01 00:06:40 104.27 23.28
4 5 -5373797595892518570 2016-05-01 00:07:18 115.88 28.66
latitude_mean
0 NaN
1 NaN
2 NaN
3 NaN
4 NaN
Was mache ich falsch, um den Rückgabewert für jede Zeile als NaN zu erhalten?
PRs für große Dokumentation (oder auch nur eine minimale docstring :-)) ist immer willkommen! – joris
@joris, ja, fair genug ... :) – MaxU