ich Pandas Datenrahmen haben, die Datumsangaben im Format enthält: yyyy-mm-dd:Sortieren Daten mit groupby Pandas
id1 = ['2015-09-23', '2014-07-08', '2015-07-30', '2008-09-26',
'2009-07-13', '2009-09-28', '2014-04-10', '2009-06-03']
id2 = ['2011-04-15', '2015-11-30', '2015-06-15', '2015-12-01',
'2015-12-23', '2009-01-14', '2009-06-17', '2009-08-07']
id3 = ['2010-01-26', '2010-03-16', '2011-11-23', '2012-01-31',
'2012-06-08', '2012-10-26', '2013-01-07', '2013-11-12']
df = pd.DataFrame({'dates':id1 + id2 + id3,'id':['id1']*8+['id2']*8+['id3']*8})
Daraus möchte ich das erste und das letzte Datum erhalten für jede ID.
Ich habe versucht, die folgenden:
df.groupby(['id'])['dates'].agg({'sort':sorted})
Das Problem mit diesem ist, dass ich nur in der Lage bin das erste Datum nicht das letzte Mal zu sehen. Ich möchte eine Liste mit nur zwei Elementen ausgeben: erstes und letztes Datum. Anstatt der ganzen Liste.
Interessant, aber es scheint, es ist t Ändern der Reihenfolge der Elemente in der Liste statt nach Datum sortieren. Ich möchte mit wissen, sind die früheren und letzten Termine –
dann ersetzen zuerst und zuletzt von min und max. du kannst meine lösung dann annehmen haha –
Wo sind diese ersten, letzten Funktionen definiert? Pandas? –