ich eine Tabelle (Eingang) haben:Lassen Sie nur letzte Ereignisnamen für jeden Benutzer (r Sprache)
user_id timestamp progression
1 Rob 22223333 Level1
2 Mike 33334444 Level2
3 Rob 55558888 Level3
4 Mike 44447777 Level7
I Spalte mit der letzten progression
hinzufügen müssen, die auf timestamp
abhängt.
gewünschter Ausgang:
user_id timestamp progression lastProgression
1 Rob 22223333 Level1 Level3
2 Mike 33334444 Level2 Level7
3 Rob 55558888 Level3 Level3
4 Mike 44447777 Level7 Level7
Es gibt wohl keine Notwendigkeit für ein externes Paket hier, aber ich würde mit 'library (data.table) gehen; setDT (df) [unique (df [Reihenfolge (-timestamp)], by = "user_id"), lastProgression: = i.progress, on = "user_id"] 'für Effizienz –
Oder' setDT (df) [, lastProgression: = progression [which.max (timestamp)], by = user_id] ' –