Ich habe ein Datenframe mit den Überschriften "ID" und "Datum", wobei jede ID mehrere Daten haben kann. Zum Beispiel:Entfernen der ersten Eintrag jeder Teilmenge mit ddply
id date
001 03/05/2000
001 06/05/2001
001 01/09/2002
002 03/05/2000
002 03/09/2004
003 03/05/2000
003 03/07/2001
003 02/10/2002
Ich möchte die Zeile des ersten Eintrags (nach Datum sortiert) entfernen. So für das obige Beispiel würde ich will am Ende:
id date
001 06/05/2001
001 01/09/2002
002 03/09/2004
003 03/07/2001
003 02/10/2002
Ich habe Dinge versucht, entlang der Linien von:
reduced <- ddply(data, .(id), function(x) x[-1,])
ohne Glück.
Irgendwelche Ideen, wie ich das effizient machen könnte?
Das Problem ist es in Subsets basierend auf der ID zu brechen, die erste Zeile (nach Datum sortiert) und dann wieder in einen endgültigen Datenrahmen, was ddply normalerweise gut ist, aber ich kann nicht scheinen damit es hier funktioniert.
Warum die downvote? Bitte erklären Sie, wenn es einen Fehler gibt, würde ich es entweder korrigieren oder löschen. Vielen Dank – PKumar