Ich habe timestamp
und id
Variablen in meiner Datenrahmen (df
)Finding doppelte Zeilen Python
timestamp id
2016-06-09 8:33:37 a1
2016-06-09 8:33:37 a1
2016-06-09 8:33:38 a1
2016-06-09 8:33:39 a1
2016-06-09 8:33:39 a1
2016-06-09 8:33:37 b1
2016-06-09 8:33:38 b1
Jeder id
kann nicht zwei Zeitstempel haben. Ich muss diese doppelten Zeitstempel für jede id
drucken. In meinem obigen Fall sollte die Ausgabe für die Zeilen sein 1,2,4,5
Der folgende Code gibt die doppelte timestamp
set([x for x in df['timestamp'] if df['timestamp'].count(x) > 1])
Wie id
prüfen zusammen mit timestamp
die doppelten Zeilen haben?
Das funktioniert !! Vielen Dank. – sshr