2017-04-12 3 views
0

Ich habe eine Reihe von x, y, z-Daten wie solche:ausschließen fiel Werte iterativ

x y z 
1 1 0 
1 1 2 
1 1 3 
1 2 1 
2 1 3 
2 2 3 
2 2 4 

I die Duplikate auswählen wollen und lassen Sie sie (durch Spalte x und y), wie solche:

Nicht Duplikate:

x y z 
1 1 0 
1 2 1 
2 1 3 
2 2 3 

Dubletten:

x y z 
1 1 2 
1 1 3 
2 2 4 

Und dann will ich es wieder tun (rekursiv):

Nicht Duplikate:

x y z 
1 1 2 
2 2 4 

Dubletten

x y z 
1 1 3 

Wie würde man (den Ausschluss von Untergruppen erreichen, bis keine Teilmenge übrig ist) Ich habe derzeit diese:

notDuplicate = df.drop_duplicates(subset=['x', 'y'], keep='first') 

Vielen Dank!

Antwort

0

Egal, die Pandas-Funktion duplicated() war die, nach der ich gesucht habe.