0
Ich habe eine Reihe von x, y, z-Daten wie solche:ausschließen fiel Werte iterativ
x y z
1 1 0
1 1 2
1 1 3
1 2 1
2 1 3
2 2 3
2 2 4
I die Duplikate auswählen wollen und lassen Sie sie (durch Spalte x und y), wie solche:
Nicht Duplikate:
x y z
1 1 0
1 2 1
2 1 3
2 2 3
Dubletten:
x y z
1 1 2
1 1 3
2 2 4
Und dann will ich es wieder tun (rekursiv):
Nicht Duplikate:
x y z
1 1 2
2 2 4
Dubletten
x y z
1 1 3
Wie würde man (den Ausschluss von Untergruppen erreichen, bis keine Teilmenge übrig ist) Ich habe derzeit diese:
notDuplicate = df.drop_duplicates(subset=['x', 'y'], keep='first')
Vielen Dank!