2017-06-28 8 views
2

Ich habe 2 Spalten, die doppelte Einträge enthält. Siehe Beispiel unten. Ich möchte Duplikate entfernen aus beiden Spalten Original-SäuleEindeutige Werte basierend auf mehreren Spalten

MatchN Striker 
1000887 DA Warner 
1000887 DA Warner 
1000887 TM Head 
1000887 TM Head 

Ich möchte endlich das Ergebnis erhalten, wie

MatchN Striker 
1000887 DA Warner 
1000887 TM Head 

Ich versuchte

np.df[["MatchN"],["Striker"]].unique() 

verwenden, aber es funktioniert nicht .

Kann jemand bitte besten Weg vorschlagen, um zum gewünschten Ergebnis zu gelangen?

Antwort

3

IIUC Sie benötigen DataFrame.drop_duplicates() Methode:

In [69]: df = df.drop_duplicates(['MatchN','Striker']) 

In [70]: df 
Out[70]: 
    MatchN Striker 
0 1000887 DA Warner 
2 1000887 TM Head 
+0

df.drop_duplicates ([ "MatchN"], [ "Striker"]) nicht –

+1

@AnoopMahajan funktioniert, sollten Sie eine reproduzierbare Daten eingestellt haben geschrieben ... Please überprüfen aktualisierte Antwort – MaxU

+0

Danke MaxU ... das hat funktioniert :) –

Verwandte Themen