2017-05-02 4 views
1

ich einen Datensatz haben:entfernen alle doppelten Daten zeigen nur eindeutige

import pandas as pd 
data = pd.read_csv('email_list.csv') 
new_data = data[['Email Address','First Name','Last Name']] 

      Email Address   First Name  Last Name 
0    [email protected]    Zoé   Z 
1    [email protected]   Yvonne   T 
2    [email protected]   Whitney   W 
3     [email protected]    Zoe   Z 
4    [email protected]   Yvonne   T 

ich den Ausgang zeigen wollen, dass ich nur eindeutige E-Mails und Namen. Also aus der kurzen Liste oben sollte der Ausgang sein:

Email Address    First Name  Last Name 
1 [email protected]   Whitney   W 

Wie kann ich das tun? Der einfachste Weg wird am besten sein.

+0

Vergessen Sie nicht, dass Sie auch die Antworten abstimmen können, um zusätzliche Dankbarkeit zu zeigen, indem Sie auf den Pfeil neben der Antwort klicken. – piRSquared

Antwort

2

Dies ist, was Sie suchen:

df.drop_duplicates(keep=False) 

drop_duplicates entfernen Betrogenen in Ihrem Datenrahmen. Mit dem leistungsstarken Argument keep können Sie einstellen, was Sie behalten und was Sie löschen möchten. Wenn das Argument falsch ist, werden alle Duplikate gelöscht.

Verwandte Themen