Gibt es eine Möglichkeit, Duplikate (mit drop_duplicates speziell) in einem Pandas-Dataframe mit etwa 10 Spalten und 400.000 Zeilen zu löschen? Das heißt, ich möchte, dass alle Zeilen, die zwei Spalten enthalten, eine Bedingung erfüllen: Wenn die Kombination aus Datum (Spalte) und Speicher (Spalte) # eindeutig ist, behalten Sie die Zeile, andernfalls, ab.Bedingtes Entfernen von Duplikaten pandas python
Antwort
Verwenden drop_duplicates
Datenrahmen mit doppelten Zeilen entfernt zurückzukehren, wahlweise nur bestimmte Spalten
Lassen anfängliche Datenrahmen wie
In [34]: df
Out[34]:
Col1 Col2 Col3
0 A B 10
1 A B 20
2 A C 20
3 C B 20
4 A B 20
eine Überlegung Wenn Sie einzigartige Kombinationen aus bestimmten Spalten 'Col1', 'Col2'
In [35]: df.drop_duplicates(['Col1', 'Col2'])
Out[35]:
Col1 Col2 Col3
0 A B 10
2 A C 20
3 C B 20
nehmen wollen
Wenn Sie eindeutige Kombinationen aller Spalten
nehmen möchtenIn [36]: df.drop_duplicates()
Out[36]:
Col1 Col2 Col3
0 A B 10
1 A B 20
2 A C 20
3 C B 20
Danke. Ich denke, du warst in der Lage, etwas Verwirrung über die Combos zu klären. –
@Morgan Sacco: Wenn diese Antwort gut für Sie ist, sollten Sie es als akzeptiert markieren. – ssoler
- 1. Entfernen von Duplikaten aus Listen in Python
- 2. Entfernen von Duplikaten in Nsarray
- 3. Entfernen von Duplikaten in MySql
- 4. Entfernen von Duplikaten Based date
- 5. Entfernen von Duplikaten aus TStringList
- 6. Python Pandas dataframe- Spalten von Header entfernen
- 7. Entfernen von Duplikaten nur aus einer Spalte
- 8. Entfernen von Duplikaten aus zweidimensionaler ArrayList
- 9. Entfernen von Duplikaten aus einer Staging-Datei
- 10. Java Entfernen von Duplikaten aus einem Array?
- 11. Entfernen von Duplikaten aus einer Liste C#
- 12. Entfernen von direkten Duplikaten auf einer Liste
- 13. SQL Entfernen von Duplikaten eine Zeile gleichzeitig
- 14. Entfernen von Duplikaten aus mehreren linken Links
- 15. MSSQL: Prozedur zum Entfernen von Duplikaten
- 16. XSLT Gruppierung und Entfernen von Duplikaten
- 17. Entfernen von Duplikaten am Ende der Makroauswahl
- 18. Entfernen von Duplikaten aus xml mit xslt
- 19. Entfernen von Duplikaten in zwei ggplot-Legende
- 20. Entfernen von Duplikaten aus der verschachtelten Liste
- 21. Entfernen und Ersetzen von Duplikaten in ArrayList
- 22. Entfernen von Duplikaten aus Netezza Tabelle
- 23. Pandas Bedingtes Kombinieren (und Summe) Zeilen
- 24. Python (pandas): Entfernen von Duplikaten, basierend auf zwei Spalten Zeile mit max-Wert in einer anderen Spalte zu halten
- 25. RichTextBox Art der Ausgabe und Entfernen von Duplikaten
- 26. Python - Pandas - Cumulative Summe ausrollen/entfernen
- 27. Python entfernen maßgeschneiderte Stoppwörter aus Pandas Dataframe
- 28. Python Pandas entfernen Duplikate in Serie
- 29. Entfernen von Duplikaten aus einem Attribut einer Klassenvariablen
- 30. Bedingtes einfügen, aktualisieren oder entfernen Dokument
Was haben Sie versucht? Es gibt die letzten handlichen 'if'-Anweisungen, aber dann kann das ein bisschen unordentlich werden. Haben Sie in der Dokumentation eine Methode dafür? – Zizouz212
Es ist immer hilfreich, Beispieldaten und erwartete Ausgaben zu veröffentlichen. – Zero
Ja, ich versuche herauszufinden, wie man einige Beispieldaten posten kann. –