Ich habe einen Pandas Datenrahmen, der zwei Spalten enthält, mit Ablaufverfolgungsnummern [Col_1] und ID-Nummern [Col_2]. Ablaufverfolgungsnummern können Duplikate sein, ebenso wie ID-Nummern. Jede ID der Ablaufverfolgung & sollte jedoch nur einem bestimmten Kollegen in der angrenzenden Spalte entsprechen. Python Pandas different value_counts() in zwei Spalten der gleichen len()
Jedes meiner beiden Spalten sind gleich lang, haben aber unterschiedliche eindeutigen Wert zählt, die gleich sein sollte, wie unten dargestellt:
in[1]: Trace | ID
1 | 5054
2 | 8291
3 | 9323
4 | 9323
... |
100 | 8928
in[2]: print('unique traces: ', df['Trace'].value_counts())
print('unique IDs: ', df['ID'].value_counts())
out[3]: unique traces: 100
unique IDs: 99
In dem obigen Code, die gleiche ID-Nummer (9232) wird durch zwei Trace-Nummern dargestellt (3 & 4) - Wie kann ich diese Vorfälle isolieren? Danke fürs schauen!
Bin ich richtig, dass Sie die Duplikate finden wollen? Wenn ja, möchten Sie die Zeilennummer oder die doppelte ID? – MSeifert
@ MSeifert - Zeilennummer wäre bevorzugt. Vielen Dank! –