ich mit Dubletten in einer Pandas df beschäftigen möchten:Python Pandas - Deal mit Dubletten
df=pd.DataFrame({'A':[1,1,1,2,1],'B':[2,2,1,2,1],'C':[2,2,1,1,1],'D':['a','c','a','c','c']})
df
ich nur Zeilen mit eindeutigen Werten von A, B, C ein erstellen binären Spalten D_a und D_C behalten möchten, so die Ergebnisse werden in etwa so sein, ohne super langsam Schleifen zu tun in jeder Zeile ..
result= pd.DataFrame({'A':[1,1,2],'B':[2,1,2],'C':[2,1,1],'D_a':[1,1,0],'D_c':[1,1,1]})
vielen Dank
Wie möchten Sie 'D_a' und' D_c' konstruieren, um von einer einzelnen Liste mit fünf Elementen zu zwei Listen mit drei Elementen zu gelangen? – vonludi
Also, was ist die Regel für die Erstellung von D_a und D_c? Ich verstehe die Gründe dafür, Duplikate zu entfernen, aber was hoffst du mit D_a und D_c zu tun? Klingt, als könnte es einen besseren Weg geben, das Endziel zu erreichen. –
Wenn eine unserer Antworten geholfen hat, stimmen Sie bitte ab und akzeptieren Sie sie. Vielen Dank! –