2017-08-23 3 views

Antwort

3

IIUC Sie suchen ein Symmetric difference:

Quelle Verschlechterungsfaktoren:

In [41]: d1 
Out[41]: 
    a 
0 a 
1 b 
2 c 
3 x 
4 d 
5 l 
6 z 

In [42]: d2 
Out[42]: 
    b 
0 b 
1 a 
2 d 
3 c 
4 y 

Numpy Lösung:

In [43]: np.setdiff1d(np.union1d(d1.a, d2.b), np.intersect1d(d1.a, d2.b)) 
Out[43]: array(['l', 'x', 'y', 'z'], dtype=object) 

Pandas Lösung:

In [44]: pd.Index.symmetric_difference(pd.Index(d1.a), pd.Index(d2.b)) 
Out[44]: Index(['l', 'x', 'y', 'z'], dtype='object') 
+0

Danke! Ihre erste Erklärung zeigt die Logik perfekt an. Obwohl ich das symmetric_difference-Objekt nicht wirklich verstehe, funktionierte es in meinem Code (Spaltenlänge> 35k). – GPB

Verwandte Themen