Concatenate Datenrahmen durch Spaltenwerte

Wie ich zwei Datenrahmen folgende fusionieren können auf Spalten A und B:Concatenate Datenrahmen durch Spaltenwerte

Und mit nur Ergebnisse der beiden passenden Zeilen zu erhalten.

df3 
A B C 
2 8 2 
2 8 9

Quelle

2016-12-22 Night Walker

Sie können sie verketten und diejenigen fallen, die nicht kopiert werden:

conc = pd.concat([df1, df2]) 
conc[conc.duplicated(subset=['A', 'B'], keep=False)] 
Out: 
    A B C 
1 2 8 2 
1 2 8 9

Wenn Sie Duplikate haben,

Sie können Spur der duplizierten diejenigen halten über boolesche Arrays:

cols = ['A', 'B'] 
bool1 = df1[cols].isin(df2[cols].to_dict('l')).all(axis=1) 
bool2 = df2[cols].isin(df1[cols].to_dict('l')).all(axis=1) 

pd.concat([df1[bool1], df2[bool2]]) 
Out: 
    A B C 
1 2 8 2 
4 2 8 5 
1 2 8 9 
4 2 8 10

Quelle

2016-12-22 10:11:47 ayhan

Das ist eine Möglichkeit zu haben. oder sogar zu "df2" hinzufügen, denke ich. – Zero

Lösung mit Index.intersection, wählen Sie dann Werte in beiden DataFrames von loc und letzte concat sie zusammen:

df1.set_index(['A','B'], inplace=True) 
df2.set_index(['A','B'], inplace=True) 
idx = df1.index.intersection(df2.index) 
print (idx) 
MultiIndex(levels=[[2], [8]], 
      labels=[[0], [0]], 
      names=['A', 'B'], 
      sortorder=0) 

df = pd.concat([df1.loc[idx],df2.loc[idx]]).reset_index() 
print (df) 
    A B C 
0 2 8 2 
1 2 8 9

Quelle

2016-12-22 13:06:09 jezrael

Hier ist eine weniger effiziente Methode, die Duplikate erhalten sollte, ist aber mit zwei merge/schließt sich

# create a merged DataFrame with variables C_x and C_y with the C values 
temp = pd.merge(df1, df2, how='inner', on=['A', 'B']) 
# join columns A and B to a stacked DataFrame with the Cs on index 
temp[['A', 'B']].join(
      pd.DataFrame({'C':temp[['C_x', 'C_y']].stack() 
       .reset_index(level=1, drop=True)})).reset_index(drop=True)

Das gibt

A B C 
0 2 8 2 
1 2 8 9

Quelle

2016-12-22 15:18:54 lmo

Concatenate Datenrahmen durch Spaltenwerte

Antwort

Verwandte Themen