Ich bin mir sicher, ich mache etwas falsch, aber es ist nicht offensichtlich für mich.Join mehrere Datenframes und doppelte Spalten
Ich habe viele Datenframes, denen ich beitreten möchte. Ich bin bei pd.merge linken verbindet ich dies tun als
Database=pd.merge(df1, df2, left_on='key', Right_on='key',how='left')
Database=pd.merge(df3, df4, left_on='key', Right_on='key',how='left')
Wiederholung aber immer wieder in der Datenbank Datenrahmen zu schreiben, alles funktioniert gut, aber am Ende habe ich mehrere Duplikate, dh df1_code als df1_code_x wiederholt wurde , df1_code_x_x, was das resultierende df sehr groß macht. Ich versuchte;
Database.T.drop_duplicates().T
aber dies führte zu einem cms Speicherfehler, wie kann ich die Spalten Duplizieren zu starten mit zu stoppen.
Können Sie ein reproduzierbares Beispiel nennen? – IanS