Ich versuche, zwei Datenrahmen zusammenführen, eines mit Spalten: customerId, voller Name und E-Mails und das andere Datenfeld mit Spalten: customerId, Menge und Datum. Ich möchte, dass der erste Datenrahmen der Hauptdatenrahmen ist und die anderen Datenrahmeninformationen enthalten sind, aber nur, wenn die customerIds übereinstimmen. Ich habe versucht zu tun:Merge zwei Datenrahmen ohne Wiederholungen Pandas
merge = pd.merge(df, df2, on='customerId', how='left')
aber der Datenrahmen, die eine Menge Wiederholungen erzeugt wird, enthält und sieht falsch:
customerId full name emails amount date
0 002963338 Star shine [email protected] $2,910.94 2016-06-14
1 002963338 Star shine [email protected] $9,067.70 2016-05-27
2 002963338 Star shine [email protected] $6,507.24 2016-04-12
3 002963338 Star shine [email protected] $1,457.99 2016-02-24
4 986423367 palm tree [email protected],[email protected] $4,604.83 2016-07-16
dies kann nicht richtig sein, bitte helfen!