Ich verwende Python csvkit
2 Dateien wie diese zu vergleichen:Pandas - Streifen weißer Raum
df1 = pd.read_csv('input1.csv', sep=',\s+', delimiter=',', encoding="utf-8")
df2 = pd.read_csv('input2.csv', sep=',\s,', delimiter=',', encoding="utf-8")
df3 = pd.merge(df1,df2, on='employee_id', how='right')
df3.to_csv('output.csv', encoding='utf-8', index=False)
Derzeit bin ich die Datei über einen Skript vor der Hand ausgeführt wird, die Leerzeichen aus der employee_id
Spalte Streifen.
Ein Beispiel für employee_id
s:
37 78973 3
23787
2 22 3
123
Gibt es eine Möglichkeit, es zu erhalten zu tun csvkit
zu und mir einen Schritt sparen?
'df1.employee_id = df1.employee_id.str.strip()' – Taylor
Was ist mit 'skipinitialspace = True' in' read_csv'? –