Ich habe versucht, zwei Excel-Tabellen zusammenführen basierend auf ihren eigenen Namen Spalten. Ich habe this als Referenz verwendet.Verwenden von Difflib zum Kombinieren von Excel-Tabellen
In df1 der Namensspalte ist Local Customer
df2 der Name Spalte ist Client
import difflib
import pandas as pd
path= 'C:/Users/Rukgo/Desktop/Match thing/'
df1=pd.read_excel(path+'2015_TXNs.xls')
df2=pd.read_excel(path+'Pipeline.xls')
df2['Client'] = df2['Client'].apply(lambda x: difflib.get_close_matches(x, df1['Local Customer'])[0])
result = df1.join(df2)
result.to_excel(path+'maybe.xls')
Obwohl, wenn ich das laufen bekomme ich eine der folgenden Fehler:
File "C:/Users/Rukgo/Desktop/Match Things/untitled3.py", line 16, in <lambda>
df2['Client'] = df2['Client'].apply(lambda x: difflib.get_close_matches(x, df1['Local Customer'])[0])
IndexError: list index out of range
Awesome, die keine Fehler wirft! Danke. Aber wenn ich das neue Excel-Blatt öffne, sind alle Header von 'df2' mit keiner der Informationen da – Rukgo