Ich habe einen Datenrahmen, wo ich Kundennamen in 2 Spalten speichern. Ich muss die gemeinsamen Wörter aus beiden Spalten weglassen und das nicht übereinstimmende Wort zurückgeben.Nicht übereinstimmende Wörter aus einer Datenrahmenspalte zurückgeben
from io import StringIO
import pandas as pd
u_cols = ['page_id','web_id']
audit_trail = StringIO('''
shantanu prabhakar oak | santanu prabhakar oak
amar atmaram patil | amar atmaram patel
''')
df11 = pd.read_csv(audit_trail, sep="|", names = u_cols )
Erwartete Ergebnisse:
santanu
patel
Was ich versucht habe:
set(df11['page_id']) - set(df11['web_id'])
{'amar atmaram patil ', 'shantanu prabhakar oak '}
Update:
Es wird groß sein, wenn ein Wörterbuch mit Korrekturen zurückgegeben wird:
{ 'shantanu': 'Shantanu', 'patil': 'patel'}
ich es vorher nicht fragen, weil ich dachte, es innerhalb Pandas nicht möglich war.
Dank für die schnelle Antwort. Ist es möglich, ein Diktat zurückzugeben? {'shantanu': 'santanu', 'patil': 'patel'} Mit anderen Worten, kann ich das erste, zweite und dritte Wort aus beiden Spalten vergleichen? Es wird immer 3 Wörter geben. – shantanuo