Ich habe d1 und d2 und ich möchte die beiden nach ID-Spalte zusammenführen. Die ID und ID2 stimmen jedoch nicht genau überein. Stattdessen ist ID die erste 8 Ziffer von ID2 (manchmal kann es die erste 6 Ziffer sein, oder manchmal kann es eine oder zwei Ziffern sein).Merge Dataframe durch regulären Ausdruck oder Fuzzy-Match
Ich verstehe, dass ich ID2 vorverarbeiten kann, um nur die ersten 8 Ziffern zu behalten. Ich kann jedoch nicht alle Situationen bewältigen.
Ich frage mich, gibt es eine erweiterte Möglichkeit, durch reguläre Ausdrücke für Fuzzy-Match zu verschmelzen? sagen wir, wenn die ersten 6 Ziffern übereinstimmen, dann fusionieren?
d1=pd.DataFrame({'ID':['00846U10','01381710'],
'count':[100,200]})
d2=pd.DataFrame({'ID2':['00846U101','013817101','02376R102'],
'value':[1,5,6]})
Pre-Prozess-ID und ID2, um nur 6 Zeichen zu halten, wird das nicht funktionieren !! –
@GauravDhama wird es nicht alle meine Situationen behandeln. die Frage aktualisiert – Lisa
Also, Sie wollen sowohl "ID" und "ID2" in Scheiben schneiden, um 6 Ziffern zu enthalten, und wenn es eine Übereinstimmung gibt, dann die beiden Datenrahmen zusammenführen? –