Ich habe zwei Datenrahmen df & df2, und ich möchte sie mit * als PlatzhalterWie pandas Datenrahmen basierend auf Wildcards zu verbinden?
import pandas as pd
data = [[".",".",1],["AB.","B.",3],["B.",".",2]]
data2 = [["A","B","1"],["ABC","BC",4],["B","A",2]]
columns = ["Type1","Type2","Value"]
df = pd.DataFrame(data,columns=columns)
df2 = pd.DataFrame(data2,columns=columns)
print(df)
print(df2)
Type1 Type2 Value
0 * * 1
1 AB* B* 3
2 B* * 2
Type1 Type2 Value
0 A B 1
1 ABC BC 4
2 B A 2
Typischerweise ist die zweite Linie von DF2 hier verschmelzen sollte mit der Linie 1 und Linie 2 Die Zeile 0 in df2 entsprechen sollte Nur die erste Zeile von DF1 übereinstimmen. Irgendwie würde Ich mag so etwas wie
df2.merge(df,how='left',on=["Type1","Type2"])
Aber das Ergebnis hier bekommen ist nicht alles passen.
Dies ist das Ergebnis, das ich gerne bekommen würde.
data3 = [["A","B","1","1"],["ABC","BC",4,1],["ABC","BC",4,3],["B","A",2,1],["B","A",2,2]]
columns3 = ["Type1","Type2","Value_x","Value_y"]
results = pd.DataFrame(data3,columns=columns3)
print(results)
Type1 Type2 Value_x Value_y
0 A B 1 1
1 ABC BC 4 1
2 ABC BC 4 3
3 B A 2 1
4 B A 2 2
Bitte beachten Sie, dass die df2 Tabelle mehr als 1 Million Zeilen tatsächlich hat, damit ich nicht leisten kann, eine Schleife aus Effizienzgründen zu tun.
Was ist Ihr erwartetes Ergebnis? – Alexander
Ok ich habe es einfach gemacht :) – Nicolas