2017-08-10 2 views
1

Ich bin ziemlich neu bei Python (und Pandas) und habe eine Ersatzaufgabe für einen großen Dataframe, für den ich keine Lösung finden konnte.Python ersetzt alle Werte im Datenrahmen mit Werten aus anderen Datenrahmen

So habe ich zwei Datenrahmen, wobei einer (df1), die etwa wie folgt aussieht:

Id  Id  Id  
4954733 3929949 515674 
2950086 1863885 4269069 
1241018 3711213 4507609 
3806276 2035233 4968071 
4437138 1248817 1167192 
5468160 4726010 2851685 
1211786 2604463 5172095 
2914539 5235788 4130808 
4730974 5835757 1536235 
2201352 5779683 5771612 
3864854 4784259 2928288 

die andere Datenrahmen (df2), die alle ‚alten‘ ids und die entsprechenden neuen in der nächsten Spalte (von 1 bis 20.000), sieht das etwa so aus:

Id  Id_new 
5774290 1 
761000 2 
3489755 3 
1084156 4 
2188433 5 
3456900 6 
4364416 7 
3518181 8 
3926684 9 
5797492 10 
4435820 11 

, was ich alles tun, möchte die ids ist zu ersetzen (alle Spalten) in df1 mit der Id_new vonentsprechenden. Ich denke, idealerweise ohne eine merge oder join für jede Spalte zu tun, angesichts der Größe des Datensatzes?

Das Ergebnis sollte so aussehen: df_new

Id_new Id_new Id_new 
8  12  22 
16  9  8 
21  25  10 
10  15  13 
29  6  4 
22  7  22 
30  3  3 
11  31  29 
32  29  27 
12  3  4 
14  6  24 

Irgendwelche Tipps wäre toll, danke im voraus!

+4

'' df1.replace? – Zero

Antwort

3

Ich glaube, Sie brauchen replace von Series von set_index erstellt: (. Df2.set_index ('Id') to_dict() [ 'Id_new'])

print (df1) 
     Id  Id.1  Id.2 
0 4954733 3929949 515674 <-first value changed for match data 
1 2950086 1863885 4269069 
2 1241018 3711213 4507609 
3 3806276 2035233 4968071 
4 4437138 1248817 1167192 
5 5468160 4726010 2851685 
6 1211786 2604463 5172095 
7 2914539 5235788 4130808 
8 4730974 5835757 1536235 
9 2201352 5779683 5771612 
10 3864854 4784259 2928288 

df = df1.replace(df2.set_index('Id')['Id_new']) 
print (df) 
     Id  Id.1  Id.2 
0   1 3929949 515674 
1 2950086 1863885 4269069 
2 1241018 3711213 4507609 
3 3806276 2035233 4968071 
4 4437138 1248817 1167192 
5 5468160 4726010 2851685 
6 1211786 2604463 5172095 
7 2914539 5235788 4130808 
8 4730974 5835757 1536235 
9 2201352 5779683 5771612 
10 3864854 4784259 2928288 
+1

danke, @ jezrael und @johngalt, das funktioniert super! –

Verwandte Themen