Ich habe einen Datenrahmen mit einem colum mit id: s können Duplikate enthalten:Pandas neu zuordnen, um im Bereich Spalte
>>> df['user_id'].head()
Out[3]:
0 2134
1 1234
2 4323
3 25434
4 1234
Name: user_id, dtype: int64
Wie kann ich diese neu zuordnen, so dass der Benutzer-ID aus einer beliebigen Zahl geht das und mehr, schrittweise nach der ursprünglichen Nummer? In diesem Beispiel wird es die folgenden sein, ausgehend von 2:
>>> df['user_id'].head()
Out[3]:
0 3
1 2
2 4
3 5
4 2
Name: user_id, dtype: int64
Cool! Wenn ich mich nicht um den Index kümmere oder die alten IDs speichere, mache ich das einfach, oder? df1 ['user_id'] = pd.factorize (df1 ['user_id']) [0] – user1506145
@ user1506145 sicher oder rufen Sie 'reset_index (drop = True)' auf, damit der Index wieder von '0' startet – EdChum