Angenommen, ich habe einen Datenrahmen mit Ländern, die wie das geht:Pandas: convert Kategorien Zahlen
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Ich weiß, dass es eine pd.get_dummies funktioniert die Länder zu ‚One-Hot-Kodierungen‘ zu konvertieren. Allerdings möchte ich sie stattdessen in Indizes konvertieren, so dass ich stattdessen cc_index = [1,2,1,3]
bekomme.
Ich gehe davon aus, dass es einen schnelleren Weg, um die get_dummies zusammen mit einem numpy als die Verwendung von where-Klausel wie folgt:
[np.where(x) for x in df.cc.get_dummies().values]
Dies ist etwas leichter in R zu tun, mit ‚Faktoren‘ Ich hoffe, dass Pandas etwas Ähnliches hat.
meinen Sie 'cc_ind ex = [0,1,0,2] '? –
sicher, vergaß über den Python 0 Index –
Categorical Series oder Spalten in einem DataFrame kann helfen. – min2bro