Bei der Verwendung XGBoost
müssen wir kategoriale Variablen in numerische konvertieren.XGBoost Kategoriale Variablen: Dummy vs Codierung
Gäbe es einen Unterschied in der Leistung/Bewertungsmetriken zwischen den Methoden von:
- dummifying Ihre kategorischen Variablen
- Ihre kategorischen Variablen der Codierung von z.B. (A, b, c) bis (1,2,3)
AUCH:
Würde es irgendwelche Gründe, nicht mit Methode 2 unter Verwendung zum Beispiel labelencoder
zu gehen?
Wird dies nicht Features macht mit vielen Kategorien wichtiger erscheinen als diejenigen mit weniger? – eleanora
Wie 'Xgboost'' array ([1., 0., ...]) 'als kategorisch statt numerisch behandeln kann? –
@ThiagoBalbo Einfach ausgedrückt: es tut es nicht. Sie ersetzen nur die ursprüngliche Variable/Feature/Spalte durch 3 binäre Variablen/Features/Spalten. – masu