Meine Frage bezieht sich auf this one bezüglich kategorischer Daten (Faktoren in R-Begriffen) bei Verwendung des Caret-Pakets. Ich verstehe aus dem verlinkten Post, dass, wenn Sie die "Formel-Schnittstelle" verwenden, einige Funktionen Faktoren sein können und das Training gut funktioniert. Meine Frage ist, wie kann ich die Daten mit der preProcess()
Funktion skalieren? Wenn ich versuche, und tun es mit einigen Spalten als Faktoren auf einem Datenrahmen, erhalte ich diese Fehlermeldung:Wie PreProcess Funktionen, wenn einige von ihnen Faktoren sind?
Error in preProcess.default(etitanic, method = c("center", "scale")) :
all columns of x must be numeric
Sehen Sie hier einige Beispiel-Code:
library(earth)
data(etitanic)
a <- preProcess(etitanic, method=c("center", "scale"))
b <- predict(etitanic, a)
Danke.
Ich denke, wir brauchen nur zwei Variablen für PClass. (entweder "pclass1st, pclass2nd" oder "pclass2nd, pclass3rd" oder "pclass3rd, pclass1st"). Wie bei variablem Sex haben wir nur Sexmängel und verworfene Frauen berücksichtigt. Korrigiere mich, wenn es nicht ausreicht. – Sandeep
@topepo, ich denke, die folgende Antwort ignoriert die To-Do-Liste. Ich würde vorschlagen, einige Warnungen für die Leute hinzuzufügen, die nicht aufpassen würden. –