Ich möchte die beste Teilmenge Regression auf eine Reihe von Variablen und dann die besten 3 Variablen mit R. Ich habe Probleme beim Erhalt der besten 2 Variablen. Ich habe meinen Code unten eingefügt.Die besten Variablen aus den besten Subsets Regression in R
set.seed(10)
a <- 1:100
b <- 1:100
c <- 1:100
d <- 1:100
e <- 1:100
f <- 1:100
g <- 1:100
h <- 1:100
data <- data.frame(a, b, c, d, e, f, g, h)
library(leaps)
# best subsets regression
test <- regsubsets(a ~ b + c + d + e + f + g + h, data=data, nbest=4)
# nbest = 4, is the number of subsets of each size that is reported
# plot a table of models showing variables in each model.
summary(test)
# models are ordered by the selection statistic.
plot(test,scale="r2")
#get the variables that are important to the model
coef(test, 2)
#NOTE: THIS DOESN'T GIVE ME THE 2 BEST VARIABLES. IT ONLY GIVES ME THE BEST VARIABLE AT THE 2ND ITERATION. LOOK AT:
coef(test, 1:2)
Ihre Hilfe würde sehr geschätzt werden!
Best, Dana
Ich bin ein wenig verwirrt von Ihrem Beispiel hier, weil alle Ihre Variablen genau gleich sind. –
Sie möchten möglicherweise echte Daten bereitstellen. Da bei Ihren aktuellen Daten alle Daten identisch sind, haben alle potenziellen Modelle die gleiche Anpassungsgüte, wenn sie die gleiche Anzahl an Variablen enthalten. Dies könnte dein Problem sein. –