Ich versuche Regression in R. zu verstehen, Ich versuche, eine Übung wich zu lösen hat eine 100 zufällig männlich-weiblich-Datensatz wie folgt aus:Regression in R mit kategorischen Variablen
sex sbp bmi
male 130 40.0
female 126 29.0
female 115 25.0
male 120 33.0
female 128 34.0
...
I erhalten möchten Eine numerische Zusammenfassung (0) zeigt die Beziehung zwischen sbp und bmi (1) und schätzt beta1, beta2 und Sigma Parameter mit R^2 (2). Dann überprüfen Sie die Güte des Modells (3) und nutzen Sie den Konfidenzintervall (4) ..
Ich denke, dass Sex eine kategorische Variable ist, so ist es hier ist mein Code:
as.numeric(framingham$sex) - 1
apply(framingham, 2, class)
#0
framingham$sex <- factor (framingham$sex)
levels (framingham$sex) <- c("female", "male")
resultadoNumerico <- compareGroups(~., data = framingham)
resumenNumerico <- createTable(resultadoNumerico)
resumenNumerico
# 1
framinghamMatrix <- data.matrix(framingham)
pairs(framinghamMatrix)
cor(framinghamMatrix)
#2
regre <- lm(sbp ~ bmi+sex, data = framingham)
regreSum <- summary(regre)
regreSum
# Sigma
regreSum$sigma
# Betas
regreSum$coefficients
#3
plot(framingham$bmi, framingham$sbp, xlab = "SBP", ylab = "BMI")
abline (regre)
Aber ich denke, dass ich die Dinge nicht richtig mache ... Könntest du mir helfen? Vielen Dank im Voraus ...
Ich habe den Code noch nicht ausgeführt, aber könnten Sie sagen, warum Sie denken, dass Sie es falsch machen? –
Ursache dann muss ich die Männer und Frauen Regression Geraden vergleichen und die Zusammenfassung des Modells gibt nur eins: Koeffizienten: Schätzung Std. Fehler t-Wert Pr (> | t |) (Achsenabschnitt) 79.0624 11.0716 7.141 1.71e-10 *** bmi 1.9338 0.3965 4.877 4.21e-06 *** sexfemale 3.0395 3.7731 0.806 0.422 –
Sie erhalten nur einen Schätzpreis für 1 Level eines 2-Level-Faktors, weil das andere Level der Referenzlevel ist. Wenn du beides hättest, würdest du in die "Dummy Variable Trap" fallen und die Ergebnisse wären bedeutungslos. http://www.algosome.com/articles/dummy-variable-trap-regression.html –