2016-11-16 3 views
-2

Ich versuche Regression in R. zu verstehen, Ich versuche, eine Übung wich zu lösen hat eine 100 zufällig männlich-weiblich-Datensatz wie folgt aus:Regression in R mit kategorischen Variablen

sex  sbp  bmi 
male  130  40.0 
female 126  29.0 
female 115  25.0 
male  120  33.0 
female 128  34.0 
... 

I erhalten möchten Eine numerische Zusammenfassung (0) zeigt die Beziehung zwischen sbp und bmi (1) und schätzt beta1, beta2 und Sigma Parameter mit R^2 (2). Dann überprüfen Sie die Güte des Modells (3) und nutzen Sie den Konfidenzintervall (4) ..

Ich denke, dass Sex eine kategorische Variable ist, so ist es hier ist mein Code:

as.numeric(framingham$sex) - 1 
apply(framingham, 2, class) 

#0 
framingham$sex <- factor (framingham$sex) 
levels (framingham$sex) <- c("female", "male") 
resultadoNumerico <- compareGroups(~., data = framingham) 
resumenNumerico <- createTable(resultadoNumerico) 
resumenNumerico 

# 1 
framinghamMatrix <- data.matrix(framingham) 
pairs(framinghamMatrix) 
cor(framinghamMatrix) 

#2 
regre <- lm(sbp ~ bmi+sex, data = framingham) 
regreSum <- summary(regre) 
regreSum 
# Sigma 
regreSum$sigma 
# Betas 
regreSum$coefficients 

#3 
plot(framingham$bmi, framingham$sbp, xlab = "SBP", ylab = "BMI") 
abline (regre) 

Aber ich denke, dass ich die Dinge nicht richtig mache ... Könntest du mir helfen? Vielen Dank im Voraus ...

+1

Ich habe den Code noch nicht ausgeführt, aber könnten Sie sagen, warum Sie denken, dass Sie es falsch machen? –

+0

Ursache dann muss ich die Männer und Frauen Regression Geraden vergleichen und die Zusammenfassung des Modells gibt nur eins: Koeffizienten: Schätzung Std. Fehler t-Wert Pr (> | t |) (Achsenabschnitt) 79.0624 11.0716 7.141 1.71e-10 *** bmi 1.9338 0.3965 4.877 4.21e-06 *** sexfemale 3.0395 3.7731 0.806 0.422 –

+6

Sie erhalten nur einen Schätzpreis für 1 Level eines 2-Level-Faktors, weil das andere Level der Referenzlevel ist. Wenn du beides hättest, würdest du in die "Dummy Variable Trap" fallen und die Ergebnisse wären bedeutungslos. http://www.algosome.com/articles/dummy-variable-trap-regression.html –

Antwort

0

Um die Beziehung zwischen den Variablen zu überprüfen, versuchen Sie eine Grafik namens pairs.panels aus der psych Bibliothek. Es gibt die Verteilungen, Streudiagramm und Korrelationskoeffizienten.

Die Geschlechtsvariable ist hier kategorisch, wandeln Sie sie in Faktor um und geben Sie dann als Eingang zu Ihrem linearen Regressionsmodell. Nach alphabetischer Reihenfolge der erste Stufe in dem Faktor wird Ihren Referenzpegel und damit in der Zusammenfassung des Modells können Sie nur andere Ebene als der Referenzpegel sehen (in diesem Fall ist weiblich Ebene Basis -Referenz)

framingham$sex<-as.factor(framingham$sex) 

Jetzt erstellen Ihr lineares Modell.

model <- lm(sbp ~ bmi+sex, data = framingham) 
model 
summary(model) 

Die Zusammenfassung gibt die Koeffizienten, abfangen, Standardfehler (95%), t-Wert und p-Wert (das zeigt die Bedeutung der Variablen), Multiple R-Quadrat (Anpassungsgüte), bereinigt R-Quadrat (Anpassungsgüte angepasst Komplexität zu modellieren) usw.

+0

Ja, aber dann ... wie kann ich die geraden Linien zwischen Männern und Frauen vergleichen? Und Vorhersage? Und kontrastierende Hypothese für beta1 = 1.75? Ich bin in einem Chaos :( –

0

ich habe gemacht Sex-1 für die kategoriale Variable:

regre <- lm(sbp ~ bmi+sex***-1***, data = framingham) 
regreSum <- summary(regre) 
regreSum 

Und jetzt erhalte ich

Call: 
lm(formula = sbp ~ bmi + sex - 1, data = framingham) 

Residuals: 
    Min  1Q Median  3Q  Max 
-28.684 -13.025 -1.314 8.711 73.476 

Coefficients: 
      Estimate Std. Error t value Pr(>|t|)  
bmi   1.9338  0.3965 4.877 4.21e-06 *** 
sexhombre 79.0624 11.0716 7.141 1.71e-10 *** 
sexmujer 82.1020 10.5184 7.806 6.93e-12 *** 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 18.48 on 97 degrees of freedom 
Multiple R-squared: 0.9813, Adjusted R-squared: 0.9808 
F-statistic: 1700 on 3 and 97 DF, p-value: < 2.2e-16 

Vielleicht gehe ich in die richtige Richtung?

Verwandte Themen