2017-01-04 6 views
1

Ich stoße auf ein Problem in R und nicht ganz sicher, was passiert. Wenn ich eine Regression und eine t.test auf den gleichen Variablen laufen lasse, finde ich, dass die t.test ~ 100 Teilnehmer fallen lässt (der DF ist 283.93 für den t-Test und 382 für die Regression) und gibt mir verschiedene pvalues. Wenn ich jedoch die Mittel für die gesamte Probe separat berechne, sind sie die gleichen wie im t-Test.t.test Teilnehmer in R fallen

Kann jemand erklären, was passieren könnte? Im Folgenden finden Sie den Code und die Ausgabe für die Regression und den t-Test. Beachten Sie, dass der DV eine Variable von 1 bis 7 ist und der IV ein 1/0-Dummy ist.

Die Regressions Ausgabe

Call: 
lm(formula = confident ~ get.surgery, data = d) 

Residuals: 
    Min  1Q Median  3Q  Max 
-4.2989 -0.7767 0.2233 0.7011 1.7011 

Coefficients: 
      Estimate Std. Error t value Pr(>|t|)  
(Intercept) 5.29893 0.07714 68.692 < 2e-16 *** 
get.surgery 0.47777 0.14895 3.208 0.00145 ** 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 1.293 on 382 degrees of freedom 
Multiple R-squared: 0.02623, Adjusted R-squared: 0.02368 
F-statistic: 10.29 on 1 and 382 DF, p-value: 0.001451 

und der t-Test

t.test(confident ~ get.surgery, data = d) 

Welch Two Sample t-test 

data: confident by get.surgery 
t = -3.6106, df = 233.93, p-value = 0.0003737 
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval: 
-0.7384624 -0.2170709 
sample estimates: 
mean in group 0 mean in group 1 
     5.298932  5.776699 
+1

Um dies zu einer Programmierfrage zu machen, sollten Sie wirklich ein [reproduzierbares Beispiel] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) bereitstellen. Aber es scheint eher eine statistische Frage zu sein, wenn man versteht, wie die Freiheitsgrade für jeden Test berechnet werden. Das ist eine Frage, die wahrscheinlich besser auf [stats.se] gehört, wo statistische Fragen zum Thema gehören. – MrFlick

+1

Ich denke, das könnte ein gepooltes Varianzproblem sein. Versuchen Sie Ihren t.test mit var.equal = TRUE (Standardwert ist FALSE), um zu sehen, ob das hilft. – Joy

+0

@Joy - das hat es gelöst! Ich danke dir sehr! –

Antwort

1

Ich denke, dies ist eine gepoolte Varianz Problem sein könnte. Versuchen Sie, Ihre t.test mit

var.equal = TRUE

(Standardeinstellung ist false), um zu sehen, ob das hilft.

Verwandte Themen