2016-06-20 13 views
2

Meine Originaldaten sind im Großformat wie in Tabelle A angezeigt.ANOVA mit breitem Datentabellenformat

Sagen wir, ich möchte untersuchen, ob Veteranen, die verschiedene Touren des Militärdienstes erfahren haben, leiden an verschiedenen Ebenen der Depression.

Ich entscheide, mit Depression_Score als Kriterium und einen Einweg-ANOVA-Test auf den Daten laufen ‚Tour der Pflicht diente‘ als Faktor. Ich weiß, dass ich die Daten in langes Format wie in Table B umformen kann und dann die ANOVA ausführen.

Hier ist meine Frage aber: ist es möglich, einen ANOVA-Test direkt auf Tabelle A ohne Umformung die Daten in Tabelle B zu laufen?

Wenn ja, welche R-Befehle würde ich verwenden, um dies zu programmieren?

Tabelle A:

ArmyVet_ID Served_WW2 Served_KoreanWar Served_VietnamWar Depression_Score 
110001   1    0     0    3 
110002   1    0     0    1 
110004   0    1     0    4 
110005   0    1     0    3 
110009   0    0     1    7 
110010   0    0     1    5 

Tabelle B:

ArmyVet_ID Served   Depression_Score 
110001   WW2     3 
110002   WW2     1 
110004   KoreanWar    4 
110005   KoreanWar    3 
110009   VietnamWar    7 
110010   VietnamWar    5 

Antwort

1

Wenn Sie eine der Spalten fallen und ihn an as.matrix, Sie das gleiche Ergebnis wie das Bestehen der kombinierte Faktor erhalten können:

anova(lm(Depression_Score ~ as.matrix(A[3:4]), data=A)) 
#Analysis of Variance Table 
# 
#Response: Depression_Score 
#     Df Sum Sq Mean Sq F value Pr(>F) 
#as.matrix(A[3:4]) 2 16.333 8.1667 5.4444 0.1004 
#Residuals   3 4.500 1.5000 

Verglichen mit dem Faktor Ergebnis nach Tabelle B in Ihrem Beispiel:

anova(lm(Depression_Score ~ I(factor(c(1,1,2,2,3,3))), data=A)) 
#Analysis of Variance Table 
# 
#Response: Depression_Score 
#        Df Sum Sq Mean Sq F value Pr(>F) 
#I(factor(c(1, 1, 2, 2, 3, 3))) 2 16.333 8.1667 5.4444 0.1004 
#Residuals      3 4.500 1.5000 
+0

Sollte es im zweiten Fall "Daten = B" sein? Eine weitere Klarstellung. Wenn es 4 Spalten von Faktoren (statt 3 wie in diesem Fall) gäbe, würde ich 3 dieser Spalten "as.matrix" zuführen, und so weiter? –

+1

@ user1883050 - es macht keinen Unterschied - "Depression_Score" ist in beiden Beispielen gleich "A" und "B". Ja, ich glaube, Sie müssen 'n-1'-Spalten immer verwenden, da Sie nur' n-1'-Vergleiche ohne Verdopplung machen können. Sehen Sie sich die 'Df'-Spalte an und beachten Sie, dass es in den anova-Ergebnissen immer' 2' ist. – thelatemail

Verwandte Themen