2016-08-26 5 views
-1

Ich arbeite auf Unabhängigkeitstests für einige Sachen bei der Arbeit. Normalerweise mache ich so etwas in R, aber mein Chef wollte, dass ich es in Excel für die Graphen mache. Mein Problem ist, dass wenn ich den Chi-Quadrat-Test von R verwende, es mir ein anderes Ergebnis gibt als das, das Excel benutzt. Ich bin mir nicht sicher, ob ich Dinge falsch mache oder ob es einen Unterschied in den verwendeten Methoden gibt, aber die Ergebnisse sind ziemlich widersprüchlich. Sind die Nullhypothesen in diesen beiden Programmen unterschiedlich?Chi-Quadrat-Test R und Excel

Hier ist, was ich habe:

Observed Values      Expected Values  

    Total Errors Priority 1 + 2     Total Errors Priority 1 + 2 
Non-V&T 342 188 530   Non-V&T 171.0759494 93.92405063 
V&T 117 64 181   V&T 58.42405063 32.07594937 
    459 252 1422      


    Test value:       
    2.68619E-79     

R:

tbl1 <- matrix(c(342,117,188,64),ncol=2) 
chisq.test(tbl1) 
Pearson's Chi-squared test with Yates' continuity correction 

data: tbl1 
X-squared = 1.6653e-30, df = 1, p-value = 1 

chisq.test(tbl1)$expected 
     [,1]  [,2] 
[1,] 342.1519 187.8481 
[2,] 116.8481 64.1519 

ps. Ich kann anscheinend nicht einfügen, was ich von Excel richtig hatte. Der Hauptpunkt ist, dass die p-Wert-Erwartungswerte sich von dem unterscheiden, was R mir gibt.

Antwort

2

Ich bin mir auch nicht sicher, wie man aus Excel im Moment einfügen kann, aber ich kann Ihnen die Formeln, die ich in Excel verwendet habe, über einen Screenshot bereitstellen. Es erzeugt einen p-Wert von 0,9782, nahe, dass in R. gegeben Bitte geben Sie die folgende Abbildung für die Werte sehen:

enter image description here

  1. In der obigen, verwende ich die aktuellen Werte als Eingabe in R. Zellen: B3
  2. Ich berechne die Randzeilen- und Spaltensummen
  3. Ich berechne die erwarteten Zellwerte, indem ich ein Produkt der entsprechenden Randzeile und Spaltensumme nehme und durch die Gesamtsumme dividiere. Zellen A7: B8
  4. Ich berechne den nächsten p-Wert mit den tatsächlichen und erwarteten Zählungen.

Wenn Sie die R Prozedur ohne die Yates-Korrektur wieder tun, das heißt chisq.test(tbl1, correct = F), erhalten Sie einen p-Wert von 0,9782, die Excel p-Wert entspricht.

+0

Danke für die Hilfe. Ich hatte die erwarteten Werte falsch berechnet, weil ich die falschen Zahlen zusammenaddierte, um n zu erhalten. – CPerkins