2017-05-18 1 views
0

Gibt es in R eine Funktion, um einen Chi-Quadrat-Zwei-Probe-Test durchzuführen? http://www.itl.nist.gov/div898/software/dataplot/refman1/auxillar/chi2samp.htmChi-Quadrat - zwei Probentest in r

Zum Beispiel würde ich beweisen, wenn x = rnorm (100) und y = rnorm (100) aus der gleichen Verteilung kommen.

Ich versuchte, die chisq.test Funktion zu nutzen, aber ich denke, dass es nicht richtig ist, weil es mir einen sehr großen p-Wert

> chisq.test(rnorm(100),runif(100)) 

    Pearson's Chi-squared test 

data: rnorm(100) and runif(100) 
X-squared = 9900, df = 9801, p-value = 0.239 

danke

+2

Normalerweise würde ich 'chisq.test' nur für binäre/kategorische Daten verwenden. Können Sie genauer erklären, was ein "Chi-Quadrat-Zwei-Stichproben-Test" ist, haben Sie einen anderen Namen dafür? – Marius

+0

[link] (http://www.itl.nist.gov/div898/software/dataplot/refman1/auxillar/chi2samp.htm) – albert

+2

Lesen Sie Ihren Link, es sieht aus wie es ist 'chisq.test', und ist für binned/kategorische Daten vorgesehen. Sie können 'ks.test' versuchen, das für kontinuierliche Daten gedacht ist, aber viele Leute denken, dass es nicht besonders nützlich ist. – Marius

Antwort

0

Ich habe ähnliche Daten gibt - gebinnten Längenhäufigkeiten von Fischen aus zwei verschiedenen Stichprobenmethoden. Da meine Daten nach meinem Verständnis gruppiert sind, ist es nicht sinnvoll, den KS-Test zu verwenden, da dieser Test kontinuierliche Daten erfordert. Also, auch ich, kam über den Chi-Quadrat zwei Stichproben Test von DataPlot an der von Ihnen angegebenen Link: http://www.itl.nist.gov/div898/software/dataplot/refman1/auxillar/chi2samp.htm

Ich installierte die Dataplot-Software und kommuniziert mit der Kontaktperson für den Test, wenn ich Probleme hatte. Ich habe es auch in R ausgeführt und dasselbe Ergebnis erhalten (ein guter Check). Hier ist, was ich in R codiert:

col1 = c (2,4,22,46,81,103,238,65,82,9,58,2) col2 = c (0,0,1,1, 0,10,32,22,20,4,0,0) chisq.test (cbind (Sp1, Sp2))

Pearson's Chi-squared test 

Daten: cbind (Sp1, Sp2) X-squared = 53.782, df = 11, p-Wert = 1.293e-07

HINWEIS: Dataplot hatte nichts dagegen, wenn ich einen Behälter hatte, der Nullen für beide meine Proben hatte, aber R tut - nach viel Frustration erkannte ich t sein, entfernte die geteilten 0s, und R gab mir den gleichen Test stat, df und p Wert, den ich mit DataPlot bekam. Hoffe das hilft!