2016-07-15 5 views
1

Ich versuche einen Kolmogorov-Smirnoff-Test mit der Funktion ks_2samp von scipy auszuführen, um festzustellen, ob Histogramme von Daten aus derselben Verteilung stammen. Der zurück p-Wert scheint nicht ganz richtig manchmal aber ...2 Beispiel KS-Test - etwas scheint falsch

Zum Beispiel mit diesem Histogramm:

Histogram.jpg

aa, bb, cc = ax1.hist(list1, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid', rwidth=1, linestyle = 'dashed', linewidth = 1.5) 

dd, ee, ff = ax1.hist(list2, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid',rwidth=1) 

print ks_2samp(aa, dd)`[1]` 

ich einen p-Wert zu erhalten zurück von etwa 0,96, was wirklich nicht richtig scheint ... mache ich etwas falsch? Sollten diese Histogramme nicht so unterschiedlich sein, dass der p-Wert niedriger wäre?

+1

was wollen Sie wahrscheinlich zu tun ist, 'ks_2samp (list1, list2)' – cel

+0

Huh interessant, das ist genau das, was für Dank ich bin auf der Suche! Jetzt bekomme ich einen p-Wert von 1.8e-5, was mehr Sinn macht. Ich dachte, die Funktion hätte vielleicht nicht so funktioniert, da ich ein Histogramm analysierte ... scheint mir nicht intuitiv zu sein, aber vielleicht verstehe ich einfach nicht, wie die Funktion tatsächlich funktioniert. Danke nochmal. – MrDinkleburg

+2

@cel Das sollte sein eine (in der Tat * die *) Antwort. –

Antwort

3

ks_2samp wendet den Kolmogorov-Smirnov-Test auf zwei Stichproben an und testet die Nullhypothese, dass beide aus der gleichen Verteilung stammen.

Daher nimmt ks_2samp auch die beiden Proben (hier list1 und list2) als Eingabe.

ks_2samp(list1, list2) 
Verwandte Themen