2017-11-30 4 views
0

Zum Beispiel könnte die A-Population in einem AB-Test 1000 Datenpunkte haben, von denen 100 Erfolge sind. Während B könnte 2000 Datenpunkte und 220 Erfolge haben. Dies ergibt A einen Erfolgsanteil von 0,1 und B 0,11, wobei das Delta 0,01 ist. Wie kann ich dieses Konfidenzintervall um dieses Delta in Python berechnen?Konfidenzintervall für die Differenz zwischen zwei Proportionen in Python

Statistische Modelle können dies für eine Probe tun, haben aber scheinbar kein Paket, um mit dem Unterschied zwischen zwei Proben umzugehen, wie es für einen AB-Test notwendig ist. (http://www.statsmodels.org/dev/generated/statsmodels.stats.proportion.proportion_confint.html)

+0

https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.ttest_ind.html oder https://stackoverflow.com/questions/752919/any-thoughts-on -ab-testen-in-django-based-project ...? – Dadep

+0

Dies ist ein * ungewöhnliches * Paradigma. Am häufigsten, wenn zwei Populationen verglichen werden, wäre die Hypothese, dass ihre Erfolgswahrscheinlichkeit gleich ist. Daraus würden Konfidenzintervalle um p = 0 berechnet werden. Dies könnte die Erklärung sein, warum Sie hier keine Antworten bekommen. –

Antwort

0

Die Stichprobengrößen müssen nicht gleich sein. Das Konfidenzintervall für zwei Anteile ist enter image description here

p1 und p2 sind die beobachteten Wahrscheinlichkeiten, berechnet über ihre jeweiligen Abtastwerte n1 und n2.

Weitere Informationen finden Sie unter this white paper.

+0

Ich glaube nicht, dass dies die Frage beantwortet. Wie die Autoren dieses Artikels sagen: "Beachten Sie, dass wir keine Aussagen über die Größe des Unterschieds zwischen p2 und p1 in der gesamten Bevölkerung machen - nur, dass es existiert." Die Frage ist, ein Konfidenzintervall um einen Wert von 0,11 zu konstruieren, nicht Null. –

+0

Ich stimme zu, wenn das die Frage ist, was ist dann die Nullhypothese? –

+0

Ich glaube nicht, dass die (gewöhnliche) Theorie zutrifft. (Nicht dass irgendjemand jemals solche Feinheiten beobachtet.) Sie können keine Proben nehmen, den Unterschied zwischen den Proportionen berechnen und dann so tun, als ob Sie testen würden, dass der Unterschied 0,11 war, bevor Sie die Proben genommen haben. Es ist nicht sportlich. –

Verwandte Themen