2017-03-22 4 views
2

Vom docsWas bedeuten die Parameter in scipy.stats.zipf?

Die Wahrscheinlichkeit Massenfunktion für zipf ist:

zipf.pmf (k, a) = 1/(zeta (a) * k ** a) für k> = 1.

ZIPF dauert a als Formparameter.

Die oben genannte Wahrscheinlichkeits-Massenfunktion ist in der "standardisierten" Form definiert. Um die Verteilung zu verschieben, verwenden Sie den Parameter loc. Insbesondere ist zipf.pmf (k, a, loc) identisch mit zipf.pmf (k - loc, a).

Aber was bedeutet das a und k beziehen sich auf? Was bedeutet "Formparameter"?

Zusätzlich gibt es in scipy.stats.zipf.interval einen alpha Parameter.

Die Beschreibung des .interval() Methode ist einfach:

Endpunkte des Bereichs, der alpha Prozent der Verteilung

Was bedeutet der alpha Parameter bedeuten enthält? Ist das das "Konfidenzintervall"?

+0

Verwandte: http://stats.stackexchange.com/questions/269255/is-it-right-to-use-normal-distribution-to-compute -Konfidenzintervalle eines poin – alvas

Antwort

3

Was bedeutet "Formparameter"?

Wie der Name schon sagt, bestimmt ein Formparameter die Form einer Verteilung. Dies ist wahrscheinlich am einfachsten zu erklären, wenn sie mit Start, was ein Formparameter ist nicht:

  1. A Standort Parameter verschieben die Verteilung überlässt es aber ansonsten unverändert. Zum Beispiel ist der Mittelwert einer Normalverteilung ein Standortparameter. Wenn X normalerweise mit Mittelwert mu verteilt wird, wird X + a normalerweise mit Mittelwert mu + a verteilt.

  2. Ein Maßstab Parameter macht die Verteilung breiter oder schmaler. Zum Beispiel ist die Standardabweichung einer Normalverteilung ein Skalierungsparameter. Wenn X normalerweise mit der Standardabweichung sigma verteilt ist, wird X * a normalerweise mit der Standardabweichung sigma * a verteilt.

  3. Schließlich ändert ein Shape Parameter die Form der Verteilung. Zum Beispiel hat die Gamma distribution einen Formparameter k, der bestimmt, wie verzerrt die Verteilung ist (= wie stark sie sich zu einer Seite "neigt").

Aber was bedeutet das a und k beziehen sich auf?

k ist die Variable, die durch die Verteilung parametrisiert wird. Mit zipf.pmf können Sie die Wahrscheinlichkeit von k berechnen, gegebenen Formparameter a. Unten ist ein Diagramm, das zeigt, wie a die Form der Verteilung (die einzelnen Wahrscheinlichkeiten von verschiedenen k) ändert.

enter image description here

Eine hohe a macht große Werte von k sehr unwahrscheinlich, während eine niedrige a klein macht k weniger wahrscheinlich und größere k möglich sind.

Was bedeutet der Parameter alpha? Ist das das "Konfidenzintervall"?

Es ist falsch zu sagen, dass alphaist das Konfidenzintervall. Es ist das Konfidenzniveau. Ich nehme an, das hast du gemeint. Zum Beispiel: alpha=0.95 Bedeutet, dass Sie ein 95% -Konfidenzintervall haben. Wenn Sie zufällig k s aus der bestimmten Verteilung generieren, werden 95% von ihnen in dem Bereich sein, der von zipf.interval zurückgegeben wird.

-Code für die Handlung:

from scipy.stats import zipf 
import matplotlib.pyplot as plt 
import numpy as np 

k = np.linspace(0, 10, 101) 

for a in [1.3, 2.6]: 
    p = zipf.pmf(k, a=a) 

    plt.plot(k, p, label='a={}'.format(a), linewidth=2) 

plt.xlabel('k') 
plt.ylabel('probability') 

plt.legend() 
plt.show()