2013-07-23 4 views
6

Scipy docs geben die durch exponentielle verwendete Verteilungsform wie:Scipy - Stats - Bedeutung der Parameter für die Wahrscheinlichkeitsverteilungen

expon.pdf(x) = lambda * exp(- lambda*x) 

jedoch die Anpassungsfunktion nimmt:

fit(data, loc=0, scale=1) 

Und die rvs Funktion übernimmt:

rvs(loc=0, scale=1, size=1) 

Frage 1: Warum die extraneou s Ortsvariable? Ich weiß, dass Exponentiale nur spezifische Formen einer allgemeineren Verteilung (Gamma) sind, aber warum die nicht benötigten Informationen einbeziehen? Selbst Gamma hat keinen Ortsparameter.

Frage 2: Ist der Ausgang der Anpassung (...) in der gleichen Reihenfolge wie die Eingangsvariable. Damit meine ich Wenn ich tun:

t = fit([....]) , t will have the form t[0], t[1] 

Soll ich interpretieren t [0] als die Form und t 1 als Maßstab.

Hält dies für alle Distributionen?

Was für Gamma:

fit(data, a, loc=0, scale=1) 

Antwort

4
  1. Jede univariate Wahrscheinlichkeitsverteilung, egal, was seine übliche Formulierung kann eine Position und Skalenparameter zu ausgedehnt werden. Manchmal bedeutet dies, die Unterstützung der Verteilung von nur den positiven/nicht-negativen Realen auf die gesamte reelle Zahllinie mit nur einem PDF-Wert von 0 zu erweitern, wenn sie unter dem loc Wert liegt. scipy.stats tut dies, um die gesamte Behandlung von loc und scale zu einer gemeinsamen Methode zu verschieben, die von allen Distributionen geteilt wird. Es wurde vorgeschlagen, dies zu entfernen und Verteilungen wie gammaloc - ohne ihre kanonischen Formulierungen zu folgen. Es stellt sich jedoch heraus, dass einige Leute tatsächlich "shifted gamma" Verteilungen mit nicht Null loc Parametern verwenden, um die Größe von Sonnenflecken zu modellieren, wenn ich mich richtig erinnere, und das aktuelle Verhalten von scipy.stats war perfekt für sie. Also behalten wir es.

  2. Die Ausgabe der fit() Methode ist ein Tupel des Formulars (shape0, shape1, ..., shapeN, loc, scale), wenn es N Formparameter gibt. Für eine Normalverteilung, die keine Formparameter hat, wird nur (loc, scale) zurückgegeben. Für eine Gammaverteilung, die eins hat, wird (shape, loc, scale) zurückgegeben. Mehrere Formparameter haben die gleiche Reihenfolge wie jede andere Methode der Verteilung. This holds for all distributions.

+2

Sie beachten sollten, wenn Sie Ihre Funktion korrekt müssen passen (ohne Fremd Parameter loc für die exponentielle) sollten Sie einen Parameter Flocke (feste Position) gleich 0 (der Wert der Position geben Sie möchte reparieren). – EnricoGiampieri

+0

Ganz so! Danke für das Erwähnen. –