Fehler beim Versuch, Gamma-Verteilung mit R fitdistr {MASS}

Ich habe ein Problem mit fitdistr {MASS} function in R. Ich habe diesen Vektor zu passen:Fehler beim Versuch, Gamma-Verteilung mit R fitdistr {MASS}

a <- c(26,73,84,115,123,132,159,207,240,241,254,268,272,282,300,302,329,346,359,367,375,378, 384,452,475,495,503,531,543,563,594,609,671,687,691,716,757,821,829,885,893,968,1053,1081,1083,1150,1205,1262,1270,1351,1385,1498,1546,1565,1635,1671,1706,1820,1829,1855,1873,1914,2030,2066,2240,2413,2421,2521,2586,2727,2797,2850,2989,3110,3166,3383,3443,3512,3515,3531,4068,4527,5006,5065,5481,6046,7003,7245,7477,8738,9197,16370,17605,25318,58524)

und ich möchte passen eine Gammaverteilung die Daten mit einem Befehl:

fitted.gamma <- fitdistr(a, "gamma")

aber ich solche Fehler haben:

Error in optim(x = c(26, 73, 84, 115, 123, 132, 159, 207, 240, 241, 254, : 
non-finite finite-difference value [1] 
In addition: Warning messages: 
1: In densfun(x, parm[1], parm[2], ...) : NaNs produced 
2: In densfun(x, parm[1], parm[2], ...) : NaNs produced 
3: In densfun(x, parm[1], parm[2], ...) : NaNs produced 
4: In densfun(x, parm[1], parm[2], ...) : NaNs produced

Also habe ich versucht, mit der Initialisierung die Parameter:

(fitted.gamma <- fitdistr(a, "gamma", start=list(1,1)))

Das Objekt fitted.gamma wird erstellt, aber wenn sie gedruckt werden, erzeugt einen Fehler:

Error in dn[[2L]] : subscript out of bounds

Sie wissen, was passiert oder vielleicht einige andere R-Funktionen kennen univariate Verteilungen passen durch MLE?

Vielen Dank im Voraus für jede Hilfe oder Antwort.

Kuba

Quelle

2013-04-12 kuba

immer plotten Ihre Sachen zuerst, Sie ist weit offfffffff Skalierung.

library(MASS) 
a <- c(26,73,84,115,123,132,159,207,240,241,254,268,272,282,300,302,329,346,359,367,375,378, 384,452,475,495,503,531,543,563,594,609,671,687,691,716,757,821,829,885,893,968,1053,1081,1083,1150,1205,1262,1270,1351,1385,1498,1546,1565,1635,1671,1706,1820,1829,1855,1873,1914,2030,2066,2240,2413,2421,2521,2586,2727,2797,2850,2989,3110,3166,3383,3443,3512,3515,3531,4068,4527,5006,5065,5481,6046,7003,7245,7477,8738,9197,16370,17605,25318,58524) 
## Ooops, rater wide 
plot(hist(a)) 
fitdistr(a/10000,"gamma") # gives warnings 
# No warnings 
fitted.gamma <- fitdistr(a/10000, dgamma, start=list(shape = 1, rate = 0.1),lower=0.001)

Jetzt können Sie entscheiden, was mit dem tun

Skalieren

Quelle

2013-04-12 15:14:32

Vielen Dank für Ihre Antwort. Ich sehe, dass das Hinzufügen "niedriger" Argument mit Skalierung den Trick gemacht. Bedeutet das, dass während der Optimierung von Gamma-Parametern irgendwann negative Werte angenommen wurden? Wenn es um die Skalierung geht, warum müssen die Werte skaliert werden (Geschwindigkeitsparameter ist zu niedrig)? Kuba – kuba

Ja, während der Gradientenoptimierung laufen wir leicht in schlechten Gradientenbereichen für einige Proben. Gamma ist möglicherweise nicht die richtige Verteilung, versuchen Sie einfach, ein paar Beispiele zu zeichnen. Log (a) sieht jedoch fast normal aus ... –

Vielen Dank für Ihre Hilfe :) – kuba

Für Daten, die eindeutig die Gamma-Verteilung passt, aber auf der falschen Skala ist (dh, als ob es multipliziert worden war/geteilt durch eine große Nummer), hier einen alternativen Ansatz die Gammaverteilung passend:

fitgamma <- function(x) { 
    # Equivalent to `MASS::fitdistr(x, densfun = "gamma")`, where x are first rescaled to 
    # the appropriate scale for a gamma distribution. Useful for fitting the gamma distribution to 
    # data which, when multiplied by a constant, follows this distribution 
    if (!requireNamespace("MASS")) stop("Requires MASS package.") 

    fit <- glm(formula = x ~ 1, family = Gamma) 
    out <- MASS::fitdistr(x * coef(fit), "gamma") 
    out$scaling_multiplier <- unname(coef(fit)) 
    out 
}

Verbrauch:

set.seed(40) 
test <- rgamma(n = 100, shape = 2, rate = 2)*50000 
fitdistr(test, "gamma") # fails 
dens_fit <- fitgamma(test) # successs 
curve(dgamma(x, 2, 2), to = 5) # true distribution 
curve(dgamma(x, dens_fit$estimate['shape'], dens_fit$estimate['rate']), add=TRUE, col=2) # best guess 
lines(density(test * dens_fit$scaling_multiplier), col = 3)

Quelle

2015-11-04 17:50:04 jwdink

Fehler beim Versuch, Gamma-Verteilung mit R fitdistr {MASS}

Antwort

Verwandte Themen