2017-12-19 6 views
0

Ich möchte nur überprüfen, ob das, was ich mache, korrekt ist!Überprüfung der Interpretation der GLM-Zusammenfassung in R

Ich habe Vogelzählungen in mehreren Standorten in zwei Lebensräume kategorisiert - Ackerland und Feuchtgebiet. Ich möchte einfach sehen, welcher Lebensraum höher zählt.

Ich bin ein GLM mit einer Poisson-Funktion (wie sie Zähldaten sind):

> mod <- glm(count ~ habitat, family = "poisson") 

> summary(mod) 


Call: 
glm(formula = count ~ habitat, family = poisson) 

Deviance Residuals: 
    Min  1Q Median  3Q  Max 
-0.5868 -0.4603 -0.2496 -0.2141 2.8464 

Coefficients: 
          Estimate Std. Error z value Pr(>|z|) 
(Intercept)     -0.2695  1.0000 -0.269 0.788 
habitatWetland    1.7331  1.0954 1.582 0.114 

(Dispersion parameter for poisson family taken to be 1) 

    Null deviance: 37.802 on 91 degrees of freedom 
Residual deviance: 34.373 on 90 degrees of freedom 
AIC: 48.987 

Number of Fisher Scoring iterations: 6 

So weit, so gut?

Mein Verständnis ist, dass (unter Verwendung der Standardkontraste) das Intercept auf Habitat bezieht: Ackerland - also würde die geschätzte durchschnittliche Anzahl auf Ackerflächen exp (-0,2695) sein. Die geschätzte durchschnittliche Anzahl an Feuchtgebieten wäre exp (1,7331).

Der Schnittpunkt p-Wert (0,788) gibt die Wahrscheinlichkeit, dass der Schnittpunkt (d. H. Zählung in Ackerland) deutlich größer als Null ist (obwohl ich nicht besonders daran interessiert bin). Der Feuchtgebiet-p-Wert (0,114) gibt die Wahrscheinlichkeit an, dass die Zählung in Feuchtgebieten sich von dem Schnittpunkt unterscheidet (d. H. Anders als die Zählung in Ackerland). In diesem Fall besteht also kein signifikanter Unterschied (auf der Ebene von 5%) zwischen den beiden Lebensraumtypen.

Ist das alles korrekt? An was sollte ich sonst noch denken oder anders denken?

+0

Für zukünftige Referenz sollten statistische Fragen dieser Art an [Cross Validated] (https://stats.stackexchange.com) gesendet werden. – merv

Antwort

0

Schließen, aber für Feuchtgebiet ist die Rate exp(-0.2695 + 1.7331), und Ihr Verständnis von p-Werte ist aus. Der p-Wert ist nicht die Wahrscheinlichkeit, dass die alternative Hypothese wahr ist; es ist die Chance, Daten mindestens so extrem zu sehen, wie sie beobachtet wurden, wenn die Nullhypothese wahr wäre (und Sie unter ähnlichen Umständen mehr Daten sammeln würden).

Der p-Wert für den Achsenabschnitt ist selten nützlich. Aus dem p-Wert für den anderen Koeffizienten (0,114) geht klar hervor, dass Sie keinen Unterschied zwischen Feuchtgebieten und Ackerland nachweisen können.

+0

Danke dafür! Noch eine Sache: Wie interpretiere ich die Standardfehler? I.e. Wenn ich ein einfaches Bar-Plot von Counts in Ackerland im Vergleich zu Counts in Feuchtgebieten mit Fehlerbalken haben möchte, denke ich, dass das Ackerland "exp (-0.2695) +/- exp (1.0000)" und Feuchtgebiet 'exp (-0.2695 + 1.7331) +/- exp (1.0954) '- oder? –

+0

Das wird dir falsche Antworten geben. Verwenden Sie stattdessen 'propect (mod, data.frame (habitat = c (" Ackerland "," Feuchtgebiet "))," response ", se.fit = TRUE)' stattdessen. –

Verwandte Themen