Angenommen, Sie modellieren binomische Daten, wobei jede Antwort eine Anzahl von Erfolgen (y) aus einer Anzahl von Versuchen (N) mit einigen erklärenden Variablen (a und b) ist. Es gibt ein paar Funktionen, die diese Art der Sache zu tun, und sie scheinen alle unterschiedliche Methoden zu verwenden, um anzugeben, y und N.Welche alternativen Möglichkeiten gibt es, binomiale Erfolge/Versuche in einer Formel zu spezifizieren?
In glm, tun Sie glm(cbind(y,N-y)~a+b, data = d)
(Matrix des Erfolgs/Fehler auf LHS)
In InlA , tun Sie inla(y~a+b, Ntrials=d$N, data=d)
In glmmBUGS (Anzahl der Versuche separat angeben), tun Sie glmmBUGS(y+N~a+b,data=d)
(angeben Erfolg + Studien als Begriffe auf LHS)
Wenn neue Methoden der Programmierung, ich habe immer gedacht, es am besten zu folgen, was Glm macht das, da würden die Leute normalerweise zuerst auf bin treffen omiale Antwortdaten. Ich kann mich jedoch nie daran erinnern, ob es cbind(y,N-y)
oder cbind(y,N)
ist - und ich habe normalerweise Erfolg/Anzahl der Versuche in meinen Daten anstatt Erfolg/Anzahl der Fehlschläge - YMMV.
Andere Ansätze sind natürlich möglich. Zum Beispiel eine Funktion auf der RHS mit markieren, ob die Variable Anzahl von Versuchen oder die Anzahl der fehlschlägt:
myblm(y ~ a + b + Ntrials(N), data=d)
myblm(y ~ a + b + Nfails(M), data=d) # if your dataset has succ/fail variables
oder definieren einen Operator nur einen cbind zu tun, so können Sie tun:
myblm(y %of% N ~ a + b, data=d)
, wodurch der LHS eine gewisse Bedeutung verliehen wird.
Hat jemand bessere Ideen? Was ist der richtige Weg, dies zu tun?
Ich mag% von%, weil es die Reihenfolge offensichtlich macht. Aber es ist weniger Standard .... –
'glm' erlaubt auch die Proportion auf der LHS mit einem zusätzlichen' Gewicht' Argument geben die Nenner gegeben –