Es scheint, als ob die Dokumentation für bestglm unvollständig ist. Ich bin auch auf diesen Fehler gestoßen und konnte mit meinem Datenrahmen nichts falsch finden. Schließlich, während ich meine Datenspalten in ein existierendes, funktionierendes data.frame (SAheart aus den Bestglm-Beispielen) setzte, fand ich heraus, dass der Xy-Datenrahmen scheinbar nur die letzte Spalte als Ergebnisvariable verwendet.
Dies schlägt fehl:
> set.seed(1)
> test.data=data.frame(y=rbinom(100,1,.5),X=rnorm(100))
> bestglm(test.data,family=binomial)
Error in bestglm(test.data, family = binomial) :
Binomial nonlogistic-regression: S and F counts can not be <0
Aber das funktioniert:
> set.seed(1)
> test.data=data.frame(X=rnorm(100),y=rbinom(100,1,.5))
> bestglm(test.data,family=binomial)
Morgan-Tatar search since family is non-gaussian.
BIC
Best Model:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.4895482 0.2060214 -2.376201 0.01749194
Egal, wie meine Variablen genannt werden, scheint es immer nur die letzte Spalte zu ergreifen, während das Ergebnis zu verwenden (y) Variable. Im ersten Fall erzeugt dies den Fehler, da diese Spalte nicht streng 0/1 ist, so dass Sie nicht glauben, dass Sie eine logistische Regression durchführen.
Meine Vermutung ist, S und F bedeutet Erfolg bzw. Misserfolg. Sie haben wahrscheinlich negative Werte in 'Xy'. – Roland
Die Sache ist, es gibt keine negativen Werte. In meinem Datensatz habe ich Daten, Einnahmen (positive Werte), binäre und kategorische Variablen (maximal 10 Stufen). – Dontik
Haben Sie die Dokumentation studiert? Sie haben wahrscheinlich die LHS für eine Binomial-GLM nicht korrekt angegeben. Bitte geben Sie ein reproduzierbares Beispiel an. – Roland