Wie bei vielen, bin ich mir sicher, dass dies keine schwierige Antwort ist, aber neu zu sein R Ich habe es nicht herausgefunden.looping logistische Regressionen durch mehrere abhängige und unabhängige Variablen in R
Ich habe einen Datensatz mit ungefähr 100K Fällen, die ich versuche, eine Reihe von logistischen Regressionen auszuführen, die verschiedene abhängige und unabhängige Variablen durchlaufen.
Ich bin nicht sicher, wie die Daten hier zur Verfügung zu stellen, aber hier ist ein Beispiel:
Loc1 loc2 loc3 demo1 demo2 demo3 demo4 demo5 Outcome1 Outcome2
1 0 0 0 1 0 0 1 1 0
0 1 0 1 0 0 1 0 0 1
1 0 0 0 0 1 0 1 0 1
0 0 1 1 0 0 1 0 1 0
Im Grunde ist es ein Bündel von Dummy-Variablen, die Ich mag würde eine Reihe von Regressionen auf wie folgt auszuführen: Glm (Ergebnis ~ Standort * demografische Variable)
Hier gibt es 4 Ergebnisvariablen, die für jede Kombination aus 9 Standorten und 13 verschiedenen demografischen Variablen vorhergesagt werden.
Nochmal - ich nehme an, das ist keine schwierige Antwort, aber ich hatte Schwierigkeiten herauszufinden, wie man mehrere Variablen zur selben Zeit wie diese umschlingt. Vielen Dank im Voraus.
Ok - lassen Sie mich versuchen zu klären. Ich möchte in erster Linie die Regressionen gruppiert nach Standort, so würde ich sie alle für Standort 1 sehen, dann alle für Standort 2, Standort 3, usw.
Es gibt 9 verschiedene Standorte, 13 verschiedene demographische Variablen und 4 verschiedene Ergebnisvariablen.
Ich würde eine Schleife will, das etwas zu diesem Effekt hat:
for(location):
for(outcome):
for(demographic):
summary(glm(outcome ~ demographic * location))
Ich weiß nicht, wie ein Beispieldatensatz hinzuzufügen, aber wenn jemand wissen läßt ich mich etwas umfangreicher als die 4 hinzufügen Fälle, die ich hier gestellt habe.
bitte Ihre Eingabe und erwartete Ausgabe klären – MichaelChirico