Ich habe einen Datenrahmen mit Spaltennamen A, B, C, D mit numerischen Werten. Ich versuche, ein lineares Regressionsmodell zu erzeugen, das Variablen verwendet und alle mögliche Kombination versucht, wie A, A + B, A + C, B, B + C ....
Ich habe Probleme, Kombinationen mit Datenrahmen zu erzeugen.Kombination von Datenrahmen Spalten in Regression r
Data frame
DependentVar A B C D
Ich versuche, etwas zu erzeugen:
Kombinationen von unabhängigen Variablen wie:
var <- A,B,C,D,A+B,A+C,A+D,B+C,B+D,C+D,A+B+C,A+B+D and so on..
for (v in var){
models <- lm (DependentVar ~ eval(parse(text=v)), data=data)
r2 <- append(summary(models)$r.squared)
}
Output wie Datenrahmen:
Variable combination Model R2
A 0.8
B 0.7
.
.
und so weiter
Jede Hilfe wird sehr geschätzt!
Dank für Ihren Kommentar danken. Ich habe einen Zweifel, wie man die formula_list automatisch generiert und nicht manuell aufschreibt. Mein tatsächlicher Datenrahmen hat mehr als 20 Spalten und das Schreiben aller von ihnen wäre fast unmöglich. Können Sie einen Code zum Generieren der Variablenkombinationsliste vorschlagen? Danke – rkg
Aggree mit @ZheyuanLi. Ich habe die Hälfte durch diesen Beitrag geschafft, bevor er als dup markiert wurde. Aber die ursprüngliche Antwort hat Möglichkeiten, die Formel automatisch zu generieren. Abgesehen davon, sind Sie sicher, was auch immer Sie tun, ist eine gute Sache zu tun? Sehr selten habe ich gesehen, dass Menschen Regressionen im industriellen Maßstab schätzen und nur R^2-Statistiken auf statistisch vernünftige Weise betrachten. – AOGSTA