2017-10-03 1 views
0

Ich arbeite an einem Datenanalyse-Labor, wo wir das beste Modell zur Vorhersage aus einem Datensatz erstellen müssen.Verwenden von quadratischen Termen im Vergleich zu linear und quadratisch gleichzeitig

Aus meinem Verständnis ist ein Regressionsmodell, das Interaktionsterme (quadratische Terme) als Prädiktoren zusammen mit den linearen Termen enthält, allgemeiner als ein entsprechendes Modell, das nur die linearen Terme verwendet.

Wann würden nur die linearen Begriffe besser funktionieren als beide?

Mein Eindruck ist, dass, wenn die einzelnen Begriffe nicht sehr verwandt sind, dann das Hinzufügen von mehr Begriffen, die sie betreffen, die Daten nur verwirren würde. Ist das der Fall? Ich bin mir nicht sicher, ob ich das Konzept verstehe.

+0

keine Programmierung, sondern eine Datenanalyse/ML Frage. –

+0

@ MarcusMüller Entschuldigung, ich dachte, meine Tags würden dafür sorgen. Gibt es woanders sollte ich die Frage stellen? –

+0

gibt es eine Datenanalyse/Statistik/ml Schwesterseite im Stackexchange-Netzwerk ... –

Antwort

-1

Es gibt eine Menge Details, die dazu gegeben werden könnten, aber ich werde auf eine kurze Antwort bleiben. demonstrieren mit einigen sehr einfachen R-Code und des Verwendens Angepasst R Quadrat:

x <- c(3, 4, 5, 7, 10) 
y <- c(5, 8, 9, 11, 18) 
plot(x, y) 

yfit <- lm(y ~ x) 
rsquaredfit <- summary(yfit)$adj.r.squared 
rsquaredfit 

yfitquad <- lm(y ~ x + I(x^2)) 
yfitquad 
rsquaredfitquad <- summary(yfitquad)$adj.r.squared 
rsquaredfitquad 

Notiere die untere eingestellte R für das Modell mit dem quadratischen Term zum Quadrat. Hier ist die wahre Beziehung klar linear und der quadratische Term überlagert.

Verwandte Themen