1

Ich habe ein bestehendes Modell, das Hauspreise prognostiziert, die einfache lineare Regression verwendet. Als Eingabe habe ich Datum und Ausgabe ist Preis.bessere Ergebnisse von einfachen linearen Regression als multivariate/multiple reg

Ich wollte die Gesamtergebnisse verbessern, also habe ich eine weitere Funktion hinzugefügt. Neu ist die Entfernung von der geschätzten Immobilie.

Problem ist, dass die multiple/multivariate Regressionen ein bisschen schlechter als die einfache Regression führt. (Alle Daten sind normalisiert)

Haben Sie einige Ideen, warum das passiert und wie kann ich das angehen?

Antwort

1

Es gibt Dutzende von möglichen Gründen, nur aufzulisten paar:

  • , wenn Ihr neues Feature ist kaum korreliert mit dem, was man vorherzusagen versuchen - Sie werden somit an das System effizient injizieren Lärm kann nicht besser erwarten Leistung
  • wenn Sie haben nur sehr wenige Datenpunkte mehr Funktionen zu viel schwierigeres Problem
  • da Sie lineares Modell führen kann verwenden, auch wenn die neue Funktion sehr guter Prädiktor ist, aber ihre Beziehung ist nicht zum abhängige lineare Variable - Modell wird fehlschlagen a s gut
  • lineare Regression als solche ist sehr naive Modell, sogar Grat/lasso Regression könnte vollständig das Ergebnis ändern (vor allem lasso, da es bessere Angebote mit schlechten Eigenschaften)
Verwandte Themen