Ich bin auf der Suche nach einem Vorhersagemodell und arbeite mit unserem aktuellen JMP-Modell. Unser aktueller Ansatz besteht darin, ein Polynom n-ten Grades zu erraten und dann zu schauen, welche Terme keine signifikanten Modelleffekte sind. Polynome sind nicht immer die besten und das führt zu viel Verwirrung und schlechten Modellen. Unsere Daten können zwischen 2 und 7 Auswirkungen haben und haben immer eine Antwort.Python Modell Targeting n Variable Vorhersage Gleichung
Ich möchte Python dafür verwenden, aber Paketdokumentation oder Online-Anleitungen für so etwas sind schwer zu finden. Ich weiß, wie man ein bestimmtes Polynom n-ten Grades anpasst oder eine lineare Regression in Python vornimmt, aber nicht, wie man den besten Funktionstyp für den Datensatz "rät".
Fehle ich etwas offensichtlich oder sollte ich etwas schreiben, das durch eine Vielzahl von Funktionstypen untersucht? Präzision ist das Wichtigste. Ich arbeite mit einem kleinen (~ 2000x100) Datensatz.
Potenziell kann ich kleinere Trainingssätze regressieren, sie mit dem Validierungssatz vergleichen, dann die Modelle ordnen und die besten auswählen. Gibt es etwas Besseres?