Ich bin (was ich denke) als ziemlich geradlinige multiple lineare Regressionsmodell passen mit Stats-Modell.Statsmodel Mehrere lineare Regressionsfehler - Python
Mein Code ist wie folgt:
y = 'EXITS|20:00:00'
all_columns = "+".join(y_2015piv.columns - ['EXITS|20:00:00'])
reg_formula = "y~" + all_columns
lm= smf.ols(formula=reg_formula, data=y_2015piv).fit()
Weil ich etwa 30 Faktor Variablen ich die Formel Erstellen von String-Manipulation mit Python. "y" ist wie oben dargestellt. all_columns ist der Datenrahmen y_2015piv columns ohne "y".
Dies ist all_columns:
DAY_Fri+DAY_Mon+DAY_Sat+DAY_Sun+DAY_Thu+DAY_Tue+DAY_Wed+ENTRIES|00:00:00+ENTRIES|04:00:00+ENTRIES|08:00:00+ENTRIES|12:00:00+ENTRIES|16:00:00+ENTRIES|20:00:00+EXITS|00:00:00+EXITS|04:00:00+EXITS|08:00:00+EXITS|12:00:00+EXITS|16:00:00+MONTH_Apr+MONTH_Aug+MONTH_Dec+MONTH_Feb+MONTH_Jan+MONTH_Jul+MONTH_Jun+MONTH_Mar+MONTH_May+MONTH_Nov+MONTH_Oct+MONTH_Sep
Die Werte in dem Datenrahmen kontinuierlich sind numerische Variablen und 0/1 Dummy-Variablen.
Wenn ich versuche, und passen das Modell, das ich diesen Fehler:
PatsyError: numbers besides '0' and '1' are only allowed with **
y~DAY_Fri+DAY_Mon+DAY_Sat+DAY_Sun+DAY_Thu+DAY_Tue+DAY_Wed+ENTRIES|00:00:00+ENTRIES|04:00:00+ENTRIES|08:00:00+ENTRIES|12:00:00+ENTRIES|16:00:00+ENTRIES|20:00:00+EXITS|00:00:00+EXITS|04:00:00+EXITS|08:00:00+EXITS|12:00:00+EXITS|16:00:00+MONTH_Apr+MONTH_Aug+MONTH_Dec+MONTH_Feb+MONTH_Jan+MONTH_Jul+MONTH_Jun+MONTH_Mar+MONTH_May+MONTH_Nov+MONTH_Oct+MONTH_Sep
Es gibt nichts auf der Linie, die Adressen, was das sein könnte. Jede Hilfe wird geschätzt.
Übrigens, wenn ich dieses Modell in Scikit-lernen, funktioniert es gut. Ich denke, die Daten sind in Ordnung.
Vielen Dank im Voraus.
Mit der 'Q' Notation funktionierte immer noch nicht. Ich habe einen anderen Fehler bekommen.Wie auch immer, wenn ich die direkte Schnittstelle verwendet habe, wie Sie vorgeschlagen haben. Es funktionierte gut mit den Variablennamen wie es ist. Vielen Dank! – Windstorm1981