folgendes Beispiel:Zahlen als Variablennamen nicht von statsmodels.formula.api erkannt
import pandas as pd
from pandas import DataFrame
import statsmodels.formula.api as smf
df = DataFrame({'a': [1,2,3], 'b': [2,3,4]})
df2 = DataFrame({'177sdays': [1,2,3], 'b': [2,3,4]})
Dann smf.ols('a ~ b', df) smf.ols('177sdays ~ b', df2)
Und das erste Werk, und die zweite nicht. Der einzige Unterschied scheint das Vorhandensein numerischer Zeichen im Variablennamen zu sein. Warum ist das?
Insbesondere generiert es Fehler ungültige Syntax! – user7147790
... gültige Python-Namen dürfen nicht mit Zahlen beginnen. Vielleicht gibt es unter der Haube ein Eval in Statistikmodellen. Versuchen Sie, mit einem Unterstrich voranzukommen. –
'Q' kann beliebige Variablennamen" zitieren "http://patsy.readthedocs.io/en/latest/builtins-reference.html#patsy.builtins.Q – user333700