2017-02-08 2 views
0

Ich habe Probleme mit meiner ersten Prognose-Implementierung in R. Was ich gerne erreichen würde, ist die Vorhersage der Variablen Y mit 2 exogenen Variablen X1 und X2. Die 3 Datensätze werden jeweils als eine einzelne Spalte mit 12 Zeilen dargestellt.Prognose mit ARIMA und xreg in R

Von einer anderen Stackpost folgte ich einen ähnlichen Ansatz:

DataSample <- data.frame(Y=Y[,1],Month=rep(1:12,1), 
        X1=X1[,1],X2=X2[,1]) 

predictor_matrix <- cbind(Month=model.matrix(~as.factor(DataSample$Month)), 
          X1=DataSample$X1, 
          X2=DataSample$X2) 
# Remove intercept 
predictor_matrix <- predictor_matrix[,-1] 

# Rename columns 
colnames(predictor_matrix) <- c("January","February","March","April","May","June","July","August","September","October","November","X1","X2") 

# Variable to be modeled 
var <- ts(DataSample$Y, frequency=12) 

#Find ARIMA 
modArima <- auto.arima(var, xreg = predictor_matrix) 

An dieser Linie ich die folgende Fehlermeldung erhalten:

Error in optim(init[mask], armaCSS, method = optim.method, hessian = FALSE, : non-finite value supplied by optim

Ich nehme an, dass meine predictor_matrix ist nicht im richtigen Format, aber ich kann finde den Fehler nicht.

Jede Hilfe würde geschätzt,

Antwort

0

Sie angegeben haben, "Datensätze sind ... 12 Reihen". Ihre Prädiktormatrix hat 13 Spalten (11 Monate [von Dummy-Variablen?] Und 2 andere Variablen). Daher haben Sie notwendigerweise eine lineare Abhängigkeit zwischen den Spalten und der Optimierungsvorgang schlägt fehl.

Sie benötigen (idealerweise viel) mehr Daten, um die Anzahl der Prädiktorvariablen und/oder eine geringere Anzahl Prädiktoren zu unterstützen.

+0

Das war in der Tat das Problem, ich benutzte ein Beispiel für einen größeren Datensatz. Gibt es eine Faustregel, wie viele Datensätze pro hinzugefügtem Prädiktor benötigt werden? – user3488736

+0

Die Faustregeln variieren je nach Feld, aber in der Wirtschaftswissenschaft könnte man mindestens viermal so viele Prädiktoren anstreben, wenn man eine starke Pre-Fit-Theorie für die Angemessenheit der Variablen verwendet. In anderen Bereichen würde von Ihnen erwartet werden, viel mehr Daten zu haben, z. 8x statt 4x, z.B. Psychologie, wo die Bedeutung von Variablen von Anfang an schwach sein könnte. –

Verwandte Themen