Ich habe Probleme mit meiner ersten Prognose-Implementierung in R. Was ich gerne erreichen würde, ist die Vorhersage der Variablen Y mit 2 exogenen Variablen X1 und X2. Die 3 Datensätze werden jeweils als eine einzelne Spalte mit 12 Zeilen dargestellt.Prognose mit ARIMA und xreg in R
Von einer anderen Stackpost folgte ich einen ähnlichen Ansatz:
DataSample <- data.frame(Y=Y[,1],Month=rep(1:12,1),
X1=X1[,1],X2=X2[,1])
predictor_matrix <- cbind(Month=model.matrix(~as.factor(DataSample$Month)),
X1=DataSample$X1,
X2=DataSample$X2)
# Remove intercept
predictor_matrix <- predictor_matrix[,-1]
# Rename columns
colnames(predictor_matrix) <- c("January","February","March","April","May","June","July","August","September","October","November","X1","X2")
# Variable to be modeled
var <- ts(DataSample$Y, frequency=12)
#Find ARIMA
modArima <- auto.arima(var, xreg = predictor_matrix)
An dieser Linie ich die folgende Fehlermeldung erhalten:
Error in optim(init[mask], armaCSS, method = optim.method, hessian = FALSE, : non-finite value supplied by optim
Ich nehme an, dass meine predictor_matrix
ist nicht im richtigen Format, aber ich kann finde den Fehler nicht.
Jede Hilfe würde geschätzt,
Das war in der Tat das Problem, ich benutzte ein Beispiel für einen größeren Datensatz. Gibt es eine Faustregel, wie viele Datensätze pro hinzugefügtem Prädiktor benötigt werden? – user3488736
Die Faustregeln variieren je nach Feld, aber in der Wirtschaftswissenschaft könnte man mindestens viermal so viele Prädiktoren anstreben, wenn man eine starke Pre-Fit-Theorie für die Angemessenheit der Variablen verwendet. In anderen Bereichen würde von Ihnen erwartet werden, viel mehr Daten zu haben, z. 8x statt 4x, z.B. Psychologie, wo die Bedeutung von Variablen von Anfang an schwach sein könnte. –