2017-04-17 4 views
0

Ich versuche, einen zufälligen Wald in R zu erstellen, mit dem folgenden Code:Zufälliger Forest-Index außerhalb des zulässigen Bereichs?

forest <- 
randomForest(Responder_7yr ~ CD4_num_log + CD8_num_log + anergy_CD8_num_log + 
      anergy_CD4_num_log + part_exhaust_CD8_num_log + exhaustion_CD8_num_log + 
      exhaustion_CD4_num_log + senescence_CD8_num_log + 
      senescence_CD4_num_log + tcm_CD4negCD8pos_num_log + 
      nTreg_CD4posCD8neg_num_log + ln_cpep + A1C + Ins, 
      data=resp, na.action=na.omit, importance=TRUE) 

ich die folgende Fehlermeldung erhalten:

Error in `[.default`(table(observed = y, predicted = out.class), levels(y), : 
    subscript out of bounds 

Ich habe alle Prädiktoren bestätigt in der richtigen sind Format, und das Ergebnis ist im Faktorformat. Jede Hilfe wird sehr geschätzt!

Antwort

2

Überprüfen Sie Ihre Daten, um die Verteilung in den Ebenen Ihrer verschiedenen Prädiktoren und Ergebnisse zu sehen. Sie können feststellen, dass einige Ihrer Prädiktor-Levels oder End-Level sehr stark verzerrt sind, oder einige Ergebnisse oder Prädiktor-Levels sehr selten sind. Ich habe diesen Fehler bekommen, als ich versuchte, ein sehr seltenes Ergebnis mit einer stark abgestimmten zufälligen Gesamtstruktur vorherzusagen, und so waren einige der Vorhersagewerte nicht wirklich in den Trainingsdaten. Somit erscheint in den Testdaten eine Faktorstufe, die nach Ansicht der Trainingsdaten außerhalb der Grenzen liegt.

Verwandte Themen