2016-11-11 7 views
1

I createFolds Funktion in R ist mit Falten zu schaffen, das erfolgreiche Ergebnis zurückkehrt. Aber wenn ich Schleife verwende, um irgendeine Berechnung auf jeder Falte durchzuführen, komme ich unter Fehler. -Code ist:Index außerhalb des Grenzen-R Fehlers

set.seed(1000) 
k <- 10 
folds <- createFolds(train_data,k=k,list = TRUE, returnTrain = FALSE) 
str(folds) 

Dies wird geben Ausgang als:

List of 10 
$ Fold01: int [1:18687] 1 8 10 21 22 25 26 29 34 35 ... 
$ Fold02: int [1:18685] 5 11 14 32 40 46 50 52 56 58 ... 
$ Fold03: int [1:18685] 16 20 39 47 49 77 78 83 84 86 ... 
$ Fold04: int [1:18685] 3 15 30 38 41 44 51 53 54 55 ... 
$ Fold05: int [1:18685] 7 9 17 18 23 37 42 67 75 79 ... 
$ Fold06: int [1:18686] 6 31 36 48 72 74 90 113 114 121 ... 
$ Fold07: int [1:18686] 2 33 59 61 100 103 109 123 137 161 ... 
$ Fold08: int [1:18685] 24 64 68 87 88 101 110 130 141 152 ... 
$ Fold09: int [1:18684] 4 27 28 66 70 85 97 105 112 148 ... 
$ Fold10: int [1:18684] 12 13 19 43 65 91 94 108 134 138 ... 

jedoch unterhalb Code mir Fehler

schenkt
for(i in 1:k){ 
    testData <- train_data[folds[[i]], ] 
    trainData <- train_data[(-folds[[i]]), ] 
} 

Fehler ist:

> for(i in 1:k){ 
+ testData <- train_data[folds[[i]], ] 
+ trainData <- train_data[(-folds[[i]]), ] 
+ } 
Error in train_data[folds[[i]], ] : subscript out of bounds 

Ich habe versucht, mit verschiedenen Samen Werte, aber ich bekomme denselben Fehler. Jede Hilfe wird geschätzt. Vielen Dank!

Antwort

0

Wie pro meinem Verständnis, Ihr Problem entsteht, weil man den ganzen Datenrahmen verwendet train_data Falten zu erstellen. K-Falten können für Proben, dh Reihen des Datensatzes erzeugt werden.

Zum Beispiel:

data(spam) # from package kernlab 
dim(spam) #has 4601 rows/samples 
folds <- createFolds(y=spam$type, k=10, list=T, returnTrain = T) 
# Here, only one column , spam$type, is used 
# and indeed 
max(unlist(folds)) #4601 
#and these can be used as row indices 
head(spam[folds[[4]], ]) 

den gesamten Datenrahmen zu verwenden ist sehr ähnlich zu einer Matrix verwendet wird. Eine solche Matrix wird zuerst in einen Vektor umgewandelt. Somit wird eine 5x10-Matrix tatsächlich zu 50-Element-Vektor umgewandelt werden, und die Werte in Falten werden die Indizes dieses Vektors werden, entsprechen. Wenn Sie dann versuchen, diese Werte als Zeilenindizes für Ihren Datenrahmen zu verwenden, werden sie

r <- 8 
c <- 10 
m0 <- matrix(rnorm(r*c), r, c) 
features<-apply(m0, c(1,2), function(x) sample(c(0,1),1)) 
features 
folds<-createFolds(features,4)  
folds 
max(unlist(folds)) 

m0[folds[[2]],] # Error in m0[folds[[2]], ] : subscript out of bounds 
überschwingen
Verwandte Themen