2017-04-19 3 views
-5
set.seed(1234) 
dataPartition <- sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))  
trainData <- data[dataPartition ==1,] 
testData <- [dataPartition ==2,] 
+1

Warum laufen Sie es nicht und finden Sie heraus? – EJoshuaS

Antwort

2

Sie teilen Ihre Daten in zwei Gruppen.

 sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3)) 

ein Vektor in der Länge der Matrixprobe, die aus 1 und 2 mit einer Wahrscheinlichkeit von 0,7 und 0,3 besteht.

 trainData <- data[dataPartition ==1,] 
     testData <- data[Partition ==2,] ## Fixed the brackets 

Dies ist nur Ihre Daten in zwei zu teilen, um der Lage zu sein (ich nehme an), ein Modell validieren. Hier ist eine detailliertere Antwort, warum teilen Sie Ihre Daten in Zug und Test https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set

Verwandte Themen