2016-04-14 5 views
0

Ich stehe vor einer lächerlichen Situation. Zur Bewältigung Daten Ausgabe fehlt, habe ich diesen Code:Umgang mit fehlenden Daten in R

fixed_data <- fetch_data[-which(! complete.cases(train_sample)),] 
train_index <- sample(1:nrow(fixed_data), size = .7*nrow(fixed_data)) 
train_sample <- fixed_data[train_index, ] 
test_sample <- fixed_data[-train_index,] 

Dann prüfe ich die Zeilen von portionierten Daten, um sicherzustellen, gibt es keine fehlenden Wert, aber es ist immer noch Wert fehlt!

length(which(! complete.cases(fixed_data))) 
+0

Definieren Sie "fehlende Daten", ist es ein Leerzeichen, ein NA, eine andere Zeichenfolge, die fehlende angibt? Wenn sie NA sind, können Sie 'is.na()' verwenden, um die Zeilen zu finden, die NA enthalten. Zeichen-NA-Zeichenfolgen werden, soweit ich weiß, von 'complete.cases()' nicht als fehlend angesehen. Das könnte also ein Problem sein. – Badger

+1

Nicht Problem bezogen, aber '- was (! ...)' ist sehr hässlich. Viel besser nur 'was (...)'. Sie sollten Ihre Daten bereitstellen, sonst wie kann jemand helfen? – nicola

+0

Ich benutze das, um alles zu entfernen, was nicht als abgeschlossen betrachtet wird, und nachdem es dies getan hat, betrachtet es immer noch einige andere Zeilen als unvollständig. Das ist das Problem! –

Antwort

0

Ich änderte den Code

fixed_data <- fetch_data[which(complete.cases(fetch_data)),] 

Und es funktioniert jetzt. Was für ein dummer Fehler!