Ich versuche PCA einige Spalten in größeren Datensatz, der NAs enthält. Wenn ich die NAs entferne, erzeugt dies einen Unterschied in der Anzahl der Elemente, so dass ich den Datensatz für die Label-Information nicht verwenden kann. Wie behebe ich das?PCA mit NAs produziert Mismatch zwischen Teilmenge und Datensatz
> ef <- sepData[c(4, 5, 6, 7, 8, 9, 10)]
> autoplot(prcomp(na.omit(ef)), data = sepData, colour = 'species', label = TRUE, label.size = 3)
Error in data.frame(..., check.names = FALSE) :
arguments imply differing number of rows: 27, 24
sepData enthält die Beispielnamen in jeder Zeile. Wenn ich die NAS entferne, verliere ich die Reihenfolge für einige Spalten.
interpolieren Sie vielleicht Ihre fehlenden Werte? – Nate
Ähnliche Beiträge: [hier] (http://stackoverflow.com/questions/12078291/) und [hier] (http://stats.stackexchange.com/questions/35561) – zx8754