lapply ignore NA

Hallo Ich möchte auf Spalte meines Datensatzes TrainingData [1] normalisieren. Der Typ dieser Spalte ist num. Aber wenn ich den Code unten ausführe, gab es mir alles NA, ist das, weil es NA in meinem Datensatz gibt, und wie kann ich sagen, dass ich es ignorieren kann?lapply ignore NA

normalize <- function(x) { 
    return ((x - min(x))/(max(x) - min(x))) 
} 

trainingData[1] <- as.data.frame(lapply(trainingData[1], normalize))

Vielen Dank!

Quelle

2017-08-29 Pumpkin C

man konnte die 'min() aufrufen,' und 'max()' Funktionen der Einstellung Argument 'na.rm = TRUE'. Beispiel: 'min (c (NA, 2: 4), na.rm = TRUE)' –

testen Werde

normalize <- function(x) { 
        return ((x - min(x,na.rm=T))/(max(x,na.rm=T) - min(x,na.rm=T))) 
       }

Quelle

2017-08-29 23:53:58

Es funktioniert! Vielen Dank! –

Ihr Willkommen, wenn Sie die Antwort mögen, akzeptieren Sie es –

Sie in einem is.na() Filter in in Ihre normalize() Funktion aufbauen können:

normalize <- function(x) { 
    #first option 
    x <- x[!is.na(x)] 
    #second option 
    #x <- na.omit(x) 
    return ((x - min(x))/(max(x) - min(x))) 
}

Quelle

2017-08-29 23:55:50

Gibt es einen Unterschied zwischen diesen beiden? –

Für Ihren Anwendungsfall, nein. Es kann jedoch zu Ausrichtungsproblemen bei der Unterteilung von Datenrahmen kommen. Hier ist eine gute Erklärung: https://stackoverflow.com/questions/21493447/what-ist-the-difference-between-na-omit-and-is-na –

Vielen Dank. Übrigens, die Genauigkeit meines Modells ist nach der Feature-Skalierung gesunken, ist das möglich? –

lapply ignore NA

Antwort

Verwandte Themen