Wie definiere ich mehrere Werte als fehlende in einem Datenrahmen in R?Definieren Sie mehrere Werte als fehlend in einem Datenrahmen
Betrachten sie einen Datenrahmen, in dem zwei Werte „888“ und „999“, stellen Daten fehlen:
df <- data.frame(age=c(50,30,27,888),insomnia=c("yes","no","no",999))
df[df==888] <- NA
df[df==999] <- NA
Diese Lösung nimmt eine Codezeile pro Wert, die fehlenden Daten. Haben Sie eine einfachere Lösung für Situationen, in denen die Anzahl der Werte für fehlende Daten hoch ist?
Versuchen 'df [df == 888 | df == 999] <- NA', da diese in zwei verschiedenen Spalten – akrun
als alt, könnten Sie wandeln sie mit 'na.strings' beim Einlesen bei' read.table' (und Variationen) zB 'na.strings = c (", 888, 999) " – user20650