Ich habe ein data.frame, das Benutzerinformationen enthält, aber jede Benutzer-ID kann doppelte Zeilen enthalten, mit einigen fehlenden Daten in verschiedenen Variablen. Was ich versuche zu tun ist, doppelte Benutzerdaten zu entfernen, aber für jeden Benutzer möchte ich die Zeile, die am wenigsten fehlende Werte in der Zeile enthält, um so viel wie Informationen des Benutzers wie möglich zu behalten. Hier ist ein Beispiel für Code zum Erstellen des Demo-Datenrahmens. Jede Hilfe wird besonders geschätzt, wenn sie über das "dplyr" -Paket durchgeführt wird.R Zeilen mit mindestens nas für doppelte Zeilen behalten
User_Table <- data.frame(User_ID =rep(c("UserA","UserB","UserC"),each=3),
VariableA= rep(c(1,NA,2),each=3),
VariableB = rep(c("TypeA","TypeB",NA),each=3),
VariableC = rep(c(NA,2,3),each=3))
User_Table[c(1,2,4,5,6,7),3] <- NA
Für User_ID "B" und „C "Es gibt mehrere Fälle, in denen die Zeilen ha ve Mindest-NA. Möchten Sie den ersten Fall oder alle diese Zeilen auswählen? – akrun