Ich habe ein Datenframe mit 1209 Spalten und 27900 Zeilen.Entfernen von Duplikaten aus jeder Zeile in R-Datenframe
Für jede Zeile sind doppelte Werte um die Spalten verteilt. Ich habe versucht, den Datenrahmen zu transponieren und nach Spalten zu entfernen. Aber es stürzt ab.
Nachdem ich transponieren ich verwendet:
for(i in 1:ncol(df)){
#replicate column i without duplicates, fill blanks with NAs
df <- cbind.fill(df,unique(df[,1]), fill = NA)
#rename the new column
colnames(df)[n+1] <- colnames(df)[1]
#delete the old column
df[,1] <- NULL
}
Aber kein Ergebnis so weit.
Ich würde gerne wissen, ob jemand eine Idee hat.
Beste