Ich mache etwas Codierung in R. Ich möchte die Zeilen anzeigen, die Duplikate für Spalten ID und NAME haben, aber unterschiedliche Werte für AGE haben.Extrahieren Sie Zeilen, die Duplikate für bestimmte Spalten haben, aber in einer anderen Spalte eindeutig sind.
Zum Beispiel habe ich diese Tabelle:
ID | NAME | AGE
111| Mark| 22
222| Anne| 21
333| Chery| 30
444| Megan| 16
555| Charles| 37
111| Mark| 23
222| Anne| 22
333| Chery| 30
111| Mark| 22
Ab jetzt habe ich diesen Code:
readfile <- read.csv(file='/home/user/shane/names.csv')
dat <- data.frame(ID=c(readfile$ID),NAME=c(readfile$NAME),AGE=c(readfile$AGE))
nam <- duplicated(dat[,c('ID','NAME)]) | duplicated(dat[,c('ID','NAME], fromLast = TRUE)
readfile[nam,]
Die Ausgabe sieht wie folgt aus:
ID | NAME | AGE
111| Mark| 22
222| Anne| 21
333| Chery| 30
111| Mark| 23
222| Anne| 22
333| Chery| 30
111| Mark| 22
Ich möchte Die Ausgabe soll lauten:
Ich möchte die Spalten mit der ID = 333 entfernen, da sie den gleichen Wert in Age haben. hätte jemand einen Vorschlag?
Ich bin verwirrt. Wie erreichen Sie die gewünschte Leistung? Durch Filtern des Originals oder des Objekts, in dem Duplikate herausgefiltert werden? Es gibt keine ID 33, nur 333. –
Hallo Entschuldigung, wenn ich unklar bin. Es wäre das Objekt, wo du die Duplikate herausgefiltert hast. Dann würden alle Ages angezeigt, die nicht konsistent sind. zum Beispiel wenn das Alter bei gleicher ID und gleichem Namen 22,23,22 ist. Ich möchte, dass diese Zeilen angezeigt werden. Entschuldigung für mein Englisch. – shia1717