ich einen Datenrahmen haben etwa so:Duplikate suchen unter verschachtelten df
df<- data.frame(region= c("1","1","1","1","2","2","2","3","3", "4",
"4"),
loc=c("1A","1A","1B","1C","2A","2B","2C","3A","3B","4A","4B"), sp1=
c("a","a","b","a","c","c","c","a","a","d","d"), sp2=
c("b","b","c","b","d","d","d","b","b", "e","e"), inter=
c("a_b","a_b","b_c","a_b","c_d","c_d","c_d","a_b","a_b",
"d_e","d_e"))
Ich mag würde der Teilmenge df
nach Regionen erste und finden inter
innerhalb jeder region
duplizieren. Dann möchte ich Duplikat inter
unter allen Regionen finden. Die erste Teilmenge würde wie folgt aussehen:
subset1<- data.frame(region=c("1","2","3","4"), sp1= c("a", "c", "a",
"d"),sp2= c("b", "d", "b", "e"), inter= c("a_b", "c_d", "a_b",
"d_e"))
Und die letzte Ausgabe aussehen würde:
df<- data.frame(sp1= c("a"), sp2= c("b"), inter=c("a_b"))
Sie brauchen nicht die 'mutate' Schritt, wenn Sie die Zählungen zu dem Datensatz hinzufügen möchten. Sie können "n()> 1" direkt in "filter" verwenden, ohne eine Zwischenvariable zu erstellen. – aosmith
Danke ~ Ich will nur OP Schritt für Schritt zeigen. – Wen