Ich habe einen großen Datenrahmen mit Gruppen und Untergruppen. Ich mag den Index der Untergruppe in jeder Gruppe bestimmen, wie in der OUTPUT
Spalte des folgenden Datenrahmen gezeigt:Untergruppe Index bestimmen
df <- data.frame(
Group = factor(c("A","A","A","A","A","B","B","B","B")),
Subgroup = factor(c("a","a","b","b","b","a","a","b","b")),
OUTPUT = c(1,1,2,2,2,1,1,2,2)
)
ich mehrere Möglichkeiten ohne Erfolg versucht habe. Ich würde gern mit dplyr
arbeiten, aber ich bin mir nicht sicher, wie ich das anstellen soll. Der folgende Code gibt ein unerwartetes Ergebnis zurück.
require(dplyr)
df <- df %>%
group_by(Group) %>%
mutate(
OUTPUT_2 = dplyr::id(Subgroup)
)
#df
# Group Subgroup OUTPUT_2
# (fctr) (fctr) (int)
#1 A a 8
#2 A a 8
#3 A b 8
#4 A b 8
#5 A b 8
#6 B a 4
#7 B a 4
#8 B b 4
#9 B b 4
Ich habe das Gefühl, ich bin in der Nähe, aber nicht dort hin. Kann jemand helfen?
von 'Gruppe' Gruppierung Sie benötigen etwas wie ' as.numerisch (Untergruppe) '? – aosmith