Ich möchte einen Datenrahmen nach Faktor unterteilen. Ich möchte nur Faktorstufen oberhalb einer bestimmten Frequenz beibehalten.Elegante Möglichkeit, seltene Faktorstufen aus dem Datenrahmen zu löschen
df <- data.frame(factor = c(rep("a",5),rep("b",5),rep("c",2)), variable = rnorm(12))
Dieser Code erstellt Datenrahmen:
factor variable
1 a -1.55902013
2 a 0.22355431
3 a -1.52195456
4 a -0.32842689
5 a 0.85650212
6 b 0.00962240
7 b -0.06621508
8 b -1.41347823
9 b 0.08969098
10 b 1.31565582
11 c -1.26141417
12 c -0.33364069
Und ich will Faktorstufen fallen, die weniger als 5-mal wiederholt. Ich habe eine For-Schleife entwickelt und es funktioniert:
Aber gibt es schnellere und schönere Lösungen?
Sie wollen wahrscheinlich ein halb Beitreten – hadley