Gruppe durch und Filterdatenmanagement dplyr

mit Nehmen Sie ein einfaches Daten-SetGruppe durch und Filterdatenmanagement dplyr

a <- c(1,2,3,4,5,6,7,8) 
b <- c(1,2,2,1,2,2,2,2) 
c <- c(1,1,1,2,2,2,3,3) 
d <- data.frame(a,b,c)

jetzt will ich meine Daten filtern, so dass wir group_by(c) und dann alle Daten entfernen, wo kein b=1 auftritt.

So sind die Ergebnisse (e) sollte wie d aussehen, aber ohne die beiden unteren Reihen

ich versucht habe

e <- d %>% 
    group_by(c) %>% 
    filter(n(b)>1)

unter Verwendung der Ausgabe der Daten in grün unten enthalten soll und die Daten in rot entfernen

enter image description here

Quelle

2015-06-24 lukeg

'e <- d %>% group_by (c)%>% Filter (b ergibt = = 1) ' – SabDeM

'! B == 1' ist gleich 'b! = 1' was ist vielleicht ein wenig lesbarer? –

nicht genau, so dass ich jede eindeutige'c' Zeile entfernen möchte, wo jede'c' Identität kein'b == 1' – lukeg

Versuchen

d %>% 
    group_by(c) %>% 
    filter(any(b == 1))

Welche gibt:

#Source: local data frame [6 x 3] 
#Groups: c 
# 
# a b c 
#1 1 1 1 
#2 2 2 1 
#3 3 2 1 
#4 4 1 2 
#5 5 2 2 
#6 6 2 2

Quelle

2015-06-24 13:06:07

Großartig. Danke, was ist die'any'-Funktion. es ist nicht dokumentiert in http://cran.r-project.org/web/packages/dplyr/dplyr.pdf – lukeg

@lukeg Dies ist nicht Teil des 'dplyr' Pakets. 'any()' ist in der Basis R. Von '? any': * Gibt es eine Menge von logischen Vektoren, ist mindestens einer der Werte wahr? * –

Sie können versuchen,

df <- d %>% mutate(test = ifelse((b != 1) == T, 0, 1)) %>% group_by(c) %>% 
      mutate(test = sum(test)) %>% filter(test != 0) %>% select(-test)

die

Quelle

2015-06-24 13:24:28

Das scheint übermäßig verschachtelt. Warum verketten Sie nicht alle Ihre Operationen? Warum erstellen Sie einige Variablen mit 'muate()' und einige mit '$'? Warum enden Sie mit 'ungroup()'? –

@ Steven Beaupre, danke. Die Bearbeitung kettet die Ops –

Gruppe durch und Filterdatenmanagement dplyr

Antwort

Verwandte Themen