2015-06-02 11 views
44

Nehmen Sie diese Probe variableR mehr Spalten mit tidyr

df <- data.frame(month=rep(1:3,2), 
       student=rep(c("Amy", "Bob"), each=3), 
       A=c(9, 7, 6, 8, 6, 9), 
       B=c(6, 7, 8, 5, 6, 7)) 

Verbreitung I spread von tidyr zu ändern, um dies zu Wide-Format verwenden kann.

> df[, -4] %>% spread(student, A) 
    month Amy Bob 
1  1 9 8 
2  2 7 6 
3  3 6 9 

Aber wie kann ich zwei Werte z. beide A und B, so dass der Ausgang ist so etwas wie

month Amy.A Bob.A Amy.B Bob.B 
1  1  9  8  6  5 
2  2  7  6  7  6 
3  3  6  9  8  7 

Antwort

95

Hier ist eine möglichst einfache und sehr effiziente Lösung data.table

library(data.table) ## v >= 1.9.6 
dcast(setDT(df), month ~ student, value.var = c("A", "B")) 
# month Amy_A Bob_A Amy_B Bob_B 
# 1:  1  9  8  6  5 
# 2:  2  7  6  7  6 
# 3:  3  6  9  8  7 

Oder eine mögliche tidyr Lösung

df %>% 
    gather(variable, value, -(month:student)) %>% 
    unite(temp, student, variable) %>% 
    spread(temp, value) 

# month Amy_A Amy_B Bob_A Bob_B 
# 1  1  9  6  8  5 
# 2  2  7  7  6  6 
# 3  3  6  8  9  7 
+0

Ich habe mit das selbe Problem, aber ich habe einige Mehrfacheinträge Studenten, A und B für einige Monate. Der Code gibt folgenden Fehler: Fehler: Doppelte Bezeichner für Zeilen. Bitte helfen Sie. –

+1

@PolarBear Wie möchten Sie mit Duplikaten umgehen? Sie wollen summieren? bedeuten? Versuchen Sie die "data.table" -Lösung und fügen Sie 'fun.aggregate = sum' in' dcast' hinzu. –

+0

Ich möchte den Median der Betrogenen mit Hilfe von tidyr nehmen –