2013-05-27 11 views
7

Ich habe folgenden Datenrahmen (df1):R- Collapse Zeilen und fasst die Werte in der Spalte

ID someText PSM OtherValues 
ABC c 2 qwe 
CCC v 3 wer 
DDD b 56 ert 
EEE m 78 yu 
FFF sw 1 io 
GGG e 90 gv 
CCC r 34 scf 
CCC t 21 fvb 
KOO y 45 hffd 
EEE u 2 asd 
LLL i 4 dlm 
ZZZ i 8 zzas 

ich die erste Spalte kollabieren möchte, und fügen Sie die entsprechenden PSM-Wert und ich mag die folgende Ausgabe erhalten:

ID Sum PSM 
ABC 2 
CCC 58 
DDD 56 
EEE 80 
FFF 1 
GGG 90 
KOO 45 
LLL 4 
ZZZ 8 

Es scheint machbar mit Aggregatfunktion, aber nicht wissen, die Syntax. Jede Hilfe wird wirklich geschätzt! Vielen Dank.

Antwort

16

In Basis:

aggregate(PSM ~ ID, data=x, FUN=sum) 
## ID PSM 
## 1 ABC 2 
## 2 CCC 58 
## 3 DDD 56 
## 4 EEE 80 
## 5 FFF 1 
## 6 GGG 90 
## 7 KOO 45 
## 8 LLL 4 
## 9 ZZZ 8 
2

Das ist super einfach mit dem plyr Paket:

library(plyr) 
ddply(df1, .(ID), summarize, Sum=sum(PSM)) 
1

Beispiel mit dplyr, die nächste Iteration der plyr:

df2 <- df1 %>% group_by(ID) %>% 
    summarize(Sum_PSM = sum(PSM)) 

Wenn Sie setzen die Zeichen %>%, du bist "Piping". Das heißt, Sie geben ein, was sich auf der linken Seite des Rohrleitungsoperators befindet und führen die Funktion auf der rechten Seite aus.

Verwandte Themen