14
Ich mag würde das Äquivalent der folgenden tun, sondern mit data.table der „durch“:Aggregate alle Spalten mit data.table
dt <- data.table(V1 = rnorm(100), V2 = rnorm(100), V3 = rnorm(100),
group = rbinom(100,2,.5))
dt.agg <- aggregate(dt, by=list(dt$group), FUN=mean)
Ich weiß, dass ich dies tun könnte:
dt.agg <- dt[, list(V1=mean(V1), V2=mean(V2), V3=mean(V3)), by=group]
Aber für den Fall, ich überlege, ich habe 100 oder so Spalten V1-V100 (und ich möchte immer alle von ihnen durch einen einzigen Faktor aggregieren, wie in aggregate oben) so die data.table Lösung, die ich habe oben ist nicht machbar.
Als Referenz unter den reichlich Beispiele in 'data.table' ist folgende:' DT [, lapply (.SD, sum) von = x ] '. – joran
@joran, könnten Sie bitte die Rolle von .SD erklären? – POTENZA
'.SD' bezieht sich auf eine Teilmenge von Daten. –