2016-10-10 7 views
1

Ich möchte einige Spalten durch eine Liste von Spalten in einer data.table aggregieren. Ich möchte jedoch darauf verzichten, die Spaltennamen außerhalb der Anführungszeichen (in der by = .(desiredColumn1, desiredColumn2), das heißt) zu verwenden. Ich bin froh, entweder die Spaltennamen oder die Spaltenindizes zu verwenden. Zum Beispiel:Aggregation in data.table durch Verweis auf Spaltennamen

library(data.table) 
x = as.data.table(iris) 
x[, sum(Sepal.Width), by = .(Sepal.Length, Species)] # I want to avoid doing this 
x[, sum("Sepal.Width"), by = .("Sepal.Length", "Species"), with = FALSE] # this does not work 
x[, sum("Sepal.Width"), by = .(1, 5), with = FALSE] 

Irgendwelche Ideen, wie man das macht?

Antwort

2

Wir c verwenden mit names

x[, sum(Sepal.Width), by = c(names(x)[c(1, 5)])] 
+0

Hallo akrun, danke für deine Antwort. Wie kann ich auch vermeiden, auf "Sepal.Length" zu verweisen? Zum Beispiel: 'x [, Summe (" Sepal.Length "), durch = c (Namen (x) [c (1, 5)]), mit = FALSE] # das scheitert' – GerasimosPanagiotakopoulos

+0

@GerasimosPanagiotakopoulos Sie sind bezieht sich nicht direkt auf "Sepal.Length". Meinst du "Sepal.Width"? – akrun

+0

Ja, du hast Recht. Ich meinte "Sepal.Width". – GerasimosPanagiotakopoulos

Verwandte Themen