Mit Spaltenindex in data.table Zustand

-2

dt <- data.table(id=c(8,5,4,9,2,7), col1=c(2,1,2,2,3,1), col2=c(1,1,1,2,3,1)) 

    id col1 col2 
1: 8 2 1 
2: 5 1 1 
3: 4 2 1 
4: 9 2 2 
5: 2 3 3 
6: 7 1 1

Ich mag dt die Teilmenge nur Zeilen zu erhalten, die den Wert 2 in einem col1 oder col2 enthält, Spaltenindizes verwenden, anstatt Namen.Mit Spaltenindex in data.table Zustand

Bearbeiten: Um klar zu sein, ich interessiere mich für Situationen, in denen nur Spaltenindizes bekannt sind (Namen sind unbekannt).

Quelle

2016-06-01 Orion

wie 'dt [col1% in% 2 | col2% in% 2,] '? – mtoto

nein, so'dt [as.vector (dt [, 2, mit = F] == 2) | as.vector (dt [, 3, mit = F] == 2)] ', aber ich habe eine große Anzahl von Spalten, daher ist es unpraktisch, dieselbe Bedingung zu kopieren und einzufügen und den Spaltenindex zu ändern. – Orion

@lukeA Ja! Bitte fügen Sie es als Antwort hinzu. – Orion

dt[rowSums(dt[,grep('col',names(dt)), with=F]==2)!=0,] 
    id col1 col2 
1: 8 2 1 
2: 4 2 1 
3: 9 2 2

Mit Spaltenindizes:

dt[rowSums(dt[,c(2,3), with=F]==2)!=0,]

Quelle

2016-06-01 11:52:04

Dies verwendet immer noch die Spaltennamen – Orion

Ich würde eher ID-Spalte auszuschließen dann mit 2 vergleichen, falls es zillion Spalten gibt. – zx8754

'dt [rowSums (dt [, 2: 3, mit = F] == 2)! = 0,]' ist eine indexbasierte Lösung. – lmo

Sie könnten die Verwendung .SD und .SDcols:

dt[dt[, Reduce("|", lapply(.SD, function(x) x==2)), .SDcols=2:3]]

Quelle

2016-06-01 11:55:21 lukeA

Dies funktioniert

> dt <- data.table(id=c(8,5,4,9,2,7), col1=c(2,1,2,2,3,1), col2=c(1,1,1,2,3,1)) 
> dt[dt[[2]] == 2 | dt[[3]] == 2] 
    id col1 col2 
1: 8 2 1 
2: 4 2 1 
3: 9 2 2

Quelle

2017-04-12 07:05:50 promagma

Mit Spaltenindex in data.table Zustand

Antwort

Verwandte Themen