2017-05-19 2 views
1

Ich muss den Datensatz teilen. Also benutze ich diesen Code.Wie kann man die Position der Variablen in r extrahieren?

Und ich werde die Faktorvariablen löschen, die mehr Ebenen als 32 in meinem Datensatz haben. Also habe ich die Funktion subset() benutzt.

dataset<-subset(a, selet=-c(??)) 

In ?? Ich muss die Position der Variablen verwenden. Ist es möglich, den Namen der Variablen zu verwenden? Wie lösche ich dann Variablen mit den Namen der Variablen? oder Soll ich nur die Position der Variablen in der Funktion subset() verwenden?

+1

Yep die unter Befehl, das ist der Punkt, der 'subset' ist, dass es die nicht notierten Variablennamen zu nehmen. Für Indizes oder Zeichenfolgen verwenden Sie '['. – alistaire

+0

@alistaire wie benutze ich es in meinem Code ??? aa <-a [, faktor_namen] << Dieser Code extrahiert die Variablen, die mehr als 32 Ebenen haben. Wie extrahiert man außer diesen Variablen? –

+2

Ich würde einfach 'Dataset <- ein [, sapply (a, nlevels) <= 32]' – alistaire

Antwort

0

Sie können auch das gleiche erreichen

a[, sapply(a, function(col) length(unique(col))) <= 32] 
Verwandte Themen