2017-06-01 7 views
0

Ich habe einen Datensatz mit etwa 2.384 Variablen, aber nur etwa 39 von ihnen verwenden müssen. Ich habe versucht, die Spalten, mit denen ich arbeite, in ein anderes Dataset zu entfernen, aber ich bekomme immer undefinierte Spalten als Fehlermeldung. Unten ist der Code, den ich schrieb:Entfernen mehrerer Spalten in R

BR < - BR [c ("id", "today_m0", "miscarriedwk", "p1_status", "p2_status", "p_status", "p3_status", "preg_bl" , "preg_m6", "preg_m12", "preg_m18", "secedu", "verheiratet", "numchild", "numpregnancy", "nummiscarriages", "numdeliveries", "pHIV_bsln", "chart_cd4_m0", "j8_m0", " partnernowsHIV_m0 "," partnertakesHIV_m0 "", "depression_m0", "mainhivstigma_m0", "meanpersonalstigma_m0", "weiblich_m0", "CommstigmaFinal_m0", "j12r_m0", "PMTCT", "ANC", "j10_m0", "age_m0", "intention1year")]

+2

„Nicht definierte Spalten“ bedeutet, dass keine Spalte mit diesem Namen, also wahrscheinlich einen Tippfehler in dort irgendwo. – neilfws

+0

Bei R ist die Groß- und Kleinschreibung zu beachten. Überprüfen Sie, ob Namen mit Zeichen vorhanden sind, die nicht mit dem Original übereinstimmen. – akrun

Antwort

0

Das dplyr Paket ist ein großes Werkzeug zur Reinigung Daten:

library(dplyr) 
select(BR, id, today_m0, miscarriedwk, p1_status, # etc 

Die Schönheit dieser Ansatz ist, dass die Fehlermeldung wird Ihnen sagen, welche Ihrer Spaltennamen falsch sind:

> select(BR, junk) 
Error in eval(expr, envir, enclos) : object 'junk' not found 
Verwandte Themen