Fügen Sie eine Spalte hinzu, um US-Bundesstaaten nach ihrer US-Census-Region zu markieren

Ich habe Daten, die E-Mailadresse und Status enthalten, und ich möchte eine Spalte erstellen, die die Region kennzeichnet, in der sich jeder Status befindet. In SQL habe ich dies über case-Anweisungen gemacht in R, was ist der beste Weg? Ich definiere Regionen durch die US-Volkszählung (Stand 2017).Fügen Sie eine Spalte hinzu, um US-Bundesstaaten nach ihrer US-Census-Region zu markieren

Meine Ausgangsdaten wie folgt aussehen:

emailaddress  states 
[email protected] NV  
[email protected] CA  
[email protected]  UT  
[email protected] AZ  
[email protected]  IA

ich das Ergebnis sein will:

emails   states regions 
[email protected] NV  West 
[email protected] CA  West 
[email protected]  UT  West 
[email protected] AZ  West 
[email protected]  IA  Midwest

Dann möchte ich diese Ausgabe in eine CSV-Datei schreiben.

Jede Hilfe oder Startpunkt ist willkommen.

Quelle

2017-09-06 sim

Sie vielleicht brauche 'split (df1 $ states, df1 $ regions)' oder wenn du eine separate Spalte brauchst, dann mit 'dcast' zB' library (data.table); dcast (setDT (df1), rowid (Regionen) ~ Regionen, value.var = "states") ' – akrun

@ akrun..Thanku für einen Start..Aber ich habe eine kurze Frage .. Wie ich diese Staaten gruppieren werde Regionen? AS diese Regionspalte ist die Ausgabe, die ich will – sim

Ich denke, die beste Option wäre, eine 'liste' mit' split' zu haben, wie oben in meinen Kommentaren erwähnt – akrun

Der schwierige Teil wie üblich sammelt die Daten zuerst, aber ich habe es zufällig von der US Census archiviert. So führen Sie die folgenden Zeilen Code nach läuft die "State/Region Daten" unter:

df <- data.frame(emails=c("[email protected]","[email protected]","[email protected]", 
          "[email protected]","[email protected]"), 
       states=c("NV","CA","UT","AZ","IA")) 

df$regions <- sapply(df$states, 
       function(x) names(region.list)[grep(x,region.list)]) 

#Then write to desktop, for example, with: 
write.csv(df,"~/Desktop/nameHere.csv",row.names=FALSE)

Ausgang:

  emails states regions 
1 [email protected]  NV West 
2 [email protected]  CA West 
3 [email protected]  UT West 
4 [email protected]  AZ West 
5 [email protected]  IA Midwest

Bundesland/Region Daten:

NE.name <- c("Connecticut","Maine","Massachusetts","New Hampshire", 
      "Rhode Island","Vermont","New Jersey","New York", 
      "Pennsylvania") 
NE.abrv <- c("CT","ME","MA","NH","RI","VT","NJ","NY","PA") 
NE.ref <- c(NE.name,NE.abrv) 

MW.name <- c("Indiana","Illinois","Michigan","Ohio","Wisconsin", 
      "Iowa","Kansas","Minnesota","Missouri","Nebraska", 
      "North Dakota","South Dakota") 
MW.abrv <- c("IN","IL","MI","OH","WI","IA","KS","MN","MO","NE", 
      "ND","SD") 
MW.ref <- c(MW.name,MW.abrv) 

S.name <- c("Delaware","District of Columbia","Florida","Georgia", 
      "Maryland","North Carolina","South Carolina","Virginia", 
      "West Virginia","Alabama","Kentucky","Mississippi", 
      "Tennessee","Arkansas","Louisiana","Oklahoma","Texas") 
S.abrv <- c("DE","DC","FL","GA","MD","NC","SC","VA","WV","AL", 
      "KY","MS","TN","AR","LA","OK","TX") 
S.ref <- c(S.name,S.abrv) 

W.name <- c("Arizona","Colorado","Idaho","New Mexico","Montana", 
      "Utah","Nevada","Wyoming","Alaska","California", 
      "Hawaii","Oregon","Washington") 
W.abrv <- c("AZ","CO","ID","NM","MT","UT","NV","WY","AK","CA", 
      "HI","OR","WA") 
W.ref <- c(W.name,W.abrv) 

region.list <- list(
    Northeast=NE.ref, 
    Midwest=MW.ref, 
    South=S.ref, 
    West=W.ref)

Quelle

2017-09-06 04:56:06 www

..In meinen Daten habe ich tausend E-Mails.so am Anfang, wo Sie E-Mails erwähnt, wie werde ich gib diese alle E-Mails ein ?? – sim

@sim - In welchem Format sind Ihre Daten gespeichert? Ist es eine Textdatei, eine CSV? Bitte suchen Sie nach Seiten wie [diese] (https://stackoverflow.com/questions/3391880/how-to-get-a-csv-file-into-r) auf read.csv(), um "zu lesen in "Ihre Daten zu R. Sie müssen sie nicht manuell eingeben. Die obigen Beispieldaten dienen nur dazu, meine Antwort zu demonstrieren. – www

..Meine Daten sind in CSV-Datei – sim

Fügen Sie eine Spalte hinzu, um US-Bundesstaaten nach ihrer US-Census-Region zu markieren

Antwort

Verwandte Themen