Ich habe Daten von Paaren, mit Variablen: "Haushaltsnummer", "Haushaltsvorstand", "Bildung", "Einkommen". "Haushaltsnummer" ist die ID-Nummer, die jedem Haushalt eindeutig zugeordnet ist. "Haushaltsvorstand" ist, ob die Person das Oberhaupt des Haushalts ist (1 = Haushaltsvorstand, 2 = Ehepartner des Haushaltsvorstandes), "Bildung" und "Einkommen" Bildungsstand bzw. Einkommen des Einzelnen. Zum Beispiel sehen die Daten wie folgt aus.Wie erstelle ich eine Ehepartnervariable?
'household_number' 'head_of_household' 'education' 'income'
1 1 high 1000
1 2 low 100
3 1 medium 500
3 2 high 800
4 2 high 800
4 1 high 800
9 1 low 150
9 2 low 200
Ich möchte die Variable des Ehepartners für jedes Individuum erstellen. So dass die Daten wie folgt aussehen. Wenn "Ehegatte edu" das Bildungsniveau des Ehegatten ist und "Ehegatte inc" das Einkommen des Ehegatten.
'household_number' 'head_of_household' 'education' 'income' 'spouse_edu' 'spouse_inc'
1 1 high 1000 low 100
1 2 low 100 high 1000
3 1 medium 500 high 800
3 2 high 800 medium 500
4 2 high 800 high 800
4 1 high 800 high 800
9 1 low 150 low 200
9 2 low 200 low 150
Ich habe sehr große Datenmenge, also suche ich nach einer einfachen Möglichkeit, dies zu tun. Gibt es eine elegante Möglichkeit, dies zu tun?
Unten ist reproduzierbare Beispielsyntax.
household_number <- c(1,1,3,3,4,4,9,9)
head_of_household <- c(1,2,1,2,2,1,1,2)
education <- c("high", "low", "medium", "high", "high", "high", "low", "low")
income <- c(1000, 100, 500, 800, 800, 800, 150, 200)
data <- data.frame(household_number, head_of_household, education, income)
'data.table' wird Ihnen helfen. – MKR