ich einen Datenrahmen haben, die wie folgt aussieht:Erstellen einer Kreuztabelle mehrere Spalten in einem Datenrahmen in R mit
structure(list(ab = c(0, 1, 1, 1, 1, 0, 0, 0, 1, 1), bc = c(1,
1, 1, 1, 0, 0, 0, 1, 0, 1), de = c(0, 0, 1, 1, 1, 0, 1, 1, 0,
1), cl = c(1, 2, 3, 1, 2, 3, 1, 2, 3, 2)), .Names = c("ab", "bc",
"de", "cl"), row.names = c(NA, -10L), class = "data.frame")
Die Spalte cl eine Clusterverband und die Variablen ab, bc & de tragen binäre zeigt Antworten, wobei 1 Ja und 0 bedeutet - Nr.
Ich versuche, eine Tabelle Kreuz Tabstopp-Cluster zusammen mit allen anderen Spalten im Datenrahmen viz ab, bc und de zu erstellen, wobei die Cluster Spaltenvariablen werden. Die gewünschte Ausgabe ist wie dieser
1 2 3
ab 1 3 2
bc 2 3 1
de 2 3 1
ich den folgenden Code versucht:
with(newdf, tapply(newdf[,c(3)], cl, sum))
Dies bietet mir Werte Quer nur eine Spalte zu einer Zeit Tabbing. Mein Datenrahmen hat mehr als 1600 Spalten mit 1 Clusterspalte. Kann jemand helfen?
Es scheint, dass Sie mit 'aggregate' versuchen könnten; Aggregat (. ~ cl, newdf, sum) '? –
alexis_laz ... danke für eine einfache Ausführung. Das ist wirklich nett, aber da mein aktueller Datensatz über 1600 Variablen hat, wird es ein bisschen schwierig, sie alle auf einmal zu lesen. – Apricot