verwenden ich den Code unten, um einen Datenrahmen in r zu erzeugen:bedingte Operation in data.frame in r
set.seed(456)
data_5 <- data.frame(id=factor(rep(c("A","B","c"),each=214)),
people=c(floor(runif(214,min=10,max=800)),
floor(runif(214,min=20,max=810)),
floor(runif(214,min=30,max=820))))
Q1: Ich mag eine neue Spalte hinzuzufügen, wo es die Ergebnisse angezeigt werden, die von jedem Wert in der Spalte kommen "Personen" dividiert durch den Gesamtwert, zu dem es gehört (dh jeder Wert in Kategorie A wird durch den Gesamtwert der Kategorie A geteilt, der gleiche für Kategorie B)
Q2: möchte eine neue Spalte hinzufügen wo es den Mittelwert von Kategorie A, B, C für jeden Schritt (insgesamt 214 Schritt) anzeigen soll, weiß ich, dass es eine Spalte mit 214 Werten 3 mal erzeugen wird .... aber es mag nicht das Plotten von ig beeinflussen uess.
Q3: Ich mag kumulierte Wert Form Q1 für die Kategorie A berechnen, B, C bzw.
versucht haben, diese Ergebnisse zu erhalten, indem jede Spalte zu erzeugen und integrieren, aber nur auf der Suche nach einem besseren Weg, es zu optimieren ..
Prost
Können Sie zeigen, was Sie so versucht, dass es einfacher wird es für andere zu optimieren? – akrun
Anfangs habe ich viele Spalten hinzugefügt, um kumulative Prozentsätze basierend auf verschiedenen Kategorien zu berechnen. Aber die Antwort unten zeigte eine sehr gute Optimierung. – hwq729