Meines Datenrahmen sieht wie folgt in R (aber viel größer):Standardabweichung in Abhängigkeit von variablen
x<-c(1,2,3,4,5,6)
y<-c(2,5,3,4,9,63)
run<-c(1,1,2,2,1,1)
studie<-c("stu1","stu1","stu1","stu1","stu2","stu2")
df<-data.frame(x,y,run,studie)
ich die Standardabweichung für jede Spalte berechnet werden soll (in diesem Fall nur x und y) für jeden läufst auf jede Studie, sd für jede Studie und schließlich eine SD für die ganze Spalte. Ein bisschen verwirrend Erklärung aber in diesem Fall wäre es eine sd für (auf x):
(1,2) since they both are in studie 1 and on run 1,
(3,4) since they both are in studie 1 and on run 2,
(5,6) since they both are in studie 2 and on run 1,
(1,2,3,4) since they are in studie 1
(5,6) since they are in studie 2
(1,2,3,4,5,6) since they are in column 1.
Ich denke, ich sollte Funktion anwenden verwenden, aber kann nicht herausfinden, wie es funktioniert.
Okey, das sieht ziemlich gut aus. Ich habe 100 Farben, für die ich die SD berechnen möchte, also habe ich versucht, vars <-df [, 1: 100]; Aggregat (vars ~ run. + Studie, df, sd) hat aber den Fehler ungültigen Typ (Liste) für die Variable 'vars' – PrincessJellyfish
Zwei Korrekturen: (1) 'vars' muss den Namen/Indizes der zugewiesen werden Spalten, verwenden Sie also 'vars <- 1: 100;', und (2) müssen Sie die Nicht-Formel-Schnittstelle von 'aggregate()' verwenden, wenn Sie die Zielspalten mit 'vars' parametrisieren wollen, also aggregate (df [vars], df [c ('run', 'studie')], sd); '. – bgoldst