Ich habe Probleme, die Verwendung des plyr-Pakets zu verstehen. Ich versuche es zu verwenden, um Datenframes zu teilen, die in einer Liste gespeichert sind, eine Funktion anzuwenden, die Ergebnisse als Datenframes zu speichern und die Datenframes wieder als Liste zu kombinieren. So die follwing Daten gegeben:Probleme bei der Verwendung des plyr-Pakets und beim Arbeiten mit Listen
#create test dfs
df1<-data.frame(a=sample(1:50,10),b=sample(1:50,10),c=sample(1:50,10),d=(c("a","b","c","a","a","b","b","a","c","d")))
df2<-data.frame(a=sample(1:50,9),b=sample(1:50,9),c=sample(1:50,9),d=(c("e","f","g","e","e","f","f","e","g")))
df3<-data.frame(a=sample(1:50,8),b=sample(1:50,8),c=sample(1:50,8),d=(c("h","i","j","h","h","i","i","h")))
#make them a list
list.1<-list(df1=df1,df2=df2,df3=df3)
Ich mag würde den Mittelwert jeder Gruppe in d jeden Datenrahmen definiert berechnen. Wenn ich nur auf einem Datenrahmen verwenden plyr würde eine Möglichkeit (den Mittelwert nach einer bestimmten Spalte von Gruppen zu berechnen) das plyr Paket zu verwenden wäre:
ddply(df1,.(d),summarise, mean=mean(a))
aber wie bewerbe ich mich auf jeder Spalte innerhalb der Datenrahmen und auf jedem Datenrahmen in der Liste? und wie kann ich alle Daten neu zusammensetzen, damit ich am Ende eine Liste mit Matrizen bekomme, die die Ergebnisse enthalten? Sorry für diese sehr grundlegende Frage, aber ich bin neu in R und ich habe wirklich versucht, dies für eine ganze Weile zu lösen ... thx.
perfekt und einfach zu bedienen. daran dachte ich, aber ich weiß nicht, wie ich das Objekt in ddply benennen soll. So funktioniert es jetzt! Danke. – Joschi