R - Median einer Häufigkeitsverteilung, durch eine andere Variable gruppiert

ich einen Datensatz haben, die aussehen wie folgt: http://i.imgur.com/OdiLf4t.png R - Median einer Häufigkeitsverteilung, durch eine andere Variable gruppiert

Meine gewünschte Ausgabe wäre eine Gruppierung nach Staat und die Median-Zahlung mit den Spalten für die durchschnittliche Zahlung und Häufigkeit.

Ich weiß, wie diese

für die Gesamtdatenmenge zu tun

median(rep(Clean$medicare_average_payment, Clean$Frequency))

aber nicht sicher, wie dies von Staat zu tun Danke

Quelle

2016-05-03 Matt S

Mögliche Duplikat [Wie eine Variable, die durch Gruppe zusammenzufassen?] (Http: // Stackoverflow .com/questions/1660124/how-to-sum-a-variable-by-group) – MichaelChirico

Wir mit dplyr

library(dplyr)  
Clean1 <- Clean[rep(1:nrow(Clean), Clean$Frequency),] 
Clean1 %>% 
     group_by(State) %>% 
     summarise(Median = median(medicare_average_payment))

versuchen

Oder mit data.table

library(data.table) 
setDT(Clean)[, .(Median = median(rep(medicare_average_payment, Frequency))) , State]

Quelle

2016-05-03 02:49:08 akrun

Danke, die dplyr-Methode hat super funktioniert! –

Sie können by verwenden, um den Datenrahmen zu tun aufgeteilt und diese Funktion auf jedem Stück durchführen:

by(Clean, Clean$State, 
    FUN=function(x) median(rep(x$medicare_average_payment, x$Frequency)) 
)

Quelle

2016-05-03 03:06:47

R - Median einer Häufigkeitsverteilung, durch eine andere Variable gruppiert

Antwort

Verwandte Themen