2017-07-26 5 views
-1

Ich möchte eine data.frame unterteilen, um nur das 99,5. Perzentil von jeder einer kategorialen Variable zu behalten.Subset-Dataset zu 99,5. Perzentil für jede einer kategorialen Variablen

Meine Daten hat Minuten verwendet = Minuten Und location = Standort

Ich möchte für jeden Standort die Spitze 0,5 Prozent Minuten Daten herauszunehmen.

Die neue Teilmenge würde 99,5 Perzentil der Lage 1. 99,5 Perzentil von 2 Standort hat usw.

Thank you!

+0

Willkommen bei Stack Overflow! Du scheinst jemanden zu bitten, etwas Code für dich zu schreiben. Stack Overflow ist eine Frage-Antwort-Website, kein Code-Schreibdienst. Bitte [siehe hier] (http://stackoverflow.com/help/how-to-ask) um zu erfahren, wie man effektive Fragen schreibt. – Junaid

Antwort

0

Dies würde wahrscheinlich Ihr Problem lösen, obwohl es wirklich hilfreich wäre, wenn Sie Ihre Daten veröffentlichen könnten.

library(plyr) 

#add a column with information on where the 99.5% cutoff is 
new.dataset1 <- ddply(your.dataset, "location", mutate, minutes.99.5.cutoff =       
         quantile(minutes.used, 0.95)) 

#subset the data to only include the bottom 99.5% of the data, then only 
#select the first two columns 
trimmed.dataset <- new.dataset1[which(new.dataset1$minutes.used <= 
             new.dataset1$minutes.99.5.cutoff),1:2] 
Verwandte Themen