Ich habe einen Datenrahmen mit ein paar Zeichen Spalten und eine Datumsspalte und eine Zeichenfolge Spalte.Wie filtere ich die Ergebnisse in Tabelle()
Eine der Spalten ist eine Liste von Städten und ich würde gerne wissen, welche Städte in meinem Datensatz am häufigsten auftauchen. Ich benutzte table(dataframe$city)
, aber es gab mir eine Liste von jeder Stadt (einschließlich Städte, die nur ein- oder zweimal auftauchen).
Wie filtere ich die Ergebnisse meiner Stadt, um nur die Städte im obersten Quartil zu zeigen, basierend auf der Häufigkeit, mit der sie in den Daten erscheinen?
hier Beispiel Eingabe:
id price city
1 $0.8 los angeles
2 $0.8 new york
3 $0.5 new york
4 $0.6 new york
5 $0.9 los angeles
6 $0.1 houston
7 $0.7 chicago
8 $0.8 new york
9 $0.7 new york
10 $0.0 new york
11 $0.5 new york
12 $0.1 new york
13 $0.9 new york
14 $0.3 los angeles
15 $0.9 los angeles
16 $0.9 los angeles
17 $0.8 los angeles
18 $0.5 miami
19 $0.9 boston
20 $1.0 newton
21 $0.2 san mateo
22 $0.3 milbrae
Als ich table(dataframe$city)
tun, ich eine Liste von jeder Stadt erhalten und zählen, wie oft es erscheint. Was, wenn ich nur eine Liste der Städte haben möchte, die überdurchschnittlich erscheinen (wie New York und Los Angeles)?
Es ist einfacher, Ihnen zu helfen, wenn Sie ein Beispiel [reproducable] (https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) mit Beispieleingabe und die gewünschte Ausgabe. – MrFlick
Speichern Sie einfach Ihre Ergebnisse Tabelle() in ein Objekt und sortieren Sie es. Mit Soja kann man es mit df sortieren [order (variable_to_be_sorted),] –