2016-07-19 12 views
2

Hier Reihe von einzigartigem Charakter Vektoren zählen, ist ein Beispiel für meine Daten-Sets:Wie in einer Teilmenge von Daten

dput -

(entfernt)

Und ich diesen Datenrahmen am subsetting Monat mit diesem Code:

simpleindoor.mean <- simple_trapindoors %>% group_by(month) %>% summarise(n=n(),mean = mean(bitingrate), stderror = std(bitingrate)) 

die eine Tabelle wie folgt erzeugt:

|Month| n | mean| stderror| 
    |-----|---|-------|---------|       
    |May | 12| 0.25|  0.13| 
    |June | 21| 0.53|  0.12| 
    |July | 21| 0.53|  0.12| 

Was ich tun möchte, ist die Berechnung der Anzahl der einzelnen FAMILY_ID innerhalb eines jeden Monats in der gleichen Funktion, und fügen Sie es als neue Spalte zu "simpleindoor.mean".

FAMILY_ID ist ein Zeichenvektor. Beispiel "6001-032". Wenn also im Mai 12 eindeutige FAMILY_IDs vorhanden wären, würde die neue Datenspalte 12 in der Zeile "May" anzeigen.

Ich habe Beispiele gesehen, in denen Sie nach bestimmten Instanzen eines Zeichenvektors suchen, aber ich habe Mühe, ein Beispiel zu finden, in dem Sie die Instanzen von Vektoren mit eindeutigen Zeichen in einer bestimmten Gruppe zählen können. Wie mache ich das?

Vielen Dank.

+0

Ich kann die 'std' Funktion – Sumedh

+0

finden, das war eine Funktion I Standardfehler berechnen erstellt, sorry ich vergaß zu erwähnen. –

Antwort

3

Sie benötigen n_distinct

simple_trapindoors %>% group_by(month) %>% summarise(n=n(),mean = mean(bitingrate), stderror = std(bitingrate), 
                UniqueFamilies = n_distinct(FAMILY_ID)) 
+0

Vielen Dank, einfache Antwort, aber ich hatte Mühe, die Lösung online zu finden! –

Verwandte Themen