2016-08-30 4 views
-3

Ich bin ein R Neuling und brauche Hilfe bei der Analyse von Daten über inhaftierte Personen für ein Projekt. Der Datensatz, mit dem ich arbeite, enthält Informationen aus einem Gefängnis, das die Monate Oktober 2015 bis Juli 2016 umfasst. Ich möchte eine kurze Zusammenfassung der Statistiken nach Monaten erstellen. Ich habe versucht, eine Teilmenge Oktober erstellen erste Formel:Probleme beim Erstellen eines Subsets in R

myworkOCTOBER <- subset(mywork, BEGINDATE=="2015-10-01" & ENDDATE=="2015-10-31") 

Aber wenn ich versuche, die Auswertungsstatistik mit dieser Formel zu ziehen:

summary(myworkOCTOBER)

... die Ausgabe einfach nicht scheint richtig zu sein.

Bitte beraten !!!

+5

"Ausgabe scheint einfach nicht richtig" ist ziemlich vage. Könnten Sie genauer sein, was Sie sehen? Es hilft auch, wenn Sie ein Beispiel der Daten, mit denen Sie arbeiten, einbeziehen können stell das Problem) – Sam

+2

Die große Frage hier ist, ob deine Daten als tatsächliche 'Date' Klassenobjekte codiert sind oder ob sie Zeichenfolgen oder Faktoren sind. Du behandelst sie, als wären sie nicht "Date's", aber es wird einfacher sein, wenn sie es sind. – Gregor

Antwort

0

Es ist schwierig, dies der Daten ohne die Verfügbarkeit zu beantworten, aber man könnte versuchen, die dplyr und lubridate Pakete mit:

library(dplyr) 
library(lubridate) 

mywork %>% 
    mutate(month = month(BEGINDATE)) %>% 
    group_by(month) %>% 
    summarize(example_of_stat_mean = mean(VARIABLENAME), 
       example_of_stat_sd = sd(VARIABLENAME)) 

Dies ist nur ein Beispiel (Sie müßten VARIABLENAME und die Funktion ändern ((mean, sd) basierend darauf, welche Statistik für welche Variable (n) berechnet werden soll

Verwandte Themen