2016-12-08 1 views
-1

Reproduzierbare Beispiel:ggplot2 facet_wrap() ist die Anzeige nicht alle verfügbaren Daten

library(ggplot2) 
library(haven) 
library(dplyr) 

data <- read_dta('http://dl.dropboxusercontent.com/s/s7zqb2e0avyp1gk/nswd_old_12.dta') 
data$treatedOrNonSample <- ifelse(data$sample == 1, 0, ifelse(data$treat == 1, 1, 2)) 
treatOrCPS <- subset(data, data$treatedOrNonSample!=2) 

m_ps <- glm(treat ~ age + age2 + ed + hisp + married + nodeg + re74 + re75 + black, 
        family=binomial(link="probit"), data=treatOrCPS) 

prs_df <- data.frame(pr_score = predict(m_ps, type = "response"), 
         treated = m_ps$model$treat) 

labs <- paste("Status:", c("Treated", "CPS Sample")) 

prs_df %>% 
    mutate(treated = ifelse(treated == 1, labs[1], labs[2])) %>% 
    ggplot(aes(x = pr_score)) + 
    geom_histogram(color = "white") + 
    facet_wrap(~treated) + 
    xlab("Probability of being in Treatment Condition") + 
    theme_bw() 

ich folgendes:

enter image description here

Warum gibt es keine Daten für die am weitesten rechts stehenden Zustand ? Ich verliere meine Meinung über dieses scheinbar triviale Thema, so dass jede Hilfe geschätzt werden würde.

+0

Haben Sie Ihre resultierenden Daten vor dem Plotten untersucht? Da Sie keine ggplot2-Fehler erhalten, sollten Sie dies tun, bevor Sie Annahmen treffen, dass der "Fehler" bei ggplot2 liegt. – hrbrmstr

+0

tat ich. Wenn ich die Daten nach Behandlungsstatus und -diagramm unterteile, erhalte ich folgende Diagramme: https://i.imgur.com/H0xAare.png. Ich führe folgende Befehle aus: https://i.imgur.com/DlXAFpB.png – Parseltongue

+1

Ja, ja, du hast es getan. Aber haben Sie auf beiden die Y-Achse betrachtet? Vielleicht möchten Sie die Dokumentation zu den Parametern nach 'facet_wrap()' lesen – hrbrmstr

Antwort

1

color=white Entfernen macht die Daten sichtbar:

prs_df %>% 
    mutate(treated = ifelse(treated == 1, labs[1], labs[2])) %>% 
    ggplot(aes(x = pr_score)) + 
    geom_histogram() + 
    facet_wrap(~treated) + 
    xlab("Probability of being in Treatment Condition") + 
    theme_bw() 

Da jedoch die Zählungen in der "CPS Probengruppe sind viel höher, werden die Daten in der‚behandelten‘Gruppe noch kaum sichtbar ist.

Verwandte Themen