2017-03-08 1 views
1

Ich bin ein sehr einfaches Benutzer von R, so entschuldige ich mich im Voraus für die Einfachheit der Frage, oder wenn die Formulierung fehlt.Add t Werte und Konfidenzintervalle zu barplot in R

Ich habe einen großen Datensatz, wo ich eine kontinuierliche numerische Variable und zwei Faktoren mit jeweils 2 Ebenen habe.

Dies ist (mehr oder weniger) eine Rekonstruktion meiner Daten auf der Basis erzeugt/künstliche Daten:

wordhigh.mu <- -2 
    wordlow.mu <- -2.5 
    pswordhigh.mu <- -1.5 
    pswordlow.mu <- -1.5 
    sigma <- 0.3 
wordshigh <- rnorm(50,mean = wordhigh.mu,sd=sigma) 
wordslow <- rnorm(50,mean = wordlow.mu,sd=sigma) 
pswordshigh <- rnorm(50,mean = pswordhigh.mu,sd=sigma) 
pswordslow <- rnorm(50,mean = pswordlow.mu,sd=sigma) 
value <- c(wordshigh,wordslow,pswordshigh,pswordslow) 
LexicalitySample <- c(rep("Word",100),rep("Pseudoword",100)) 
FrequencySample <- c(rep("High",50),rep("Low",50),rep("High",50),rep("Low",50)) 
new.table <- data.frame(ErpMinAv=value,Lexicality=LexicalitySample,Frequency=FrequencySample) 

ich es geschafft, meine Daten plotten ggplot mit:

ExampleBarPlot <- ggplot(new.table,aes(Lexicality,ErpMinAv,fill=Frequency)) + geom_bar(stat="identity",position="dodge") + xlab("Lexicality") + ylab("Microvolts") + labs(title = "Frequency effect for singular nouns and pseudoword controls") + scale_y_continuous("Microvolts",breaks = round(seq(0, -20, by = -0.5),1)) + guides(fill=guide_legend(title="Frequency"))+ scale_colour_manual(values = c("blue","red")) 

Das Grundstück sieht aus wie dies:

Plot using simulated data

Was würde Ich mag n tun Es soll gezeigt werden, dass der Frequenzunterschied zwischen Pseudowörtern nicht signifikant ist, aber zwischen Wörtern signifikant ist. Dafür wäre es toll, eine Signifikanzstatistik (t-Werte in meinem Fall) und auch Konfidenzintervalle zu haben. Ich weiß, wie man diese berechnet, aber ich weiß nicht, wie man sie zum Barplot hinzufügt.

Ich habe ausgiebig im Internet geschaut, aber ich konnte kein Beispiel finden, das zu dem führte, was ich sehen wollte.

Alle Unterstützung wird sehr geschätzt.

Antwort

3

Ich gehe davon aus, dass Sie Mittel und Konfidenzintervalle wollen.

Derzeit zeichnen Sie Summen, weil Sie einen gestapelten Barplot haben. Wir können sehen, dass, wenn eine Rahmenfarbe hinzu:

enter image description here

Wir stat_summary() können Mittel berechnen und Bootstrap-Konfidenzintervall:

ggplot(new.table, aes(Lexicality,ErpMinAv,fill=Frequency)) + 
    stat_summary(geom = 'bar', fun.y = mean, position = position_dodge(0.9)) + 
    stat_summary(geom = 'errorbar', fun.data = mean_cl_boot, position = position_dodge(0.9), 
       width = 0.5) + 
    scale_y_continuous("Microvolts",breaks = round(seq(0, -20, by = -0.5),1)) 

enter image description here

+0

Danke für die Antwort, und für Einführung in stat_summary. Sehr hilfreich! – HernanLG