2017-06-08 1 views
0

Normalerweise habe ich einige Variable in 3 Bedingungen in 2 Gruppen. Wie kann ich herausfinden, ob es statistische Unterschiede zwischen diesen beiden Gruppen gibt?Unterschiede zwischen zwei Gruppen in molekulargenetischen

Zum Beispiel kurzen CSV:

genotype,group,gene 
5g/5g,1,PAI 
5g/5g,1,PAI 
4g/5g,1,PAI 
4g/5g,1,PAI 
4g/5g,1,PAI 
4g/5g,1,PAI 
5g/5g,1,PAI 
4g/4g,1,PAI 
4g/4g,1,PAI 
4g/4g,2,PAI 
4g/5g,2,PAI 
4g/4g,2,PAI 
4g/4g,2,PAI 
4g/4g,2,PAI 
4g/5g,2,PAI 
5g/5g,2,PAI 
4g/4g,2,PAI 
5g/5g,2,PAI 
5g/5g,2,PAI 
5g/5g,2,PAI 
4g/5g,2,PAI 

Gene PAI haben 3 Genotypen: 5g/5 g, 4 g/5 g und 4 g/4g.

Falls vorhanden diese Daten in Tabellenformat:

enter image description here

Also, wie kann ich einen p-Wert like there - Bild unten? picture below

+0

zu klären, ein Unterschied in was? Proportionen jedes Genotyps zwischen den beiden Gruppen? –

+0

Ja, denke ich. Wie ich sehen kann (letztes Bild), um Unterschiede zu analysieren, benutzte ich Chi-Quadrat-Test. Und p-Wert = 0,56. So haben zwei Gruppen keine statistischen Unterschiede. – autumnrustle

Antwort

1

Könnte das das sein wonach Sie suchen?

## simulating some data 
df <- data.frame(genotype=sample(c("5g/5g","4g/5g","4g/4g"),16,replace=T), group=c(rep(1,8), rep(2,8))) 

df 
## genotype group 
## 1  4g/5g  1 
## 2  4g/5g  1 
## 3  4g/5g  1 
## 4  5g/5g  1 
## 5  5g/5g  1 
## 6  4g/4g  1 
## 7  4g/4g  1 
## 8  4g/5g  1 
## 9  4g/4g  2 
## 10 4g/4g  2 
## 11 4g/4g  2 
## 12 4g/5g  2 
## 13 5g/5g  2 
## 14 5g/5g  2 
## 15 4g/5g  2 
## 16 4g/4g  2 

## first a table 
with(df, table(group, genotype)) 
##  genotype 
## group 4g/4g 4g/5g 5g/5g 
##  1  2  4  2 
##  2  4  2  2 

## and maybe a chi-squared test is what you want? 
with(df, chisq.test(table(group,genotype))) 
## Pearson's Chi-squared test 

## data: table(group, genotype) 
## X-squared = 1.3333, df = 2, p-value = 0.5134 

Beachten Sie, dass dies nicht mit Ihren realen Daten ist, aber Sie könnten das gleiche tun.

+1

Rost! aber jedes Mal, wenn ich eine Warnung habe "chisq.test (Tabelle (Gruppe, Genotyp)): Chi-Quadrat-Approximation kann falsch sein". Ist es im Testdatensatz möglich, dass einige Werte sehr klein sind? Also, wenn einige Werte sehr klein sind (manchmal habe ich wirklich 0 oder 1 für einige Werte) muss ich nicht Chi-Quadrat-Test verwenden? Ich brauche fisher.test? – autumnrustle

+1

Guter Punkt. Die Chi-Quadrat-Approximation ist bei kleinen Stichprobengrößen weniger zuverlässig - Sie können eine Tabelle mit erwarteten Zählungen mit 'mit (df, chisq.test (Tabelle (Gruppe, Genotyp)) $ erwartet erzeugen) - im Allgemeinen, wenn irgendwelche erwarteten Zählungen vorliegen weniger als 5, wird der Chi-Quadrat-Test nicht empfohlen. Alternativen sind Fishers exakter Test (den Sie bereits gefunden haben!) Oder ein Chi-Quadrat-ish-Test basierend auf Randomisierung, mit (df, chisq.test (Tabelle (Gruppe, Genotyp), simulate.p.value = T)) . Vielleicht versuchen Sie beide, und sehen Sie, ob die p-Werte ähnlich sind? –

+0

GROSSES DANKE! Es ist traurig, dass ich dir keine Punkte mehr geben kann) – autumnrustle

Verwandte Themen