2016-09-20 2 views
1

Meine Daten in folgendem Format und enthalten eine bestimmte StatistikEstimating p-Wert Schwellen aus einem Verteilungsdiagramm

site  LRStat 
    1  3.580728 
    2  2.978038 
    3  5.058644 
    4  3.699278 
    5  4.349046 

Dies ist nur ein Beispiel der Daten.

Ich erhielt dann auch die Null-LR-Verteilung durch Permutieren zufälliger Datenpaare. Ich habe damit ein Histogramm mit der Häufigkeit in den y-Achsen und der LR-Statistik in den x-Achsen gezeichnet. Wie ist es möglich, die kritischen p-Wert-Cut-Off-Punkte basierend auf der Nullverteilung zu bestimmen (wie in der folgenden Abbildung gezeigt)?

enter image description here

Antwort

3

Sie haben nun eine Stichprobenverteilung von LR Werte. Die Funktion quantile in R gibt Ihnen eine Schätzung des von Ihnen bevorzugten "kritischen Werts". Wenn zum Beispiel haben Sie beschlossen, Ihnen die herkömmlichen 0,05 „p-Wert“ wollten Sie Ihre Datenrahmen nehmen könnte, mit dem Namen LR_df zur Veranschaulichung, und geben Sie diesen Befehl ein:

quantile(LR_df[ , 'LRStat'] , 0.95) 

Wenn Sie auf alle diese „Wahrscheinlichkeiten“ wollte die Figur, würden Sie einen Vektor von Werten verwenden, die zur Einheit komplementär sind. Der folgende Code gibt Ihnen die LSstat Werte, bei denen ein bestimmter Anteil der Stichprobe höher als dieser Wert ist.

Die p-Werte sind nur eine Stichprobenverteilung einer Teststatistik unter einer Nullhypothese. Ihre Nullhypothese ist in diesem Fall, dass die LRstats gleichmäßig verteilt sind. (Ich weiß, es klingt seltsam, so zu sagen, aber wenn Sie mit den Statistikern argumentieren wollen, dann erhalten Sie eine Kopie von http://amstat.tandfonline.com/doi/pdf/10.1198/000313008X332421.) Die Wahl des p-Wertes für den Cutoff hängt von der wissenschaftlichen oder geschäftlichen Einstellung ab. Wenn Sie eine Investitionsmöglichkeit beurteilen würden, könnte der Cutoff 0,15 sein, aber wenn Sie versuchen, neue wissenschaftliche Kenntnisse zu finden, denke ich, dass es kleiner sein sollte (strengerer Test). Das Gebiet der Molekulargenetik weist in ihrer Literatur viel Unrat auf (d. H. Ergebnisse werden nicht reproduziert), da sie in den statistischen Methoden nicht streng genug waren.

Verwandte Themen