Sie haben nun eine Stichprobenverteilung von LR Werte. Die Funktion quantile
in R gibt Ihnen eine Schätzung des von Ihnen bevorzugten "kritischen Werts". Wenn zum Beispiel haben Sie beschlossen, Ihnen die herkömmlichen 0,05 „p-Wert“ wollten Sie Ihre Datenrahmen nehmen könnte, mit dem Namen LR_df zur Veranschaulichung, und geben Sie diesen Befehl ein:
quantile(LR_df[ , 'LRStat'] , 0.95)
Wenn Sie auf alle diese „Wahrscheinlichkeiten“ wollte die Figur, würden Sie einen Vektor von Werten verwenden, die zur Einheit komplementär sind. Der folgende Code gibt Ihnen die LSstat
Werte, bei denen ein bestimmter Anteil der Stichprobe höher als dieser Wert ist.
Die p-Werte sind nur eine Stichprobenverteilung einer Teststatistik unter einer Nullhypothese. Ihre Nullhypothese ist in diesem Fall, dass die LRstats
gleichmäßig verteilt sind. (Ich weiß, es klingt seltsam, so zu sagen, aber wenn Sie mit den Statistikern argumentieren wollen, dann erhalten Sie eine Kopie von http://amstat.tandfonline.com/doi/pdf/10.1198/000313008X332421.) Die Wahl des p-Wertes für den Cutoff hängt von der wissenschaftlichen oder geschäftlichen Einstellung ab. Wenn Sie eine Investitionsmöglichkeit beurteilen würden, könnte der Cutoff 0,15 sein, aber wenn Sie versuchen, neue wissenschaftliche Kenntnisse zu finden, denke ich, dass es kleiner sein sollte (strengerer Test). Das Gebiet der Molekulargenetik weist in ihrer Literatur viel Unrat auf (d. H. Ergebnisse werden nicht reproduziert), da sie in den statistischen Methoden nicht streng genug waren.