Die Frage ist so:Wie wird die binäre t-Statistik dargestellt?
Lesen Sie die Datei diabetes.csv. Es gibt zwei Variablen namens BMI und Outcome. Das Variable Ergebnis nimmt nur zwei Werte: 0 und 1. Conduct einen nicht-parametrische zwei Proben Test für die Hypothese, dass die Standardabweichung des BMI das gleiche für beide Ergebnis ist Wert
bmi <- diabetes$BMI
bmi
outcome <- diabetes$Outcome
outcome
n <- length(bmi)
# tstat
tstat <- ???
# Describe the population and draw synthetic samples
f1 <- function()
{
x <- c(bmi, outcome)
x <- sample(x)
m1 <- sd(x[1:n])
m2 <- sd(x[(n+1):length(x)])
return(m1 - m2)
}
# Create sampling distribution
sdist <- replicate(10000, f1())
plot(density(sdist))
# Gap
gap <- abs(mean(sdist) - tstat)
abline(v = mean(sdist) + c(-1,1) * gap, col = "dark orange")
s1 <- sdist[sdist <(mean(sdist - gap)) | sdist >(mean(sdist + gap))]
pvalue <- length(s1)/length(sdist)
pvalue
die Daten in einigem Datensatz sind, "Diabetes" genannt. Meine Frage ist, wie man die "t-Statistik" darstellt, da das Ergebnis binär ist?