Ich habe mehrere Kreuzvalidierungstests ausgeführt und mehrere AUROCs (Area unter der ROC) erhalten. Ich habe herausgefunden, dass die Verteilung dieser AUC einer Normalverteilung folgt. Gibt es dafür eine wissenschaftliche Erklärung? Vielen Dank.Normalverteilung der AUROCs
Antwort
Eine normale Verteilung der AUROC-Werte ist nicht möglich.
Weil Normalverteilungen unendlich sind, aber AURUC ist begrenzt auf [0: 1]. Es sieht höchstens vage wie eine Normalverteilung aus. Es ist wahrscheinlicher, dass Sie eine Binomialverteilung beobachten.
Es gibt eine probabilistische Interpretation von AUROC (sorry, ich erinnere mich nicht an die Quelle dafür). Unter der Annahme, dass es eine "wahre" Wahrscheinlichkeit p gibt und Sie k Stichproben von dieser wahren Wahrscheinlichkeit p beobachten, ist die Verteilung der AUROC-Werte möglicherweise B (n, p)/n, dann?
Der zentrale Grenzwertsatz wird oft verwendet, um die annähernde Normalität von (Stichproben-) Verteilungen von Statistiken zu rechtfertigen, die für große Datenmengen berechnet wurden. Dies wird offensichtlich für AUC nahe 0 oder 1 zusammenbrechen, weil die Normalverteilung Unterstützung auf der gesamten realen Linie hat.
Warum kümmert es dich? Ist es nur aus Neugier oder versuchen Sie etwas mit dieser Intuition zu tun?
Wenn Sie Intervalle berechnen möchten, ist es eine bessere Technik, den Bootstrap zu verwenden. Wenn Sie die ROCs zweier Modelle vergleichen, können Sie die Paarungsentscheidungen der beiden Modelle starten, um Intervalle für die Differenz zu erhalten.
Der zentrale Grenzwertsatz macht eigentlich Sinn. Ich habe einige der möglichen Techniken zur Berechnung der Konfidenzintervalle überprüft und stelle fest, dass einige davon ausgehen, dass bei einer großen Anzahl von AUCs die sich annähernde Verteilung zu einer Normalverteilung wird, aber natürlich mit der Einschränkung, dass keine negativen Werte auftreten können. aber mit den gleichen Eigenschaften zur gleichen Zeit. –
- 1. Plot Normalverteilung in 3D
- 2. Python pylab plot Normalverteilung
- 3. Normalverteilung Beste Annäherung
- 4. Julia: zufällige Normalverteilung
- 5. Kurtosis einer Normalverteilung
- 6. Normalverteilung mit scipy
- 7. eine Normalverteilung bis 1D Daten
- 8. Python 3.1 - Erstellen von Normalverteilung
- 9. Umwandlung einer Normalverteilung nach Linear
- 10. Wie man Daten von Normalverteilung erzeugt
- 11. Wie kumulative Normalverteilung in Python zu berechnen
- 12. Zeichnen Normalverteilung Graph einer Probe in Matlab
- 13. Zufallszahl in einer Skew-Normalverteilung (entspricht NORMINV())
- 14. Probe aus Multivariate Normalverteilung mit Boost
- 15. Suchen Sie eine Python-Transformationsfunktion oder eine numpige Matrix, um die verzerrte Normalverteilung in Normalverteilung zu transformieren.
- 16. Generieren von Werten aus der Normalverteilung mit der Box-Muller-Methode
- 17. Schnellste Methode zur Berechnung der CDF der Normalverteilung über Vektoren - R :: pnorm vs erfc vs?
- 18. Wie man eine kumulative Normalverteilung in PHP generiert
- 19. wie Zufallszahlen zu generieren, die Skew Normalverteilung in Matlab folgen
- 20. erzeugen N Zufallszahlen aus einer Skew-Normalverteilung mit numpy
- 21. Maximale Wahrscheinlichkeit Schätzung von Hand für die Normalverteilung in R
- 22. Generieren von Vektor mit Normalverteilung von ganzen in Java
- 23. 3D-Plot der Normalverteilung in R um einen (x, y) -Punkt
- 24. Simulieren 5000 Proben der Größe 5 aus einer Normalverteilung mit Mittelwert 5 und Standardabweichung 3
- 25. alle Funktionen in Java oder verwandten Bibliotheken zum Generieren von Zufallsdaten in der Normalverteilung
- 26. Kennt jemand eine .NET-Bibliothek, die die inverse Funktion erf() in der Normalverteilung berechnet?
- 27. Skalierung und Anpassung an eine logarithmische Normalverteilung unter Verwendung einer logarithmischen Achse in Python
- 28. Konvertieren Z-Score (Z-Wert, Standard-Score) zu p-Wert für die Normalverteilung in Python
- 29. Wie kann ich zufällig eine Normalverteilung mit einem bestimmten Mittelwert und Standardfehler in C++ abtasten?
- 30. Wie erstelle ich eine zufällige C++ - Normalverteilung, die in einer separaten Methode funktioniert?
AUCROC ist wie beschrieben an den Bereich [0-1] gebunden. Die Binomialverteilung unterstützt positive Ganzzahlen. Meinst du vielleicht die Beta-Distribution? Oder können Sie klären? –
B (n; p)/n sollte [0; 1] sein –
Es gibt einige sehr gute Papiere darüber: 'Vergleich der nicht-parametrischen Konfidenzintervalle für den Bereich unter der ROC-Kurve einer kontinuierlichen Skala Diagnose-Test ',' Konfidenzintervalle für den Bereich unter der ROC-Kurve ' –