Gibt es einen integrierten Weg, um scikit-learn zu erhalten, um eine geschichtete k-fache Kreuzvalidierung durchzuführen? Dies ist eine der häufigsten CV-Methoden, und ich bin überrascht, dass ich dafür keine integrierte Methode finden konnte.Randomisierte geschichtete k-fache Kreuzvalidierung in scikit-learn?
Ich sah, dass cross_validation.KFold()
hat eine Shuffling-Flag, aber es ist nicht geschichtet. Leider hat cross_validation.StratifiedKFold()
keine solche Option, und cross_validation.StratifiedShuffleSplit()
erzeugt keine disjunkten Falten.
Fehle ich etwas? Ist das geplant?
(natürlich kann ich das von mir implementieren)
Wie ich in meiner Frage schrieb, StratifiedShuffleSplit() tut nicht eine gemischte Version von StratifiedKFold(), dh Mischen vor StratifiedKFold(). Dies wird sogar im letzten Satz Ihrer Antwort erwähnt. KFold CV erfordert, dass es keinen Schnittpunkt zwischen den Falten gibt und dass ihre Vereinigung der gesamte Datensatz ist. – Bitwise
Ah, ja die Falten sind nicht garantiert nicht zu trennen. Tut mir leid, dass ich nicht bis zum Ende Ihrer Frage gelesen habe. – rd108
Sie sollten Ihre Antwort löschen! Bitte... – Merlin