In Bezug auf h2o.glm lambda search not appearing to iterate over all lambdas, las ich die Frage als beschwert, dass Lambda zu hoch war; Sie haben versucht, early_stopping=F
in der Hoffnung, dass das beheben könnte "Bug".Worauf müssen Sie bei der Kreuzvalidierung mit GLM Lambda Search achten?
Ist das ursprüngliche Verhalten nicht ein Feature, kein Bug? Und wenn das korrekt ist, sollten Sie immer early_stopping=T
verwenden, wenn Sie die Kreuzvalidierung mit GLM verwenden, andernfalls ist die Fehlerschätzung aus der Kreuzvalidierung nutzlos; Sie riskieren auch Überanpassung.
(Meine Hauptfrage ist, ob mein Verständnis der Art, wie GLM und CV zusammenarbeiten, korrekt ist, aber ich wäre interessiert, wenn es noch andere Dinge gibt, auf die man bei der Verwendung von lambda_search und Kreuzvalidierung achten sollte.)
Danke Tomas, das ist interessant. In der verknüpften Frage war das beste Lambda der 3 cv-Faltungen 0,011, 0,018, 0,016, aber das beste Lambda des Modells war 0,106 (d. H. 10 mal größer). Es sieht nicht so aus, als wäre es aufgrund der Kreuzvalidierung ausgewählt worden, aber ist das mit einigen ungewöhnlichen Daten noch möglich? (Oder ist das auch ein Symptom für den # 4858 early stopping bug?) –