max_depth
VS min_samples_leaf
Wie Sklearn RandomForest tune? max_depth Vs min_samples_leaf
Die Parameter max_depth
und min_samples_leaf
verwechselst mich am meisten während eines mehrere Versuche von GridSearchCV
verwenden. Nach meinem Verständnis sind diese beiden Parameter eine Möglichkeit, die Tiefe der Bäume zu kontrollieren, Bitte korrigieren Sie mich, wenn ich falsch liege.
max_features
Ich bin eine sehr einfache Klassifikationsaufgabe zu tun und sich verändernden min_samples_leaf
scheint auf der AUC-Score keine Wirkung zu haben; Die Optimierung der Tiefe verbessert jedoch meine AUC von 0,79 auf 0,84, ziemlich drastisch. Nichts anderes scheint es ebenfalls zu beeinflussen. Ich dachte, die Hauptsache, die ich tun sollte, ist max_features
, jedoch ist der beste Ergebniswert nicht weit von sqrt(n_features)
.
scoring='roc_auc'
Ein weiteres Problem, bemerkte ich, wenn alle Parameter festgelegt werden, während die Anzahl der Bäume ändern, GridSearchCV
die höchste Anzahl der Bäume immer wählen. Dies ist verständlich, aber die AUC fällt aus irgendeinem Grund leicht ab, obwohl scoring='roc_auc'
. Warum ist das hacken? berücksichtigt es stattdessen den oob_score.
Bitte zögern Sie nicht teilen Sie jede Ressource, die hilfreich sein kann zu verstehen, wie zufällige Wälder systematisch abgestimmt werden können, da es scheint, gibt es einige verwandte Parameter beeinflussen sich gegenseitig.