In RandomForestClassifier
ist der Standardwert für max_features
sqrt(n_features)
und in RandomForestRegressor
ist es n_features
, einen bestimmten Grund dafür?Warum ist der Standardwert für max_features in RandomForestClassifier anders als der in RandomForestRegressor?
5
A
Antwort
6
Dies ist eine Heuristik, die auf empirischen Ergebnissen basiert. Im Durchschnitt scheint es die bessere Wahl zu sein, als Voreinstellung max_features = sqrt (n_features) für die Klassifizierung und max_features = n_features für die Regression zu setzen.
Diese Heuristik ergibt sich aus diesem Papier: http://orbi.ulg.ac.be/bitstream/2268/9357/1/geurts-mlj-advance.pdf
In jedem Fall ist es natürlich immer eine bessere Idee, um Cross-validate dieser Parameter.
0
Beachten Sie, dass Sie einstellen müssen:
max_features = 'sqrt'
Statt der vorgeschlagen:
max_features=sqrt(n_features)
abhängig von der Version Sie ausführen.
Verwandte Themen
- 1. Warum ist der Ausgang anders?
- 2. Warum ist der Standardwert in diesem Fall nicht 0?
- 3. Warum ist der Standardwert im Storyboard ausgegraut?
- 4. Ist der iOS-Schlüsselbunddienst anders als der iCloud-Schlüsselbund?
- 5. Was ist der Standardwert für FACELETS_REFRESH_PERIOD?
- 6. Warum ist `sz +" text "` anders als `sz +" text "` in coffeescript?
- 7. Was ist der Standardwert für Guid?
- 8. Was ist der Standardwert für die Sitzungszeitüberschreitung in ASP.NET?
- 9. Was ist der Standardwert für eine ungesetzte Variante in VB6?
- 10. Warum sieht der TIFF-Ausgang anders aus als der ggplot2-Ausgang in R Studio?
- 11. Verwendung der aktuellen Zeit in UTC als Standardwert in PostgreSQL
- 12. Fenstergröße ist anders als Modell
- 13. Klassenvariable als Standardwert der Klassenmethode zuweisen Argument
- 14. Normalerweise transformieren wir Image zu Base64, wenn es weniger als 8 KB ist. Aber warum ist der Standardwert 8?
- 15. Ist $ HTTP_XXX_VARS anders als $ _XXX in PHP?
- 16. Warum behandelt PowerShell leere Zeichenfolgen in der Befehlszeile anders?
- 17. Erstellen eines Array mit einem Standardwert, aber der Standardwert ist
- 18. Bei Verwendung von: =, warum ist mit = TRUE der Standardwert?
- 19. Wie ist? anders als Objekt sagen?
- 20. Der Mongoid-Standardbereich überschreibt den Standardwert. Warum?
- 21. Local Repo anders als der auf Github
- 22. Warum wird der Standardwert für Dateien nicht korrekt abgeschnitten?
- 23. Standardwert der Variablen in PHP?
- 24. Standardwert von Enum in der Klasse erklärt
- 25. Got kontinuierliche wird nicht unterstützt Fehler in RandomForestRegressor
- 26. Standardwert eines TextBox als Spalten in der Datenbank
- 27. Warum ist die Abfrage anders?
- 28. now() als Standardwert in Postgres
- 29. Warum ist das File.ReadAllBytes-Ergebnis anders als bei der Verwendung von File.ReadAllText?
- 30. Warum werden Tabellenliterale anders als Tabellenreferenzen in Lua behandelt?
Danke für die Referenz! Wenn ich die zufällige Gesamtstruktur mit max_features = n_features und bootstrap = False verwende, wäre es richtig zu sagen, dass es sich im Wesentlichen wie ein einzelner Entscheidungsbaum verhält (nur mit viel Rechenaufwand) – d1337
Ja, in diesem Fall sind alle Bäume die Gleiches (modulo einige Verbindungen, die passieren können, wenn sie nach den besten Spalten suchen). –
Wenn max_features = n_features, dann wird die zufällige Subraum-Methode nicht einmal verwendet? –