Ich machte eine zufällige Wald in H2O mit r. Es hat Bäume und Blätter.Gesamtblattzahl in H2O
Ich möchte wissen, wie viele Blätter. Ich vergleiche gerne meine Gesamtzahl an Zeilen mit Blättern.
Ich habe 200 Bäume, 8 Schichten tief, erfordern 5 Reihen pro Terminalblatt. Überquere ich einen Großteil meiner Daten? Ich habe 20k Zeilen.
Gibt es eine saubere Möglichkeit, die Anzahl der Blätter im h2o randomForest zu zählen?
Ein Zufallswaldmodell eigentlich eine Sammlung von Bäumen ist. Warum musst du die Anzahl der Blätter berechnen? –
Ich möchte das Verhältnis von Blättern zu Zeilen verwenden, um über Überanpassung oder Unteranpassung hinsichtlich variabler Wichtigkeit nachzudenken. Wenn ich jede Zeile 12 mal verwende, dann ist wahrscheinlich ein Problem. Wenn ich weniger als 0,5% der Zeilen verwende, könnte ich unterbemustert sein, auch wenn es bootstrappy aussieht. Vielleicht benutzen meine Bäume die gleiche Reihe 12 mal oder 0,1 mal. Ich möchte in Bezug auf die Berichterstattung denken und weiß nicht, wie man auf die tatsächlichen "h2o" Blätter zugreifen kann. – EngrStudent
Dieser Ansatz ist nicht richtig AFAIK. Die Variablen, die für eine frühzeitige Aufteilung verwendet werden, dominieren normalerweise das Verhalten eines bestimmten Baumes. Wenn Sie eine variable Wichtigkeit wünschen, sollten Sie 'folicion()' verwenden oder für eine einfachere Option das beste Konstantenmodell ausprobieren. –