2016-08-06 2 views
1

Der folgende Code:Extrakt h2o Zufall Wald im Format wie rpart Rahmen

library(randomForest) 
z.auto <- randomForest(Mileage ~ Weight, 
         data=car.test.frame, 
         ntree=1, 
         nodesize = 15) 
tree <- getTree(z.auto,k=1,labelVar = T) 
tree 

gibt dies als Textausgabe:

left daughter right daughter split var split point status prediction 
1    2    3 Weight  2567.5  -3 24.45000 
2    0    0  <NA>   0.0  -1 30.66667 
3    4    5 Weight  3087.5  -3 22.37778 
4    6    7 Weight  2747.5  -3 24.00000 
5    8    9 Weight  3637.5  -3 19.94444 
6    0    0  <NA>   0.0  -1 25.20000 
7    10    11 Weight  2770.0  -3 23.29412 
8    0    0  <NA>   0.0  -1 21.18182 
9    0    0  <NA>   0.0  -1 18.00000 
10    0    0  <NA>   0.0  -1 22.50000 
11    0    0  <NA>   0.0  -1 23.72727 

Aus diesen Daten mir die Logik eines einzelnen Baumes sehen.

Wie bekomme ich die viel längere Tabelle, basierend auf dieser, beschreibt alle Bäume in einer zufälligen Gesamtstruktur, von H2O?

Ich mag 'H2O', weil es sauber alle Kerne verwendet, und geht an einem ziemlich guten Clip auf meinem System. Es ist ein nettes Werkzeug. Es ist jedoch eine von 'r' getrennte Bibliothek, so dass ich nicht weiß, wie ich auf verschiedene Teile meiner Daten zugreifen kann.

Wie bekomme ich etwas wie die oben genannte gedruckte Ausgabe, in Form einer CSV-Datei, aus einem zufälligen Waldwald?

Antwort

1

H2O verfügt derzeit nicht über eine Funktion eine Tabelle wie die angezeigt werden, aber man kann das Zufallswaldmodell zu POJO (eine Java-Datei) mit der h2o.download_pojo() Funktion exportieren und dann den Baum inspiziert (Einzel Regeln) manuell.

H2O akzeptiert auch feature requests.