2016-09-06 1 views
1

Gibt es ein Python-Paket oder Funktion, die %incMSE und %incNodePurity in der gleichen Art und Weise berechnen kann, dass randomForest Paket in R sie durch importance Funktion berechnet?% incMSE und% incnodepurity in zufälligem Python Wald

+0

Vielleicht [diese] (http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html) obwohl ich nicht genug über R weiß, um Ihnen zu sagen, ob es eine Variation hat auf "% incMSE" oder "% inknodepurity". [Dies] (http://www.slideshare.net/PyData/random-forests-r-vs-python-linda-uruchurtu) Dia-Set scheint jedoch darüber zu sprechen. – Ouroborus

Antwort

1

Wenn ich richtig verstehe, bezieht sich %incNodePurity auf die Bedeutung der Gini-Funktion; Dies wird unter sklearn.ensemble.RandomForestClassifier.feature_importances_ implementiert. Gemäß der original Random Forest paper ergibt dies eine "schnelle variable Wichtigkeit, die oft sehr konsistent mit dem Permutationsbedeutungsmaß ist".

Soweit ich weiß, ist die Permutationsfunktion Wichtigkeit selbst (%incMSE) in scikit-learn nicht implementiert.

+0

Danke dafür, also von dem, was du gesagt hast, ist das 'importances_' in' pyhton' nur das '% incNodePurity' von dem von' R's 'Wichtigkeit'. Habe ich recht? –

+0

Ja, das ist mein Verständnis – maxymoo

Verwandte Themen