2016-07-04 10 views
1

Hallo Ich möchte eine .csv mit 2 Spalten erstellen: die Funktion Bedeutung eines zufälligen Waldmodells und den Namen dieses Features. Und sicher sein, dass das Spiel zwischen numerischem Wert und Variablennamen korrekt istExportfunktion Bedeutung für CSV aus zufälliger Wald

Hier ein Beispiel, aber ich kann nicht Correclty

test_features = test[["area","product", etc.]].values 

# Create the target 
target = test["churn"].values 

pred_forest = my_forest.predict(test_features) 

# Print the score of the fitted random forest 
print(my_forest.score(test_features, target)) 


importance = my_forest.feature_importances_ 


pd.DataFrame({"IMP": importance, "features":test_features }).to_csv('forest_0407.csv',index=False) 
+0

Wie funktioniert das .csv exportieren scheitern ? das sieht ein bisschen fischig aus, wenn Sie versuchen, die Feature-Wichtigkeit mit den Features df selbst zu vergleichen, was falsch ist, da die Wichtigkeit der Spalten – EdChum

+0

ist Ich bin verwirrt, weil ich "Wichtigkeit" drucke, kann ich nur ein Array sehen , aber ich bin mir nicht sicher, welche Funktion Übereinstimmungen sind, dafür möchte ich sowohl Namen als auch Werte überprüfen. der Nachrichtenfehler ist dies: Ausnahme: Daten müssen 1-dimensional sein – progster

+0

versuchen Sie dies für Features 'test.columns.tolist()'. – shivsn

Antwort

1

verwenden

x = list(zip(my_forest.feature_importances_,list of features you are using)) 
x = pandas.DataFrame(x,columns=["Importance","Feature_Name"])