2017-08-03 1 views
0

Bei Verwendung von sklearn.tree.export_graphiz() enthalten die Beschriftungen der exportierten Baumknoten statistische Metadaten wie samples und value.Rendern eines DecisionTreeClassifier scikit-learn ohne die statistischen Metadaten?

Ich möchte dem Benutzer eine Version des Baums ohne diese Daten anzeigen. Das heißt, nur Entscheidungskriterien wie length <= 7 und die Klassifizierung selbst werden innerhalb des Knotens angezeigt, nichts anderes.

Ist das möglich mit export_graphviz()? Alles, was ich sehe, ist eine Keyword-Option, um den Wert impurity zu entfernen, aber keine der anderen Statistiken.

+0

Beim Durchsehen der Quelle scheint es keinen Konfigurationspfad zu geben, um diese anderen Statistiken auszuschließen. Möglicherweise muss ich die DOT-Dateidaten nachbearbeiten, indem ich sie analysiere und die Knotenbeschriftungen an meine Anforderungen anpasse. –

+0

Nun, es gibt einen Parameter namens "label", der, wenn er auf "None" gesetzt ist, informative Beschriftungen für die Verunreinigung ausblendet, z. B. alle Knoten. Vielleicht kann das helfen. –

+1

@VivekKumar: Ja, danke, dieser Parameter existiert. Leider entfernt es nicht alle statistischen Metadaten von den Baumknoten, nur die * Etiketten * der Daten, also ist es nicht gut genug für mich. –

Antwort

0

Derzeit ist keine solche Option im Code vorhanden. Ich musste die Zeichenfolge des DOT-Dateiinhalts abrufen (indem Sie das out_file=None-Argument bereitstellen) und es dann über einen einfachen DOT-Parser verarbeiten, um alle Metadaten aus dem Label zu entfernen.

Verwandte Themen