Gibt es eine Möglichkeit, Entscheidungsbaum zu visualisieren/plotten, der entweder mit mllib oder ml library in pyspark erstellt wurde. Wie man Informationen wie die Anzahl der Datensätze in Blattknoten erhält. DankWie visualisiert man das Entscheidungsbaummodell/Objekt in pyspark?
2
A
Antwort
1
Zuerst müssen Sie model.toDebugString verwenden, um eine Ausgabe wie die auf Ihrem zufälliges Waldmodell zu erhalten:
"RandomForestClassificationModel (uid=rfc_6c4ceb92ba78) with 20 trees
Tree 0 (weight 1.0):
If (feature 0 <= 3="" 10="" 1.0)="" if="" (feature="" <="0.0)" predict:="" 0.0="" else=""> 6.0)
Predict: 0.0
Else (feature 10 > 0.0)
If (feature 12 <= 12="" 63.0)="" predict:="" 0.0="" else="" (feature=""> 63.0)
Predict: 0.0
Else (feature 0 > 1.0)
If (feature 13 <= 3="" 1.0)="" if="" (feature="" <="3.0)" predict:="" 0.0="" else=""> 3.0)
Predict: 1.0
Else (feature 13 > 1.0)
If (feature 7 <= 7="" 1.0)="" predict:="" 0.0="" else="" (feature=""> 1.0)
Predict: 0.0
Tree 1 (weight 1.0):
If (feature 2 <= 11="" 15="" 1.0)="" if="" (feature="" <="0.0)" predict:="" 0.0="" else=""> 0.0)
Predict: 1.0
Else (feature 15 > 0.0)
If (feature 11 <= 11="" 0.0)="" predict:="" 0.0="" else="" (feature=""> 0.0)
Predict: 1.0
Else (feature 2 > 1.0)
If (feature 12 <= 5="" 31.0)="" if="" (feature="" <="0.0)" predict:="" 0.0="" else=""> 0.0)
Predict: 0.0
Else (feature 12 > 31.0)
If (feature 3 <= 3="" 4.0)="" predict:="" 0.0="" else="" (feature=""> 4.0)
Predict: 0.0
Tree 2 (weight 1.0):
If (feature 8 <= 4="" 6="" 1.0)="" if="" (feature="" <="2.0)" predict:="" 0.0="" else=""> 10875.0)
Predict: 1.0
Else (feature 6 > 2.0)
If (feature 1 <= 1="" 36.0)="" predict:="" 0.0="" else="" (feature=""> 36.0)
Predict: 1.0
Else (feature 8 > 1.0)
If (feature 5 <= 4="" 0.0)="" if="" (feature="" <="4113.0)" predict:="" 0.0="" else=""> 4113.0)
Predict: 1.0
Else (feature 5 > 0.0)
If (feature 11 <= 11="" 2.0)="" predict:="" 0.0="" else="" (feature=""> 2.0)
Predict: 0.0
Tree 3 ...
speichert es unter einer TXT-Datei dann verwenden: https://github.com/tristaneljed/Decision-Tree-Visualization-Spark
+0
Haben wir etwas in pyspark nur statt d3.js zu benutzen? Außerdem gibt model.toDebugString nicht an, wie viel Prozent der Daten in jeden Knoten fließen. – Neo
Verwandte Themen
- 1. PYSPARK: Wie visualisiert man einen GraphFrame?
- 2. Wie visualisiert man Rekursion?
- 3. wie man Steuerzeichen visualisiert
- 4. Wie visualisiert man den Bildverlauf in Python?
- 5. Wie visualisiert man eine Abstandsmatrix in Python?
- 6. Wie visualisiert man eine Tiefenstruktur in OpenGL?
- 7. Wie visualisiert man die Fehlerfläche in Keras?
- 8. Wie visualisiert man multiindizierte Daten in Orange?
- 9. Wie visualisiert man Daten in Apache Kudu?
- 10. Wie visualisiert man das Verhalten vieler gleichzeitiger mehrstufiger Prozesse?
- 11. Sprite-Kit: Wie man einen SKFieldNode visualisiert
- 12. wie man eine Imagemap visualisiert/debuggt?
- 13. java: Wie man einen Familienstammbaum visualisiert
- 14. Wie visualisiert man ein neuronales Netzwerk?
- 15. Wie visualisiert man effektiv eine rekursive Funktion?
- 16. Wie man Dataset im Web dynamisch visualisiert?
- 17. Wie man Pyfst-Wandler über Punktdateien visualisiert
- 18. Wie man eine XML-Datei visualisiert
- 19. Wie visualisiert man einen Sklearn GradientBoostingClassifier?
- 20. Wie visualisiert man den Halogenid-Zeitplan?
- 21. Wie visualisiert man die eingebettete Derby-Datenbank?
- 22. Wie visualisiert man ein Kommunikationsprotokoll für Designzwecke?
- 23. Wie visualisiert man die Schritte eines Algorithmus?
- 24. Wie visualisiert man die Punktwolke "XYZL"?
- 25. Wie visualisiert man ein Multi-Qubit-System in Python?
- 26. Wie visualisiert man Werte in logarithmischer Skala auf Matplotalib?
- 27. Wie visualisiert man Synfusionstabellen in UWP-Anwendungen mit sqlite?
- 28. Wie visualisiert man eine SVM mit Matplotlib in Python?
- 29. Wie visualisiert man Datenbanktabellen in postgresql mit pgAdmin?
- 30. Wie visualisiert man Daten von einem Postgresql in Kibana?
Verwendung von Python Grundstück pyspark Entscheidungsbaum ist auch in Ordnung. – Neo