Wie kann ich Entscheidungsbaum Grafik verwenden, um die signifikanten Variablen zu bestimmen, ich weiß, welche größte Informationsgewinn in der Wurzel des Baumes sein soll, was bedeutet, dass kleine Entropie, so ist dies mein Diagramm, wenn ich will wissen, welche Variablen von Bedeutung sind, wie kann ichEntscheidungsbaum für signifikante Variablen
Antwort
interpretieren Was Sie erhebliche bedeutet das? An jedem Knoten hat die Variable den Kontext mit der größten Bedeutung ausgewählt und angenommen, dass die Auswahl nach Informationsgewinn tatsächlich funktioniert (dies ist nicht immer der Fall). Zum Beispiel ist BB am Knoten 11 der wichtigste Diskriminator, der gegeben ist mit AA> 20.
Offensichtlich sind AA und BB am nützlichsten, wenn man annimmt, dass die Auswahl durch Informationsgewinn den besten Weg zur Partitionierung der Daten liefert. Der Rest gibt weitere Verfeinerung. C und N wären die nächsten.
Was Sie fragen sollten, ist: Soll ich alle Knoten behalten?
Die Antwort hängt von vielen Dingen ab und es gibt wahrscheinlich keine beste Antwort. Ein Weg wäre, die Gesamtzahl der Fälle jedes Blattes zu verwenden und sie zusammenzuführen.
Nicht sicher, wie ich dies bei Ihrem Bild tun würde. Es ist nicht wirklich klar, was an den Blättern gezeigt wird und was "n" ist. Auch nicht sicher, was "p" ist.
- 1. Spark Entscheidungsbaum mit kategorischen Variablen
- 2. Kann Entscheidungsbaum lernen "semi-überwacht"
- 3. ein Entscheidungsbaum-Modell
- 4. Klassifikations- und Vorhersage Entscheidungsbaum
- 5. Entscheidungsbaum mit kategorischen Merkmalen
- 6. Signifikante Regionsänderung/Regionsüberwachung
- 7. C++ signifikante Zahlen
- 8. Spark Entscheidungsbaum mit Spark
- 9. Entscheidungsbaum kontinuierliche attributes
- 10. Entscheidungsbaum auf Informationsgewinn
- 11. Plot ein Entscheidungsbaum mit R
- 12. Entscheidungsbaum vs. Naive Bayes Klassifikator
- 13. Visualizing Entscheidungsbaum in Scikit-Learn
- 14. Entscheidungsbaum mit endgültigem Text out
- 15. einen Entscheidungsbaum mit Python plotten
- 16. So finden Sie signifikante Korrelationen in einem großen Datensatz
- 17. xtable für bedingte Zellenformatierung signifikante p-Werte der Tabelle
- 18. Design-Muster für große Entscheidungsbaum AI in C++
- 19. UIBackgroundModes Position und signifikante Standortänderungen mit Regionsüberwachung
- 20. CLLocationManager - Überwachen von Regionen vs. Signifikante Standortänderungen
- 21. Berechnung Entropie in Entscheidungsbaum (Maschinelles Lernen)
- 22. Signifikante Standortänderungen Überwachung stoppt im Hintergrund
- 23. R: Plotten Entscheidungsbaum Etiketten verlassen Text abgeschnitten
- 24. Clustering-Algorithmus oben auf Entscheidungsbaum Lerner
- 25. Wie bekomme ich einen detaillierten Entscheidungsbaum, wenn 7 meiner 13 unabhängigen Variablen kategorischer Natur sind?
- 26. Wie kann ich eine Kontingenztabelle mit mehreren Variablen als Entscheidungsbaum in R visuell darstellen?
- 27. „didUpdateLocations“ nicht, wenn signifikante Überwachung Standort
- 28. Signifikante Unterschiede in Array vs Array List?
- 29. Erklären der Zahlen in einem Entscheidungsbaum
- 30. Einen Entscheidungsbaum visualisieren (Beispiel von scikit-learn)
AA, N, BB das sind Attribute (Variablen) basierend auf diesem Baum Ich möchte sagen, dass diese Attribute signifikant sind –
Ich habe das. Was benötigt wird, ist eine kurze Beschreibung jedes Elements im Bild und was gezeigt wird. Zum Beispiel bedeutet p <0,001 was genau? 'p' ist Entropie ?, Wahrscheinlichkeit? andere?. Die Blätter zeigen was? Was ist n? Zahl der Fälle? Wenn die Seitenachse jedes Blattes Klasse ist, wie erhält man dann eine Verteilung von Klassen in einem einzigen Fall (wenn n == 1 bedeutet, dass in Knoten 17). – DAV
alle von ihnen in diesem Baum sind Variablen, die nicht von ihnen sind Klasse tut mir leid, aber ich verstehe p ist Wahrscheinlichkeit bin ich richtig? denn in der Formel des Informationsgewinns haben wir E, was Entropie ist und wir haben p welche Wahrscheinlichkeit –