Es gibt ein bekanntes Problem in Tom's Mitchell Machine Learning Buch, um Entscheidungsbaum basierend auf den folgenden Daten zu bauen, wobei Play Ball die Zielvariable ist.Scikit Entscheidung Baum kategorische Funktionen
Der resultierende Baum folgt
Ich frage mich, ob es möglich ist, diesen Stammbaum mit Scikit-Learn zu bauen. Ich fand einige Beispiele wo Entscheidungsbaum als
export_graphviz(clf)
Source(export_graphviz(clf, out_file=None))
dargestellt werden aber es sieht aus wie scikit nicht gut funktioniert mit kategorischen Daten, müssen die Daten in mehrere Spalten digitalisiert werden. Als Ergebnis ist es unmöglich, den Baum genau wie im Bild zu bauen. Ist es richtig?
Textform der Daten verfügbar? – Dark
Etikettencodierung? – Adorn
Ich habe es selbst nicht benutzt, aber ein schnelles Suchergebnis ist hier, aus den Kommentaren sieht es vielversprechend aus. https://github.com/scikit-learn/scikit-learn/pull/4899 – Adorn