2016-11-30 2 views
2

mit habe ich eine Frage über Entscheidungsbaum stufenlose mitEntscheidungsbaum stufenlose

Ich hat gehört, dass, wenn Ausgangsgröße kontinuierlich ist und Eingangsgröße ist kategorisch, Splitkriterien Varianz oder etwas reduziert. aber ich weiß nicht, wie es funktioniert, wenn Eingangsgröße kontinuierlich ist

1) Eingangsgröße: kontinuierlich/Ausgangsgröße: kategorischen

2) Eingangsgröße: kontinuierlich/Ausgangsgröße: kontinuierlich

über zwei Fälle, wie können wir ein Split-Kriterium wie Gini-Index oder Informationsgewinn bekommen?

Wenn ich rpart in R verwenden, was auch immer Eingangsgröße und Ausgangsgröße ist, es funktioniert gut, aber ich kann nicht einen Algorithmus im Detail

+1

Dies ist keine technische quesion ist: Sehen Sie in Gemeinden kreuzvalidierte oder Data Science veröffentlichen. –

Antwort

0

Der Algorithmus weiß, dass rpart verwendet, kann in der Dokumentation zu dieser fand Paket. Die vignette! gibt eine schöne Erklärung.

Wenn Sie wissen möchten, wie der Algorithmus für kontinuierliche Eingabevariablen funktioniert, können Sie dies einfach mit einer Google-Suche finden. Schauen Sie sich this video an!

1

1) Eingangsvariable: kontinuierlich/Ausgangsvariable: kategorisch
C4.5 Algorithmus lösen diese Situation.

Um fortlaufende Attribute zu behandeln, erstellt C4.5 einen Schwellenwert und teilt die Liste dann in solche auf, deren Attributwert über dem Schwellenwert liegt, und solche, die kleiner oder gleich sind.

2) Eingangsvariable: kontinuierliche/Ausgangsvariable: kontinuierlich
CART (Klassifikations- und Regressionsbäume) Algorithmus löst diese Situation. CART

Fall 2 ist das Regressionsproblem. Sie sollten das Attribut j aufzählen und die Werte s in diesem Attribut aufzählen und dann die Liste in diejenigen aufteilen, deren Attributwert über dem Schwellenwert liegt, und diejenigen, die kleiner oder gleich sind. Dann erhalten Sie zwei Bereiche enter image description here

Finden Sie das beste Attribut j und den besten Split Wert s, die

enter image description here

c_1 und c_2 und wie folgt gelöst werden:

enter image description here

Dann, wenn Regression,
enter image description here

wo

enter image description here

Verwandte Themen