2017-04-08 2 views
0

In der Random Forest-Methode wählen wir für jeden Baum zufällig eine Reihe von Variablen (Features) fester Größe aus. Aber sobald dieser Satz für diesen bestimmten Baum eingefroren ist, verhält sich der Baum wie ein normaler Entscheidungsbaumalgorithmus?Variable zufällig an jedem Knoten in einem Baum in zufälliger Gesamtstruktur auswählen

Ich gehe davon aus, dass zufälliger Wald nichts anderes ist, als eine Reihe klassischer "Entscheidungsbäume" zu generieren und ihre Stimmen in die endgültige Klassifizierung zu bringen. Aber an vielen Stellen scheint die Beschreibung, die ich gelesen habe, darauf hinzudeuten; Für einen gegebenen Entscheidungsbaum innerhalb der Gesamtstruktur wählen wir zufällig an jedem Knoten Variablen aus. Ist das der Fall?

Bedeutet dies, dass wir an jedem Knoten im Baum zufällig m Variablen aus der Variablenmenge auswählen, die für diesen Baum festgelegt ist? Oder aus dem globalen Variablensatz des Trainingsdatensatzes? Und dann wählen wir aus der ausgewählten Gruppe von Variablen eine Variable heuristisch aus (z. B. welche Variable den Informationsgewinn maximiert) - ist das eine korrekte Aussage?

Antwort

0

"In der Random Forest-Methode wählen wir für jeden Baum zufällig eine Reihe von Variablen (Features) mit fester Größe. Aber sobald dieser Satz für diesen bestimmten Baum eingefroren ist, verhält sich der Baum wie ein normaler Entscheidungsbaumalgorithmus"

Kein

"ich gehe davon aus, dass zufällige Wald ist nichts anderes als eine Reihe von klassischen‚Entscheidungsbäume‘zu erzeugen und ihre Stimmen für die Gesamtwertung nehmen aber an vielen Orten, was Beschreibung, die ich gelesen habe scheint vorzuschlagen. Für einen gegebenen Entscheidungsbaum innerhalb der Gesamtstruktur wählen wir zufällig an jedem Knoten Variablen aus. Ist das der Fall? "

Ja

„Ist es an jedem Knoten im Baum bedeutet, dass wir nach dem Zufall m Variablen aus dem Variablensatz auszuwählen, die für diesen Baum befestigt ist?

Diese etwas verwirrend ist, ist diese Annahme, dass Es gibt eine andere größere Teilmenge, die für diesen Baum reserviert ist, von dem m ausgewählt werden kann.Wenn nicht diese Annahme, denke ich, dass im Wesentlichen gefragt wird, obder Baum mit dem gleichen Satz zufällig ausgewählter Merkmale fürjeden Knoten gewachsen ist, und die Antwort ist NEIN

In Random Forest findet die Randomisierung von Features für jeden Knoten statt Insgesamt 100 Prädiktoren, für jeden Knoten in einem Baum wird zufällig eine Teilmenge von 10 ausgewählt und für die beste Aufteilung ausgewertet. Beachten Sie, dass die Anzahl der Bäume in jedem Knoten während des gesamten Wachstums des Baums konstant gehalten wird.

Hoffe, das hilft.

Verwandte Themen