In der Random Forest-Methode wählen wir für jeden Baum zufällig eine Reihe von Variablen (Features) fester Größe aus. Aber sobald dieser Satz für diesen bestimmten Baum eingefroren ist, verhält sich der Baum wie ein normaler Entscheidungsbaumalgorithmus?Variable zufällig an jedem Knoten in einem Baum in zufälliger Gesamtstruktur auswählen
Ich gehe davon aus, dass zufälliger Wald nichts anderes ist, als eine Reihe klassischer "Entscheidungsbäume" zu generieren und ihre Stimmen in die endgültige Klassifizierung zu bringen. Aber an vielen Stellen scheint die Beschreibung, die ich gelesen habe, darauf hinzudeuten; Für einen gegebenen Entscheidungsbaum innerhalb der Gesamtstruktur wählen wir zufällig an jedem Knoten Variablen aus. Ist das der Fall?
Bedeutet dies, dass wir an jedem Knoten im Baum zufällig m Variablen aus der Variablenmenge auswählen, die für diesen Baum festgelegt ist? Oder aus dem globalen Variablensatz des Trainingsdatensatzes? Und dann wählen wir aus der ausgewählten Gruppe von Variablen eine Variable heuristisch aus (z. B. welche Variable den Informationsgewinn maximiert) - ist das eine korrekte Aussage?