Ich habe ein Problem, einige Grundlagen zu verstehen, also bin ich mit einem Regressionsbaum fest. Ich verwende einen Klassifizierungsbaum von rpart, um den Einfluss von Umweltparametern auf einen gemessenen Baumwachstumsfaktor I zu überprüfen. Lange Geschichte kurz:rpart: Sind Trainingsdaten erforderlich
Was ist der Zweck der Aufteilung von Daten in Training und Testdaten und (wann) brauche ich es? Meine Recherchen zeigten Beispiele, in denen sie es entweder nicht tun oder tun, aber ich kann die Hintergrundgeschichte nicht finden. Ist es nur um den Schnitt zu überprüfen?
Vielen Dank!
Ein spätes Dankeschön! Ich beherrsche es jetzt, aber mein Modell verliert durch Beschneiden alle Knoten, so dass nur noch ein Knoten übrig bleibt. Nach dem Testen ist der Mittelwert und der SD des eingestellten Sets wirklich besser, sieht einfach komisch aus: D – Qiyuan