ich zu Data Mining bin neu und ich versuche Entscheidungsbaum zu trainieren, aber der Datensatz ich gewählt habe, ist sehr voreingenommen daher das Ergebnis, das ich erhalte auch vorgespannt ist. Ich habe online gesucht und bin mit ausgewogener Genauigkeit gereist. Ich bin nicht mit dem Ergebnis zufrieden.Trainingsentscheidungsbaum mit voreingenommen Datensatz
Ist es eine gute Idee, wenn ich meinen Datensatz so probiere, dass ich ihn gleichmäßig verteile, wie in 1000 Fällen von YES
und 1000 von NO
?
Anstatt den Datensatz neu zu erfassen, verwende ich Gewichte während des Trainings. –