In meinem Klassifikationsproblem haben einige der Features (~ 5) unter 85 Features meist Nullwerte (> 90%). Wie gehe ich mit diesen Werten um? Ich,Ich habe ein Klassifizierungsprojekt, bei dem einige der Spalten/Features mehr als 90% Nullwerte haben. Wie gehe ich mit ihnen um?
1) Ignorieren Sie diese Spalten/Merkmale insgesamt
2) Versuchen Sie, und diese Werte unterstellen, wenn ja, wie?
3) Eine andere Methode?
Ich beginne mit zufälligen Gesamtstrukturen und ich bin ein Neuling für diese Methode, behandelt zufällige Gesamtstruktur NULL-Werte von selbst? Wie kann ich das umsetzen? Wie macht zufälliger Wald das? Wo kann ich etwas darüber erfahren - Referenzen wären sehr willkommen.
Vielen Dank im Voraus.
Das ist keine gute Frage für SO, da es a) nicht um Programmierung geht und b) viel zu breit ist. Ich würde vorschlagen, es selbst auszuprobieren (es wäre sehr einfach zu sehen, ob RF NULL-Werte nur durch Ausführen behandelt) und auch diesen Beitrag zu entfernen und eine fokussiertere Frage bei [Cross Validated] (https: //stats.stackexchange) zu stellen .com) – Tchotchke