-1

In meinem Klassifikationsproblem haben einige der Features (~ 5) unter 85 Features meist Nullwerte (> 90%). Wie gehe ich mit diesen Werten um? Ich,Ich habe ein Klassifizierungsprojekt, bei dem einige der Spalten/Features mehr als 90% Nullwerte haben. Wie gehe ich mit ihnen um?

1) Ignorieren Sie diese Spalten/Merkmale insgesamt

2) Versuchen Sie, und diese Werte unterstellen, wenn ja, wie?

3) Eine andere Methode?

Ich beginne mit zufälligen Gesamtstrukturen und ich bin ein Neuling für diese Methode, behandelt zufällige Gesamtstruktur NULL-Werte von selbst? Wie kann ich das umsetzen? Wie macht zufälliger Wald das? Wo kann ich etwas darüber erfahren - Referenzen wären sehr willkommen.

Vielen Dank im Voraus.

+1

Das ist keine gute Frage für SO, da es a) nicht um Programmierung geht und b) viel zu breit ist. Ich würde vorschlagen, es selbst auszuprobieren (es wäre sehr einfach zu sehen, ob RF NULL-Werte nur durch Ausführen behandelt) und auch diesen Beitrag zu entfernen und eine fokussiertere Frage bei [Cross Validated] (https: //stats.stackexchange) zu stellen .com) – Tchotchke

Antwort

0

Haben Sie versucht, das neuronale Netzwerk in Ihrem Dataset auszuführen, obwohl Features fehlen? Ein neuronales Netzwerk benötigt nicht alle Merkmale, um vorhanden zu sein.

Sie können einfach alle fehlenden Merkmale auf 0 für das neuronale Netzwerk einstellen, da neuronale Netzwerke keinen Unterschied zwischen 0 und feature is missing sehen. Warum fragst du nicht? Wenn Sie einen Eingabewert auf 0 setzen, bedeutet dies, dass alle Verbindungen von diesem Eingangsknoten einen 0-Wert haben und nichts zu den versteckten Neuronen hinzufügen, die mit diesem Eingangsknoten verbunden sind.

Bevor Sie es versuchen, stellen Sie sich folgende Frage: Wenn ein Feature so oft fehlt, ist es für die Vorhersage des Datasets von Bedeutung?

Verwandte Themen