2017-03-27 3 views
-1

Ich möchte ein Modell für lineare Regression von Multiple Classifier in ML trainieren. Aber die Daten sind ziemlich spärlich. Wenn ich diese fehlenden Daten als "NA" markieren möchte, ist es eine gute Übung? Für Daten, die für das Training verwendet werden, kann ich diese Aufzeichnung einfach mit verpassten Daten löschen. Aber wie steht es mit den endgültigen Daten, die man noch vorhersagen kann? Wie kann ich ein Modell zur Vorhersage spärlicher Daten verwenden? keine schlechte PraxisKann ich verpasste Daten in der linearen Regression für mehrere Klassifizierer nur als 'NA' markieren?

Antwort

0

soweit ich weiß, indem sie den Wert als NA machen Sie ein Ausreißer machen sollen es und ist ein Ausreißer ist. Auch wenn Sie die Datensätze fallen Sie mit sehr wenigen Daten in Ihrem Trainingssatz könnte am Ende, und ich glaube, Ihre Frage gut ist hier nicht gebildet, könnten Sie, welche Art von Daten erarbeiten bitte versuchen Sie Klassifizierung zu beantragen?

+0

Danke für die Antwort! Meine Daten sind für einige Waren. Ich kann ihre Eigenschaften wie Beschreibung, Klasse, Preis usw. bekommen. Ein Teil der Funktionen sind spärlich. Und ich will ihre Verkäufe in der Zukunft vorherzusagen, sagen, welche Rohstoffe für mehr verkauft werden können als ‚x‘ Einheiten in den nächsten ‚y‘ Tage. Meine größte Sorge ist über die Zieldaten. Ich möchte alle Zieldaten vorhersagen, so dass ich keine Daten filtern möchte, nur weil sie einen Teil der Features übersehen haben. Deshalb möchte ich spärliche Features mit 'NA' markieren. – HouZhe

Verwandte Themen