2017-12-29 25 views
2

Es ist üblich, Daten (sowohl programmatisch, z. B. zufällige Ausschnitte usw. im Falle eines Datensatzes aus Bildern) sowohl im Trainings- als auch im Testset oder nur im Trainingsdatensatz zu ergänzen.Datenerweiterung im Test/Validierungssatz?

+0

Nur Training. Goldene Regel - Berühren Sie niemals das Testset. Grund - Testset stellt ungesehene Daten dar, wenn Sie Ihr Modell in Produktion nehmen. – saurabheights

Antwort

2

Nur beim Training. Die Datenerweiterung wird verwendet, um die Größe des Trainingssatzes zu erhöhen und mehr unterschiedliche Bilder zu erhalten. Technisch gesehen könnten Sie die Datenerweiterung im Testset verwenden, um zu sehen, wie sich das Modell auf solchen Bildern verhält, aber normalerweise tun es die Leute nicht.

1

Die Datenerweiterung wird nur am Trainingssatz durchgeführt, da das Modell dadurch verallgemeinert und robuster wird. Es macht also keinen Sinn, das Testset zu erweitern.

0

Tun Sie es nur auf dem Trainingssatz.

Der Grund, warum wir ein Training und ein Testset überhaupt verwenden, ist, dass wir den Fehler schätzen wollen, den unser System in der Realität haben wird. Daher sollten die Daten für den Testsatz so nahe wie möglich an realen Daten liegen.

Wenn Sie dies auf dem Testset tun, haben Sie möglicherweise das Problem, dass Sie Fehler einführen. Angenommen, Sie möchten Ziffern erkennen und durch Drehen erhöhen. Dann könnte ein 6 wie ein 9 aussehen.

Verwandte Themen