Datenerweiterung im Test/Validierungssatz?

Es ist üblich, Daten (sowohl programmatisch, z. B. zufällige Ausschnitte usw. im Falle eines Datensatzes aus Bildern) sowohl im Trainings- als auch im Testset oder nur im Trainingsdatensatz zu ergänzen.Datenerweiterung im Test/Validierungssatz?

Quelle

2017-12-29 rodrigo-silveira

Nur Training. Goldene Regel - Berühren Sie niemals das Testset. Grund - Testset stellt ungesehene Daten dar, wenn Sie Ihr Modell in Produktion nehmen. – saurabheights

Nur beim Training. Die Datenerweiterung wird verwendet, um die Größe des Trainingssatzes zu erhöhen und mehr unterschiedliche Bilder zu erhalten. Technisch gesehen könnten Sie die Datenerweiterung im Testset verwenden, um zu sehen, wie sich das Modell auf solchen Bildern verhält, aber normalerweise tun es die Leute nicht.

Quelle

2017-12-30 05:02:54

Die Datenerweiterung wird nur am Trainingssatz durchgeführt, da das Modell dadurch verallgemeinert und robuster wird. Es macht also keinen Sinn, das Testset zu erweitern.

Quelle

2017-12-30 22:06:00

Tun Sie es nur auf dem Trainingssatz.

Der Grund, warum wir ein Training und ein Testset überhaupt verwenden, ist, dass wir den Fehler schätzen wollen, den unser System in der Realität haben wird. Daher sollten die Daten für den Testsatz so nahe wie möglich an realen Daten liegen.

Wenn Sie dies auf dem Testset tun, haben Sie möglicherweise das Problem, dass Sie Fehler einführen. Angenommen, Sie möchten Ziffern erkennen und durch Drehen erhöhen. Dann könnte ein 6 wie ein 9 aussehen.

Quelle

2018-01-05 09:12:46

Datenerweiterung im Test/Validierungssatz?

Antwort

Verwandte Themen