Es ist üblich, Daten (sowohl programmatisch, z. B. zufällige Ausschnitte usw. im Falle eines Datensatzes aus Bildern) sowohl im Trainings- als auch im Testset oder nur im Trainingsdatensatz zu ergänzen.Datenerweiterung im Test/Validierungssatz?
Antwort
Nur beim Training. Die Datenerweiterung wird verwendet, um die Größe des Trainingssatzes zu erhöhen und mehr unterschiedliche Bilder zu erhalten. Technisch gesehen könnten Sie die Datenerweiterung im Testset verwenden, um zu sehen, wie sich das Modell auf solchen Bildern verhält, aber normalerweise tun es die Leute nicht.
Die Datenerweiterung wird nur am Trainingssatz durchgeführt, da das Modell dadurch verallgemeinert und robuster wird. Es macht also keinen Sinn, das Testset zu erweitern.
Tun Sie es nur auf dem Trainingssatz.
Der Grund, warum wir ein Training und ein Testset überhaupt verwenden, ist, dass wir den Fehler schätzen wollen, den unser System in der Realität haben wird. Daher sollten die Daten für den Testsatz so nahe wie möglich an realen Daten liegen.
Wenn Sie dies auf dem Testset tun, haben Sie möglicherweise das Problem, dass Sie Fehler einführen. Angenommen, Sie möchten Ziffern erkennen und durch Drehen erhöhen. Dann könnte ein 6
wie ein 9
aussehen.
- 1. Datenerweiterung in Spark (Scala)
- 2. Verschieben als Datenerweiterung in Machine Learning
- 3. Datenerweiterung in der Objekterkennung API: random_image_scale
- 4. Fit Generator und Datenerweiterung in Keras
- 5. Datenerweiterung in Tensorflow mit Estimator-API und TFRecords-Datenmenge
- 6. Datenerweiterung für semantische Segmentierung, Ist meine Python-Layer-Definition korrekt?
- 7. Wie verwenden Sie Beispielgewichte mit Datenerweiterung in Keras?
- 8. Wie erstellt man eine Logik/ein Skript für eine Datenerweiterung?
- 9. Keras beste Image Data Generator Parameter für die Datenerweiterung
- 10. Fehler bei der Datenerweiterung Optionen in der Objekterkennung API
- 11. Warum verbessert die Datenerweiterung nicht die Genauigkeit der Texturklassifizierung in CNNs?
- 12. Wie hdf5 mit Python-Layer in Caffe lesen und Datenerweiterung tun?
- 13. Laden Sie eine Datei und Speichern in der Datenerweiterung programmgesteuert mit Ampscript
- 14. Tensorflow: Erhöhung von ValueError ("GraphDef kann nicht größer als 2GB sein.") Bei Verwendung von tf.image und keras zur Datenerweiterung
- 15. SSDT für SSRS - Verbindung zur Datenquelle "DataSource1" nicht möglich. Die ausgewählte Datenerweiterung ORACLE ist nicht installiert oder kann nicht geladen werden
- 16. Können ExactTarget und AMPscript ein Formular verwenden, um ein Bild hochzuladen?
- 17. Variable Initialisierung im Variablenbereich im Tensorflow
- 18. Datenbank im SQL-Server-Stack im Wiederherstellungsmodus
- 19. Bilder im Platzhalter im Fokus anzeigen
- 20. Anklickbare Links im WebBrowser-Steuerelement im Bearbeitungsmodus
- 21. SQL-Nummer im angegebenen Bereich im Frühjahr
- 22. die Änderung im HTML- oder im Code
- 23. Funktioniert im Terminal aber nicht im Skript
- 24. Funktion im geladenen Paket nicht im Suchpfad
- 25. Im Hintergrund push notifications im Hintergrund
- 26. Initialisierungsstatus im Konstruktor im Vergleich zum Status
- 27. Daten im Array nicht im zweiten UIPickerView
- 28. Internationalisierung im Server oder im Browser
- 29. Schreiben im Debug-Modus im Freigabemodus
- 30. Fehler im Applet im Navigator mit Fingerabdruckleser
Nur Training. Goldene Regel - Berühren Sie niemals das Testset. Grund - Testset stellt ungesehene Daten dar, wenn Sie Ihr Modell in Produktion nehmen. – saurabheights