Ich arbeite am Training eines Segmentierungsnetzwerks U-net auf dem LIDC-IDRI Datensatz. Es gibt derzeit zwei Trainingsstrategien:Was sind Unterschiede zwischen 1) Training eines CNN aus dem ganzen Trainingssatz und 2) Training aus einer Teilmenge des Trainingssatzes und dann des ganzen Trainingssatzes?
- Trainieren Sie das Modell auf dem gesamten Trainingssatz von Grund auf (40k Schritte, 180k Schritte).
- Trainieren Sie das Modell auf 10% des gesamten Trainingssets. Nach der Konvergenz (30k Schritte), trainieren Sie das Modell auf dem gesamten Trainingssatz (10k Schritte).
Mit Dice coefficient als Verlustfunktion, die auch in V-Netzarchitektur verwendet wird (paper), Modell mit Methode 2 trainiert ist immer besser als die mit Methode 1. Erstere ein Würfel Score von 0.735 erreichen können, während Letzterer kann nur 0,71 erreichen.
BTW, mein U-net-Modell wird in TensorFlow umgesetzt, und das Modell auf NVidia GTX 1080Ti
eine Erklärung oder Referenzen Könnte jemand trainiert geben. Vielen Dank!