Ich arbeite an Deep Learning-Projekt für die Segmentierung. Ich verwende Softmax-Layer zur Klassifizierung. Ich sehe unten Konvergenz von MSE und divergent von Kreuz-Entropie-Fehler für Test-Set. Irgendeine Idee was passiert außer Überanpassen? Cross-entrpyGrund für das unterschiedliche Verhalten von Kreuz-Entropie und MSE im Deep Learning?
-1
A
Antwort
0
MSE ist eine viel einfachere Metrik, auf die konvergiert werden kann (konvexe Funktion). Für die Klasse des Problems scheint die Kreuzentropie jedoch eine bessere Wahl der Verlustfunktion zu sein.
Verwandte Themen
- 1. Bildvorverarbeitung im Deep Learning
- 2. Deep Learning für Handerkennung
- 3. MSE Verlust für Matrix Machine Learning
- 4. Data Augmentation für Deep Learning
- 5. Confusion Matrix für Deep Learning
- 6. Deep Learning für Chatbot Training
- 7. Einfache Deep-Learning-Vorhersage
- 8. Deep Learning Theano
- 9. Zellenerkennung mit Deep-Learning-Techniken
- 10. So verwenden Sie das Tflearn-Deep-Learning für die Dokumentklassifikation
- 11. ASP.NET-Migration, DbContext und Deep Learning Ansatz
- 12. H2O Deep Learning R
- 13. Datenvergrößerung für Objekterkennung mit Deep Learning
- 14. Warum brauchen wir GPU für Deep Learning?
- 15. Irgendwelche schlechten Auswirkungen von unausgewogenen Daten im Deep Learning?
- 16. Rechtschreibkorrektur für Zahlen mit Deep Learning
- 17. Deep Learning und Time Series: Unterschiedlich Vektorlängen
- 18. Wie wählt man die Fenstergröße von CNN im Deep Learning?
- 19. Python Deep Learning finde Duplikate
- 20. Deep Learning auf massiven Datensätzen
- 21. Rinder Klassifizierung mit Deep Learning
- 22. Python Deep Learning mit Theano das Grundprogramm von Mnist
- 23. Numpy-Deep Learning, Training Beispiele
- 24. Java Code für Restricted Boltzmann Maschinen und Deep Learning
- 25. Deep Learning mit Caffe - Python
- 26. Udacity Deep Learning: Aufgabe 1, Teil 5
- 27. Wie kann man das Signal für die Vorwärtsausbreitung im Deep-Learning-Netzwerk verstärken?
- 28. Brauchen Sie Hilfe beim Kauf von GPU für Deep Learning
- 29. Deep Learning Person Erkennung mit Opencv
- 30. Deep Learning Gradient am Ende aber Ausgabeschicht ist immer Null