Ich nehme an, dass der Gradient bei jeder Schicht irgendwie 0,1 ist. Der Gradient eines Farb-/Stapelnetzwerkes, den eine Schicht berechnen kann, indem der Gradient als Wie berechnet man Gradienten in der ResNet-Architektur?
berechnet wird. In dem ResNet wird der Gradient durch die Skip-Verbindung propagiert. Also, wie kann ich den Gradienten von x
wie oben Abbildung erreichen? Ist es 0.1x0.1+0.1
oder 0.1
?
Ich habe es. Vielen Dank. – user8264