Ich weiß, dass die beiden Funktionen sind für Rückwärtsausbreitung der Fackel und die Schnittstelle ist als updateGradInput(input, gradOutput) accGradParameters(input, gradOutput, scale)
folgt über Ich bin verwirrt, was die gradInput
und gradOutput
wirklich in einer Schicht bedeuten. Angenommen, die Kosten des Netzwerks sind C
und eine Schicht L
. Do gradInput
und gradOutput
der Schicht L
bedeuten d_C/d_input_L
und d_C/d_output_L
?Wie schreibe ich die updateGradInput und accGradParameters in Fackel?
Wenn ja, wie berechnet man gradInput
entsprechend gradOutput
?
Darüber hinaus bedeutet accGradParameters
zu akkumulieren d_C/d_Weight_L
und d_C/d_bias_L
? Wenn ja, wie werden diese Werte berechnet?
Vielen Dank. Deine Antwort ist perfekt für meine Verwirrung. –