Ich bin ein Anfänger in Deep Learning.Ich weiß in regelmäßigen neuronalen Netzen Menschen Batch-Norm vor der Aktivierung verwenden und es wird die Abhängigkeit von der guten Gewicht Initialisierung reduzieren. Ich frage mich, ob es das gleiche zu RNN/lstm RNN tun würde, wenn ich es benutze. Hat jemand Erfahrung damit? Vielen Dank.Ist es normal, Batch-Normalisierung in RNN/lstm RNN zu verwenden?
0
A
Antwort
1
Nein, Sie können die Batch-Normalisierung in einem rekurrenten neuronalen Netzwerk nicht verwenden, da die Statistiken pro Batch berechnet werden. Dies berücksichtigt nicht den wiederkehrenden Teil des Netzwerks. Gewichte werden in einem RNN geteilt, und die Aktivierungsantwort für jede "wiederkehrende Schleife" kann vollständig unterschiedliche statistische Eigenschaften haben.
Andere Techniken ähnlich der Batch-Normalisierung, die diese Einschränkungen berücksichtigen, wurden entwickelt, zum Beispiel Layer Normalization.
Verwandte Themen
- 1. Ist es normal, LocalDb in der Produktion zu verwenden?
- 2. Ist es normal, $ Broadcast in angularjs zu verwenden?
- 3. tf.nn.depthwise_conv2d ist zu langsam. Es ist normal?
- 4. IEnumerator: Ist es normal, eine leere Dispose-Methode zu verwenden?
- 5. Ist es normal include_once selbst?
- 6. Ist es normal, intercept_ = 0.0 in scikits LogisticRegression zu haben?
- 7. Wie BatchNormalisierung in Keras funktioniert?
- 8. Ist es normal ein Objekt als eigenen Schlüssel in einem Dictionary/hashmap (in Python) zu verwenden?
- 9. Matplotlib sehr langsam. Es ist normal?
- 10. C++: Ist es normal Array Referenz auf Funktion zu übergeben
- 11. Datenbindung, die null zurückgibt. Es ist normal?
- 12. Modell mit BatchNormalisierung: stagnierender Testverlust
- 13. Wie variable Chargengröße für bidirektionale RNN in Tensorflow zu verwenden
- 14. Keras BatchNormalisierung nicht initialisierter Wert
- 15. Warum Chinesisch verstümmelt, wenn Webpy verwenden, aber es ist normal, wenn MySQLdb verwenden?
- 16. Ist es normal, dass ein High-Bit gesetzt ist?
- 17. RNN ist nicht Training (PyTorch)
- 18. keine willkommene Absicht in Smart Home-Aktion, ist es normal
- 19. Keras BatchNormalisierung, Was genau ist die probeweise Normalisierung?
- 20. Ist es in Ordnung, mit() zu verwenden?
- 21. Öffnl normal zu Vektoren
- 22. Tensorflow - Verwenden Sie ausgebildete RNN, um Text zu generieren
- 23. Was ist eine dynamische RNN in TensorFlow?
- 24. RNN & Batches in Tensorflow
- 25. Mysqlnd aktive Verbindungen Nummer ist zu groß. Ist das normal?
- 26. LSTM/RNN viele zu eins
- 27. Tensorflow CSV-Eingang zu RNN
- 28. angular2-meteor Aktualisierungszeit 30-60s ist es normal
- 29. Ist es normal, ein Produktions-Website-Repo in einem abgetrennten HEAD-Zustand zu haben?
- 30. Ist es normal, dass "Pods/Products /" -Dateien rot sind/fehlen?