Da der Quellcode von tf.nn.softmax_cross_entropy_with_logits
in gen_nn_ops
versteckt ist, könnte mir jemand vielleicht erklären, wie Tensorflow die Kreuzentropie nach Softmax berechnet. Ich meine, nach softmax könnte es wegen der Präzision 0 ausgeben, was zu einem NaN-Problem mit Kreuz-Entropie führen wird. Hat tensorflow die clip-Methode benutzt, wenn softmax die Ausgabe davon begrenzt hat?tensorflow softmax_cross_entropy code
1
A
Antwort
0
Die Implementierung von tf.nn.softmax_cross_entropy_with_logits
geht weiter zu nativem C++ - Code, here ist XLA-Implementierung. Logits sind nicht gebunden und 0
ist möglich, wenn einer der Logits viel größer als andere ist. Beispiel:
>>> session.run(tf.nn.softmax([10.0, 50.0, 100.0, 200.0]))
array([ 0., 0., 0., 1.], dtype=float32)
Wenn Sie möchten, können Sie die Logits Clip kurz vor dem softmax, aber es wird nicht empfohlen, da es die Steigung tötet, wenn der Ausgang groß ist. Eine bessere Option ist es, batch normalization zu verwenden, um die Aktivierungen mehr normal verteilt zu machen.
Verwandte Themen
- 1. tensorflow Code-Optimierung Strategie
- 2. Code Vervollständigung für C-Code in TensorFlow
- 3. Simple Tensorflow Code, Matmul Fehler
- 4. Port TensorFlow Code zu Android
- 5. Ist es möglich, Tensorflow-Code in denano-Code umzuwandeln?
- 6. Warum funktioniert dieser Code in Tensorflow nicht?
- 7. Tensorflow-Äquivalent für diesen MATLAB-Code
- 8. Backpropagation (durch Zeit) Code in Tensorflow
- 9. Fehler im einfachen Tensorflow-Code in Python
- 10. Wie Debug Skflow-Code (Tensorflow) gmm_ops.py?
- 11. Tensorflow Verwirrung Matrix One-Hot-Code
- 12. Tensorflow Autoencoder Code Klärung und benutzerdefinierte Testdaten
- 13. Iterator Nutzung in TensorFlow Beispiel Code
- 14. Ich kann meinen Code nicht ausgeführt Tensorflow
- 15. TensorFlow-Importfehler: TensorFlow-Importfehler
- 16. Basic neuronales Netz in Tensorflow
- 17. Tensorflow numpy tensorflow
- 18. Setzt ich das Berechnungsdiagramm in meinem Tensorflow-Code vollständig zurück?
- 19. Gründe für die Auswertung in tensorflow Tutorial Code cifar10_eval.py
- 20. Wo und wie den Dateinamen in diesen Tensorflow-Code eingeben?
- 21. Python TensorFlow-Code auf einer von Django erstellten Website ausführen?
- 22. Wie Code-Vervollständigung für Tensorflow in PyCharm erhalten?
- 23. Debuggen von Tensorflow C++ - Code hinter der SWIG-Schnittstelle
- 24. wie Kreuzvalidierung in diesem Tensorflow SVM-Code Klasse
- 25. Wie finde ich den Code von "tf.nn.dynamic_rnn" im Tensorflow-Repository?
- 26. Tensorflow Dokumentationsbeispiel Code auf "Logging Device Placement" druckt nichts
- 27. TensorFlow ändert automatisch den Namen meines Variablenbereichs? folgenden Code
- 28. gleicher Code, sehr unterschiedliche Genauigkeit auf Windows/ubuntu (Keras/Tensorflow)
- 29. Geben Sie GPU in Tensorflow-Code:/GPU: 0 funktioniert immer?
- 30. Tensorflow: Wie schreibe ich sauberen Code für Multi-GPU-Modellparallelität?