Verwendet Tensorflow automatisch Cuda-Streams zur gleichzeitigen Ausführung des Berechnungsgraphen auf einer einzelnen GPU oder sollten Streams manuell Ops/Tensoren zugewiesen werden?Wie unterstützt Tensorflow Cuda Streams?
Antwort
Derzeit verwendet TensorFlow nur einen Datenstrom und mehrere Kopienströme. Einige Kernel können mehrere Streams für die Berechnung verwenden, während sie eine Single-Stream-Semantik beibehalten.
Unser Experiment zeigte, dass das automatische Aktivieren von Multi-Stream nicht viel Performance bringt, da die meisten unserer Kernel groß genug sind, um alle Prozessoren in der GPU zu nutzen. Die Aktivierung von Multi-Stream würde jedoch unser aktuelles Design deaktivieren, um GPU-Speicher aggressiv zu recyceln.
Dies ist eine Entscheidung, die wir in Zukunft vielleicht noch einmal besprechen werden. Wenn dies geschieht, ist es wahrscheinlich, dass TensorFlow automatisch Ops/Kernel verschiedenen Cuda-Streams zuweist, ohne sie den Benutzern zu zeigen.
- 1. Unterstützt Tensorflow Tesla K80
- 2. CUDA-Streams nehmen längere Zeit in Anspruch
- 3. Unterstützt eine GPU, die CUDA unterstützt, auch OpenCL?
- 4. C++ - Version unterstützt von cuda 5.0
- 5. Unterstützt Android Mediaplayer HLS Audio Streams?
- 6. Tensorflow Installation schlägt fehl mit CUDA 8 RC
- 7. Gibt es eine maximale Anzahl von Streams in CUDA?
- 8. Sollten CUDA Events und Streams immer zerstört werden?
- 9. Unterstützt Tensorflow map_fn mehr als einen Tensor?
- 10. Wie CUDA synchronisieren Latenz/Verzögerung
- 11. wie tensorflow verteilt mnist Beispiel
- 12. Installation von TensorFlow, wo ist Cuda auf Ubuntu zuhause?
- 13. Tensorflow GPU-Setup: Fehler mit CUDA auf PyCharm
- 14. CUDA Installation für TensorFlow. No cuDNN v4 für CUDA 7.5 bei NVIDIA
- 15. Wie CUDA konstante Speicherzuordnung funktioniert?
- 16. TensorFlow Bazel bauen
- 17. Wird Cuda 6 mit Visual Studio 2013 unterstützt?
- 18. CUDA 7.0 beschwert sich über nicht gcc unterstützt 4.9
- 19. Wie wird der TensorFlow-Ausgang interpretiert?
- 20. Typeerror: ‚Tensor‘ Objekt nicht Gegenstand Zuordnung in TensorFlow unterstützt
- 21. Verschachtelte Kernel in CUDA
- 22. Erste: tensorflow auf dieser Plattform nicht unterstützt Rad ist
- 23. Cuda Bibliothek tot nach Linux-Updates
- 24. Wie funktioniert einen Transfer CUDA Konstante Speicher in tensorflow der C++ API
- 25. Die erforderliche Mindest Cuda Fähigkeit beträgt 3,5
- 26. Doppelpräzisions-Gleitkommazahl in CUDA
- 27. Wie gepufferte Streams funktioniert?
- 28. Wie stoppen Streams?
- 29. Konfiguration in TensorFlow kompilieren cudnn
- 30. Jetson TK1 Multiple Streams parallele Ausführung