Ich versuche, einige Experimente mit einem in Thrust codierten Algorithmus auszuführen. Ich möchte wissen, wie sich die Anzahl der Threads pro Block auf die Leistung meines Algorithmus auswirkt. Ist es möglich, den Schub so zu begrenzen, dass nicht mehr als X Gewinde pro Block verwendet werden?Startkonfiguration in Thrust
0
A
Antwort
2
Thrust bietet keine Möglichkeit, die Anzahl der Threads pro Block oder die Anzahl der Blöcke, die in einem bestimmten Kernel-Aufruf verwendet werden, direkt festzulegen.
Diese Dinge werden indirekt durch Algorithmus und Problemgröße bestimmt, aber Sie haben keine direkte Kontrolle über sie.
Natürlich ist Schub eine Open-Source-Header/Template-Bibliothek, so dass Sie theoretisch alle gewünschten Codeänderungen vornehmen können. Ich nehme an, das ist nicht das, was Sie fragen und liegt außerhalb des Rahmens meiner Antwort.
Verwandte Themen
- 1. Ablaufverfolgung ohne Startkonfiguration aktivieren
- 2. CPAN ersten Startkonfiguration
- 3. Cuda Thrust min_element stürzt
- 4. CUDA on Thrust: Wie prioritätswarteschlange
- 5. Ist Thrust synchron oder asynchron?
- 6. Der Builder Startkonfiguration konnte nicht gefunden werden
- 7. Detektieren ptx Kernel von Thrust transform
- 8. Erstellen und Verwenden von Gerätefunktoren mit Thrust
- 9. Thrust - Sortierelementarrays des Klassenobjekts auf GPU
- 10. Thrust CUDA finden maximal pro Gruppe (Segment)
- 11. Thrust Fehler mit CUDA separate Kompilierung
- 12. Thrust Reduce mit binary_function und mehreren Typen
- 13. thrust :: sort_by_key ist viel langsamer als qsort
- 14. Eclipse: Wie kann ich eine Startkonfiguration programmgesteuert ausführen?
- 15. Runtime-Linker-Fehler mit Thrust in MATLAB MEX-Datei
- 16. Aufteilen von Jobs für Threads in Cuda mit Thrust
- 17. Gibt es eine Analogie der Boost-Compute-Funktion in Thrust?
- 18. Cuda Thrust vorheriges Element in einem Segment erhalten
- 19. Aufruf Funktor für alle Kombinationen in Cuda/Thrust
- 20. Geschachtelte Propery von Yaml im Frühjahr Startkonfiguration lesen
- 21. Wie wird die Ausführung der Eclipse-Startkonfiguration ordnungsgemäß beendet?
- 22. Verwenden von CUB und Thrust für parallelen Summenscan
- 23. Undefinierter Symbolfehler bei der Verwendung von thrust :: max_element
- 24. "Fehler beim Abrufen der Hauptmethode von gegebener Startkonfiguration" beim Exportieren von jar aus Eclipse
- 25. Thrust: Wie man absichtlich vermeiden, einen Parameter in Algorithmus zu übergeben?
- 26. So löschen Sie die alte Startkonfiguration mit Hilfe des Ansible-Codes
- 27. Thrust vektorisierte Suche: effizient kombinieren lower_bound und binary_search, um sowohl Position und Existenz zu finden
- 28. CUDA Thrust Funktor GMEM Zugriff: Ctor Daten kopieren vs Ctor dev Ptr Arg
- 29. Verwendung der CUDA Thrust-Ausführungsrichtlinie zum Überschreiben von Thrusts Low-Level-Gerätespeicherzuordner
- 30. Cuda Thrust - So optimieren Sie einen Code mit sort_by_key, merge_by_key und reduce_by_key
Schub exponiert bewusst nichts dergleichen – talonmies