Gibt es eine Möglichkeit auf CUDA 2.0-Geräten, den L1-Cache nur für eine bestimmte Variable zu deaktivieren? Ich weiß, dass man L1-Cache zur Kompilierzeit deaktivieren kann, indem man für alle Speicheroperationen das Flag -Xptxas -dlcm=cg
zu nvcc
hinzufügt. Ich möchte jedoch den Cache nur für Speicherlesevorgänge bei einer bestimmten globalen Variablen deaktivieren, sodass der gesamte Rest des Speichers gelesen wird, um den L1-Cache zu durchlaufen.CUDA deaktiviert den L1-Cache nur für eine Variable
Basierend auf einer Suche, die ich im Web gemacht habe, ist eine mögliche Lösung durch PTX-Assembly-Code.
Danke! Das funktioniert großartig! – zeus2
@Reguj, wird dies nicht von NVIDIA-Kopfzeilen bereitgestellt? – einpoklum
[this] (https://nvlabs.github.io/cub/classcub_1_cache_modified_input_iterator.html#details) kann von Interesse sein –