Ich habe ein CUDA-Projekt. Es besteht aus mehreren CPP-Dateien, die meine Anwendungslogik und eine .cu-Datei enthalten, die mehrere Kernel sowie eine __host__
-Funktion enthält, die sie aufruft.nvcc -Xptxas -v Compiler-Flag hat keine Wirkung
Jetzt möchte ich die Anzahl der von meinem Kernel (s) verwendeten Register bestimmen. Mein normaler Compiler-Aufruf sieht so aus:
nvcc -arch compute_20 -link src/kernel.cu obj/..obj obj/..obj .. -o bin/..exe -l glew32 ..
.
Das Hinzufügen des Compiler-Flags "-Xptxas -v" zu diesem Aufruf hat leider keine Auswirkungen. Der Compiler erzeugt immer noch die gleiche Textausgabe wie zuvor. Die kompilierte .exe-Datei funktioniert genauso wie zuvor mit einer Ausnahme: Meine Framerate springt von 80 fps auf 1800 fps.
das kann nicht korrekt sein, weil es die Frage nicht beantwortet .. Wenn Sie nur eine Möglichkeit zum Zählen von Registern wünschen, ändern Sie die Frage. – jmilloy
@jimilloy "Jetzt würde ich gerne die Anzahl der von meinen Kernel (s) verwendeten Register bestimmen" –