ptx

2Hitze

2Antwort

Ich möchte zwei 32-Bit-Ganzzahlen ohne Vorzeichen in CUDA PTX hinzufügen und ich möchte auch auf die Übertragsfortpflanzung kümmern. Ich verwende den folgenden Code, um das zu tun, aber das Ergebnis i

26Hitze

2Antwort

Welchen Zweck haben mehrere "arch" -Flags in Nvidias NVCC-Compiler?

Ich habe mich kürzlich gefragt, wie NVCC CUDA-Gerätecode für verschiedene Rechnerarchitekturen kompiliert. Aus meiner Sicht ist "arch" die minimale Compute-Architektur, die für die Anwendung des Progr

12Hitze

3Antwort

CUDA deaktiviert den L1-Cache nur für eine Variable

Gibt es eine Möglichkeit auf CUDA 2.0-Geräten, den L1-Cache nur für eine bestimmte Variable zu deaktivieren? Ich weiß, dass man L1-Cache zur Kompilierzeit deaktivieren kann, indem man für alle Speiche

7Hitze

2Antwort

Ist es möglich, Montageanweisungen in den CUDA-Code aufzunehmen?

Ich möchte Assembler-Code in CUDA C-Code verwenden, um teure Ausführungen wie wir mit asm in c-Programmierung zu reduzieren. Ist es möglich?