Ich möchte zwei 32-Bit-Ganzzahlen ohne Vorzeichen in CUDA PTX hinzufügen und ich möchte auch auf die Übertragsfortpflanzung kümmern. Ich verwende den folgenden Code, um das zu tun, aber das Ergebnis i
Ich habe mich kürzlich gefragt, wie NVCC CUDA-Gerätecode für verschiedene Rechnerarchitekturen kompiliert. Aus meiner Sicht ist "arch" die minimale Compute-Architektur, die für die Anwendung des Progr
Gibt es eine Möglichkeit auf CUDA 2.0-Geräten, den L1-Cache nur für eine bestimmte Variable zu deaktivieren? Ich weiß, dass man L1-Cache zur Kompilierzeit deaktivieren kann, indem man für alle Speiche