Ich versuche Matrix Zeile Summe in der Cuda zu berechnen. da cuda für die parallele Verarbeitung verwendet wird, ist keine Schleife erforderlich. Ich habe Matrix Summenoperation durchgeführt und der Code istMatrix Zeile Summe in Cuda
__global__ void MatAdd(int A[][N], int B[][N], int C[][N]){
int i = threadIdx.x;
int j = threadIdx.y;
C[i][j] = A[i][j] + B[i][j];
}
aber im gleichen Fall nicht in der Lage es in Matrixzeilensumme zu konvertieren. Ich habe versucht, Code folgende
__global__ void rowSums(float* matrix, float* sums, int rows, int cols)
{
int row = blockIdx.y * blockDim.y + threadIdx.y;
int col = blockIdx.x * blockDim.x + threadIdx.x;
if (i < N && j < M)
sums[j] += matrix[i][j];
}
Haben Sie eine Frage zu stellen? – talonmies
Ich möchte fragen, wie Matrix Zeilensumme sollte in jcuda getan werden .. – user3804161