Ich bin total neu in Cuda und ich würde gerne einen Cuda Kernel schreiben, der eine Faltung berechnet, die eine Eingabematrix, Faltung (oder Filter) und eine Ausgabematrix hat.Wie schreibe ich den Cuda Kernel für Faltungen?
Hinweis: Ich möchte, dass jeder Thread des Cuda-Kernels einen Wert in der Ausgabematrix berechnet.
Wie kann ich das tun?
Soweit ich mich erinnere, gab es Dutzende von Beispielen auf der CUDA-Website. Vor allem angesichts der Tatsache, dass Faltung eine sehr häufige Aufgabe ist. Hat sich das geändert oder hast du dort nichts gefunden? – CWBudde
@CWBudde danke für Ihren Kommentar. Ja, ich habe ein paar lange Beispiele mit vielen harten Fällen auf den ganzen Webseiten gefunden, aber leider habe ich noch keinen direkten gefunden. Ich werde mehr als glücklich sein, wenn Sie welche haben. – Bilgin