Ich entwickle für eine GPU mit OpenCL 1.2.OpenCL halbe Quadratwurzel
Ich versuche, halbe Quadratwurzelfunktion zu verwenden, um die Quadratwurzel meines halben Datentyps zu berechnen.
Wie auch immer, für alle Half_Square Root-Funktionen, wird am Ende eine Makro-Erweiterung zur Standard-Quadratwurzel-Funktion.
Dies führt zu Compilerfehlern, da keine der Funktionsüberladungen mit dem halben Datentyp übereinstimmt.
Ich verwende den folgenden Pragma in meiner Kernel-Datei #pragma OPENCL EXTENSION cl_khr_fp16 : enable
Sie könnten 'half_sqrt (x)' versuchen. Dies garantiert eine Genauigkeit von mindestens 10 Bits, aber der Hersteller kann dennoch entscheiden, ihn mit float zu implementieren. – Neapolitan