Я только что обнаружил, что на моей (довольно дорогой) Radeon 6970 поддерживается только расширение cl_amd_fp64
. Я получаю странные результаты в некоторых частях кода (доступ к значению 0.005
фактически использует 1.99916e+37
?) при работе с cl_amd_fp64
. Использование cl_khr_fp64
с Intel SDK на ЦП работает отлично. (Входные буферы точно такие же)
На странице расширения содержится очень мало информации.
Каковы именно различия между ними?
struct
, вероятно, проблемы с выравниванием (union{ struct{ double; };}
послеint
глючит, еслиunion
идет послеdouble4
, все в порядке). Я попытаюсь поиграть с этим, найти возможную причину и выделить минимальный пример. 03.02.2012