请求计算能力2.0设备(费米架构):
struct cudaDeviceProp device_prop;
int chosen_device;
memeset(device_prop, 0, sizeof(cudaDeviceProp));
device_prop.major = 2;
device_prop.minor = 0;
if(cudaChooseDevice(&chosen_device, device_prop) != cudaErrorInvalidValue)
{
CUDA_CALL(cudaSetDevice(chosen_device));
}
cuda错误处理:
每个函数返回一个错误代码时,每次函数调用必须进行错误检查,并编写处理函数。这使得错误处理很麻烦,并且导致高度缩进的程序代码:
if (cudaMalloc(..) == cudaSuccess)
{
if (cudaEventCreate(&event) == cudaSuccess)
{
}
}
else
{
...
}
为了重复性的编程,可以使用下面的宏来调用CUDA应用程序接口:
#define CUDA_CALL(x) {const cudaError_t a=(x); if (a != cudaSuccess) {printf("\nCUDAError:%s(err_num=%d)\n",cudaGetErrorString(a),a); cudaDeviceReset(); assert(0);}}