cudaStreamCreate
是 CUDA 中用于创建异步流的核心函数,其作用是为 GPU 任务分配一个独立的执行队列。通过流(Stream),开发者可以控制核函数、内存操作等任务的执行顺序,实现并行化以提高 GPU 利用率。
一、函数原型
cudaError_t cudaStreamCreate(cudaStream_t* pStream);
- 参数:
pStream
(输出参数)
指向cudaStream_t
类型变量的指针,用于接收新创建的流的句柄。 - 返回值:
cudaSuccess
表示成功,否则返回错误码(可通过cudaGetErrorString
解析)。
二、核心功能
-
创建非默认流
默认流(NULL
或0
)是隐式存在的,但所有操作会阻塞其他流。通过cudaStreamCreate
显式创建流,可以实现任务并行。cudaStream_t stream; cudaStrea