核函数线程索引与图像对应关系
在opencv中进行图像像素索引,首先在width上索引,再在height上索引。两个循环的外层是height,内层是width。在核函数中的更新速度x>y>z,当只使用二维网格时,x对应图像width,y对应图像height。
对图像进行归一化
在resnet中将像素从0-255映射到0-1之间,通过减去均值除以方差。
float __device__ normalized(float src, float mean, float std)
{
float res = (src / 255.0f - mean) / std;
return res;
}
HWC转化为CHW
由于通过opencv读取到的图像为BGR格式,通过指针进行逐像素索引的顺序是BGRBGRBGR,在tensorRT中传入的像素顺序由神经网络模型推理的通道顺序确定的,在resnet中tensor为[C,H,W]的顺序传入的。
void __global__ preprocess(uchar * src, float* res, const int width, const int height)
{
int x = threadIdx.x + blockIdx.x * blockDim.x;
int y = threadIdx.y + blockIdx.y * blockDim.y;
const int size = width * height;
const float mean[3] = {0.485f, 0.456f, 0.406f};
const float std[3] = {0.229f, 0.224f, 0