低功耗计算机视觉中的目标检测与神经网络量化

# 低功耗计算机视觉中的目标检测与神经网络量化 ## 1. 低功耗目标检测模型优化在计算机视觉领域，低功耗目标检测模型的优化至关重要。通过对目标检测模型的优化，可以提高检测精度，同时降低模型的执行延迟。 ### 1.1 目标检测精度优化对不同大小目标的检测精度进行优化，采用了缩放区域优化方法，相对提高了超过 7.8%的目标检测平均精度均值（mAP），将整体 mAP 从 16.5%提升至 17.8%。 ### 1.2 非极大值抑制阈值调整非极大值抑制阈值可以用来进一步平衡速度和精度。对于 236×236 的检测模型，它有几毫秒的空间来达到 100ms 的延迟预算，这是微调非极大值抑制阈值的理想范围。通过实验，对优化后的 236×236 MobileNetV1 SSD 模型应用不同的非极大值抑制阈值，结果如下表所示： | 非极大值抑制阈值 | 精度 (mAP %) | | --- | --- | | 0.30 | 17.85 | | 0.25 | 18.11 | | 0.20 | 18.29 | | 0.15 | 18.40 | | 0.10 | 18.43 | 最终选择了阈值 0.15，因为它在精度和延迟之间取得了最佳平衡。 ### 1.3 综合优化效果通过结合上述所有方法，可以得到一个延迟在 100ms 以内且精度最高的检测模型。将优化后的 236×236 检测模型与原始的 300×300 检测模型进行对比，结果如下表所示： | 模型 | 输入分辨率 | 精度 (mAP %) | 延迟 (ms) | | --- | --- | --- | --- | | 原始检测模型 | 300×300 | 18.0 | 145 | | 优化后的检测模型 | 236×236 | 18.4 | 93 | 优化后的模型不仅在精度上有所提高，而且在执行速度上也有显著提升。该检测模型在 2018 年的 LPIRC COCO 保留测试数据集的交互式检测挑战中获得了第一名，进一步优化的模型在 2019 年再次获得了一等奖。同时，将类似的方法应用于 ImageNet 分类（除了数据集过滤和非极大值抑制优化），还训练出了一个非常好的 8 位量化友好的分类模型，该模型在 2018 年的 LPIRC-II ImageNet 保留测试数据集的交互式分类挑战中获得了第二名。 ## 2. 神经网络量化基础随着深度学习在计算机视觉应用中的广泛采用，神经网络虽然在许多任务上优于传统计算机视觉算法，但往往伴随着较高的计算成本。降低神经网络推理的功耗和延迟是将最先进的网络集成到对功耗和计算有严格要求的边缘设备中的关键。神经网络量化是实现这些节省的最有效方法之一，但它引入的额外噪声可能会导致精度下降。下面将介绍神经网络量化的基础知识。 ### 2.1 硬件背景在深入技术细节之前，先了解量化的硬件背景以及它如何实现高效的设备端推理。神经网络（NN）加速器中矩阵 - 向量乘法（y = Wx + b）的计算过程如下： ```mermaid graph LR classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px; classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px; A([加载偏置值 bn 到累加器 An]):::startend --> B([加载权重值 Wn,m 和输入值 xm 到数组]):::process B --> C([在处理元素 Cn,m 中计算 Wn,m * xm]):::process C --> D([将 Cn,m 的结果累加到累加器 An 中]):::process D --> E([完成所有循环后，将累加器 An 的值移回内存]):::process ``` 神经网络通常使用 FP32 权重和激活进行训练。如果也以 FP32 进行推理，处理元素和累加器必须支持浮点逻辑，并且需要将数据从内存传输到计算单元。MAC 操作和数据传输消耗了神经网络推理过程中的大部分能量。因此，使用低比特定点或量化表示这些量可以带来显著的好处。低比特定点表示（如 INT8）不仅减少了数据传输量，还降低了 MAC 操作的大小和能耗。为了从浮点运算转换到高效的定点替代方案，需要一种将浮点向量转换为整数表示的方案。一个实值向量 x 可以近似表示为一个实数乘以一个整数值向量： $\hat{x} = s_x \cdot x_{int} \approx x$ 其中 $s_x$

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

低功耗计算机视觉中的目标检测与神经网络量化

相关推荐

专栏目录

低功耗计算机视觉中的目标检测与神经网络量化

相关推荐

低功耗计算机视觉技术

用于实时目标检测的FPGA神经网络加速器设计.pdf

卷积神经网络的损失最小训练后参数量化方法.docx

低功耗计算机视觉中的目标检测与神经网络量化技术

低功耗计算机视觉：NAS搜索空间设计与神经网络量化优化

低功耗计算机视觉中的深度神经网络技术解析

低功耗计算机视觉与高效神经网络架构

低功耗深度学习与计算机视觉：压缩与加速技术探析

【YOLO目标检测中的神经网络剪枝与量化优化】： 优化YOLO目标检测中的神经网络剪枝和量化

低功耗计算机视觉与图像识别系统设计

rabbitmq-c移植到arm32-linux开发板

二级造价师安装工程计量与计价押题四.doc

专栏目录

最新推荐

Tableau基础图表的创建与理解

Tableau高级功能：地图与仪表盘操作指南

数据故事创作：从理论到实践的全面指南

预训练模型的十大关键问题探索

电子商务中的聊天机器人：开发、测试与未来趋势

概率注释模型：特征添加与序列标注任务建模

优化PowerBI体验与DAX代码的实用指南

利用MicrosoftFairlearn实现AI系统的公平性

问答与对话系统技术探索

Snowflake数据平台全方位解析

【YOLO目标检测中的神经网络剪枝与量化优化】：优化YOLO目标检测中的神经网络剪枝和量化