一、本文介绍
本文记录的是基于EfficientViT的RT-DETR轻量化改进方法研究。EfficientViT
通过构建多尺度线性注意力模块
将全局感受野与多尺度学习相结合,并以此模块为核心构建网络,构建轻量级且硬件高效的操作,以提升性能并降低硬件部署难度。
本文在替换骨干网络中配置了原论文中的EfficientViT_M0
、EfficientViT_M1
、EfficientViT_M2
、EfficientViT_M3
、EfficientViT_M4
和EfficientViT_M5
6 种模型,以满足不同的需求。
模型 | 参数量 | 计算量 | 推理速度 |
---|---|---|---|
rtdetr-l | 32.8M | 108.0GFLOPs | 11.6ms |
Improved | 20.6M | 64.8GFLOPs | 10.2ms |
专栏目录:RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进