更换 RT-DETR 主干网络为【ResNet-18】【ResNet-34】| 已支持 18/34/50/101/152 全系列尺寸

最新推荐文章于 2025-04-11 17:36:29 发布

迪菲赫尔曼

最新推荐文章于 2025-04-11 17:36:29 发布

阅读量1.7k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： RT-DETR改进实战文章标签：算法目标检测人工智能 DETR resnet 主干网络 RTDETR

原创文章为博主个人所有，未经授权不得转载、摘编、传播、倒卖、洗稿或利用其它方式使用上述作品。违反上述声明者，本站将追求其相关法律责任。

本文链接：https://blog.csdn.net/weixin_43694096/article/details/139471656

RT-DETR改进实战专栏收录该内容

48 篇文章 ¥199.90 ¥299.90

订阅专栏

博主介绍了如何在RT-DETR中使用ResNet-18和ResNet-34作为主干网络，详细阐述了网络结构的添加步骤和参数量对比，旨在优化目标检测模型的性能。同时强调了更深的残差网络在视觉识别任务中的重要性，并在COCO目标检测数据集上取得了提升。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本专栏内容均为博主独家全网首发，未经授权，任何形式的复制、转载、洗稿或传播行为均属违法侵权行为，一经发现将采取法律手段维护合法权益。我们对所有未经授权传播行为保留追究责任的权利。请尊重原创，支持创作者的努力，共同维护网络知识产权。

之前这篇文章写过了添加【ResNet-50】【ResNet-101】【ResNet-152】，我们这篇写添加【ResNet-18】【ResNet-34】，需要在原来的基础上添加一个新的模块。

模型	参数量
resnet-18	29905484
resnet-34	40013644
resnet-50	42925132
resnet-101	61917260
resnet-152	77560908
rtdetr-l	32970476

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

迪菲赫尔曼

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

原论文一比一复现 | 更换 RT-DETR 主干网络为【ResNet-50】【ResNet-101】【ResNet-152】| 对比实验必备

YOLOv8项目贡献者

11-14

3128

回归经典，更换 RT-DETR 主干网络为【ResNet-50🏅】【ResNet-101🏅】【ResNet-152🏅】，同行别抄了行不行！

【RT-DETR多模态融合改进】（可见光+红外）涉及前期、中期、中后期、后期融合方式的完整配置步骤以及二次改进方案（resnet18版本）

最新发布

Limiiiing的博客

05-29

816

主题： RT-DETR的多模态融合改进（resnet18版本）。方式：前期融合、中期融合、中-后期融合、后期融合。内容：包含融合方式详解和完整的项目包和配置步骤以及二次改进建议，开箱即用，一键运行。定义：在网络输入阶段将多模态数据直接合并，形成统一的特征表示。实现方式：将 RGB（3 通道）与红外（3 通道）图像直接拼接为 6 通道输入，以保留原始模态的细节信息。结构示意图：定义：在网络中间层（骨干网络与颈部网络之间）对多模态特征进行融合。实现方式：每个模态通过独立的骨干网络提取特征，融合时采

参与评论您还未登录，请先登录后发表或查看评论

RT-DETR-R18版本的ultralytics的yaml更改分享！！

DADONGOOO的博客

04-11

1548

起因：本人深度学习，无奈组内没有好的显卡，只有我自己拥有的一张4060卡跑CV，稍微大一点的模型跑不了，我的模型主打一个轻量化... 在找模型与我的模型进行比较的时候，看的RT-DETR-R18版本(GFLPOS也是相当高...)，但是也是一个开源的比较好的模型。

RT-DETR 更换主干网络之 ShuffleNetv2 | 《ShuffleNet v2：高效卷积神经网络架构设计的实用指南》

YOLOv8项目贡献者

01-10

1494

RT-DETR 轻量化的简单尝试

YOLOv8改进 | 主干篇 | 2024.5全新的移动端网络MobileNetV4改进YOLOv8（含MobileNetV4全部版本改进）

Snu77的博客

05-08

8960

本文给大家带来的改进机制是MobileNetV4，MobileNetV4是一种高度优化的神经网络架构，专为移动设备设计。它最新的改动总结主要有两点，采用了通用反向瓶颈（UIB）和针对移动加速器优化的Mobile MQA注意力模块（一种全新的注意力机制）。这些创新有助于在不牺牲准确性的情况下，显著提高推理速度和计算效率。MobileNetV4作为一种移动端的网络，其实它的论文中主要是配合蒸馏技术进行改进，大家可以搭配本专栏的蒸馏进行二次创新涨点。

RT-DETR 更换骨干网络之 MobileNetV3 | 《搜寻 MobileNetV3》

YOLOv8项目贡献者

01-10

1521

轻量化的主干，有些同学反馈想尝试下。

YOLOv11改进策略【模型轻量化】| 替换骨干网络为 ICCV 2023的EfficientViT 用于高分辨率密集预测的多尺度线性关注

Limiiiing的博客

10-28

824

本文记录的是基于EfficientViT的YOLOv11轻量化改进方法研究。通过构建多尺度线性注意力模块将全局感受野与多尺度学习相结合，并以此模块为核心构建网络，构建轻量级且硬件高效的操作，以提升性能并降低硬件部署难度。本文在替换骨干网络中配置了原论文中的和6种模型，以满足不同的需求。

RT-DETR改进策略：主干网络改进|DeBiFormer，可变形双级路由注意力|全网首发

m0_47867638的博客

10-19

1093

摘要在目标检测领域，RT-DETR以其高效和准确的性能而闻名。然而，为了进一步提升其检测能力，我们引入了DeBiFormer作为RT-DETR的主干网络。这个主干网络的计算量比较大，不过，上篇双级路由注意力的论文受到很大的关注，所以我也将这篇论文中的主干网络用来改进RT-DETR，卡多的同学可以试试。 DeBiFormer是一种新型的视觉转换器，它结合了可变形注意力和双级路由注意力的优点。通过引入可变形双级路由注意力（DBRA）机制，DeBiFormer能够灵活且语义化地获取数据依赖的注意力模式。这种注意

【RT-DETR改进涨点】ResNet18、34、50、101等多个版本移植到ultralytics仓库(RT-DETR官方一比一移植)

Snu77的博客

01-29

5557

本文是本专栏的第一篇改进，我将RT-DETR官方版本中的ResNet18、ResNet34、ResNet50、ResNet101移植到ultralytics仓库，网上很多改进机制是将基础版本的也就是2015年发布的ResNet移植到ultralytics仓库中，但是其实RT-DETR实验的ResNet和其是有很大区别的在其中有很多细节上的不同（文章中我也会列出举例）

RT-DETR改进有效系列目录 | 包含卷积、主干、RepC3、注意力机制、Neck上百种创新机制

热门推荐

Snu77的博客

01-29

2万+

Hello，各位读者们好Hello，各位读者，距离第一天发RT-DETR的博客已经过去了接近两个月，这段时间里我深入的研究了一下RT-DETR在ultralytics仓库的使用，旨在为大家解决为什么用v8的仓库训练的时候模型不收敛，精度差的离谱的问题，我也是成功的找到了解决方案，对于ultralytics仓库进行多处改进从而让其还原RT-DETR官方的实验环境从而达到一比一的效果。同时本人一些讲解视频和包含我所有创新的RT-DETR文档。

resnet34-333f7ec4.pth

03-14

resnet34-333f7ec4.pth

YOLOv11改进 | 主干/Backbone篇 | 利用RT-DETR主干网络PPHGNetV2助力yolov11有效涨点（轻量化目标检测网络）

Snu77的博客

10-24

2718

本文给大家带来利用RT-DETR模型主干HGNet去替换YOLOv11的主干，RT-DETR是今年由百度推出的第一款实时的ViT模型，其在实时检测的领域上号称是打败了YOLO系列，其利用两个主干一个是HGNet一个是ResNet，其中HGNet就是我们今天来讲解的网络结构模型，这个网络结构目前还没有推出论文，所以其理论知识在网络上也是非常的少，我也是根据网络结构图进行了分析（精度mAP提高0.05）。YOLOv11改进系列专栏——本专栏持续复习各种顶会内容——科研必备目录一、本文介绍。

剑指RT-DETR改进主干EfficientNet模型：重新思考卷积神经网络的模型扩展，使得RT-DETR目标检测模型高效涨点

包括YOLOv5、YOLOv7、YOLOv8等模型改进

01-29

275

RT-DETR实践改进代码｜EfficientNet网络结构原创改进

RT-DETR改进|爆改模型|涨点|使用VMamba作为骨干网络（附代码+修改教程）

m0_51665349的博客

10-09

5487

本文修改的模型是RT-DETR，在原本的RT-DETR中，使用ResNet作为骨干网络，本文使用最新的VMamba（Visual State Space Model）替换ResNet作为RT-DETR的骨干网络。VMamba是一种全新的视觉框架，VMamba结合了CNNs和ViTs的优势，同时优化了计算效率，能够在保持全局感受野的情况下实现线性复杂度。

革新目标检测：重塑RT-DETR的骨干网络与简约之美的RIFormer

一直在水些技术小文

11-20

254

通过本文的深度解析，我们详细讨论了RT-DETR算法的骨干网络改进和RIFormer的极简ViT架构的引入。这一优化方案在性能上实现了显著提升，为目标检测领域带来了更为高效的解决方案。希望这次技术分享能够激发更多研究者和开发者对目标检测领域的关注和创新。在评论区分享您的看法和经验，让我们共同推动目标检测技术的不断进步。

【RT-DETR有效改进】主干篇 | SwinTransformer替换Backbone（附代码 + 详细修改步骤 +原理介绍）

Snu77的博客

01-23

2904

本文给大家带来的改进机制是利用替换RT-DETR中的骨干网络其是一个开创性的视觉变换器模型，它通过使用位移窗口来构建分层的特征图，有效地适应了计算机视觉任务。与传统的变换器模型不同，Swin Transformer的自注意力计算仅限于局部窗口内，使得计算复杂度与图像大小成线性关系，而非二次方。这种设计不仅提高了模型的效率，还保持了强大的特征提取能力。Swin Transformer的创新在于其能够在不同层次上捕捉图像的细节和全局信息，使其成为各种视觉任务的强大通用骨干网络。

主干网络篇 | 利用RT-DETR模型主干HGNet去替换YOLOv8的主干

突然好想你

03-31

593

本文所作出的改进是利用RT-DETR模型主干HGNet去替换YOLOv8的主干，并提供了两个版本的方法~！🌈

【RT-DETR有效改进】FasterNet一种跑起来的主干网络（提高FPS和检测效率）

Snu77的博客

01-25

1873

本文给大家带来的改进机制是FasterNet网络，将其用来替换我们的特征提取网络，其旨在提高计算速度而不牺牲准确性，特别是在视觉任务中。它通过一种称为部分卷积（PConv）的新技术来减少冗余计算和内存访问。这种方法使得FasterNet在多种设备上运行速度比其他网络快得多，同时在各种视觉任务中保持高准确率。经过我的实验该主干网络确实能够涨点在大中小三种物体检测上，同时该主干网络也提供多种版本，大家可以在源代码中进行修改版本的使用。本文通过介绍其主要框架原理，然后教大家如何添加该网络结构到网络模型中。

rt-detr r18

03-22

<think>好的，我现在需要帮助用户找到关于RT-DETR模型使用ResNet18（R18）作为主干网络的实现方法和使用信息。首先，我应该回忆一下RT-DETR的基本结构以及它通常使用的主干网络。RT-DETR是实时检测变换器（Real-Time Detection Transformer）的缩写，结合了Transformer架构和实时目标检测的需求。通常，RT-DETR可能会使用不同的主干网络，比如ResNet或者更轻量级的网络来平衡速度和精度。用户提到的ResNet18是一个比较轻量级的卷积神经网络，适合在资源受限的环境下使用。因此，使用R18作为主干网络可能旨在降低计算复杂度，提高推理速度，同时保持一定的检测精度。接下来，我需要考虑如何在RT-DETR中替换或使用R18主干。首先，我需要查找是否有公开的代码库或论文中提到了RT-DETR与ResNet18的结合。例如，DETR的原始实现使用ResNet作为主干，而RT-DETR可能在其基础上进行了优化。参考用户提供的引用内容，他们提到了YOLOv10的修改，比如添加模块文件和修改模型解析函数，这可能对理解如何修改RT-DETR的结构有帮助。根据引用[2]，修改模型解析函数（parse_model）可能需要调整输入通道和层结构。如果要将R18集成到RT-DETR中，可能需要调整主干网络的输出特征图，以匹配Transformer部分的输入要求。此外，引用[3]中提到的空间通道解耦下采样模块（SCDown）可能对优化下采样过程有帮助，但不确定是否适用于RT-DETR。接下来，实现步骤可能包括：1）加载ResNet18作为主干，并移除其全连接层；2）提取不同阶段的特征图作为Transformer的输入；3）调整Transformer的编码器和解码器结构以适应特征图的尺寸；4）进行端到端的训练，可能需要修改损失函数和训练策略以适应实时检测的需求。在代码实现方面，可以参考PyTorch中的ResNet18实现，并将其集成到RT-DETR的框架中。例如，使用torchvision.models.resnet18，获取中间层的输出，然后将这些特征传递给Transformer编码器。同时，需要注意特征图的通道数和空间分辨率，确保与后续模块兼容。训练时，可能需要调整数据增强、学习率调度等参数，特别是因为ResNet18的参数较少，可能需要不同的训练策略来防止欠拟合。此外，实时性要求可能影响批次大小和设备选择，如引用[1]中使用CPU训练，但实际部署可能需要GPU加速。用户可能还关心如何评估RT-DETR-R18模型的性能，比如在COCO数据集上的mAP和推理速度。比较与其他主干网络（如ResNet50或MobileNet）的权衡，分析速度和精度的平衡。最后，需要确保回答结构清晰，分步骤说明实现方法，并引用提供的参考资料。可能还需要生成相关问题，如优化方法、性能比较或应用场景，以帮助用户进一步探索。</think>### RT-DETR模型使用ResNet18主干的实现方法 #### 1. **主干网络替换** RT-DETR（Real-Time Detection Transformer）的默认主干网络可能基于更复杂的架构（如ResNet50或Swin Transformer），但替换为ResNet18可通过以下步骤实现： - **加载ResNet18**：使用预训练的ResNet18作为特征提取器，移除其全连接层，保留卷积层输出多尺度特征图[^2]。 - **调整特征输出**：ResNet18的Stage2-Stage5输出特征图（如C3-C5）需与RT-DETR的Transformer输入对齐，通常通过1x1卷积调整通道数。 #### 2. **模型架构修改** 参考YOLOv10的解耦设计思想[^3]，可优化RT-DETR的流程： - **特征融合**：将ResNet18输出的多尺度特征图输入Transformer编码器，通过自注意力机制增强全局上下文建模。 - **解码器适配**：Transformer解码器需根据ResNet18的特征分辨率调整查询（Query）生成策略，例如减少查询数量以提升实时性。 #### 3. **代码实现示例（PyTorch框架）** ```python import torch import torchvision from rt_detr import RTDETRTransformer # 加载ResNet18主干 backbone = torchvision.models.resnet18(pretrained=True) backbone = torch.nn.Sequential(*list(backbone.children())[:-2]) # 移除最后两层（avgpool和fc） # 定义RT-DETR模型 class RTDETR_R18(torch.nn.Module): def __init__(self, num_classes=80): super().__init__() self.backbone = backbone self.transformer = RTDETRTransformer( d_model=256, # 与ResNet18输出通道对齐 num_queries=100, num_classes=num_classes ) def forward(self, x): features = self.backbone(x) # 输出特征图尺寸例如：[batch, 512, 16, 16] return self.transformer(features) ``` #### 4. **训练与优化** - **数据配置**：类似YOLO系列，需配置数据集路径和类别数（参考引用[1]的`data=cfg/datasets/coco128.yaml`格式）。 - **训练参数**：若使用CPU训练，设置`device=cpu`并减小`batch`值（如`batch=8`）以避免内存溢出[^1]。 - **损失函数**：采用匈牙利匹配损失，包含分类损失和边界框回归损失。 #### 5. **性能与应用场景** - **实时性优势**：ResNet18的计算量显著低于复杂主干，适合边缘设备部署。 - **精度权衡**：相比ResNet50，检测精度可能下降，可通过知识蒸馏或量化训练补偿[^3]。 ---

更换 RT-DETR 主干网络为 【ResNet-18】【ResNet-34】| 已支持 18/34/50/101/152 全系列尺寸

更换 RT-DETR 主干网络为【ResNet-18】【ResNet-34】| 已支持 18/34/50/101/152 全系列尺寸