mmdetection中Swin transformer检测器的代码注解

刚哥吧

已于 2022-03-16 08:26:56 修改

阅读量5.8k

点赞数 5

CC 4.0 BY-SA版权

分类专栏：视觉检测图像分割干货文章标签：深度学习人工智能 mmdetection swin transformer

于 2022-03-14 20:17:22 首次发布

本文链接：https://blog.csdn.net/qq_42308217/article/details/123470974

视觉检测图像分割干货专栏收录该内容

58 篇文章 ¥119.90 ¥299.90

订阅专栏

本文详细解释了mmdetection框架中Swin Transformer的实现，从forward()函数开始，逐步剖析patch_embed、BasicLayer、SwinTransformerBlock以及WindowAttention等关键组件的工作原理。建议读者跟随代码顺序理解，并查看提供的源码以辅助学习。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先说一下之前有小伙伴问的两个问题：

为什么每次定义网络都需要写forward()函数，而它又不是python的特殊函数？

答：因为我们的网络父类都为nn.Module类(mmdetection最新版本都为BaseModule类)，而nn.Module类中定义了__call__()方法，该方法中调用了forward()函数。因此当执行module(data)的时候，会自动调用__call__()函数。

class Module(nn.Module):
    def __init__(self):
        super(Module, self).__init__()
        # ......
    def forward(self, x):
        # ......
        return x

data = .....  #输入数据
module = Module()# 实例化一个对象
module(data)  # 前向传播
"""
    而不是使用module.forward(data)
    而实际上 module(data) 和 module.forward(data) 是等价的
"""

注：P

了解本专栏