关于yolov5加注意力之后的yaml文件讲解（5.0版本和6.0版本通用），文末有一个大部分人都没注意到的细节

本文详细解析了在Yolov5中添加注意力模块后的yaml配置文件变化，包括5.0和6.0版本的差异。介绍了如何在common.py和yolo.py中封装和调用注意力模块，并提供了CBAMC3和CoordAtt的添加方法。同时强调了在骨干层和head层中修改yaml文件的重要性，特别是concat函数和detect层参数的调整，以避免模型性能下降。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我发布的第一篇博客是关于添加一些常见的注意力模块到yolov5网络的代码教程，有不少同学看了之后有一些地方不是很明白，在这里我做统一回答，并讲解一下添加注意力之后的yaml文件的改动，大家掌握了具体的原理之后可以自己去决定将注意力添加在网络的哪一层。

文章链接：点我

我的习惯是，会将要用到的注意力都封装在common.py文件里，再在yolo.py里将判断条件都添加进去，这样我只需要修改yaml文件就可以很方便的调用注意力模块了，其他没有被调用的注意力模块也不会给网络带来什么影响，以下是我将CA,ECA,CBAMC3（SE也有，我不常用，yolo.py里没有SE的判断条件）这三个模块封装好的common.py和yolo.py，这两个文件在5.0和6.0版本中是没有太大区别的，大家可以像我一样放进去。

common.py

class h_sigmoid(nn.Module):
    def __init__(self, inplace=True):
        super(h_sigmoid, self).__init__()
        self.relu = nn.ReLU6(inplace=inplace)

    def forward(self, x):
        return self.relu(x + 3) / 6
        
class h_swish(nn.Module):
    def __init__(self, inplace=True):
        super(h_swish, self).__init__()
        self.sigmoid = h_sigmoid(inplace=inplace)

    def forward(self, x):
        return x * self.sigmoid(x)


class CoordAtt(nn.Module):
    def __init__(self, inp, oup, reduction=32):
        super(CoordAtt, self).__init__()
        self.pool_h = nn.AdaptiveAvgPool2d((None, 1))
        self.pool_w = nn.AdaptiveAvgPool2d((1, None))

        mip = max(8, inp // reduction)

        self.conv1 = nn.Conv2d(inp, mip, kernel_size=1, stride=1, padding=0)
        self.bn1 = nn.BatchNorm2d(mip)
        self.act = h_swish()

        self.conv_h = nn.Conv2d(mip, oup, kernel_size=1, stride=1, padding=0)
        self.conv_w = nn.Conv2d(mip, oup, kernel_size=1, stride=1, padding=0)

    def forward(self, x):
        identity = x

        n, c, h, w = x.size()
        x_h = self.pool_h(x)
        x_w = self.pool_w(x).permute(0, 1, 3, 2)

        y = torch.cat([x_h, x_w], dim=2)
        y = self.conv1(y)
        y = self.bn1(y)
        y = self.act(y)

        x_h, x_w = torch.split(y, [h, w], dim=2)
        x_w = x_w.permute(0, 1, 3, 2)

        a_h = self.conv_h(x_h).sigmoid()
        a_w = self.conv_w(x_w).sigmoid()

        out = identity * a_w * a_h

        return out  
class SELayer(nn.Module):
    def __init__(self, c1, r=16):
        super(SELayer, self).__init__()
        self.avgpool = nn.AdaptiveAvgPool2d(1)
        self.l1 = nn.Linear(c1, c1 // r, bias=False)
        self.relu = nn.ReLU(inplace=True)
        self.l2 = nn.Linear(c1 // r, c1, bias=False)
        self.sig = nn.Sigmoid()

    def forward(self, x):