记录：关于多头transformer中qkv矩阵变化过程

聪聪0620

已于 2024-04-02 17:02:02 修改

阅读量765

点赞数 4

CC 4.0 BY-SA版权

文章标签： transformer 矩阵深度学习

于 2024-04-02 17:00:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41544900/article/details/137276259

from typing import Optional

import torch
import torch.nn as nn
from torch import Tensor


class MultiHeadAttention(nn.Module):
    """
    This layer applies a multi-head self- or cross-attention as described in
    `Attention is all you need <https://arxiv.org/abs/1706.03762>`_ paper

    Args:
        embed_dim (int): :math:`C_{in}` from an expected input of size :math:`(N, P, C_{in})`
        num_heads (int): Number of heads in multi-head attention
        attn_dropout (float): Attention dropout. Default: 0.0
        bias (bool): Use bias or not. Default: ``True``

    Shape:
        - Input: :math:`(N, P, C_{in})` where :math:`N` is batch size, :math:`P` is number of patches,
        and :math:`C_{in}` is input embedding dim
        - Output: same shape as the input

    """

    def __init__(
        self,
        embed_dim: int,
        num_heads: int,
        attn_dropout: float = 0.0,
        bias: bool = True,
        *args,
        **kwargs
    ) -> None:

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄8年

6
原创

19
点赞

16
收藏

4
粉丝

关注

私信

热门文章

分类专栏

文件批量处理 1篇

上一篇：: MATLAB使用audiowrite 警告: 数据在写入文件期间被裁剪

下一篇：: 修改labelme的标注点的大小

最新评论

修改labelme的标注点的大小
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
记录：关于多头transformer中qkv矩阵变化过程
CSDN-Ada助手: 恭喜用户写了第四篇博客，内容围绕多头transformer中qkv矩阵变化过程展开，对于深入理解transformer模型起到了很好的帮助。在此基础上，建议用户可以尝试结合实际案例或者应用场景，进一步探讨qkv矩阵在不同情境下的应用和影响，从而丰富博客内容，提升读者的阅读体验。希望用户在未来的创作中能够继续保持热情和耐心，不断挖掘深度，为读者带来更多有价值的内容。期待您的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
MATLAB使用audiowrite 警告: 数据在写入文件期间被裁剪
CSDN-Ada助手: 恭喜你坚持不懈地创作博客！标题“MATLAB使用audiowrite 警告: 数据在写入文件期间被裁剪”引人入胜，让我对你的博客产生了浓厚的兴趣。在下一步的创作中，我建议你可以探索一下如何解决这个警告问题，并分享你的解决方案。这将帮助更多的读者更好地理解和应用MATLAB的audiowrite功能。期待你的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
记录F.grid_sample及F.interpolate中的align_corners=True
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。