
Transformer
文章平均质量分 90
AliceWanderAI
北邮自动化学院,研究方向:图像处理,机器学习
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Switch Transformer模型解读-Introduction
论文相关资料 论文 Switch Transformer: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity 下载地址https://arxiv.org/pdf/2101.03961.pdf github 代码:https://github.com/tensorflow/mesh/blob/master/mesh_tensorflow/transformer/moe.py 论文解读 Introduction原创 2021-01-23 22:26:09 · 1446 阅读 · 0 评论 -
Transformer & BERT 详解第1篇(共4篇)
本系列文章围绕以下几个主题来详细解读Transformer和BERT的原理和发展 Transformer 模型详解 Transformer在CV,NLP,推荐系统的发展与应用 BERT模型详解 BERT最新发展与应用 本篇文章:Transformer模型详解 整体结构 Encoder Decoder Positional Encoding Self Attention Add & Norm 1. 整体结构 Transformer主要由两大部分组成:Encoder &.原创 2021-01-15 22:29:07 · 917 阅读 · 0 评论