Transformer及其变体模型在计算机视觉领域应用论文盘点

最新推荐文章于 2025-05-25 03:07:10 发布

lqfarmer

最新推荐文章于 2025-05-25 03:07:10 发布

阅读量537

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习视频教程及资料下载深度学习模型汇总生成对抗网络GAN 文章标签：自然语言处理神经网络深度学习目标跟踪知识图谱

本文链接：https://blog.csdn.net/lqfarmer/article/details/119064028

这篇博客介绍了Transformer模型在深度学习中的重要性，特别是在NLP领域的广泛应用，如Bert。同时，它提到了计算机视觉的重要性，并分享了一个资源链接，该链接包含了Transformer及其变体在计算机视觉领域的最新论文集合，供研究者参考学习。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Attention Is All You Need是一篇Google提出的将Attention思想发挥到极致的论文。这篇论文中提出一个全新的模型，叫 Transformer，抛弃了以往深度学习任务里面使用到的 CNN 和 RNN ，目前大热的Bert就是基于Transformer构建的，这个模型广泛应用于NLP领域，例如机器翻译，问答系统，文本摘要和语音识别等等方向。

计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的，被拍摄对象的数据与信息的学问。形象地说，就是给计算机安装上眼睛（照相机）和大脑（算法），让计算机能够感知环境。我们中国人的成语"眼见为实"和西方人常说的"One picture is worth ten thousand words"表达了视觉对人类的重要性。不难想象，具有视觉的机器的应用前景能有多么地宽广。

本资源整理了Transformer模型，机器各式各样变体模型，在计算机视觉的各个领域应有的最新论文，分享给大家。

资源整理自网络，资源获取见源地址：

https://github.com/alohays/awesome-visual-representation-learning-with-transformers

资源列表