主流的25个深度学习模型

最新推荐文章于 2025-06-06 15:00:20 发布

原创

最新推荐文章于 2025-06-06 15:00:20 发布 · 3.7w 阅读

235 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习

本文列举了25个主流的深度学习模型，包括前馈神经网络、自动编码器、卷积神经网络、循环神经网络等，并简单介绍了它们的特点和应用场景。从基本的FFNN到复杂的生成对抗网络，每个模型都有其独特的价值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

深度学习发展很快，新的模型层出不穷，所以要想全部列举是不可能的。另外，很多模型都是这里提出很长很长时间了，所以也不是说“老”模型就没用，大家学习的话，还是要全面而深入的学习。

1、 Feed forward neural networks (FF or FFNN) and perceptrons (P)

前馈神经网络和感知机，信息从前（输入）往后（输出）流动，一般用反向传播（BP）来训练。算是一种监督学习。

2、Radial basis function (RBF)

径向基函数网络，是一种径向基函数作为激活函数的FFNNs（前馈神经网络）。

3、 Hopfield network (HN)

Hopfield网络，是一种每个神经元都跟其它神经元相连接的神经网络。

4、 Markov chains (MC or discrete time Markov Chain, DTMC)

马尔可夫链或离散时间马尔可夫链，算是BMs和HNs的雏形。

5、 Boltzmann machines (BM)

玻尔兹曼机，和Hopfield网络很类似，但是：一些神经元作为输入神经元，剩余的是隐藏层。

6、Restricted Boltzmann machines (RB

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

昂刺鱼人工智能

关注关注

18
点赞
踩
235

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

AI学习笔记（二）- 当前主流的AI 深度学习框架与运行平台

weixin_53880910的博客

07-21

1485

PyTorch采用已经为许多研究人员、开发人员和数据科学家所熟悉的原始Python命令式编程风格。同时它还支持动态计算图，这一特性使得其对时间序列以及自然语言处理数据相关工作的研究人员和工程师很有吸引力

深度学习五大模型：CNN、Transformer、BERT、RNN、GAN解析

Androiddddd的博客

02-14

2017

今天探讨它们各自适用的场景，让您知道在何种情况下选择何种模型；同时分析它们的优势与局限，助您全面评估这些模型的性能。

4 条评论您还未登录，请先登录后发表或查看评论

深度学习模型

jun778895的博客

10-08

1066

深度学习是机器学习的一个分支，它使用了深度神经网络（Deep Neural Network，DNN）进行机器学习。深度神经网络通常指的是使用了两层或两层以上隐藏层的神经网络。这种网络结构能够学习到数据中的复杂特征，并通过这些特征进行预测和分类。因此，深度学习模型可以理解为一种具有多层隐藏层的神经网络模型，它能够从大量数据中自动提取特征、识别模式、进行分类和预测等任务。

深度学习五大模型：CNN、Transformer、BERT、RNN、GAN解析，（非常详细）从零基础到精通，收藏这一篇就够了

最新发布

Libra1313的博客

06-06

873

此前，我们介绍了很多深度学习基础模型，今天探讨它们各自适用的场景，让您知道在何种情况下选择何种模型；同时分析它们的优势与局限，助您全面评估这些模型的性能。

深度学习模型列举

zhangzhechun的专栏

03-17

5942

生成对抗网络（Generative Adversarial Networks，GAN）：由生成器和判别器两部分组成，用于生成能够欺骗判别器的假样本，主要应用于图像、视频、音频等生成任务。它可以学习序列中的上下文信息，能够自动捕捉输入数据中的长期依赖性。自编码器（Autoencoder，AE）：一种无监督学习模型，用于数据压缩、去噪和特征提取等任务，能够学习输入数据的低维表示。除了上述模型，还有很多其他的深度学习模型，如Transformer、BERT、GPT等，它们在自然语言处理领域中应用广泛。

常用的深度学习模型

羞羞滴小朋友

09-20

1万+

目录１自动编码器２受限玻尔兹曼机 3.深信度网络１自动编码器如果事先不知道输入数据的标签，那么可以使用自动编码器。自动编码器训练示意图标题自动编码器让输入数据经过一个编码器得到一个编码输出，在将该输出导入一个解码器得到最终的输出，由于输入数据是无标签数据，此时的误差来自于输出和原输入之间的比较。通过调整编码器和解码器的参数，使得误差达到最小，就能得到输入信号的另...

[深度学习-总结]Deep learning中8大模型介绍与比较(LeNet5,AlexNet,VGG,Inception,MobileNets,ResNet,DenseNet,Senet)

Harry的博客

04-01

1万+

LeNet5 LeNet5不是CNN的起点，但却是它的hello world，让大家看到了卷积神经网络商用的前景。 AlexNet是CNN向大规模商用打响的第一枪，夺得ImageNet 2012年分类冠军，宣告神经网络的王者归来。VGG以其简单的结构，在提出的若干年内在各大计算机视觉领域都成为了最广泛使用的benchmark。它们都有着简单而又优雅的结构，同出一门。诠释了增加深度是如何提高了深度...

一文了解深度学习模型：CNN、RNN、GAN、transformer

Java_rich的博客

10-17

1万+

深度学习是一种模仿人脑神经网络结构和功能的机器学习方法，通过构建多层神经网络模型，自动从大规模数据中学习复杂的特征表示。其核心原理包括和层次化特征提取：通过多层非线性变换，逐步提取数据的高级语义特征端到端学习：直接学习输入与输出间的映射关系，无需人工干预这种机制使深度学习能有效处理高维、非线性数据，在图像识别、语音识别和自然语言处理等领域展现出卓越性能。

深度学习几种常见模型

weixin_44378497的博客

03-31

3244

网络设计网络设计的目的：(1)减少参数量；(2)节省时间；(3)提高精度； AlexNet AlexNet是2012年被提出来的（ImagNet），网络有8层。（1）使用了Relu作为激活函数，比sigmoig和tanh使用的激活函数收敛更快；（2）使用了dropout随机删减神经原，防止过拟合。（3）全部使用最大池化，避免平均池化带来的模糊影响，步长比卷积核小，重叠卷积，提取特征更充分，...

深度学习模型汇总

热门推荐

qq_43431934的博客

12-20

2万+

深度学习五大模型：CNN、Transformer、BERT、RNN、GAN详细解析

人心中的成见是一座大山…

03-01

1万+

CNN利用卷积操作实现局部连接和权重共享，能够自动学习数据中的空间特征。：广泛应用于图像处理相关的任务，包括图像分类、目标检测、图像分割等。此外，也常用于处理具有网格状结构的数据，如文档数据。

深度学习常用模型

小幸运

03-10

3801

1. VGG （1）卷积层串联两个3*3卷积层的串联相当于1个5*5的卷积层，三个3*3的卷积层串联相当于1个7*7的卷积层 3个3*3卷积层的感受野大小相当于1个7*7的卷积层。但是3个3*3的卷积层参数量只有7*7的一半左右，同时前者可以有3个非线性操作，而后者只有1个非线性操作，这样使得...

深度学习最常见的 26 个模型汇总，请务必掌握！

weixin_33671935的博客

12-17

1万+

点击上方“AI有道”，选择“置顶”公众号重磅干货，第一时间送达本文转载自公众号：AI部落联盟（AI_Tribe）本文首先从4个方面（张量、生成模型、序列学习、深度强化学习...

常见的深度学习模型总结

hebhljdx的博客

08-30

2977

机器学习：指的是让计算机能够通过经验自动“学习”如何完成任务的一系列算法和技术。机器学习模型可以从数据中学习规律并做出预测或决策，而无需明确编程。深度学习：是机器学习的一个子集，它专注于使用多层神经网络（即深度神经网络）来模拟人脑处理信息的方式，从而解决复杂的学习任务。

深度学习经典网络模型汇总——LeNet、AlexNet、ZFNet、VGGNet、GoogleNet、ResNet【对卷积池化后特征图变化有详细讲解】

秃头小苏的博客

01-26

1万+

先来看一下我们要讲述哪些经典的网络模型，如下： LeNet ：最早用于手写数字识别的CNN网络 AlexNet ：2012年ILSVRC比赛冠军，比LeNet层数更深，这是一个历史性突破。 ZFNet ：2013年ILSVRC比赛效果较好，和AlexNet类似。 VGGNet ：2014年ILSVRC比赛分类亚军、定位冠军 GoogleNet ：2014年ILSVRC分类比赛冠军 ResNet ：2015年ILSVRC比赛冠军，碾压之前的各种网络 LeNet 1989年，Yang LeCun等

深度学习中的几大模型

qq_41503511的博客

03-06

2784

一、AlexNet 模型 1、提出了LRN层，对局部神经元的活动创建竞争机制，使得其中响应比较大的值变得相对更大，并抑制其他反馈较小的神经元，增强了模型的泛化能力。 2、数据增强，随机地从256´256的原始图像中截取224´224大小的区域（以及水平翻转的镜像）。使用了数据增强大大减轻过拟合，提升泛化能力。（进行预测时，则是取图片的四个角加中间共5个位置，并进行左右翻转，一共获得10张图片，对他...

一网打尽！5大深度学习模型！RNN、CNN、Transformer、BERT、GPT

yyyyyybw的博客

04-21

1187

从 RNN 的时序记忆到 GPT 的生成革命，深度学习模型的演进始终围绕 “如何更高效地提取数据特征” 这一核心命题。开发者可根据任务特性（如图像 vs 文本、理解 vs 生成）选择适配模型，同时关注 Transformer 架构的持续创新 —— 这一 “万能基底” 正不断突破模态边界，引领 AI 从 “专项智能” 迈向 “通用智能”。未来，模型的性能提升将更多依赖数据质量、训练策略与工程优化的协同创新，为各行业智能化转型提供更强大的动力。推荐up：coward咿呀咿t=P1C7t=P1C7。

主流深度学习模型算法介绍

05-08

<think>好的，用户现在想了解主流深度学习模型算法的种类和应用场景。我需要结合之前的对话和提供的引用内容来回答。首先，回顾之前的回答，已经介绍了前馈神经网络、CNN、RNN、BP神经网络、GAN等。用户现在可能希望更全面的覆盖，包括最新的模型。查看用户提供的引用，引用5提到了GPT和Transformer模型，引用4提到了PyTorch框架，引用3提到了大模型训练，引用1提到了金融应用。需要将这些信息整合到回答中，尤其是补充Transformer和GPT这类模型。用户的需求是“主流深度学习模型算法的种类和应用场景”，所以需要系统化分类，并给出每个模型的算法特点和应用场景。可能需要补充之前未提到的模型，比如Transformer、自编码器、图神经网络等。注意用户之前的回答结构，使用了分点说明，每个模型的结构、数学表达、特点和应用。这次应该保持类似结构，但可能需要更详细的应用场景，特别是引用中提到的金融欺诈检测、NLP等。另外，用户可能希望了解不同模型之间的区别和选择建议，像之前的表格那样。可能需要更新表格，加入新提到的模型。需要检查是否有遗漏的主流模型，比如ResNet、BERT等。根据引用5，GPT基于Transformer，所以Transformer是重点。同时，VAE（变分自编码器）在生成模型中也很重要，可能补充进去。注意引用中的信息，例如深度学习在金融欺诈检测中的应用（引用1），可以添加到应用场景中。GPT的介绍（引用5）应详细说明其结构和应用。最后，确保回答结构清晰，分点明确，每个模型有数学公式（如Transformer的自注意力机制），应用场景具体，并适当引用提供的资料。还要生成相关问题，可能涉及模型选择、优化方法、应用挑战等。</think>### 主流深度学习模型算法及场景详解 #### 1. **Transformer 模型** - **算法核心**：基于自注意力机制（Self-Attention），数学表达式为： $$\text{Attention}(Q,K,V) = \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)V$$ 其中$Q$（查询）、$K$（键）、$V$（值）为输入向量，$d_k$为维度缩放因子。 - **特点**： - 并行计算能力强，避免RNN的序列依赖性 - 长距离依赖建模能力优异，支持大规模预训练 - **应用场景**： - **自然语言处理**：如GPT系列（文本生成）、BERT（文本理解）[^5] - **多模态任务**：如CLIP（图文匹配）、DALL·E（图像生成） - **金融领域**：交易序列分析（欺诈检测）[^1] #### 2. **卷积神经网络（CNN）** - **算法改进**：引入深度可分离卷积（MobileNet）、空洞卷积（DeepLab） - **数学表达**：卷积层输出为 $$F_{out}(i,j) = \sum_{m} \sum_{n} F_{in}(i+m, j+n) \cdot K(m,n)$$ - **应用场景**： - **医学影像**：肿瘤分割（U-Net）、X光片分类 - **自动驾驶**：道路目标检测（YOLO系列） - **工业质检**：缺陷识别（ResNet迁移学习） #### 3. **图神经网络（GNN）** - **算法原理**：聚合邻居节点信息，更新公式为 $$h_v^{(k)} = \sigma\left(W^{(k)} \cdot \text{AGGREGATE}(\{h_u^{(k-1)}, \forall u \in \mathcal{N}(v)\})\right)$$ - **应用场景**： - **社交网络**：用户关系预测（GraphSAGE） - **化学分子**：药物分子属性预测（GCN） - **推荐系统**：异构图嵌入（PinSage） #### 4. **强化学习（RL）模型** - **核心方程**：贝尔曼最优方程 $$Q^*(s,a) = \mathbb{E}\left[r + \gamma \max_{a'} Q^*(s',a')\right]$$ - **应用场景**： - **游戏AI**：AlphaGo（蒙特卡洛树搜索+DQN） - **机器人控制**：机械臂路径规划（PPO算法） - **能源优化**：智能电网调度（Actor-Critic框架） #### 5. **生成模型（GAN/VAE）** - **GAN对抗过程**：优化目标为 $$\min_G \max_D \mathbb{E}_{x\sim p_{data}}[\log D(x)] + \mathbb{E}_{z\sim p_z}[\log(1-D(G(z)))]$$ - **应用场景**： - **艺术创作**：StyleGAN生成虚拟人脸 - **数据增强**：医学图像合成（CycleGAN） - **语音合成**：WaveGAN生成自然语音 --- ### 模型选型指南（扩展版） | 任务类型 | 推荐模型 | 典型案例 | |---------------------------|------------------------------|------------------------------| | 文本生成/翻译 | Transformer (GPT-3, T5) | ChatGPT对话系统[^5] | | 时序预测 | LSTM/TCN | 股票价格预测 | | 小样本学习 | 元学习（MAML, Prototypical） | 工业设备故障诊断 | | 高维数据降维 | 变分自编码器（VAE） | 基因序列分析 | | 复杂决策优化 | 深度强化学习（DRL） | 仓储物流路径规划 | --- ### 关键技术挑战 1. **计算资源需求**：GPT-3训练需数千块GPU[^3]，企业需掌握分布式训练技术 2. **模型可解释性**：金融风控场景需SHAP/LIME等解释工具[^1] 3. **部署优化**：PyTorch模型需转换为ONNX格式适配工业环境[^4] ---