机器学习与深度学习：从基础到复杂关系的探索

### 机器学习与深度学习：从基础到复杂关系的探索在机器学习领域，优化模型参数以找到最佳解决方案是核心任务之一。同时，对于复杂问题，简单的线性模型往往力不从心，深度学习的出现为解决这类问题提供了新的途径。 #### 1. 模型优化与评估在机器学习中，优化的目标是找到最佳的参数值，使模型能够准确地对数据进行分类和预测。随机梯度下降是常用的优化方法，但在计算负梯度时，若仅针对小批量数据，会导致负梯度随机偏离所有训练数据的“正确”负梯度，使最小化路径出现强烈的随机波动。不过，该方法仍能接近最优解。 ##### 1.1 应用模型到新数据当模型的参数向量通过优化调整，以最大化训练数据中观察到的类别的预测概率后，就可以将模型应用于新的输入。具体操作步骤如下： 1. 使用经过训练优化的参数向量。 2. 对输入进行一次模型预测，计算各类别的概率向量。 3. 选择概率最高的类别作为输出。 ##### 1.2 测试集上的准确性检查为了评估模型的质量，需要计算分类的准确性。准确性的计算方法是：正确分类的样本数据数量除以所有分类的样本数据数量。但为了确保模型具有泛化能力，即能够正确分配训练期间未使用的新输入，不能在训练数据上计算准确性，而应在未用于训练的数据上进行计算。通常的做法是将可用的标注数据随机分为两个子集：训练集和测试集，一般测试集包含约20%的数据样本。以MNIST数据为例，在优化的每个周期后，训练集和测试集的准确性变化情况如下：开始时，准确性迅速增加，随后振荡上升，最终训练集的准确性约为0.924，即每100个数字中，略多于7个被错误分类。由于小批量梯度下降导致梯度随机偏差，所以会出现振荡。而且，测试集的准确性明显低于训练集。在笔记本电脑上进行计算，该方法所需时间不到10秒。 ##### 1.3 不同规模类别的精确率和召回率在某些情况下，准确性可能是一个具有误导性的指标。例如，在一个只有两个类别的应用中，第二类仅占测试示例的1%，如果模型将所有测试示例都分配到第一类，那么它将达到99%的准确性，但实际上这个分类模型是不可用的。因此，为每个类别定义了两个额外的质量指标：类k的精确率和类k的召回率，类k的F值是精确率和召回率的调和平均值。具体定义如下表所示： | 指标 | 定义 | | ---- | ---- | | 准确率 | 正确分类的测试示例数量 / 所有测试示例数量 | | 精确率 | 正确分配到类的所有测试示例数量 / 分配到类的所有测试示例数量 | | 召回率 | 正确分配到类的所有测试示例数量 / 属于类的所有测试示例数量 | | F值 | 2 * (精确率 * 召回率) / (精确率 + 召回率) | 精确率和召回率的重要程度取决于具体应用。如果要尽可能识别出类的潜在训练示例，召回率应该较高；如果要确保分配到类的准确性，精确率应该较高。许多分类器可以调整精确率和召回率的相对权重。下面是一个简单的mermaid流程图，展示了模型评估的基本流程： ```mermaid graph LR A[获取标注数据] --> B[随机划分训练集和测试集] B --> C[在训练集上训练模型] C --> D[在测试集上评估模型] D --> E[计算准确率、精确率、召回率和F值] ``` #### 2. 深度学习解决复杂问题虽然逻辑回归模型在许多情况下表现良好，但对于一些复杂问题，它无法找到令人满意的解决方案。例如，在处理XOR问题时，逻辑回归模型就显得力不从心。 ##### 2.1 XOR问题 XOR问题是一个二维输入向量的分类问题，输出概率需要以复杂的方式变化。当输入特征的组合效应影响分类时，这种现象称为统计交互。逻辑回归模型本质上是一个仿射变换，只能产生类之间的直线分离超平面，因此无法解决需要曲线分离超平面的分类问题。这一问题在早期神经网络研究中被指出，导致该领域的研究陷入停滞。 ##### 2.2 非线性层创建曲线分离平面为了解决复杂问题，Rumelhar

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

机器学习与深度学习：从基础到复杂关系的探索

相关推荐

专栏目录

机器学习与深度学习：从基础到复杂关系的探索

相关推荐

机器学习（深度学习）：在线电商平台收集的T恤图像数据集

基于机器学习与深度学习的中文微博情感解析研究

探索图像识别技术：从传统算法到深度学习

PyTorch深度学习教程：从基础到进阶

深度学习笔记：从基础知识到DeepLearning模型

机器学习/深度学习：income数据集

机器学习复旦大学AI人工智能课程 机器学习课程 神经网络与深度学习 共208页 复旦大学AI课程：神经网络与深度学习详解-从基础到前沿技术旦大学AI人工智能

深度学习：深度学习人工智能机器学习资料汇总（深度学习人工智能机器学习）持续更新……

深度学习入门：从零开始构建神经网络基础教程

机器学习与算法及源码：随机游动.zip

多维弥散MRI的MATLAB代码_MATLAB code for Multidimensional Diffusion

专栏目录

最新推荐

Rust模块系统与JSON解析：提升代码组织与性能

Rust应用中的日志记录与调试

Rust编程：模块与路径的使用指南

Rust开发实战：从命令行到Web应用

iOS开发中的面部识别与机器学习应用

Rust项目构建与部署全解析

AWS无服务器服务深度解析与实操指南

React应用性能优化与测试指南

Rust数据处理：HashMaps、迭代器与高阶函数的高效运用

并发编程中的锁与条件变量优化

机器学习复旦大学AI人工智能课程机器学习课程神经网络与深度学习共208页复旦大学AI课程：神经网络与深度学习详解-从基础到前沿技术旦大学AI人工智能