无约束优化——梯度下降法

Amber-J

于 2018-09-22 11:19:05 发布

阅读量870

点赞数 1

CC 4.0 BY-SA版权

文章标签：机器学习数据分析数据挖掘

本文链接：https://blog.csdn.net/weixin_42907809/article/details/82796836

本文介绍了无约束优化的概念，并重点讲解了梯度下降法，这是一种用于求解函数最小值的数值解方法。通过分析梯度的方向和大小，找到函数下降最快的方向，利用学习率调整步长，逐步逼近最小值。虽然可能只找到局部最小值，但梯度下降法在机器学习和数据分析中广泛应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

有 $d$ 元函数 $f(x⃗)f(\vec{x})$ ，其中 $x⃗\vec{x}$ 为 $d$ 维向量，试图找到 $x⃗\vec{x}$ 的某个取值 $x⃗∗\vec{x}^*$ ，使 $f(x⃗∗)f(\vec{x}^*)$ 达到 $f(x⃗)f(\vec{x})$ 的最小值（或最大值），这就是我们常说的“最优化”或“优化”。我们知道，机器学习中用训练集训练模型，其实大多时候就是建立目标函数，找到使目标函数达到最小值（或最大值）的模型参数的过程。这不就是在解决优化问题吗！所以，学好优化，刻不容缓！

如果函数 $f(x⃗)f(\vec{x})$ 没有附带约束条件，那这属于无约束优化；如果函数 $f(x⃗)f(\vec{x})$ 附带的都是等式约束条件，那这属于等式约束优化；如果函数 $f(x⃗)f(\vec{x})$ 附带有不等式约束条件，那这属于不等式约束优化。面对不同的优化问题，需要不同的方法来解决。

无约束优化

用数学的语言表达出来，就是
$min⁡x⃗f(x⃗)，\displaystyle \min_{\vec{x}} f(\vec{x})，$

因为求最大值和最小值可以相互转化，所以都以求最小值为例。对于一元函数 $f (x)$ 来说，大家都知道通过 $f′(x)=0f^\prime(x)=0$ 来找到 $x^*$ 使 $f(x^*)$ 达到最小值。对于 $d$ 元函数 $f(x⃗)f(\vec{x})$ 来说，方法类似，通过方程组
$∂f∂x1=0,∂f∂x2=0,…,∂f∂xd=0,①\frac{\partial f}{\partial x_1}=0,\frac{\partial f}{\partial x_2}=0,…,\frac{\partial f}{\partial x_d}=0,①$