线性代数之矩阵求导（3）标量、向量求导的快速记忆

最新推荐文章于 2024-05-16 21:44:51 发布

RuiH.AI

最新推荐文章于 2024-05-16 21:44:51 发布

阅读量2.9k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：概率论与机器学习文章标签：线性代数矩阵机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41035283/article/details/121247837

本文介绍了如何快速记忆线性代数中矩阵求导的规则，特别是针对标量对向量、向量对向量的求导。提出了分子布局和后置变量求导的概念，强调在求导过程中系数的位置和转置规则。通过实例解析了包含多个变量的函数求导，并提供了与传统分母布局的对比，帮助理解这一方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

线性代数之矩阵求导（3）标量、向量求导的快速记忆

前言
基本约定
引例
总结
扩展

前言

上一次记录了矩阵求导的基本法则和公式，并且大部分给出了基于矩阵乘法的证明（本质证明）。然而这样记忆矩阵求导还是比较困难的。

这里给出一种作者使用的快速记忆矩阵求导的方法。

注意：该方法仅是作者个人记忆用方法，公式推导并不严格符合数学规范。

基本约定

默认向量是列向量。只涉及标量对向量，向量对向量的求导。

本次矩阵求导默认使用分子布局，即分子不变分母转置。

引例

标量对标量求导

我们都知道下面函数的求导：
$f(x_0)=ax_0^2+bx_0+c \\ f'(x_0)=2ax_0+b$
其中，多项式的系数写在自变量的前面。我们把这种表示叫做变量后置。对于标量而言，变量前置后置是没有区别的。

标量对向量求导

先看一个分母布局的例子：
$f(x)=a^Tx \\ \quad \\ \partial (a^Tx)^T/\partial x= a$
$a^Tx$ 这个标量对列向量求导，得到列向量 $a$ 。但是结果出现了 $a^T$ 的转置，不好记。

而从直观的角度上， $\partial (a^Tx)/\partial x= a^T$ 这种类似标量对标量求导的表示更符合我们的思维直觉。

分子布局刚好符合这种直觉：
$f(x)=a^Tx \\ \quad \\ \partial (a^Tx)/\partial x^T= a^T$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。