根据线性递推的DP公式如何写出变换矩阵

本文介绍了一种使用矩阵快速幂优化动态规划(DP)的方法,将DP状态视为向量,状态转移方程作为矩阵,通过矩阵快速幂将计算复杂度从O(N)降低到O(log(N))。以斐波那契数列为示例,展示了如何构建向量和矩阵,以及如何应用矩阵快速幂进行优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原理

一组DP状态,其实等价于一个向量。而DP状态的转移方程,可以是对一个向量做变形的矩阵。那么本质上从1个向量到另一个状态的向量,是可以通过一个矩阵来做到。矩阵具有结合律,我们可以先对右半部分矩阵用快速幂得到一个终极的变形矩阵,再乘以向量,就可以把 O ( N ) O(N) O(N)的计算 优化到 O ( l o g ( N ) ) O (log(N)) O(log(N))


示例

以大家最熟悉的斐波那契数列为例:

递推公式为 d p [ i ] = d p [ i − 1 ] + d p [ i − 2 ] dp[i] = dp[i-1] + dp[i - 2] dp[i]=dp[i1]+dp[i2],那么每一个新的数的计算依赖于前2个数,所以可以构建这么一个向量为 ( d p [ n − 1 ] , d p [ n − 2 ] ) (dp[n-1], dp[n-2]) (dp[n1],dp[n2]),那么它和递推的下一组 ( d p [ n ] , d p [ n − 1 ] ) (dp[n], dp[n-1]) (dp[n],dp[n1])有什么关系呢?

  • d p [ n ] = d p [ n − 1 ] ∗ 1 + d p [ n − 2 ] ∗ 1 dp[n] = dp[n-1] *1+ dp[n - 2]*1 dp[n]=dp[n1]1+dp[n2]1
  • d p [ n − 1 ] = d p [ n − 1 ] ∗ 1 = d p [ n − 1 ] ∗ 1 + d p [ n − 2 ] ∗ 0 dp[n-1] = dp[n-1]*1=dp[n-1] *1+ dp[n - 2]*0 dp[n1]=dp[n1]1=dp[n1]1+dp[n2]0

转换为矩阵形式,显而易见:在这里插入图片描述
依次递推,要从 d p [ 2 ] , d p [ 1 ] dp[2], dp[1] dp[2],dp[1]求到 d p [ n ] , d p [ n − 1 ] dp[n], dp[n-1] dp[n],dp[n1] 中间需要有n-2个同样的变形矩阵的乘法

在这里插入图片描述
(此处若n比较大,则需要结合矩阵快速幂优化)

 传送门:矩阵快速幂优化

注:
本文部分引自西部小笼包https://www.jianshu.com/p/9817cf3c2fd9

### 矩阵快速幂算法实现与应用 #### 1. 矩阵快速幂的核心概念 矩阵快速幂是一种通过结合矩阵乘法和快速幂技术来高效计算某些递推关系的方法。其核心在于将递推式的多次迭代转化为矩阵的指数次幂运算,从而显著降低时间复杂度[^1]。 #### 2. 快速幂的基础原理 快速幂的思想基于分治策略,能够以 \(O(\log n)\) 的时间复杂度完成原本需要 \(O(n)\) 时间的任务。对于整数快速幂而言,目标是求解形如 \(a^n\) 的表达式;而对于矩阵快速幂,则扩展到求解矩阵的高次幂 \((A^k)\)[^2]。 以下是 C++ 和 Python 中分别实现的简单快速幂模板: ```cpp // 整数快速幂 (C++) long long fast_pow(long long base, long long exp, long long mod) { long long result = 1; while (exp > 0) { if (exp % 2 == 1) { // 如果当前指数位为奇数 result = (result * base) % mod; } base = (base * base) % mod; // 平方基数 exp /= 2; // 减半指数 } return result; } ``` ```python # 整数快速幂 (Python) def fast_pow(base, exp, mod): result = 1 while exp > 0: if exp % 2 == 1: # 当前指数位为奇数 result = (result * base) % mod base = (base * base) % mod # 基数平方 exp //= 2 # 指数减半 return result ``` #### 3. 矩阵快速幂的具体实现 为了支持矩阵操作,我们需要定义两个辅助函数:一个是用于初始化单位矩阵(Identity Matrix),另一个是用来执行矩阵相乘的操作。下面是一个通用的矩阵快速幂实现方案(以 Fibonacci 数列为例): ##### 初始化单位矩阵 单位矩阵的特点是对角线上全为 1,其余位置均为 0。这在矩阵乘法中起到类似于数字 “1” 的作用。 ```cpp // 单位矩阵初始化 (C++) vector<vector<long long>> identity_matrix(int size) { vector<vector<long long>> I(size, vector<long long>(size)); for (int i = 0; i < size; ++i) { I[i][i] = 1; } return I; } ``` ##### 矩阵乘法 给定两个大小相同的矩阵 A 和 B,它们的结果矩阵 C 定义如下: \[ C_{ij} = \sum_k{A_{ik}B_{kj}} \] ```cpp // 矩阵乘法 (C++) vector<vector<long long>> matrix_multiply(const vector<vector<long long>>& a, const vector<vector<long long>>& b, int mod) { int rows = a.size(); int cols = b[0].size(); int common_dim = b.size(); // 或者等于 a[0].size() vector<vector<long long>> res(rows, vector<long long>(cols, 0)); for (int i = 0; i < rows; ++i) { for (int j = 0; j < cols; ++j) { for (int k = 0; k < common_dim; ++k) { res[i][j] = (res[i][j] + a[i][k] * b[k][j]) % mod; } } } return res; } ``` ##### 矩阵快速幂主逻辑 利用上述工具函数,我们可以编写完整的矩阵快速幂程序: ```cpp // 矩阵快速幂 (C++) vector<vector<long long>> matrix_fast_power(vector<vector<long long>> mat, long long power, int mod) { int size = mat.size(); vector<vector<long long>> result = identity_matrix(size); while (power > 0) { if (power & 1) { // 判断最低位是否为1 result = matrix_multiply(result, mat, mod); } mat = matrix_multiply(mat, mat, mod); // 自身相乘 power >>= 1; // 右移一位 } return result; } ``` #### 4. 应用场景分析 矩阵快速幂广泛应用于解决各种线性递推问题,尤其是那些可以通过固定阶数的状态转移描述的情况。常见的例子包括但不限于以下几种: - **Fibonacci 数列**:经典的动态规划问题之一,可以用矩阵形式表示并加速。 - **状态机 DP**:当状态之间的转换满足一定的规律时,可以借助矩阵快速幂优化效率。 - **图论中的路径计数**:例如,在有向无环图上统计长度固定的路径数目。 假设我们要求数组第 N 项值,而该数组由某个特定递推公式决定,则只需构建对应的变换矩阵即可轻松解决问题[^3]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值