线性规划弱对偶性
给定矩阵A∈Rm×nA\in \mathbb{R}^{m\times n}A∈Rm×n,向量x,c∈Rnx,c\in \mathbb{R}^nx,c∈Rn,向量b,y∈Rmb,y\in \mathbb{R}^mb,y∈Rm,则有如下线性规划minx{c⊤x∣Ax=b,x≥0}\min\limits_{x}\{c^{\top}x|Ax=b,x\ge 0\}xmin{c⊤x∣Ax=b,x≥0}其中x∗x^{*}x∗为以上线性规划的最小值,其对偶形式表示为maxy{b⊤y∣A⊤y≤c}\max\limits_{y}\{b^{\top}y|A^{\top}y\le c\}ymax{b⊤y∣A⊤y≤c}在等式两边Ax∗=bAx^{*}=bAx∗=b同乘y⊤y^{\top}y⊤,则有如下不等式成立y⊤b=y⊤Ax∗≤c⊤x∗ y^{\top}b=y^{\top}A x^{*}\le c^{\top}x^{*}y⊤b=y⊤Ax∗≤c⊤x∗进而则有maxy{b⊤y∣A⊤y≤c}≤minx{c⊤x∣Ax=b,x≥0}\max\limits_{y}\{b^{\top}y|A^{\top}y \le c \}\le \min\limits_{x}\{c^{\top}x|Ax=b,x\ge 0\}ymax{b⊤y∣A⊤y≤c}≤xmin{c⊤x∣Ax=b,x≥0}这个就是线性规划的弱对偶形式,即线性规划问题原始形式的最小值是其对偶形式的上界。
Farkas\mathrm{Farkas}Farkas引理
在证明线性规划的强对偶性之前,需要用到Farkas\mathrm{Farkas}Farkas引理
对于给定的矩阵A∈Rm×nA \in \mathbb{R}^{m \times n}A∈Rm×n和向量b∈Rmb\in \mathbb{R}^mb∈Rm,则如下两个命令对立成立
- 命题1: 存在x∈Rnx \in \mathbb{R}^nx∈Rn且x≥0x \ge 0x≥0, 使得Ax=bAx=bAx=b
- 命题2: 存在y∈Rmy \in \mathbb{R}^my∈Rm使得A⊤x≤0A^{\top}x \le 0A⊤x≤0且b⊤y>0b^{\top}y > 0b⊤y>0
以上两个命题同时有且只能有一个命题成立,即如果命题1成立,则命题2不能成立,反之。Farkas\mathrm{Farkas}Farkas引理的几何解释是,先考虑一个向量集合{Ax∣x∈Rn,x≥0}\{Ax|x\in\mathbb{R}^n, x \ge 0\}{Ax∣x∈Rn,x≥0}将AAA看成nnn个mmm维列向量的组合A=(a1,a2,⋯ ,an)A=(a_1,a_2,\cdots,a_n)A=(a1,a2,⋯,an)以上集合实际上就是所有a1,a2⋯ ,ana_1,a_2\cdots,a_na1,a2⋯,an的非负线性组合,其中以上集合的非负线性组合组成了一个锥体。给定一个mmm维的向量bbb,命题1说明向量bbb在矩阵AAA张成的锥体中(包括边界上),命题2说明向量bbb椎体外,如下图所示,
对于命题1来说,如果向量bbb在锥体内,它可以表示为向量a1,a2,⋯ ,ana_1,a_2,\cdots,a_na1,a2,⋯,an的非负线性组合,存在非负系数x1,x2,⋯ ,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn,则有b=x1a1+x2a2+⋯+xn−1an−1+xnanb=x_1 a_1+x_2a_2+\cdots+x_{n-1}a_{n-1}+x_n a_nb=x1a1+x2a2+⋯+xn−1an−1+xnan即存在向量x≥0x\ge 0x≥0,使得等式Ax=bAx=bAx=b成立。
对于命题2来说,如果向量bbb在锥体外,总可以找到一个向量yyy,它与锥体中的所有向量余弦值不大于0,即(a1⊤y,a2⊤y,⋯ ,an⊤y)≤0⟹A⊤y≤0(a^{\top}_1 y,a^{\top}_2 y,\cdots,a^{\top}_ny)\le 0 \Longrightarrow A^{\top}y \le 0(a1⊤y,a2⊤y,⋯,an⊤y)≤0⟹A⊤y≤0并且与向量bbb的余弦值大于0,即b⊤y>0b^{\top}y > 0b⊤y>0。
线性规划强对偶性
线性规划初始问题minx{c⊤x∣Ax=b,x≥0}\min\limits_{x}\{c^{\top}x|Ax=b,x\ge 0\}xmin{c⊤x∣Ax=b,x≥0}如果存在解x∗x^{*}x∗,其对偶形式maxy{b⊤y∣A⊤y≤c}\max\limits_{y}\{b^{\top}y|A^{\top}y\le c\}ymax{b⊤y∣A⊤y≤c}也存在解y∗y^{*}y∗,且有c⊤x∗=b⊤y∗c^{\top}x^{*}=b^{\top}y^{*}c⊤x∗=b⊤y∗。
证明: 线性规划强对偶性可以利用Farkas\mathrm{Farkas}Farkas引理进行证明。令min\minmin的最小值在x∗x^{*}x∗处取到,即z∗=c⊤xz^{*}=c^{\top}xz∗=c⊤x,假定有如下向量A^=(A−c⊤),b^c=(b−z∗+ε),y^=(yα)\hat{A}=\left(\begin{array}{c}A\\-c^{\top}\end{array}\right),\quad \hat{b}_c=\left(\begin{array}{c}b\\-z^{*}+\varepsilon\end{array}\right),\quad \hat{y}=\left(\begin{array}{c}y\\\alpha\end{array}\right)A^=(A−c⊤),b^c=(b−z∗+ε),y^=(yα)其中ε>0\varepsilon>0ε>0,对于任意x≥0x \ge 0x≥0,A^x\hat{A}xA^x都不可能等于b^c\hat{b}_cb^c,因为c⊤x∗=z∗c^{\top}x^{*}=z^{*}c⊤x∗=z∗已经时最小值,所以−z∗-z^{*}−z∗是−c⊤x-c^{\top}x−c⊤x能达到的最大值,它不可能等于更大的−z∗+ε-z^{*}+\varepsilon−z∗+ε。根据Farkas\mathrm{Farkas}Farkas引理,因为不满足命题1,所以满足命题2,令向量y^=(yα)\hat{y}=\left(\begin{array}{c}y\\\alpha\end{array}\right)y^=(yα),使得A^⊤y^≤0\hat{A}^{\top}\hat{y}\le 0A^⊤y^≤0且b^ϵ⊤y^>0\hat{b}^{\top}_{\epsilon}\hat{y}>0b^ϵ⊤y^>0,这等价于A⊤y≤αc,b⊤y>α(z∗−ε)A^{\top}y\le \alpha c,\quad b^{\top}y > \alpha(z^{*}-\varepsilon)A⊤y≤αc,b⊤y>α(z∗−ε)因为b^ε⊤y^=b^0y^+αε>0\hat{b}^{\top}_{\varepsilon} \hat{y}=\hat{b}_0 \hat{y}+\alpha \varepsilon > 0b^ε⊤y^=b^0y^+αε>0对于任意x≥0x \ge 0x≥0,A^x∗=b^0\hat{A}x^{*}=\hat{b}_0A^x∗=b^0,此时以上条件满足命题1,所以就不会满足命题2,则意味着∀A^⊤y^≤0\forall \hat{A}^{\top} \hat{y}\le 0∀A^⊤y^≤0,都有b^0⊤y^≤0\hat{b}_0^{\top}\hat{y}\le 0b^0⊤y^≤0,又因为b^0⊤y^+αε>0\hat{b}_0^{\top}\hat{y}+\alpha \varepsilon>0b^0⊤y^+αε>0,所以必有α>0\alpha>0α>0。综上所述则有A⊤(y/α)≤c,b⊤(y/α)≤z∗−cA^{\top}(y/\alpha)\le c,\quad b^{\top}(y/\alpha)\le z^{*}-cA⊤(y/α)≤c,b⊤(y/α)≤z∗−c进而则有maxy{b⊤y∣A⊤y≤c}>z∗−ε\max\limits_{y}\{b^{\top}y|A^{\top}y \le c\}> z^{*}-\varepsilonymax{b⊤y∣A⊤y≤c}>z∗−ε又由弱对偶性可知z∗≥maxy{b⊤y∣A⊤y≤c}z^{*}\ge \max\limits_y\{b^{\top}y|A^{\top}y\le c\}z∗≥ymax{b⊤y∣A⊤y≤c}利用极限中的夹逼定理则有maxy{b⊤y∣A⊤y≤c}=z∗=minx{c⊤x∣Ax=b,x≥0}\max\limits_y\{b^{\top}y|A^{\top}y\le c\}=z^{*}=\min\limits_{x}\{c^{\top}x|Ax=b,x\ge0\}ymax{b⊤y∣A⊤y≤c}=z∗=xmin{c⊤x∣Ax=b,x≥0}这便是线性规划的强对偶形式。