规范对偶理论:非凸力学与全局优化的联系
立即解锁
发布时间: 2025-08-22 01:35:30 阅读量: 1 订阅数: 5 


应用数学与全局优化的进展:纪念Gilbert Strang
### 规范对偶理论:非凸力学与全局优化的联系
#### 1. 引言
互补性和对偶性是两个极具启发性且密切相关的概念,它们在数学科学的多学科领域,特别是工程力学和优化领域中发挥着基础性作用。
自 1787 年勒让德变换正式引入以来,数学和力学中互补性和对偶性的研究已有悠久历史。在经典力学系统中,通过勒让德变换,配置空间中的能量函数与对偶空间中的互补能量相联系,进而可以构建拉格朗日量和哈密顿量。
在静态系统中,凸的总势能会产生一个鞍点拉格朗日量,从而构建出优美的鞍点极小 - 极大对偶理论,该理论在凸分析和约束优化的经典对偶理论中占据核心地位。然而,在凸动态系统中,总作用通常是非凸的差凸(d.c.)函数,即凸动能与总势能函数的差。此时,经典拉格朗日量不再是鞍点函数,而哈密顿量在其每个变量上都是凸的,因此在凸动力学中,哈密顿量得到了广泛应用。
从几何角度看,凸系统和差凸规划中的拉格朗日和哈密顿结构呈现出一种吸引人的对称性,但在非凸系统中,这种对称性会被打破。近年来,人们投入了大量精力研究哈密顿力学中对称性及其破缺的作用,以深入理解非线性和非凸现象。
工程力学中拉格朗日对偶性的早期例子包括 1909 年 Haar 和 von Kármán 为弹塑性提出的互补能量原理,以及 1914 年 Hellinger 为连续介质力学提出的原理。1953 年,E. Reissner 澄清了 Hellinger 原理中的边界条件后,互补 - 对偶变分原理和方法得到了应用数学家和工程师的广泛研究。
数学对偶理论在凸变分分析和优化中的发展历程与之类似。1949 年 W. Fenchel 提出著名的 Fenchel 变换后,现代数学对偶理论不断发展。1966 年 J. J. Moreau 引入超势和次微分的概念后,对偶理论得到了进一步完善。在线性弹性中,工程力学中的 Hellinger - Reissner 互补变分原理等价于 Fenchel - Moreau - Rockafellar 型对偶变分问题,广义互补变分原理实际上就是鞍点拉格朗日对偶理论,它是混合/杂交有限元方法的基础。
早在 20 世纪初,Haar 和 von Kármán 就意识到,在连续介质力学的非线性变分问题中,直接求解最小势能(原问题)只能得到上界解,而最小互补能量原理(即最大拉格朗日对偶问题)能提供下界解。在工程结构的安全分析中,对弹塑性结构所谓坍塌状态的上下界近似对工程师同样重要,因此,原 - 对偶变分方法被广泛用于解决非光滑非线性问题。
在数学规划和计算科学中,原 - 对偶内点法基于拉格朗日对偶理论,在过去 15 年中成为一种革命性技术。与之互补的是,Gao 在 1988 年开发的泛罚有限元规划实际上是一种原 - 对偶外点法,他证明了在刚塑性极限分析中,外罚泛函和相关摄动方法具有优雅的物理意义,这导致了大规模非线性混合有限元规划问题中的有效维度缩放技术。
在数学规划和分析中,互补性与约束优化、变分不等式和不动点理论密切相关。通过经典拉格朗日对偶性,约束优化问题的 KKT 条件会导致相应的互补问题。原 - 对偶模式在过去 20 年中不断发展,但对于非凸系统,KKT 条件仅在某些正则条件下是全局最优性的必要条件,且底层的非线性互补问题由于非线性算子的非单调性而本质上很困难,许多全局优化问题是 NP 难问题。成熟的 Fenchel - Moreau - Rockafellar 对偶理论会在原问题和其拉格朗日对偶之间产生所谓的对偶间隙,因此,如何制定无对偶间隙的完美对偶问题是全局优化和非凸分析中的一项具有挑战性的任务。
另一方面,源于大变形力学的 Hellinger - Reissner 互补能量原理对凸和非凸问题都成立。有趣的是,在 Reissner 工作的同一时期,胡海昌(1955)和鹫津久一郎(1955)独立提出了有限变形弹塑性中的广义势能变分原理,这两个变分原理是完美对偶的,在大变形力学和计算方法中发挥着重要作用。1964 年,钱伟长发现了 Hellinger - Reissner 原理和胡 - 鹫津原理之间的内在关系,并提出了在固体力学中构建广义变分原理的系统方法。
然而,数学和力学中互补 - 对偶理论半个多世纪的独立发展在两者之间产生了“对偶间隙”。在现代分析中,数学对偶理论主要基于 Fenchel 变换,过去三十年中提出了许多改进版本,但由于对偶间隙的存在,这些方法得到的松弛解不能直接得到非凸原问题的真实解。因此,人们致力于寻找全局优化中的完美对偶理论。而工程师和科学家更倾向于经典的勒让德变换,他们主要关注如何使用传统拉格朗日乘数法和互补本构定律正确制定互补变分原理以用于数值计算和应用。
1989 年,Gao 和 Strang 在非凸/非光滑变分问题的联合工作中部分解决了 Hellinger - Reissner 原理和胡 - 鹫津原理的极值性问题。他们引入了互补间隙函数,证明了当该间隙函数在对偶可行空间上为正时,广义 Hellinger - Reissner 能量是鞍点拉格朗日量。1997 年,Gao 在研究非凸力学中的后屈曲问题时发现,当间隙函数为负时,广义 Hellinger - Reissner 能量(所谓的超拉格朗日量)在其每个变量上都是凹的,从而产生了双对偶理论。至此,规范对偶理论逐渐发展起来,该理论主要由规范对偶变换和相关的三对偶理论组成,规范对偶变换可用于制定无对偶间隙的完美对偶问题,三对偶理论可用于识别全局和局部极值。
#### 2. 二次最小化问题
我们从最简单的二次最小化问题(简称原问题 (Pq))开始:
\[
(Pq) : \min \left\{ P(u) = \frac{1}{2} \langle u, Au \rangle - \langle u, f \rangle : u \in U_k \right\}
\]
其中,$U_k$ 是线性空间 $U$ 的一个开子集,$A$ 是一个线性对称算子,它将每个 $u \in U$ 映射到其对偶空间 $U^*$,双线性形式 $\langle u, u^* \rangle : U \times U^* \to \mathbb{R}$ 使 $U$ 和 $U^*$ 形成对偶,$f \in U^*$ 是
0
0
复制全文
相关推荐










