简简单单 Online zuozuo :本心、输入输出、结果文章目录约束优化:拉格朗日乘子与增广拉格朗日前言1、概念定义2、原理机制3、典型应用4、常见误区5、与相邻模块6、延伸阅读7、小结8、补充:增广拉格朗日迭代模板扩展:活跃集与互补松弛扩展:ALM vs 二次罚扩展:内点法概要扩展:验收参考资料约束优化:拉格朗日乘子与增广拉格朗日编辑 | 简简单单 Online zuozuo地址 | https://blog.csdn.net/qq_15071263如果觉得本文对你有帮助,欢迎点赞、收藏、关注前言细项 ID:c01-M04-P05实际 ML 问题很少是无约束的:参数范数界、概率单纯形、公平性约束、RLHF 中的 KL 信赖域都化为约束优化。拉格朗日乘子法给出最优性必要条件;罚函数法将约束并入目标;增广拉格朗日(ALM)结合二者,避免罚参数趋于无穷导致的病态(Bertsekas 1982;Boyd ADMM 综述)。本文对应c01-M04-P05(约束优化:拉格朗日乘子、罚函数)。资料截至日期:2026-07-04#约束优化#拉格朗日乘子#罚函数#增广拉格朗日#C