1. 基于DC 分解：CCCP / DCA 到底是什么

这两个东西高度相关。

DCA = Difference of Convex Algorithm
CCCP = Convex-Concave Procedure

它们都建立在一个核心表示上：

把原目标函数写成

f (x) = g (x) - h (x)

其中 $g, h$ 都是 凸函数。

2. DCA 的基本迭代公式

如果

f (x) = g (x) - h (x)

那么在第 $k$ 步，先取

y_{k} \in \partial h (x_{k})

也就是 $h$ 在 $x_{k}$ 处的一个次梯度。
然后解下面这个问题：

x_{k + 1} \in ar g x min (g (x) - ⟨ y_{k}, x ⟩)

注意这里发生了什么：

原来难的是 $- h (x)$
现在把 $h (x)$ 在 $x_{k}$ 处线性化成 $⟨ y_{k}, x ⟩$
于是子问题变成

g (x) - 线性项

这仍然是 凸优化问题。

因为“凸函数 - 线性函数”还是凸的。

这就是 DCA 的本质。

3. CCCP 和 DCA 的关系

如果函数可微，而且你把问题写成

f (x) = convex part + concave part

那么每一步对 concave part 做一阶线性化，这就是 CCCP。

所以你可以粗略理解为：

DCA：更一般，允许非光滑，用 DC 语言表述
CCCP：更常见于可微情形，用“凸-凹分解”表述

很多地方你甚至可以把它们看成同一家族。

4. 它能保证什么，不能保证什么

能保证的

通常可以保证：

目标值下降
迭代点收敛到某个驻点、临界点，或局部稳定点附近
每步子问题都是凸的，容易算

不能保证的

一般 不能保证全局最优。

因为原问题还是非凸的。
你只是把它拆成了一串凸子问题来做局部推进，而不是把整个非凸性消灭了。

所以 CCCP / DCA 的本质是：

把“难的非凸问题”转成“一连串好解的凸问题”，从而求得一个较好的局部解。

5. 一个简单例子

考虑

f (x) = x^{4} - 3 x^{2}

这个函数显然非凸。

我们把它写成 DC 形式：

f (x) = x^{4} + 3 x^{2} - 6 x^{2}

设

g (x) = x^{4} + 3 x^{2}, h (x) = 6 x^{2}

则 $g, h$ 都是凸函数，所以

f (x) = g (x) - h (x)

是一个 DC 分解。

在当前点 $x_{k}$ 处，

\nabla h (x_{k}) = 12 x_{k}

于是下一步解：

x_{k + 1} = ar g x min (x^{4} + 3 x^{2} - 12 x_{k} x)

这已经是一个凸问题了，因为

x^{4} + 3 x^{2} - 12 x_{k} x

对 $x$ 是凸的。

所以原来的非凸优化，就变成了 不断求解凸子问题。

为学日益，为道日损

探索

CCCP 与 DCA