凸优化(08.27)
凸优化总结
1基本概念
1.1) 凸集合:S ⊂R 是凸集,如果其满足:x; y ∈ S λ+μ = 1 ⇒ λx + μy ∈S
n
几何解释:x; y ∈ S,则线段[x,y]上的任何点都∈
S
1.2) 仿
射
集
:
S ⊂
n
是仿射集,如果其满足:R
x; y ∈ S λ, μ ∈R ,λ+μ = 1⇒ λx + μy ∈S
几何解释:x; y ∈ S,则穿过x, y的直线上的任何点都∈S
1.3) 子空间:如果其满足:x; y ∈ S λ, μ ∈R ,⇒ λx + μy ∈S S ⊂R 是子空间,几何解释:x; y ∈ S,则穿过x, y,0的平面上的任何点都∈S
1.4) 凸锥:S ⊂R 是凸锥,如果其满足:x; y ∈ S λ, μ≥0 ⇒ λx + μy ∈S 几何解释:x; y ∈ S,则x, y之间的扇形面的任何点都⊂
S
n n
集合C 是凸锥的充分必要条件是集合C 中的元素的非负线性组合仍在C 中,作为一般化结
果,其中非负线性组合的数目可以推广到无穷
1.5) 超平面:满足x a x = b (a ≠ 0)的仿射集,如果b=0则变为子空间
{
T
}
1.6) 半空间:满足x a x ≤ b (a ≠ 0)的凸集,如果b=0则变为凸锥
{
T
}
1.7) 椭球体:ξ =x (x-xc ) A (x-xc ) ≤1 A = AT 0; xc ∈R n 球心 1.8) 范数:f :R n —R 是一种范数,如果对所有的x; y ∈R , t∈R 满足
n
{
T -1
}
1. f(x)≥ 0; f(x) = 0 ⇒ x = 02. f(tx) = tf(x)3. f(x + y) ≤f(x) + f(y)
范数分类
● 1范数
x
2
=
● 2范数 x 1=● 3无穷范数 x
∞
∑
x
x i
=max i x i
1.9) 有效域:集合dom (f ) ={x ∈X f (x )
1.10) 水平集:{x ∈X f (x )
1.11) 上镜图:函数f :x ∈-∞(∞, 的上镜图由下面的集合给定
epi (f ) ={(x , w ) x ∈X , w ∈R , f (x )
1.12) 多面体:有限数目半空间集合的交集P =x a i x ≤ bi , i =1,... k =x Ax b 1.13) 共轭函数:f :R n —R 上的共轭函数定义为:f *(y ) =sup (y T x -f (x )) ,f 是凸
x ∈domf
*
{
T
}{
}
函数即使f 不是
1.14) Jensen 不等式: f :R n —R 上的凸函数
● 两点θ1+θ2=1, θi ≥0⇒f (θ1x 1+θ2x 2) ≤θ1f (x 1) +θ2f (x 2) ● 多点
∑θ
i
i
=1, θi ≥0⇒f (∑i θi x 1) ≤∑i θi f (x i )
● 连续p (x ) ≥0, p (x ) dx =1⇒f (xp (x ) dx ) ≤
⎰⎰⎰f (x ) p (x ) dx
● 一般情况 f (Ex ) ≤Ef (x )
1.15) 凸函数:设C 是R n 上的凸子集,如果
f (ax +(1-a ) y ) ≤af (x ) +(1-a ) f (y ), ∀x , y ∈C
则函数f :C -R 称为凸函数
凸函数一阶可微定义
如果f 一阶可微,则f 是凸函数等价于对于所有的x , x 0∈dom (f ) ,
f (x ) ≥f (x 0) +∇f (x 0)(x -
x 0)
凸函数二阶可微定义
如果f 二阶可微,则f 是凸函数等价于x ∈dom (f ) , ∇f (x ) 0
常见的凸,凹函数
● 线性函数和仿射函数都是凸函数
● 二次函数f (x ) =x Px +2q x +r 是凸函数等价于P 0 ● 任意求范数操作是凸函数 ● ●
T
T
2
x α在R++是凸的α≥1, α ≤ 0; 凹的0≤α≤1
log x 在R++是凹的, x log x在R+是凸的
●
exp(ax ) 是凸的
● |x|, max(0, x), max(0,−x) 是凸的 ●
log ⎰e -t dt 是凹的
-∞
x
2
2规划问题分类
2.1) 线性规划linear program
目标函数和等式限制函数都是仿射函数的规划
Minimize c x + d Subject to Gx h
T
Ax = b
目标函数中d 可以消除,不会改变其凸性。线性规划的几何解释是仿射集形成的多面体上求解目标函数的最小值。应用中存在等效问题转化,不等式限制变等式限制,等式限制中的变量求出其反函数表达式来消除等式限制,以及找到一些松弛变量,例如如果存在最优解x ,必然相应的-f(x)小于0。
例子:切比雪夫多面体求解中心
注:多项式max fi (x)
Minimize c x + f;
Subject to Gx h
T
T
Ax = b
其中f 0(x) =c x + de x + f; domf 0 = x e x + f > 0,目标函数为准凸函数,故该规划为准凸优化问题。一般来说,通过构造新变量,将准凸优化问题转化为新变量的凸问题来解决,利用原变量和新变量的关系求出。这种方法比较常用,实现凸优化问题的等效变化,可以使得问题得以简化,例如将目标函数设为新变量进行优化,求解新变量的反函数实现原优化问题解
T
T
{
T
}
2.3) 二次规划quadratic program (QP) 目标函数是二次函数,限制条件是仿射函数
Minimize (1/2)xPx + qx + r Subject to Gx h
T
T
Ax = b
其中P 是半正定矩阵,上式中的不等式限制 Gx h 也可以是二次函数限制
(1/2)xT P i x + qi T x+ ri 0; i = 1,...,m,此时优化问题转化为二次约束二次规划
quadratically constrained quadratic program (QCQP)问题。此外,线性规划可以视为二
次规划的特殊情况(P=0)。二次规划问题首先是解决约束P 是半正定的,则问题马上可以得以解决。否则,问题的求解形式变得比较困难,即使任意一个P i 不是半征定的。QCQP 问题当i=1时,不用考虑凸和非凸问题,可以求解。对于i=2的情况,如果有一个P i 不是半征定,可以通过SDP 问题,进行求解(Luo on research)。i 其他情况,如果有一个P i 不是半征定,NP-hard 问题,难以解决。想办法求最有近似解。
几何解释
2
T
T
T
T
例子:带限制下的最小误差问题:Ax -b2= xA Ax -2bAx + bb ,还有两个多面体之间的距离问题,此外,可以考虑二次规划和信道估计误差相结合,限制条件是误码率小于限定值或者容量大于限定值,限制条件可以增加不断细化问题。
2.4) 二阶锥规划second-order cone program (SOCP)
二阶锥规划是特殊的二次规划形式
Minimize
f T x
T
Subject to A i x + bi ≤c i x + di ,; i = 1,...,m
Fx = g
其中Ax + b≤cx + d,为二阶锥限制,如果c=0 则转化为二次限制二次规划问题QCQP 问
题,如果A=0,则转化为线性规划问题,LP 。可见SOCP 问题要比LP 以及QCQP 要更具有普遍性。
例子:鲁棒线性规划可视为二次锥规划
Minimize c x
Subject to prob(ai x ≤ bi)>η, i =1,..., m ¸
转化为SOCP 问题
Minimize c x
Subject to
T
T
T
i T x +Φ-1(η)
∑
1/2i
x ≤b i ; i = 1,...., m
大部分鲁棒线性规划问题可视为二次锥规划问题来处理,例如,误差的方差小于特定的概率,最小表面问题,连续积分离散化求和。
2.5)
几何规划geomet-ric program (GP).
α
α
α
单项式函数:f(x) = cx11x 22 x n n ,在此情况下,
log f(ey1 eyn )=α1y 1+ +αn y n +β仿射函数,故凸
束函数:f(x) =
∑c x α
k
1
k=1
K
1k
αnk 2k
x α x 2n
log f(e e)=log ∑exp(α1k y 1+ +αnk y n +βk )
y1
yn
k=1
K
几何规划的表示形式:
Minimize f 0(x)
Subject to f i (x) ≤1; i = 1, ...,m
h i (x) = 1; i = 1,..., p
其中f i (x)是束函数,h i (x) 是单项式。一般多个单项式限制以及目标函数单项式并非凸函数,优化问题原来形式并非凸优化,但需要对目标函数以及限制条件进行转换,可以通过求对数运算将其转化为凸函数的形式y i =log x i , x i =exp(y i ) :
Minimize logf 0(e ey)
y1
yn
y1n
S.t. logf i (e e) ≤ 0; i = 1 m Log hi (e e) = 0; i = 1 p
GP 问题:FDM 系统功率分配问题(Luo- chapter5- ppt)
2.6) 半正定规划semideinfite program (SDP)
Minimize c x
T
y1
yn
Subject to x 1F 1 + + xn F n + G 0
Ax = b
其中F 1,F n , G∈S k ,A ∈R
p ⨯n
,如果F 1, F n , G是对角矩阵,则该问题转化为线性规划问题
n
1标准形式SDP :具有线性等式约束以及限制变量具有非负定性对于X ∈S
Minimize tr(CX)
subject to tr(Ai X) = bi ; i = 1, , p
X 0
其中A 1, A p , C∈S
2不等式SDP
n
Minimize cx
subject to x1A 1 + + xn A n B;
T
其中A 1, A n , B∈S k , c ∈R , x ∈R
例如:最小化最大特征值问题,对于A(x) = A0 + x1A 1 + + xm A m , Ai = Ai ,
T
n n
minimize x λmax (A(x))是SDP 问题:
Minimize t Subject to A(x) -tI 0
2.7) 鲁棒优化Robust Optimization 一般的优化问题形式:
Minimize f 0(x)
Subject to f i (x) ≤0; i = 1, ...,p
实际中,由于误差或测试的影响:
Subject to f i (x,σ) ≤0; i = 1, ...,p,σ∈∆
2.8) SDP Relaxation对于非凸问题
模型一般性: LP QP > QCQP > SOCP > SDP.
3规划问题的例子
3.1)
多面体中心设计问题
在多面体P = x a i x ≤b i , i = 1, ,m 内求解一最大的球,寻找球心称为切比雪夫中心设计问题。
球体c T x 在多面体P 内当且仅当sup a i x c + ai u u ≤r ≤b i ; i = 1, m; 从而这也就等价于
T
{}
T
{
T
}
a i T x c +ra i ≤bi; i = 1, m
因此,寻找切比雪夫中心可以归结为LP 问题
Maximize r
Subject to ai T x c +ra i ≤bi; i = 1, , m
3.2)
功率最优化问题
假定同一频率m 发射机,mn 接收机,发射机i 同时给n 个接收机(i;j) j=1 n 传输功率。A ijk 代表发射机k 到接收机(i; j)路径增益,N ij 代表接收机的噪声功率。优化变量:发送功率p k , k = 1….m 。
对于接收机(i; j),期望信号功率:S ij = Aiji p i 干扰及其噪声功率:I ij =信噪比:S ij I ij
优化目标:寻找p k 使得最小SINR ij SINR 最大化
∑A
k ≠i
ijk
p k + Nij
Maximize min
ij
A iji p i
A
k ≠i
ijk
p k + Nij
线性分式规划问题
功率分配转化为几何规划问题
信噪比(dB ): SINR ij = 10 log10S ij I ij 平均信噪比:
A iji p i 1010
SINR ij =log 10∏(Sij I ij ) =log 10∏∑nm nm A p + Ni,j i,j i,j ijk k ij
k ≠i
寻找p k 使得平均 (dB)最大化
Minimize ∏k ≠i
i,j
∑A
ijk
p k + Nij
A iji p i
目前更多的SDP 应用
● 结构优化(structural optimization): Ben-Tal, Nemirovsky, Kocvara, Bendsoe, ● 信号处理(signal Processing) Vandenberghe, Stoica, Lorenz, Davidson,
Shaked, Nguyen, Luo, Sturm, Balakrishnan, Saadat, Fu, de Souza ● 电路设计(circuit design): El Gamal, Vandenberghe, Boyd, Yun,
●
代数几何学(algebraic geometry):Parrilo, Sturmfels, Lasserre, de Klerk, Pressman, Pasechnik
● 通信和信息理论(communications and information theory): Rasmussen,
Rains, Abdi, Moulines,
● 量子论计算(quantum computing):Kitaev, Waltrous, Doherty, Parrilo,
Spedalieri, Rains,
● 金融(finance): Iyengar, Goldfarb, . . .
● 机器学习(machine learning): Lanckriet, El Ghaoui,.
下一步研究
1, 问题的难点在于如何建模,建模非凸,如何凸优化松弛,怎么松弛才能得到较好近似
解
2, 找出一些优化问题例子,比如波束形成中的加权因子,功率分配,预编码设计,多用
户调度等问题,该问题需要涉及搜索最优变量,如何分析
3, 思考一些特定的场合中的优化问题,逼近问题,近似问题能否转化到凸优化上来 4, SeDuMi 软件的应用