凸函数笔记(2)

目录

  • 4. 凸函数的结构
  • 5. 拟凸函数
    • 5.1 定义与等价刻画
    • 5.2 可微函数的拟凸性判定
    • 5.3 保拟凸运算
      • 练习

4. 凸函数的结构

本节将证明: 给定凸函数 f f f 的一个相对内点 x x x, 必存在过 ( x , f ( x ) ) (x,f(x)) (x,f(x)) 的一个仿射函数 y = f ( x ) + v T ( y − x ) y=f(x)+v^T(y-x) y=f(x)+vT(yx) 支撑函数 f f f. 进而说明,下半连续的凸函数是仿射函数的逐点上确界.

函数 f : R n → R ‾ f:\mathbb{R}^n\to\overline{\mathbb{R}} f:RnR 称为是下半连续的,是指对 R n \mathbb{R}^n Rn 中任意收敛的点列 x k → x   ( k → ∞ ) x_k\to x\:(k\to\infty) xkx(k) f ( x ) ≤ lim ⁡ k → ∞ f ( x k ) . f(x)\leq\lim_{k\to\infty}f(x_k). f(x)klimf(xk).下半连续的函数也称为闭函数.

命题 4.1 (切平面的存在性):设 f : R n → R ∪ { ∞ } f:\mathbb{R}^n\to\mathbb{R}\cup\{\infty\} f:RnR{} 是真凸函数, x ∈ r i ( d o m ( f ) ) x\in\mathbf{ri}(\mathbf{dom}(f)) xri(dom(f)),则存在 v ∈ R n v\in\mathbb{R}^n vRn 使得 f ( y ) ≥ f ( x ) + v T ( y − x ) , ∀ y ∈ R n . \begin{align}f(y)\geq f(x)+v^T(y-x),\quad\forall y\in\mathbb{R}^n.\end{align} f(y)f(x)+vT(yx),yRn.因而 f f f 在有界集上有下界. 特别,若 f f f x x x 处可微,则 v = ∇ f ( x ) v=\nabla f(x) v=f(x)

: 所需证的结论意味着切平面 t = f ( x ) + v T ( y − x ) t=f(x)+v^T(y-x) t=f(x)+vT(yx) 是上镜图 e p i ( f ) \mathbf{epi}(f) epi(f) 的支撑超平面,如图 4.1所示,由于 e p i ( f ) \mathbf{epi}(f) epi(f) R n + 1 \mathbb{R}^{n+1} Rn+1 中一凸集, ( x , f ( x ) ) (x,f(x)) (x,f(x)) 是边界上一点,所以这样的超平面是存在的. 但需要证明该超平面不与 R n + 1 \mathbb{R}^{n+1} Rn+1 中坐标向量 (0,…,0,1) 平行.


图 4.1:支撑超平面示意图

第一步: 支撑超平面的存在性: 设 x ∈ r i ( d o m ( f ) ) x\in\mathbf{ri}(\mathbf{dom}(f)) xri(dom(f)). 因为 e p i ( f ) \mathbf{epi}(f) epi(f)是凸集,显然 ( x , f ( x ) ) ∈ c l ( e p i ( f ) ) ∖ r i ( e p i ( f ) ) (x,f(x))\in\mathbf{cl}(\mathbf{epi}(f))\setminus\mathbf{ri}(\mathbf{epi}(f)) (x,f(x))cl(epi(f))ri(epi(f)).根据支撑超平面命题, 存在 ( a T , b ) T ∈ R n + 1 (a^T,b)^T\in\mathbb{R}^{n+1} (aT,b)TRn+1,使得 ( a T , b ) [ ( y t ) − ( x f ( x ) ) ] ≥ 0 , ∀ ( y t ) ∈ e p i ( f ) , (a^T,b)\Big[\begin{pmatrix}y\\t\end{pmatrix}-\begin{pmatrix}x\\f(x)\end{pmatrix}\Big]\geq0,\quad\forall\begin{pmatrix}y\\t\end{pmatrix}\in\mathbf{epi}(f), (aT,b)[(yt)(xf(x))]0,(yt)epi(f),其中等号不恒成立.显然上式可化为 a T ( y − x ) + b ( t − f ( x ) ) ≥ 0 , ∀ y ∈ d o m ( f ) ,   t ≥ f ( y ) , \begin{align} a^T(y-x)+b(t-f(x))\geq0,\quad\forall y\in\mathbf{dom}(f),\:t\geq f(y),\end{align} aT(yx)+b(tf(x))0,ydom(f),tf(y),且存在 y ˉ ∈ d o m ( f ) , t ˉ ≥ f ( y ˉ ) \bar{y}\in\mathbf{dom}(f),\bar{t}\geq f(\bar{y}) yˉdom(f),tˉf(yˉ), 使得 a T ( y ˉ − x ) + b ( t ˉ − f ( x ) ) > 0. a^T(\bar{y}-x)+b(\bar{t}-f(x))>0. aT(yˉx)+b(tˉf(x))>0.

第二步 : b ≥ 0 :b\geq0 :b0:在(2)中,令 t → ∞ t\to\infty t 可知 b ≥ 0. b\geq0. b0.

第三步 : b > 0 :b>0 :b>0:若 b = 0 b=0 b=0,则 a T ( y − x ) ≥ 0 , ∀ y ∈ d o m ( f ) , \begin{align} a^T(y-x)\geq0,\quad\forall y\in\mathbf{dom}(f),\end{align} aT(yx)0,ydom(f),且存在 y ˉ ∈ d o m ( f ) \bar{y}\in\mathbf{dom}(f) yˉdom(f),使得 a T ( y ˉ − x ) > 0 a^T(\bar{y}-x)>0 aT(yˉx)>0. 这意味着凸集 d o m ( f ) \mathbf{dom}( f) dom(f) { x } \{x\} {x} 被超平面 a T ( y − x ) = 0 a^T(y-x)=0 aT(yx)=0 真分离.根据凸集分离定理得: r i ( { x } ) ∩ r i ( d o m ( f ) ) = ∅ \mathbf{ri}(\{x\})\cap\mathbf{ri}(\mathbf{dom}(f))=\emptyset ri({x})ri(dom(f))=.即 x ∉ r i ( d o m ( f ) ) x\not\in\mathbf{ri}(\mathbf{dom}(f)) xri(dom(f)).矛盾.所以 b > 0. b>0. b>0.

第四步: 切平面的存在性: 记 v : = − a / b v:=-a/b v:=a/b,代入(2), 并令 t = f ( y ) t=f(y) t=f(y),便得到 f ( y ) ≥ f ( x ) + v T ( y − x ) , ∀ y ∈ d o m ( f ) f(y)\geq f(x)+v^T(y-x),\forall y\in\mathbf{dom}(f) f(y)f(x)+vT(yx),ydom(f).当 y ∈ R n ∖ d o m ( f ) y\in\mathbb{R}^n\setminus\mathbf{dom}(f) yRndom(f) 时,此不等式显然仍成立.

f ( x ) > − ∞ f(x)>-\infty f(x)>.对任意的 r > 0 r>0 r>0,当 y ∈ B ( x , r ) y\in B(x,r) yB(x,r) 时,有 f ( y ) ≥ f ( x ) + v T ( y − x ) ≥ f ( x ) − ∥ v ∥ 2 ∥ y − x ∥ 2 ≥ f ( x ) − r ∥ v ∥ 2 . \begin{aligned}f(y)\geq f(x)+v^T(y-x)\geq f(x)-\|v\|_2\|y-x\|_2\geq f(x)-r\|v\|_2.\end{aligned} f(y)f(x)+vT(yx)f(x)v2yx2f(x)rv2.所以 f f f B ( x , r ) B(x,r) B(x,r) 上有下界.

最后,当 f f f x x x 处可微时容易证明 v = ∇ f ( x ) v=\nabla f(x) v=f(x).

注 1:满足(1)的 v v v 称为 f f f x x x 处的次梯度, 记为 v ∈ ∂ f ( x ) v ∈ ∂f(x) vf(x). 命题 3.4.1说明, 当 f f f 是凸函数且 x ∈ r i ( d o m ( f ) ) x ∈ \mathbf{ri}(\mathbf{dom}(f)) xri(dom(f)) 时, ∂ f ( x ) ∂f(x) f(x) 非空.当 x ∉ r i ( d o m ( f ) ) x \notin \mathbf{ri}(\mathbf{dom}(f)) x/ri(dom(f)) 时, 次梯度未必存在.

注2:注 2: 证明的第三步也可以不利用凸集分离定理而直接证明: 因 x ∈ r i ( d o m ( f ) ) x\in\mathbf{ri}(\mathbf{dom}(f)) xri(dom(f)),对任意的 y ∈ d o m ( f ) y\in\mathbf{dom}(f) ydom(f),根据线段原理 可知,存在 λ > 1 \lambda>1 λ>1, 使得 y + λ ( x − y ) ∈ d o m ( f ) . y+\lambda(x-y)\in \mathbf{dom}(f) . y+λ(xy)dom(f). y + λ ( x − y ) = x − ( λ − 1 ) ( y − x ) ∈ d o m ( f ) . \begin{aligned}y+\lambda(x-y)=x-(\lambda-1)(y-x)\in\mathbf{dom}(f).\end{aligned} y+λ(xy)=x(λ1)(yx)dom(f). x − ( λ − 1 ) ( y − x ) x-(\lambda-1)(y-x) x(λ1)(yx) 替换(3)中的 y y y 便得 − ( λ − 1 ) a T ( y − x ) ≥ 0 -(\lambda-1)a^T(y-x)\geq0 (λ1)aT(yx)0,即 a T ( y − x ) ≤ 0. a^T(y-x)\leq0. aT(yx)0. 联立(3)得 a T ( y − x ) = 0 a^T(y-x)=0 aT(yx)=0.与 a T ( y ˉ − x ) > 0 a^T(\bar{y}-x)>0 aT(yˉx)>0 矛盾.所以 b > 0. b>0. b>0.

命题 4.2: (凸函数是仿射函数族的逐点上确界) 设 f : R n → R ∪ { ∞ } f:\mathbb{R}^n\to\mathbb{R}\cup\{\infty\} f:RnR{} 是凸函数,且下半连续的,那么对任意的 x ∈ R n x\in\mathbb{R}^n xRn, 存在一列仿射函数 { g k } \{g_k\} {gk}, 使得 f ( y ) ≥ g k ( y ) ,   ∀ y ∈ R n , g k ( x ) → f ( x )   ( k → ∞ ) . \begin{aligned}f(y)\geq g_k(y),\:\forall y\in\mathbb{R}^n,\quad g_k(x)\to f(x)\:(k\to\infty).\end{aligned} f(y)gk(y),yRn,gk(x)f(x)(k).从而 f ( x ) = sup ⁡ { g ( x ) ∣ g 是仿射函数 ,  满足 : g ( y ) ≤ f ( y ) ,   ∀ y ∈ R n } . \begin{align} f(x)=\sup\{g(x)|g\text{是仿射函数},\text{ 满足}:g(y)\leq f(y),\mathrm{~}\forall y\in\mathbb{R}^n\}.\end{align} f(x)=sup{g(x)g是仿射函数, 满足:g(y)f(y), yRn}.

:根据命题 4.1, 只需考虑 x ∈ R n ∖ r i ( d o m ( f ) ) x\in\mathbb{R}^n\setminus\mathbf{ri}(\mathbf{dom}(f)) xRnri(dom(f)) 的情形.不妨设 d o m \mathbf{dom} dom ( f ) ≠ ∅ ( f) \neq\emptyset (f)=.否则令 g k ( y ) ≡ k ,   ∀ y ∈ R n . g_k(y)\equiv k,\:\forall y\in\mathbb{R}^n. gk(y)k,yRn.

(a) 若 x ∈ c l ( d o m ( f ) ) \ r i ( d o m ( f ) ) x\in\mathbf{cl}(\mathbf{dom}(f))\backslash\mathbf{ri}(\mathbf{dom}(f)) xcl(dom(f))\ri(dom(f)), 取 x 0 ∈ r i ( d o m ( f ) ) x_0\in\mathbf{ri}(\mathbf{dom}(f)) x0ri(dom(f)) x k : = x + 1 k ( x 0 − x ) ,   k ∈ N . x_k:=x+\frac1k(x_0-x),\:k\in\mathbb{N}. xk:=x+k1(x0x),kN. 由线段原理可知 x k ∈ r i ( d o m ( f ) ) x_k\in\mathbf{ri}(\mathbf{dom}(f)) xkri(dom(f)),于是,利用命题 4.1可知,存在仿射函数 g k ( y ) = g_k(y)= gk(y)= f ( x k ) + v k T ( y − x k ) , \begin{aligned}f(x_k)+v_k^T(y-x_k),\end{aligned} f(xk)+vkT(yxk), 使得 f ( y ) ≥ g k ( y ) , ∀ y ∈ R n . f(y)\geq g_{k}(y),\quad\forall y\in\mathbb{R}^{n}. f(y)gk(y),yRn.
在上式中令 y = x 0 y=x_0 y=x0,得:
f ( x 0 ) ≥ f ( x k ) + v k T ( x 0 − x k ) = f ( x k ) + ( 1 − 1 k ) v k T ( x 0 − x ) \begin{aligned} f(x_{0})\geq f(x_{k})+v_{k}^{T}(x_{0}-x_{k})=f(x_{k})+(1-\frac{1}{k})v_{k}^{T}(x_{0}-x)\end{aligned} f(x0)f(xk)+vkT(x0xk)=f(xk)+(1k1)vkT(x0x)
从而,当 k ≥ 2 k\geq2 k2 时, 有: v k T ( x 0 − x ) ≤ k k − 1 [ f ( x 0 ) − f ( x k ) ] v_k^T(x_0-x)\leq\frac k{k-1}[f(x_0)-f(x_k)] vkT(x0x)k1k[f(x0)f(xk)].于是 g k ( x ) = f ( x k ) + v k T ( x − x k ) = f ( x k ) − 1 k v k T ( x 0 − x ) ≥ f ( x k ) − 1 k − 1 [ f ( x 0 ) − f ( x k ) ] = k k − 1 f ( x k ) − 1 k − 1 f ( x 0 ) . \begin{aligned}g_k(x)&=f(x_k)+v_k^T(x-x_k)=f(x_k)-\frac{1}{k}v_k^T(x_0-x)\\ &\geq f(x_k)-\frac1{k-1}[f(x_0)-f(x_k)] \\ &=\frac k{k-1}f(x_k)-\frac1{k-1}f(x_0). \end{aligned} gk(x)=f(xk)+vkT(xxk)=f(xk)k1vkT(x0x)f(xk)k11[f(x0)f(xk)]=k1kf(xk)k11f(x0). k → ∞ k\to\infty k,取下极限,利用 f f f 的下半连续性,得 f ( x ) ≤ lim ⁡ ‾ k → ∞ f ( x k ) ≤ lim ⁡ ‾ k → ∞ g k ( x ) . f(x)\leq\underline{\lim}_{k\to\infty}f(x_k)\leq\underline{\lim}_{k\to\infty}g_k(x). f(x)limkf(xk)limkgk(x).

f ( x ) ≥ g k ( x ) ,   ∀ k ∈ N f(x)\geq g_k(x),\:\forall k\in\mathbb{N} f(x)gk(x),kN.故 f ( x ) ≥ lim ⁡ ‾ k → ∞ g k ( x ) f(x)\geq\overline{\lim}_{k\to\infty}g_k(x) f(x)limkgk(x).所以 lim ⁡ k → ∞ g k ( x ) = f ( x ) . \lim_{k\to\infty}g_k(x)=f(x). limkgk(x)=f(x).

(b) 若 x ∈ R n ∖ c l ( d o m ( f ) ) x\in\mathbb{R}^n\setminus\mathbf{cl}(\mathbf{dom}(f)) xRncl(dom(f)),因 d o m ( f ) \mathbf{dom}(f) dom(f) 非空,据 (1)所证,存在仿射函数 g g g,使得 f ( y ) ≥ g ( y ) ,   ∀ y ∈ R n . \begin{aligned}f(y)\geq g(y),\:\forall y\in\mathbb{R}^n.\end{aligned} f(y)g(y),yRn.

根据凸集的严格分离命题,存在 a ∈ R n a\in\mathbb{R}^n aRn b ∈ R b\in\mathbb{R} bR, 使得超平面 a T x + b = 0 a^Tx+b=0 aTx+b=0 严格分离 x x x c l ( d o m ( f ) ) \mathbf{cl}(\mathbf{dom}(f) ) cl(dom(f)),即

a T x + b > 0 , a T y + b ≤ 0 , ∀ y ∈ c l ( d o m ( f ) ) . a^Tx+b>0,\quad a^Ty+b\leq0,\quad\forall y\in\mathbf{cl}(\mathbf{dom}(f)). aTx+b>0,aTy+b0,ycl(dom(f)).
a a a b b b 乘以适当的正数,可设 (将 a , b a,b a,b 改记为 a k , b k ) a_k,b_k) ak,bk)
a k T x + b k = k  且  a k T y + b k ≤ 0 , ∀ y ∈ c l ( d o m ( f ) ) . a_k^Tx+b_k=k\quad\text{ 且 }\quad a_k^Ty+b_k\leq0,\quad\forall y\in\mathbf{cl}(\mathbf{dom}(f)). akTx+bk=k  akTy+bk0,ycl(dom(f)). g k ( y ) : = g ( y ) + a k T y + b k g_k(y):=g(y)+a_k^Ty+b_k gk(y):=g(y)+akTy+bk, 则 g k g_k gk 仍为仿射函数,满足 g k ( y ) = g ( y ) + a k T y + b k ≤ g ( y ) ≤ f ( y ) , ∀ y ∈ d o m ( f ) , g_k(y)=g(y)+a_k^Ty+b_k\leq g(y)\leq f(y),\quad\forall y\in\mathbf{dom}(f), gk(y)=g(y)+akTy+bkg(y)f(y),ydom(f), g k ( x ) = g ( x ) + k → ∞ ,   k → ∞ . g_k(x)=g(x)+k\to\infty,\:k\to\infty. gk(x)=g(x)+k,k∞.

最后, 利用已证结论容易推出(4),此部分可以留作练习。

5. 拟凸函数

5.1 定义与等价刻画

凸函数因为其局部极小必为全局极小而在优化理论中具有特别的重要性. 可以将具有这一特性的函数可以推广到更大的函数类, 即拟凸函数.

定义 5.1.1: (拟凸函数) 对函数 f : R n → R ‾ f:\mathbb{R}^n\to\overline{\mathbb{R}} f:RnR, 如果 f ( θ x + ( 1 − θ ) y ) ≤ max ⁡ { f ( x ) , f ( y ) } , ∀ x , y ∈ d o m ( f ) , θ ∈ [ 0 , 1 ] , \begin{align} f(\theta x+(1-\theta)y)\leq\max\{f(x),f(y)\},\quad\forall x,y\in\mathbf{dom}(f),\quad\theta\in[0,1],\end{align} f(θx+(1θ)y)max{f(x),f(y)},x,ydom(f),θ[0,1],则称 f f f 是拟凸的. 如果上式中的严格不等号对 x ≠ y x\neq y x=y 恒成立,则称 f f f 是严格拟凸的.

如果 − f −f f 是拟凸 (或严格拟凸) 的, 则称 f f f 是拟凹 (或严格拟凹) 的. 既是拟凸又是拟凹的函数称为拟线性函数.

拟凸函数的有效定义域 d o m ( f ) \mathbf{dom}(f) dom(f) 必为凸集.

易见,拟凸函数的有效定义域 d o m ( f ) \mathbf{dom}(f) dom(f)必为凸集. 对函数 f : R n → R ∪ { ∞ } f:\mathbb{R}^n\to\mathbb{R}\cup\{\infty\} f:RnR{},易见(5) 等价于 f ( θ x + ( 1 − θ ) y ) ≤ max ⁡ { f ( x ) , f ( y ) } , ∀ x , y ∈ R n , θ ∈ [ 0 , 1 ] . \begin{align} f(\theta x+(1-\theta)y)\leq\max\{f(x),f(y)\},\quad\forall x,y\in\mathbb{R}^n,\quad\theta\in[0,1].\end{align} f(θx+(1θ)y)max{f(x),f(y)},x,yRn,θ[0,1].依据定义容易看出, 凸函数必为拟凸的; 凹函数必为拟凹的. 仿射函数必为拟线性的.

命题 5.1.1 :(拟凸性的水平集刻画) 函数 f : R n → R ∪ { ∞ } f:\mathbb{R}^n\to\mathbb{R}\cup\{\infty\} f:RnR{}是拟凸的当且仅当: ∀ α ∈ R ∀α ∈ \mathbb{R} αR,水平集 l e v α ( f ) : = x ∈ R n ∣ f ( x ) ≤ α \mathbf{levα}(f) := {x ∈ \mathbb{R}^n \mid f(x) ≤ α} levα(f):=xRnf(x)α 是凸集.

:设 f f f 是拟凸函数,那么,对任意的 α ∈ R \alpha\in\mathbb{R} αR,若 x , y ∈ l e v α ( f ) x,y\in\mathbf{lev}_\alpha(f) x,ylevα(f) 以及 ∀ θ ∈ [ 0 , 1 ] \forall\theta\in[0,1] θ[0,1],有
f ( θ x + ( 1 − θ ) y ) ≤ max ⁡ { f ( x ) , f ( y ) } ≤ α . f(\theta x+(1-\theta)y)\leq\max\{f(x),f(y)\}\leq\alpha. f(θx+(1θ)y)max{f(x),f(y)}α.
所以 θ x + ( 1 − θ ) y ∈ l e v α ( f ) \theta x+(1-\theta)y\in\mathbf{lev}_\alpha(f) θx+(1θ)ylevα(f).从而 l e v α ( f ) \mathbf{lev}_\alpha(f) levα(f) 是凸集.

反之,设对任意的 α ∈ R \alpha\in\mathbb{R} αR, 水平集 l e v α ( f ) \mathrm{lev}_\alpha(f) levα(f) 是凸集. 那么, ∀ x , y ∈ d o m ( f ) \forall x,y\in\mathbf{dom}(f) x,ydom(f), 不妨设 f ( y ) ≤ f ( x ) f(y)\leq f(x) f(y)f(x),对任意的 α > f ( x ) \alpha>f(x) α>f(x),有 x , y ∈ l e v α ( f ) x,y\in\mathbf{lev}_\alpha(f) x,ylevα(f). 根据 l e v α ( f ) \mathbf{lev}_\alpha(f) levα(f) 凸性可知, ∀ θ ∈ [ 0 , 1 ] \forall\theta\in[0,1] θ[0,1],有 θ x + ( 1 − θ ) y ∈ l e v α ( f ) \theta x+(1-\theta)y\in\mathbf{lev}_\alpha(f) θx+(1θ)ylevα(f),从而 f ( θ x + ( 1 − θ ) y ) ≤ α f(\theta x+(1-\theta)y)\leq\alpha f(θx+(1θ)y)α.令 α → f ( x ) \alpha\to f(x) αf(x),便得 f ( θ x + ( 1 − θ ) y ) ≤ f ( x ) = max ⁡ { f ( x ) , f ( y ) } \begin{aligned}f(\theta x+(1-\theta)y)\leq f(x)=\max\{f(x),f(y)\}\end{aligned} f(θx+(1θ)y)f(x)=max{f(x),f(y)}.所以 f f f 是拟凸函数.

定义 5.1.2: (截面函数) 设 x , y ∈ d o m ( f ) x,y\in\mathbf{dom}(f) x,ydom(f),考虑函数 f f f 限制在过 x , y x,y x,y 的直线上的函数

ϕ ( t ) : = f ( x + t ( y − x ) ) , t ∈ R , \begin{align} \phi(t):=f(x+t(y-x)),\quad t\in\mathbb{R},\end{align} ϕ(t):=f(x+t(yx)),tR,它是一个一元函数,称为 f f f 的截面函数.

命题 5.1.2:(拟凸函数的截面刻画) 函数 f : R n → R ‾ f:\mathbb{R}^n\to\overline{\mathbb{R}} f:RnR 是拟凸函数当且仅当如下条件之一成立:

( 5.1.2.1 )   ∀ x , y ∈ R n ,   ( 7 ) (5.1.2.1)\:\forall x,y\in\mathbb{R}^n,\:(7) (5.1.2.1)x,yRn,(7)所定义的 ϕ \phi ϕ 是一元拟凸函数.

( 5.1.2.2 )   ∀ x , y ∈ R n ,   ( 7 ) (5.1.2.2)\:\forall x,y\in\mathbb{R}^n,\:(7) (5.1.2.2)x,yRn,(7)所定义的 ϕ \phi ϕ 满足 ϕ ( t ) ≤ max ⁡ { ϕ ( 0 ) , ϕ ( 1 ) } ,   ∀ t ∈ [ 0 , 1 ] . \phi(t)\leq\max\{\phi(0),\phi(1)\},\:\forall t\in[0,1]. ϕ(t)max{ϕ(0),ϕ(1)},t[0,1].

( a ) (a) (a) f : R n → R ‾ f:\mathbb{R}^n\to\overline{\mathbb{R}} f:RnR 是拟凸函数,那么 ∀ x , y ∈ R n \forall x,y\in\mathbb{R}^n x,yRn ∀ t , s ∈ R \forall t,s\in\mathbb{R} t,sR 以及 θ ∈ [ 0 , 1 ] \theta\in[0,1] θ[0,1], 记 ξ : = x + t ( y − x ) ,   η : = x + s ( y − x ) \xi:=x+t(y-x),\:\eta:=x+s(y-x) ξ:=x+t(yx),η:=x+s(yx).有
θ ξ + ( 1 − θ ) η = x + ( θ t + ( 1 − θ ) s ) ( y − x ) . \theta\xi+(1-\theta)\eta=x+\left(\theta t+(1-\theta)s\right)(y-x). θξ+(1θ)η=x+(θt+(1θ)s)(yx).于是
ϕ ( θ t + ( 1 − θ ) s ) = f ( θ ξ + ( 1 − θ ) η ) ≤ max ⁡ { f ( ξ ) , f ( η ) } = max ⁡ { ϕ ( t ) , ϕ ( s ) } . \begin{aligned}\phi(\theta t+(1-\theta)s)=f(\theta\xi+(1-\theta)\eta)\leq\max\{f(\xi),f(\eta)\}=\max\{\phi(t),\phi(s)\}.\end{aligned} ϕ(θt+(1θ)s)=f(θξ+(1θ)η)max{f(ξ),f(η)}=max{ϕ(t),ϕ(s)}.所以, ϕ \phi ϕ 是一个一元拟凸函数. 即 (5.1.2.1) 成立.

( b ) (b) (b) 若(5.1.2.1) 成立,那么 ∀ t ∈ [ 0 , 1 ] \forall t\in[0,1] t[0,1],有 ϕ ( t ) ≤ max ⁡ { ϕ ( 0 ) , ϕ ( 1 ) } \phi(t)\leq\max\{\phi(0),\phi(1)\} ϕ(t)max{ϕ(0),ϕ(1)}.故 (5.1.2.2) 成立.

( c ) (c) (c) 设(5.1.2.2)成立.那么, ∀ x , y ∈ R n \forall x,y\in\mathbb{R}^n x,yRn θ ∈ [ 0 , 1 ] \theta\in[0,1] θ[0,1], 有
f ( x + θ ( y − x ) ) = ϕ ( θ ) ≤ max ⁡ { ϕ ( 0 ) , ϕ ( 1 ) } = max ⁡ { f ( x ) , f ( y ) } . f(x+\theta(y-x))=\phi(\theta)\leq\max\{\phi(0),\phi(1)\}=\max\{f(x),f(y)\}. f(x+θ(yx))=ϕ(θ)max{ϕ(0),ϕ(1)}=max{f(x),f(y)}.所以 f f f 是拟凸函数.

命题 5.1.3:(一元拟凸函数) 函数 f : R → R ‾ f:\mathbb{R}\to\overline{\mathbb{R}} f:RR 拟凸当且仅当如下条件成立:

(5.1.3.1) f f f R \mathbb{R} R 上单调;

(5.1.3.2) R \mathbb{R} R 可以被分成互不相交的左右两个区间,使得 f f f 在左边的区间上递减,在右边的区间上递增.

推论 5.1: 一元函数 f : R → R ‾ f:\mathbb{R}\to\overline{\mathbb{R}} f:RR 是拟线性的 (既是拟凸的也是拟凹的) 当且仅当 f f f R \mathbb{R} R 上单调函数

5.2 可微函数的拟凸性判定

命题 5.2.1 :(拟凸性的一阶微分判据) 设函数 f : R n → R ∪ { ∞ } f:\mathbb{R}^n\to\mathbb{R}\cup\{\infty\} f:RnR{} 的有效定义域 d o m ( f ) \mathbf{dom}(f) dom(f) 是一个凸集, f f f d o m ( f ) \mathbf{dom}(f) dom(f) 上可微,那么, f f f 是拟凸函数当且仅当:
f ( y ) ≤ f ( x ) 蕴含 ∇ f ( x ) T ( y − x ) ≤ 0 , ∀ x , y ∈ d o m ( f ) . \begin{align} f(y)\leq f(x)\quad\text{蕴含}\quad\nabla f(x)^T(y-x)\leq0,\quad\forall x,y\in\mathbf{dom}(f).\end{align} f(y)f(x)蕴含f(x)T(yx)0,x,ydom(f).

命题 5.2.3 :(拟凸性的二阶微分判据) 设函数 f : R n → R ∪ { ∞ } f:\mathbb{R}^n\to\mathbb{R}\cup\{\infty\} f:RnR{} 的有效定义域为凸集, f f f d o m ( f ) \mathbf{dom}(f) dom(f) 连续,在 r i ( d o m ( f ) ) \mathbf{ri}(\mathbf{dom}(f)) ri(dom(f)) 上处处二阶连续可微的. 那么,

(5.2.3.1) 当 f f f 拟凸时,对任意的 x ∈ r i ( d o m ( f ) ) x\in\mathbf{ri}(\mathbf{dom}(f)) xri(dom(f)) y ∈ d o m ( f ) y\in\mathbf{dom}(f) ydom(f),当 ∇ f ( x ) T ( y − x ) = 0 \nabla f(x)^T(y-x)=0 f(x)T(yx)=0时,有 ( y − x ) T ∇ 2 f ( x ) ( y − x ) ≥ 0 (y-x)^T\nabla^2f(x)(y-x)\geq0 (yx)T2f(x)(yx)0;

(5.2.3.2) 若对任意的 x ∈ r i ( d o m ( f ) ) x\in\mathbf{ri}(\mathbf{dom}(f)) xri(dom(f)) y ∈ d o m ( f ) ,   y ≠ x y\in\mathbf{dom}(f),\:y\neq x ydom(f),y=x,当 ∇ f ( x ) T ( y − x ) = 0 \nabla f(x)^T(y-x)=0 f(x)T(yx)=0 时, 有 ( y − x ) T ∇ 2 f ( x ) ( y − x ) > 0 (y-x)^T\nabla^2f(x)(y-x)>0 (yx)T2f(x)(yx)>0,则 f f f 拟凸.

5.3 保拟凸运算

类似于凸函数情形, 可以给出保拟凸运算的若干结果. 这里不加证明地将这些典型的结果罗列在这此.

命题 5.3.1:设 h : R m → R ‾ h:\mathbb{R}^m\to\overline{\mathbb{R}} h:RmR 是一个拟凸函数,对 i = 1 , ⋯   , m , g i : C i → R i=1,\cdots,m,g_i:C_i\to\mathbb{R} i=1,,m,gi:CiR 是凸函数或凹函数,其中 C i ⊂ R n C_i\subset\mathbb{R}^n CiRn,满足条件:

(5.3.1.1) g i g_i gi 是凸函数时, h h h 关于第 i i i 个变元 x i x_i xi 在 R 上递增; 或

(5.3.1.2) g i g_i gi 是凹函数时, h h h 关于第 i i i 个变元 x i x_i xi 在 R 上递减,

g ( x ) : = ( g 1 ( x ) , ⋯   , g m ( x ) ) T . g(x):=(g_1(x),\cdots,g_m(x))^T. g(x):=(g1(x),,gm(x))T.那么,复合函数 f = h ∘ g , dom ( f ) : = { x ∈ ⋂ i = 1 m C i ∣ h ( g ( x ) ) < ∞ } , f=h\circ g,\quad\textbf{dom}(f):=\Big\{x\in\bigcap\limits_{i=1}^mC_i\Big|h(g(x))<\infty\Big\}, f=hg,dom(f):={xi=1mCi h(g(x))<},也是拟凸函数.

命题 5.3.2:(关于部分变量的下确界) 设 g : R n × R m → R ‾ g:\mathbb{R}^n\times\mathbb{R}^m\to\overline{\mathbb{R}} g:Rn×RmR 是拟凸函数, C ⊂ R m C\subset\mathbb{R}^m CRm 是非空凸集,那么 f ( x ) : = inf ⁡ inf ⁡ ( x , y ) ∈ d o m ( g ) g ( x , y ) f(x):=\inf_{\underset{(x,y)\in\mathbf{dom}(g)}{\operatorname*{inf}}}g(x,y) f(x):=(x,y)dom(g)infinfg(x,y)是拟凸函数.

命题 5.3.3: (逐点上确界) 设 { f γ } γ ∈ Γ , Γ ≠ ∅ \{f_\gamma\}_{\gamma\in\Gamma},\quad\Gamma\neq\emptyset {fγ}γΓ,Γ=,是 R n \mathbb{R}^n Rn 上一族拟凸函数,则
f ( x ) : = sup ⁡ γ ∈ Γ f γ ( x ) f(x):=\sup_{\gamma\in\Gamma}f_\gamma(x) f(x):=γΓsupfγ(x)也是拟凸函数.

练习

g : R n → R ∪ { ∞ } g:\mathbb{R}^n\to\mathbb{R}\cup\{\infty\} g:RnR{} 是一个凸函数, h : R n → R ∪ { − ∞ } h:\mathbb{R}^n\to\mathbb{R}\cup\{-\infty\} h:RnR{} 是凹函数,在凸集 C ⊂ R n C\subset\mathbb{R}^n CRn 上,有 g ( x ) ≥ 0 ,   h ( x ) > 0 g(x)\geq0,\:h(x)>0 g(x)0,h(x)>0.那么 f ( x ) : = g ( x ) / h ( x ) , d o m ( f ) : = C f(x):=g(x)/h(x),\quad\mathbf{dom}(f):=C f(x):=g(x)/h(x),dom(f):=C,是拟凸函数.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/252521.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Lumerical 技巧------Plot in New Window

Lumerical 技巧------Plot in New Window 简介正文 简介 当我们在计算模式分布后想要观察模式对应的图像&#xff0c;为了清晰地观察到一些细节&#xff0c;我们可以通过点击图像绘制窗口的 Plot in New Window 按键来实现。 正文 默认模式绘制图像如下&#xff1a; 窗口很…

C++中的继承(一)

文章目录 前言概念访问限定符基类和派生类的赋值转换继承中的作用域派生类的默认成员函数构造函数 拷贝构造析构函数 继承的其他一些细节 前言 我们之前说过&#xff0c;继承是面向对象的三大特性。 面向对象的三大特性&#xff1a; 封装、继承、多态。 封装在类和对象体现出…

【unity小技巧】最简单的FPS游戏准心跳动动画控制

最终效果 文章目录 最终效果前言绘制简单的准心UI实现不同状态准心大小变化射击准心跳动的效果完结 前言 游戏准心跳动在FPS也是比较常用的功能&#xff0c;可以增强游戏反馈和打击感&#xff0c;丰富游戏内容&#xff0c;实现准心跳动的方式五花八门&#xff0c;我不知道别人…

Redis Streams 实现消息队列

简单介绍 Redis中有三种消息队列模式&#xff1a; 可以看出&#xff0c;作为Redis 5.0 引入的专门为消息队列设计的数据类型&#xff0c;Stream 功能更加健全&#xff0c;更适合做消息队列分发。 Stream 可以包含 0个 到 n个元素的有序队列&#xff0c;并根据ID的大小进行排序…

【CMU 15-445】Lecture 10: Sorting Aggregations Algorithms 学习笔记

Sorting & Aggregations Algorithms SortingTop-N Heap SortExternal Merge Sort2-WAY External Merge SortK-WAY External Merge SortDouble Buffering Optimization AggregationsSortingHashing 本节课主要介绍的是数据库系统中的排序算法以及聚合算法 Sorting 排序算法…

数据结构期末考题之001

算法复杂度就是n&#xff08;0&#xff09;

JdbcTemplate

环境搭建 依赖 <!-- Oracle11g 连接驱动依赖。这里是个坑&#xff0c;官方提供的不能用 --><dependency><groupId>cn.easyproject</groupId><artifactId>ojdbc6</artifactId><version>12.1.0.2.0</version></dependency&g…

20231217在Canonical 官网下载ubuntu-20.04.6以及通过rufus-4.3p写入U盘作为安装盘

20231217在Canonical 官网下载ubuntu-20.04.6以及通过rufus-4.3p写入U盘作为安装盘 2023/12/17 11:45 百度搜索&#xff1a;https://ubuntu.com/ https://ubuntu.com/engage/migrating-from-rhel-centos-to-ubuntu-public-cloud?utm_sourcetakeover http://releases.ubuntu.co…

从关键新闻和最新技术看AI行业发展(2023.12.4-12.17第十二期) |【WeThinkIn老实人报】

写在前面 【WeThinkIn老实人报】旨在整理&挖掘AI行业的关键新闻和最新技术&#xff0c;同时Rocky会对这些关键信息进行解读&#xff0c;力求让读者们能从容跟随AI科技潮流。也欢迎大家提出宝贵的优化建议&#xff0c;一起交流学习&#x1f4aa; 大家好&#xff0c;我是Rock…

软件设计规约和评审

软件设计规约 概要设计规约&#xff1a;这是面向软件开发者的文档&#xff0c;主要作为软件项目管理人员、系统分析人员与设计人员之间交流的媒介。它指明了软件的组织结构&#xff0c;主要内容包括&#xff1a; 系统环境&#xff1a;硬件、软件接口与人机界面&#xff1b;外部…

半导体设备之外延炉简述

半导体设备对整个半导体行业起着重要的支撑作用。因半导体制造工艺复杂&#xff0c;各个环节需要的设备也不同&#xff0c;从流程工序分类来看&#xff0c;半导体设备主要可分为晶圆制造设备&#xff08;前道工序&#xff09;、封装测试设备&#xff08;后道工序&#xff09;等…

自动驾驶学习笔记(二十)——Planning算法

#Apollo开发者# 学习课程的传送门如下&#xff0c;当您也准备学习自动驾驶时&#xff0c;可以和我一同前往&#xff1a; 《自动驾驶新人之旅》免费课程—> 传送门 《Apollo 社区开发者圆桌会》免费报名—>传送门 文章目录 前言 参考线平滑 双层状态机 EM Planner …

724. 寻找数组的中心下标

代码&#xff1a; class Solution {public int pivotIndex(int[] nums) {int last0; //放前一个下标的左右差值int now0; //放当前下标的左右差值// 0 位于边界&#xff0c;先算出 0 下标左右的差值for(int i1;i<nums.length;i){lastnums[i];}//判断是否 0 下标就已…

大模型自定义算子优化方案学习笔记:CUDA算子定义、算子编译、正反向梯度实现

01算子优化的意义 随着大模型应用的普及以及算力紧缺&#xff0c;下一步对于计算性能的追求一定是技术的核心方向。因为目前大模型的计算逻辑是由一个个独立的算子或者说OP正反向求导实现的&#xff0c;底层往往调用的是GPU提供的CUDA的驱动程序。如果不能对于整个计算过程学习…

Ubuntu 常用命令之 cp 命令用法介绍

cp命令在Ubuntu系统中用于复制文件或目录。它的基本格式是cp [选项] 源文件或目录 目标文件或目录。 以下是一些常用的cp命令选项 -i&#xff1a;在覆盖目标文件之前将给出提示。-r或-R&#xff1a;递归复制&#xff0c;用于目录的复制操作。-v&#xff1a;详细模式&#xff…

地平线前端实习一面复盘(加深对var的理解+展开运算符+平拍数组)

目录 前言一&#xff0c;var的作用二&#xff0c;展开运算符三&#xff0c;平拍数组总结 前言 地平线的面试&#xff0c;有提示&#xff0c;很专业&#xff0c;体验很好。 可惜后面未收到消息&#xff0c;但还是要做复盘。收获还是很大的。 一&#xff0c;var的作用 且看下…

MySQL中EXPLAIN执行计划的分析

一. 执行计划能告诉我们什么&#xff1f; SQL如何使用索引联接查询的执行顺序查询扫描的数据函数 二. 执行计划中的内容 SQL执行计划的输出可能为多行&#xff0c;每一行代表对一个数据库对象的操作 1. ID列 ID列中的如果数据为一组数字&#xff0c;表示执行SELECT语句的顺…

网络基础(十二):ACL与NAT

目录 一、ACL 1、ACL的概述 2、ACL的分类 3、ACL的应用 4、ACL的组成和基本原理 ​编辑 5、ACL的配置 5.1配置基本ACL 5.2配置高级ACL 二、NAT 1、NAT的概述 2、NAT的分类 3、NAT的工作原理 4、静态NAT的配置 5、动态NAT的配置 6、NAPT&#xff08;端口映射&am…

自动驾驶技术:驶向未来的智能之路

导言 自动驾驶技术正引领着汽车产业向着更安全、高效、智能的未来演进。本文将深入研究自动驾驶技术的核心原理、关键技术、应用场景以及对交通、社会的深远影响。 1. 简介 自动驾驶技术是基于先进传感器、计算机视觉、机器学习等技术的创新&#xff0c;旨在实现汽车在不需要人…

论文降重系统同义词替换功能的改进方向 快码论文

大家好&#xff0c;今天来聊聊论文降重系统同义词替换功能的改进方向&#xff0c;希望能给大家提供一点参考。 以下是针对论文重复率高的情况&#xff0c;提供一些修改建议和技巧&#xff0c;可以借助此类工具&#xff1a; 标题&#xff1a;论文降重系统同义词替换功能的改进方…