次梯度、次梯度下降

 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家:点击跳转

目录

一,次梯度

1,次梯度、次微分

2,次梯度的性质

3,共轭函数和次梯度

(1)共轭函数和原函数次梯度的对偶

(2)原函数次梯度和共轭函数次梯度的对偶

(3)共轭函数和共轭函数次梯度的对偶

4,近端映射函数和次梯度

(1)近端映射函数和次梯度的对偶

(2)原函数的近端映射函数和共轭函数的近端映射函数的对偶

(3)广义Moreau 分解

二,次梯度下降

三,镜像次梯度下降算法

1,Bregman距离

2,镜像次梯度下降算法

3,实例


一,次梯度

1,次梯度、次微分

函数f的次微分:

集合中的每个g都称为次梯度。

2,次梯度的性质

PS:第(2)条的集合加法是A+B={x+y | x in A && y in B} 

(4)凸函数的次梯度是一个非空有界凸集。

(5)某点处的次梯度含有0则代表该点是极值点。

3,共轭函数和次梯度

(1)共轭函数和原函数次梯度的对偶

f^*(y)=y^Tx-f(x)\leftrightarrow y \in \delta f(x)

y^Tx-f(x)的上确界在x处能取到,等价于,y是f在x处的次微分。

(2)原函数次梯度和共轭函数次梯度的对偶

x是共轭函数在y处的次梯度,等价于y是原函数在x处的次梯度。

例子:

例1,f是一元可微函数 

f的次微分是单元素集合{f'},y是原函数在x处的次梯度即y=f'(x)

根据共轭函数的导数和原函数的导数互为反函数可得,x等于共轭函数的导数在y处的值,

即x是共轭函数在y处的次梯度。

例2,f(x) = |x| 即一阶范数

f的次微分∂f是个分段函数,x<0时∂f={-1},x=0时∂f=[-1,1], x>0时∂f={1}

f的共轭函数是f*(y)=0, y∈[-1,1],

f*的次微分∂f*是个分段函数,y=-1时∂f*=(-∞,0],  y∈(-1,1)时,∂f*={0},y=1时∂f*=[0,+∞)

显然2个次微分完全对应。

应用:

(3)共轭函数和共轭函数次梯度的对偶

 f^*(y)=y^Tx-f(x)\leftrightarrow x \in \delta f^*(y)   

y^Tx-f(x)的上确界在x处能取到,等价于,x是f*在y处的次微分。

4,近端映射函数和次梯度

(1)近端映射函数和次梯度的对偶

u=prox_f(x)\Leftrightarrow x-u \in \delta f(u)

推导:

(2)原函数的近端映射函数和共轭函数的近端映射函数的对偶

即Moreau 分解:

prox_f(x)+prox_{f^*}(x)=x

推导:

(3)广义Moreau 分解

prox_{af}(x)+a \, prox_{a^{-1}f^*}(a^{-1}x)=x

推导:

g(x)=af(x)\rightarrow \\prox_{g^*}(x)=a \, prox_{a^{-1}f^*}(a^{-1}x)\\prox_{g^*}(x)=x-prox_g(x)=x-prox_{af}(x)\\ \rightarrow a \, prox_{a^{-1}f^*}(a^{-1}x)=x-prox_{af}(x)\\\rightarrow prox_{af}(x)+a \, prox_{a^{-1}f^*}(a^{-1}x)=x

二,次梯度下降

在不可微分的场景下,用次梯度取代梯度做梯度下降。 

实际上,各种梯度下降可以对应各种次梯度下降(不一定所有的都能对应)。

比如:

普通梯度下降 对应 普通次梯度下降

投影梯度下降 对应 投影次梯度下降

三,镜像次梯度下降算法

1,Bregman距离

2,镜像次梯度下降算法

迭代求解:

3,实例

比如:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/458374.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[pdf]抱歉!二十三年前我们没看懂《人月神话》幻灯片-共127页

DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 《抱歉&#xff01;二十三年前我们没看懂《人月神话》幻灯片》-pdf文件&#xff0c;共127页 已上传至CSDN资源 也可以访问以下链接下载&#xff1a; http://www.umlchina.com/url/m…

电子学会 2023.03 Python 3级(yanpuxin)

十进制数111转换成二进制数是&#xff1f; 1、十进制数111转换成二进制数是&#xff1f;&#xff08; &#xff09; A 111 B 1111011 C 101111 D 1101111 正确答案:D 试题解析: 十进制转二进制&#xff0c;采用除二倒取余数&#xff0c;直到商为0为止。 2、某班有36人…

无人棋牌室茶室台球室自习室共享棋牌室系统开发小程序开发

项目背景 **市场概况**&#xff1a; 在当今社会&#xff0c;随着科技的不断进步和人们对自动化服务的需求增加&#xff0c;无人经营的棋牌室、茶室、台球室和自习室等概念正在逐渐受到关注。这种无人化经营模式在市场前景、应用人群、操作使用流程、技术框架设计等方面都具有一…

面具安装LSP模块时提示 Unzip error错误的解决办法

面具(Magisk Delta)安装LSP模块时提示 Unzip error错误的解决办法 ​​ 如果前面的配置都正常的话&#xff0c;可能是LSP版本有问题重新去Github下载一个最新版的吧&#xff1b;我是这么解决的。 我安装1.91那个版本的LSP就是死活安装不上&#xff0c;下载了1.92的版本一次就…

用Stable Diffusion生成同角色不同pose的人脸

随着技术的不断发展&#xff0c;我们现在可以使用稳定扩散技术&#xff08;Stable Diffusion&#xff09;来生成同一角色但不同姿势的人脸图片。本文将介绍这一方法的具体步骤&#xff0c;以及如何通过合理的提示语和模型选择来生成出更加真实和多样化的人脸图像。 博客首发地…

前端Prettier 插件的使用配置(详细)

各个参数代表的意思:printWidth&#xff1a;每行代码的最大长度限制。 tabWidth&#xff1a;选项用于控制制表符的宽度。 useTabs&#xff1a;指定是否使用制表符代替空格。 semi&#xff1a;指定是否在语句的末尾添加分号。 singleQuote&#xff1a;指定是否使用单引号或双引号…

Buildroot 之二 详解构建架构、流程、external tree、示例

构建系统 Buildroot 中的构建系统使用的是从 Linux Kernel(4.17-rc2) 中移植的 Kconfig(配置) + Makefile & Kbuild(编译)这套构建系统,移植后的源码位于 support/kconfig/ 目录下。Buildroot 本身是一个构建系统,与直接编译源码不同,因此,它对这套系统进行了比较…

Long类型字段在前后端传值问题

文章目录 抛出问题解决问题解决方法1&#xff1a;解决方法2:解决方法3&#xff1a;<font colorgree>解决方法:4 抛出问题 Java 服务端如果直接返回 Long 整型数据给前端&#xff0c;Javascript 会自动将其转换为 Number 类型&#xff08;注&#xff1a;此类型为双精度浮点…

arcgis pro植被冠层分析及单木识别

测试正射影像和点云数据介绍(文末分享):点云数据每平方米包含 0.5-1 个点。准备的课程如下;地面、水、桥或未分类。两个数据的最小单位覆盖面积为 2.5 x 2.5 公里。两个数据均位于 SWEREF 99 TM 坐标系中。正射影像数据由 RGBI(红、绿、蓝和近红外)波段组成。两个数据的空…

提交数据加快百度搜索引擎收录

百度站长工具做了更新&#xff0c;百度收录的地址分享如下&#xff0c;新站点提交后&#xff0c;可以加快百度收录。 普通收录_加快网站内容抓取&#xff0c;快速提交数据工具_站长工具_网站支持_百度搜索资源平台普通收录工具可实时向百度推送数据&#xff0c;创建并提交site…

【Emgu CV教程】9.5、形态学常用操作之形态学梯度

文章目录 一、相关概念1.什么叫形态学梯度2.形态学梯度的函数 二、演示1.原始素材2.代码3.运行结果 一、相关概念 1.什么叫形态学梯度 形态学梯度&#xff0c;就是用膨胀的原始图像减去腐蚀的原始图像&#xff0c;所以它的特性就是去除前景物体的内部区域&#xff0c;只得到前…

Docker 安装部署 SqlServer 数据库

Docker 安装部署 SqlServer 数据库 背景&#xff1a; ​ 最近在开发数据中台数据集成模块&#xff0c;需要对接大量的数据做测试&#xff0c; 由于SqlServer 下载安装会耗费大量时间&#xff0c;所以采用 Docker 安装 Sqlserver 的方式部署数据库。 1、拉去 sqlserver 镜像 …

【汇编】#3 8086与数据有关的寻址方式

文章目录 操作码与操作数1. 8086处理器的与数据有关的寻址方式1.1 立即数寻址方式1.2 寄存器寻址方式 2. 有效&#xff08;偏移&#xff09;地址&#xff08;effective address&#xff0c;EA&#xff09;与缺省段寄存器选择tips:段跨越前缀2.1 直接寻址tips:直接寻址与立即寻址…

Android14之解决报错:No module named sepolgen(一百九十二)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 优质专栏&#xff1a;多媒…

1.1 课程架构介绍:STM32H5信息安全特性概览

1.1 课程架构介绍&#xff1a;STM32H5信息安全特性概览 1. 概述 开发者在打造嵌入式系统时&#xff0c;安全和性能是产品开发设计的考量重点。为实现这一目标&#xff0c;ST推出了STM32H5系列&#xff0c;该系列作为微控制器新标杆面向工业应用市场&#xff0c;将为用户带来更…

(每日持续更新)jdk api之StreamTokenizer基础、应用、实战

博主18年的互联网软件开发经验&#xff0c;从一名程序员小白逐步成为了一名架构师&#xff0c;我想通过平台将经验分享给大家&#xff0c;因此博主每天会在各个大牛网站点赞量超高的博客等寻找该技术栈的资料结合自己的经验&#xff0c;晚上进行用心精简、整理、总结、定稿&…

Linux -- 线程概念和控制

一 什么是线程 1.1 线程的引出 我们开始理解一下Linux中的线程。我们以前说过&#xff0c;一个进程被创建出来&#xff0c;要有自己对应的进程PCB的&#xff0c;也就是 task_struct&#xff0c;也要有自己的地址空间、页表&#xff0c;经过页表映射到物理内存中。所以在进程角…

Docker:构建镜像,运行springboot项目、服务器开启虚拟内存

文章目录 构建镜像&#xff0c;运行项目开启虚拟内存构建&#xff0c;运行 构建镜像&#xff0c;运行项目 开启虚拟内存 我们自己购买服务器一般内存就2g&#xff0c;是不够用的&#xff0c;所以要开启虚拟内存。 创建目录 mkdir /file创建虚拟内存 dd if/dev/zero of/fi…

java数据结构与算法刷题-----LeetCode46. 全排列

java数据结构与算法刷题目录&#xff08;剑指Offer、LeetCode、ACM&#xff09;-----主目录-----持续更新(进不去说明我没写完)&#xff1a;https://blog.csdn.net/grd_java/article/details/123063846 文章目录 1. 暴力回溯2. 分区法回溯 1. 暴力回溯 解题思路&#xff1a;时…

ASP.NET-Server.HtmlEncode

目录 背景: 1.转义特殊字符&#xff1a; 2.防止跨站脚本攻击&#xff08;XSS&#xff09;&#xff1a; 3.确保输出安全性&#xff1a; 4.保留原始文本形式&#xff1a; 5.与用户输入交互安全&#xff1a; 实例说明: 不用Server.HtmlEncode 效果展示: 用Server.HtmlEnc…