【PyTorch][chapter 22][李宏毅深度学习]【无监督学习][ WGAN]【理论二】

前言:

       本篇主要参考《Wasserstein GAN and the Kantorovich-Rubinstein Duality》

重点介绍一下 WGAN 的损失函数 是如何通过 Wasserstein Distance 变换过来的。

分为5步:

  1.     我们首先建立Wasserstein Distance         极小值形式,
  2.     经过对偶变换得到Wasserstein Distance  极大值形式,
  3.     通过Farkas 引理证明其二者是强对偶关系,
  4.    利用对偶形式的约束函数 对 极大值形式 进行变换,得到WGAN 损失函数形式
  5.    极大值的约束函数就是1-Lipschitz

 


   目录:

  1.         Earth Mover’s Distance
  2.         对偶形式(Dual Form)  
  3.         Farkas 引理(Farkas Theorem)
  4.         强对偶(Strong Duality)
  5.        传输成本的对偶( Dual Implementation)
  6.         对偶到WGAN
  7.          Lipschitz约束和Wasserstein 关系

一    Earth Mover’s Distance

         我们以任意两个离散的概率分布p,q 为例

     1.1 EMD 距离定义

        

           一种用来测量两个概率分布之间的距离度量。它主要应用在图像处理和语音信号处理领域。EMD问题可以通过线性规划来求解,其核心思想是将一个分布的密度通过“搬土”的方式转移到另一个分布的位置上,使得转移的代价最小。在这个过程中,每个点对之间的距离和转移的量共同决定了总的工作量,即EMD

                   

                                      

      优化的目标:  

                   求解r,使得W[p,q] 达到极小值

        其中:

                      p(x) :离散的随机分布,对应状态变量x的维度为l

                              (图像中就是对应每个像素值变化范围0-255)

                     q(y):   离散的随机分布,对应状态变量y的维度为l

                     \gamma(x,y)\sim\prod (P_r,P_{\theta}): 代表推土方案,是(P_r,P_{\theta})的联合概率分布函数

                      inf:    积分下限 ,等价于求极小值

               约束条件

                     

 

1. 2   矩阵表达形式

         

          \left \langle \right \rangle_F is Frobenius inner product: 两个大小相同的矩阵元素一一对应相乘并且相加

    1.3 EMD 向量表达形式

                

                 通过求解optimal transport plan \Gamma, 使得EMD 最小

             

              约束条件: A\Gamma =b

                  

    1.4    线性规划问题(LP: Linear Programming)

          通过上面我们可以看到EMD等价于LP问题:

        ​​​​​​​

               

  Python 有对应的LP 库,如下例子

# -*- coding: utf-8 -*-
"""
Created on Sun Mar 10 20:58:19 2024

@author: cxf
"""

import numpy as np
from scipy.optimize import linprog

def run():
    """
    数学规划模型
    scppy.optimize.linprog
    """
  
    c=np.array([-2,-3,5]).transpose()    #行列向量不影响求解
    A=np.array([[-2,5,-1],[1,3,1]])
    b=np.array([-10,12])
    Aeq=np.array([[1,1,1]])    # 单个约束也要表示为矩阵形式
    beq=np.array([7])
    x=linprog(c,A,b,Aeq,beq,method='highs',bounds=np.array([[0,None],[0,None],[0,None]]))
    print(x)

def main():
    '''
    LINPROG_METHODS = ['simplex',
                       'revised simplex',
                       'interior-point', 
                       'highs', 
                       'highs-ds',
                       'highs-ipm']


    Returns
    -------
    None.

    '''
    print("\n ------1--------")
  
    P_r = np.array([[0.1,0.9]]).transpose()
    P_t = np.array([[0.5,0.5]]).transpose()
    D = np.array([[0.0,1.0],
                  [1.0,0.0]])
    
    L,L = D.shape
    
    C = D.reshape((L**2,1))
    print("\n  C: distance |x-y| 功能 \n",C)
    
  
    A_r = np.zeros((L,L,L))
    A_t = np.zeros((L,L,L))
    
    for i in range(L):
        for j in range(L):
            
            A_r[i,i,j]=1
            A_t[i,j,i]=1
    
    #Aeq是约束条件
    aeq = np.concatenate((A_r.reshape(L,L**2),A_t.reshape(L,L**2)),axis=0)
    print("\n 约束条件:Ax=b: \n",aeq,aeq.shape)
    #b 就是Pr,Pg 的概率分布组成一列
    beq =  np.concatenate((P_r,P_t),axis=0)
    print("\n   vec(pr,pg) :\n",beq)
    bound = np.repeat([[0.0,1.0]],L*L,axis=0)
    print("\n 0=<x<1 \n",bound)
    #x[L*L,1]
    #bounds=bound
    opt_res= linprog(C,A_eq=aeq, b_eq=beq, method='highs-ds',bounds=bound)
    emd = opt_res.fun
    #gamma = opt_res.x.reshape((1,1))
    print("\n x:\n ",opt_res.x)
    
    
    
print("\n-----------")
main()


二 对偶形式(Dual Form)

        

            原始形式 问题:

         不幸的是,这种优化在很多情况下并不实用,尤其是在通常使用 GAN 的领域。在我们的示例中,我们使用具有十种可能状态的一维随机变量。可能的离散状态的数量随着输入变量的维度数量呈指数级增长。对于许多应用,例如图像,输入很容易就有数千个维度。即使是近似值那么几乎是不可能的。
 但实际上我们并不关心。我们只想要一个数字,即 EMD。此外,我们想用它来训练我们的生成器网络,该网络生成分布,为此,我们必须能够计算梯度。自从p和q只是我们优化的限制,这不可能以任何直接的方式实现. 事实证明,还有另一种更方便的 EMD 计算方法。任何 LP 有两种方式可以表述问题:我们刚才使用的原始形式和对偶形式。

       证明:

设    A^Ty \leq c

         z=c^Tx \geq \begin{pmatrix} A^Ty \end{pmatrix}^Tx

                          \geq y^TAx

                          \geq y^Tb

           因为y^Tb 是标量,所以 \tilde{z}=b^Ty \leq z

         

   这种形式也称为弱对偶形式,那是否有强对偶使得z=\tilde{z}  


三    Farkas 引理

       强对偶形式的证明,主要用到称之为“Farkas 引理”的结论:

       对 \forall A \in R^{m\times n}, 以下两个命题是互斥的:

     3.1 引理一:   向量b在凸锥C内

          矩阵 A=\begin{bmatrix} a_1 &a_2 & ... & a_n \end{bmatrix}  由n个m维的列向量组成

          向量  x=\begin{bmatrix} \alpha_1\\ \alpha_2 \\ ... \\ \alpha_n \end{bmatrix}  由n个非负标量组成 

          Ax=\alpha_1a_1+\alpha_2a_2+...+\alpha_na_n 

          a_1,a_2,...a_n的非负系数的线性组合是一个凸锥C

      如上图:

         a_1,a_2 两个向量顶点连接起来可以组成一个凸锥C,

两者通过非负的线性系数相加得到的a_3 也一定落在该凸锥C 内

同理:   Ax=b(x\geq0) 

非负的线性组合a_1,a_2,..a_n 组成了凸锥C,b由该非负的线性组合得到,也落在该凸锥C内.

 

   3.2 引理二  :b在凸锥C外

     

          A^Ty \leq 0  :  、  A^Ty=\begin{bmatrix} a_1^Ty\leq0\\ a_2^Ty\leq0 \\ ... \\ a_n^Ty\leq0 \end{bmatrix}

                        向量y在凸锥C外,向量y与该凸锥C中任意向量夹角大于90  

          b^Ty> 0:   

                            b^Ty=|b||y|cos\theta,向量 b,y 夹角小于90度, 所以向量b 在凸锥C外

               

                     也可以用下图表示

                          

   


四 强对偶(Strong Duality)

      

             

                Farkas 两条引理:

            ​​​​​​​

            我们要利用Farkas 两条引理 , 证明的是 \hat{z}  可以无限接近 z

  证明:

      假设原始问题的最优解为z^{*}=c^Tx^*,我们定义:

   

        其中 \epsilon,\alpha \in R

    4.1 当 \epsilon =0 时,满足   Farkas case (1)

                 因为 \hat{A}x^*=\hat{b_0} 

                \begin{bmatrix} Ax^*\\ -c^Tx^* \end{bmatrix}=\begin{bmatrix} b\\ -z^*+0 \end{bmatrix}

         不满足Farkas case(2) 即

           \forall \hat{A}^T\hat{y} \leq 0,      \hat{b_0}^T\hat{y} \leq 0 ....(9)

   4.2 \epsilon >0 时,满足Farkas case(2)

               \hat{A}x=\begin{bmatrix} Ax\\-c^Tx\end{bmatrix}
.             因为z^* 已经是最小值了,不存在非负解,使得c^Tx=z^*-\epsilon(EMD为非负的值)

  所以Farkas case(1) 不成立, Farkas case(2) 成立。

               存在\hat{y}=\begin{bmatrix} y\\ \alpha \end{bmatrix} 使得 \hat{A}\hat{y}\leq 0\hat{b_{\epsilon }}\hat{y}>0

              

                 等价于: 推理2,推理3 

              ...(10)

                         \forall \hat{A}^T\hat{y} \leq 0,   \hat{b_{\epsilon }}^T\hat{y}=\hat{b_0}^T\hat{y}+\alpha \epsilon > 0 ...(11)

        当 \forall \hat{A}^T\hat{y} \leq 0,    根据式(9) \hat{b_0}^T\hat{y} \leq 0,  式(11)  \hat{b_{\epsilon }}^T\hat{y}=\hat{b_0}^T\hat{y}+\alpha \epsilon > 0

                得知\alpha>0,取\alpha=1

                         max_{y}\begin{Bmatrix} b^Ty|A^Ty \leq c & \end{Bmatrix} \geq z^*-\epsilon

                弱对偶形式:

                          z^* \geq max_{y}\begin{Bmatrix} b^Ty|A^Ty \leq c & \end{Bmatrix}

                 则:

                       z^*-\epsilon \leq max_{y}\begin{Bmatrix} b^Ty|A^Ty \leq c & \end{Bmatrix} \leq z^*

               \epsilon>0 是任意的,两者可以无限接近,从而

                      max_{y}\begin{Bmatrix} b^Ty|A^Ty \leq c & \end{Bmatrix} = z^*=min_x\begin{Bmatrix} c^Tx|Ax =b,x\geq 0\end{Bmatrix}


五:传输成本的对偶

      EMD 优化目标

            

   

      GAN 在图像处理里面,状态变量 x,和y 的范围一致,所以EMD 优化目标可以写成如下:

     

          根据约束条件:A^TF \leq C

       


六   对偶到WGAN

       我们得到最优传输成本的对偶形式

    

     因为 g(x) \leq -f(x), 同时 p(x),q(x)代表的是非负的概率(标量),所以

   

      等价于求解

    这便是我们最终要寻找的最优传输成本(1)的对偶形式了

   当c(x,y)=||x-y||,我们有 c[p,q]=W_1(p,q)

    

这就是WGAN所采用的W距离,于p,q 都是概率分布,因此我们可以写成采样形式

自然地,整个WGAN的训练过程就是


七 Lipschitz约束和Wasserstein 关系

     7.1 Lipschitz 函数定义

       当L =1 的时候 就是 WGAN的约束条件

    

         其中约束条件我们通常写为||f||_L \leq 1

参考:  

20 AI Projects for Kids That Will Blow Their Minds

https://www.cnblogs.com/yhxm/p/13047489.html

python模块:Scipy.optimize.linprog线性规划求解-CSDN博客

CSDN

从Wasserstein距离、对偶理论到WGAN - 科学空间|Scientific Spaces

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/453573.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linly-Talker智能数字人实时对话系统如何部署体验

环境&#xff1a; Linly-Talker 问题描述&#xff1a; Linly-Talker智能数字人实时对话系统如何部署体验 Linly-Talker 是一个智能 AI 系统&#xff0c;它将大型语言模型 &#xff08;LLMs&#xff09; 与视觉模型相结合&#xff0c;创造出一种新颖的人机交互方式。它集成了…

【HTML】1px边框与1px分割线

对比图 箭头标注的是处理过的 1px分割线 使用transform的scaleY进行缩小 码 <div class"mini-heriz"></div><br><div style"border: solid 1px black; width: 300px;height: 1px;"></div> <style> .mini-heriz {wi…

Linux编程4.2 网络编程-协议

1、为什么要有协议&#xff1f; 计算机网络中实现通信必须有一些约定&#xff0c;如对速率、传输代码、代码结构、传输控制步骤和出错控制等约定&#xff0c;这些约定即被称为通信协议。在两个节点之间要成功地进得通信&#xff0c;两个节点之间必须约定使用共同的“语言”&am…

MySQL用法---MySQL Workbench创建数据库和表

1. 连接数据库 打开软件&#xff0c;点击左下角卡片&#xff0c;输入设置的数据库密码&#xff0c;勾选单选框 2. 了解主页面的组成部分 3. 创建数据库 先点击工具栏的创建按钮 再输入数据库名称 点击 Apply 创建 4. 创建数据表 展开数据库&#xff0c;在Tables上右键&…

如何在WordPress网站上设置多语言展示

在今天的全球化世界中&#xff0c;拥有多语言网站对于吸引更广泛的受众至关重要。前不就我们遇到Hostease的客户咨询我们的在线客服&#xff0c;他想要对他的wordpress网站支持多语言。我们提供给客户可以尝试以下的插件来支持多语言。 在本教程中&#xff0c;我们将逐步介绍如…

cpp qt 一个奇怪的bug

今天在用cpp qt的时候发现了一个奇怪的东西 这是我的源代码 #include "mywidget.h" #include <QPushButton>myWidget::myWidget(QWidget *parent): QWidget(parent) {QPushButton * btn1 new QPushButton;btn1->show();btn1->setParent(this);btn1-&g…

冥想与AI:打造定制的放松体验

如今&#xff0c;在浏览网页或社交网络时&#xff0c;您似乎很难对一条条心理健康信息无动于衷。遇到这种情况的可不只是您。当今不断变化的时代给人们平添压力&#xff0c;企业纷纷利用智能技术满足人们的减压需求&#xff0c;让人们的生活多一些平和从容。 冥想就是一种练习呼…

低代码开发能否降低程序员门槛?技能需求分析与优势评估揭秘!

一&#xff0e;什么是低代码开发平台 低代码开发平台和零代码开发平台是近几年时兴的一种新的程序开发方法。该模式的特征是可以使用用户界面、拖拽操作等方式快速构建应用软件软件&#xff0c;从而减少开发者的学习标准&#xff0c;使每个人都能变成开发者。 但它仍然是基于…

别再写传统简历了!AI简历5个超实用的功能,助你求职一臂之力(强烈建议收藏)

你们在制作简历时,是不是基本只关注两件事:简历模板,还有基本信息的填写。 当你再次坐下来更新你的简历时,可能会发现自己不自觉地选择了那个“看起来最好看的模板”,填写基本信息,却没有深入思考如何使简历更具吸引力。这其实是一个普遍现象:许多求职者仍停留在传统简历…

在使用qml的qmldir文件创建常用组件报错unknow component

解决方法&#xff1a;Qt Creator中的工具-->QML/JS-->重置代码模型 参考博文:QML自定义模块及qmldir的使用_同一资源文件目录下的qml模块使用-CSDN博客 不一样的地方是我给我的文件起了别名 以及我的qrc文件路径有前缀/qml 总体操作&#xff1a; 1.使用模块中的组件时…

ChatGPT提问技巧:可解释的软提示

ChatGPT提问技巧&#xff1a;可解释的软提示 可解释的软提示是一种既能控制模型生成的文本&#xff0c;又能为模型提供一定灵活性的技术。 具体做法是为模型提供一组受控输入和一些有关所需输出的附加信息。这种技术可以使生成的文本更具可解释性和可控性。 提示示例及其公式…

Mysql 学习(十七)事务隔离级别和MVCC

前提准备 首先创建一个表&#xff1a; CREATE TABLE hero (number INT,name VARCHAR(100),country varchar(100),PRIMARY KEY (number) ) EngineInnoDB CHARSETutf8;INSERT INTO hero VALUES(1, 刘备, 蜀);事务隔离级别 mysql 是一个 客户端 和 服务器架构的软件&#xff0c…

【Linux操作系统】:Linux进程概念(2)

一、Z(zombie)-僵尸进程 1.僵尸进程概念 故事 张三每天都有跑步的习惯&#xff0c;这一天他和往常一样跑步&#xff0c;跑了两三圈&#xff0c;突然跑在它前面的一个人倒在地上不动了&#xff0c;作为热心市民张三赶紧报警并且拨打120。很快120就来了&#xff0c;但是没过几分…

C#、C++、Java、Python 选择哪个好?

作者&#xff1a;网博汇智 链接&#xff1a;https://www.zhihu.com/question/298323023/answer/2789627224 来源&#xff1a;知乎 著作权归作者所有。商业转载请联系作者获得授权&#xff0c;非商业转载请注明出处。 一个好的程序员不能把自己绑定在一种语言上&#xff0c;不…

摄像机内存卡删除的视频如何恢复?恢复指南来袭

在现代社会&#xff0c;摄像机已成为记录生活、工作和学习的重要设备。然而&#xff0c;随着使用频率的增加&#xff0c;误删或意外丢失视频的情况也时有发生。面对这样的情况&#xff0c;许多用户可能会感到无助和困惑。那么&#xff0c;摄像机内存卡删除的视频真的无法恢复吗…

X小蓝鸟,已破!支持批量下载且速度飞快

从马斯克把小蓝鸟改名之后&#xff0c;最大的感觉就是域名更好记了&#xff0c;对于软件爱好者来说&#xff0c;可以关注软件最新消息&#xff0c;许多软件开发者都是在上面更新动态。 本期给大家分享一款可以下载X上的图片/视频工具X-Spider&#xff0c;它的特点是开源免费&am…

愿原力与您同在:电影魔术背后的AI

在《星球大战》系列影视作品的经典配乐中&#xff0c;无论您喜欢《酒吧乐队》还是喜欢《帝国进行曲》&#xff0c;我们都想说“愿原力与您同在”。5月4日“星战日”是个非正式节日&#xff0c;旨在纪念《星球大战》系列影视作品留给我们的遗产及其对现代电影制作不可磨灭的影响…

使用webpack打包ts代码

通常情况下&#xff0c;实际开发中需要使用构建工具对代码进行打包&#xff0c;TS也可以结合构建工具进行使用&#xff0c;以webpack为例&#xff0c;介绍如何结合构建工具使用TS。 基本功能实现步骤&#xff1a; 项目初始化&#xff0c;生成package.json&#xff1a;npm ini…

汉诺塔问题代码写法的详细解析

汉诺塔游戏规则&#xff1a; 规则&#xff1a; 汉诺塔问题是一个经典的问题。汉诺塔&#xff08;Hanoi Tower&#xff09;&#xff0c;又称河内塔&#xff0c;源于印度一个古老传说。大梵天创造世界的时候做了三根金刚石柱子&#xff0c;在一根柱子上从下往上按照大小顺序摞着…

自动化运维工具 ---------------Ansible

一、Ansible 发展史及功能 作者&#xff1a;Michael DeHaan&#xff08; Cobbler pxe kikstar 与 Func 作者&#xff09;ansible 的名称来自科幻小说《安德的游戏》中跨越时空的即时通信工具&#xff0c;使用它可以在相距数光年的距离&#xff0c;远程实时控制前线的舰队战斗2…