信息熵为凹函数-推导

凹函数和凸函数,是凹凸是相对于x轴来说的,对于熵来说,它是凹函数。因为它是-log函数,函数曲线相对于x轴来说是凸的。

Jensen不等式推导

以下是证明熵是凹函数。

引理:

①Jensen不等式,条件:对于实数域上的凸函数f,如果x是一个随机变量,则不等式可以表述为: f ( E [ x ] ) ≤ E [ f ( x ) ] f(E[x])\leq E[f(x)] f(E[x])E[f(x)],意为自变量均值的函数值(曲线上的值)≤自变量函数值的均值(直线上的值)。

②利用Jensen不等式判定函数为凹或凸。

凸:如果对于所有的x,y和所有t ∈ [ 0 , 1 ] \in[0,1] [0,1],满足: f ( t ⋅ x   +   ( 1 − t ) ⋅ x ) ≤ t ⋅ f ( x )   +   ( 1 − t ) ⋅ f ( x ) f(t \cdot x\ +\ (1-t)\cdot x)\leq t\cdot f(x) \ +\ (1-t)\cdot f(x) f(tx + (1t)x)tf(x) + (1t)f(x),则为凸函数——直线上的点y值要比曲线上的点y值大。

凹:则相反。

因为-log函数是凸函数。所以, − log ⁡ ( t ⋅ x + ( 1 − t ) ⋅ x ) ≥ t ⋅ ( − log ⁡ ( x ) ) + ( 1 − t ) ⋅ ( − log ⁡ ( x ) ) -\log(t\cdot x+ (1-t)\cdot x)\geq t\cdot (-\log(x)) + (1-t)\cdot (-\log(x)) log(tx+(1t)x)t(log(x))+(1t)(log(x))

H ( λ p + ( 1 − λ ) q ) ) = ∑ i = 1 n − ( λ p i + ( 1 − λ ) q i ) ⋅ log ⁡ ( λ p i + ( 1 − λ ) q i ) = ∑ i = 1 n ( λ p i + ( 1 − λ ) q i ) ⋅ − log ⁡ ( λ p i + ( 1 − λ ) q i ) ≥ ∑ i = 1 n ( λ p i + ( 1 − λ ) q i ) ( λ ⋅ − log ⁡ p i + ( 1 − λ ) ( − log ⁡ q i ) ) = ∑ i = 1 n ( λ p i ⋅ − log ⁡ p i + λ p i ⋅ ( 1 − λ ) ( − log ⁡ q i ) ) + ( 1 − λ ) q i ⋅ − log ⁡ p i + ( 1 − λ ) q i ⋅ ( 1 − λ ) ( − log ⁡ q i ) ) = ∑ i = 1 n ( λ p i ⋅ − log ⁡ p i + ( 1 − λ ) q i ⋅ ( 1 − λ ) ( − log ⁡ q i ) ) + ∑ i = 1 n ( λ p i ⋅ ( 1 − λ ) ( − log ⁡ q i ) ) + ( 1 − λ ) q i ⋅ − log ⁡ p i ) ≥ ∑ i = 1 n ( λ p i ⋅ − log ⁡ p i + ( 1 − λ ) q i ⋅ ( 1 − λ ) ( − log ⁡ q i ) ) = λ 2 H ( p ) + ( 1 − λ ) 2 H ( q ) = λ H ( p ) + ( 1 − λ ) H ( q ) H(\lambda p + (1- \lambda) q))=\sum_{i=1}^n-(\lambda p_i+(1-\lambda ) q_i)\cdot \log(\lambda p_i+(1-\lambda )q_i)\\ =\sum_{i=1}^n(\lambda p_i+(1-\lambda ) q_i)\cdot -\log(\lambda p_i+(1-\lambda )q_i)\\ \geq \sum_{i=1}^n (\lambda p_i+(1-\lambda)q_i) (\lambda \cdot -\log p_i+(1-\lambda) (-\log q_i))\\=\sum_{i=1}^n(\lambda p_i\cdot -\log p_i + \lambda p_i \cdot (1-\lambda) (-\log q_i)) + (1-\lambda)q_i \cdot -\log p_i+ (1-\lambda)q_i \cdot (1-\lambda) (-\log q_i))\\=\sum_{i=1}^n(\lambda p_i\cdot -\log p_i + (1-\lambda)q_i \cdot (1-\lambda) (-\log q_i))+\sum_{i=1}^n(\lambda p_i \cdot (1-\lambda) (-\log q_i)) + (1-\lambda)q_i \cdot -\log p_i)\\\geq\sum_{i=1}^n(\lambda p_i\cdot -\log p_i + (1-\lambda)q_i \cdot (1-\lambda) (-\log q_i))\\ =\lambda^2 H(p)+(1-\lambda)^2H(q)\\=\lambda H(p)+(1-\lambda)H(q) H(λp+(1λ)q))=i=1n(λpi+(1λ)qi)log(λpi+(1λ)qi)=i=1n(λpi+(1λ)qi)log(λpi+(1λ)qi)i=1n(λpi+(1λ)qi)(λlogpi+(1λ)(logqi))=i=1n(λpilogpi+λpi(1λ)(logqi))+(1λ)qilogpi+(1λ)qi(1λ)(logqi))=i=1n(λpilogpi+(1λ)qi(1λ)(logqi))+i=1n(λpi(1λ)(logqi))+(1λ)qilogpi)i=1n(λpilogpi+(1λ)qi(1λ)(logqi))=λ2H(p)+(1λ)2H(q)=λH(p)+(1λ)H(q)
因为 q i q_i qi p i p_i pi都是0-1的概率,所以一长串要大于单独的剩下两项。同时,尽管最后有 λ 2 \lambda^2 λ2 ( 1 − λ ) 2 (1-\lambda)^2 (1λ)2,因为关注的是线性组合,这都是常数,可以改写成另一种常数,(这里我不确定是否合理,希望小伙伴多多指正)所以这是最后的化简结果。

最后得到 H ( λ p + ( 1 − λ ) q ) ≥ λ H ( p ) + ( 1 − λ ) H ( q ) H(\lambda p+(1-\lambda)q)\geq\lambda H(p)+(1-\lambda)H(q) H(λp+(1λ)q)λH(p)+(1λ)H(q),即熵是凹函数。

这是利用了Jensen不等式来辅助证明的。

下面知乎博客的证明式子更直接简单易于理解。直接看图。

image-20240508114904820

GPT推导

GPT给的回答是这样,但现在理解不了。

好的,让我们重新审视熵是凹函数这一性质,并结合之前的讨论。

我们知道熵$ ( H(X) ) $的定义为:

[ H ( X ) = − ∑ x P ( x ) log ⁡ P ( x ) ] [ H(X) = - \sum_{x} P(x) \log P(x) ] [H(X)=xP(x)logP(x)]

我们需要证明熵的二阶导数是负的,即$ ( \frac{{d2H}}{{dx2}} < 0 )$。

首先,我们计算一阶导数:

[ d H d x = − ∑ x ( d P ( x ) d x log ⁡ P ( x ) + P ( x ) d ( log ⁡ P ( x ) ) d x ) ] [ \frac{{dH}}{{dx}} = - \sum_{x} \left( \frac{{dP(x)}}{{dx}} \log P(x) + P(x) \frac{{d(\log P(x))}}{{dx}} \right) ] [dxdH=x(dxdP(x)logP(x)+P(x)dxd(logP(x)))]

接着,计算二阶导数:

[ d 2 H d x 2 = − ∑ x ( d 2 P ( x ) d x 2 log ⁡ P ( x ) + 2 d P ( x ) d x d ( log ⁡ P ( x ) ) d x + P ( x ) d 2 ( log ⁡ P ( x ) ) d x 2 ) ] [ \frac{{d^2H}}{{dx^2}} = - \sum_{x} \left( \frac{{d^2P(x)}}{{dx^2}} \log P(x) + 2 \frac{{dP(x)}}{{dx}} \frac{{d(\log P(x))}}{{dx}} + P(x) \frac{{d^2(\log P(x))}}{{dx^2}} \right) ] [dx2d2H=x(dx2d2P(x)logP(x)+2dxdP(x)dxd(logP(x))+P(x)dx2d2(logP(x)))]

现在,让我们考虑概率分布$ ( P(x) ) $的条件:

  1. 所有的概率值都必须是非负的: ( P ( x ) ≥ 0 ) ( P(x) \geq 0 ) (P(x)0),对于所有的$ ( x )$。
  2. 所有概率值的总和必须为1: ( ∑ x P ( x ) = 1 ) ( \sum_{x} P(x) = 1 ) (xP(x)=1)

根据上述讨论,我们知道 ( P ( x ) ) ( P(x) ) (P(x))是非负的,因此 ( d P ( x ) d x ) ( \frac{{dP(x)}}{{dx}} ) (dxdP(x))也是非负的。对数函数的二阶导数是负的。因此,我们可以得出结论:

  1. ( d 2 P ( x ) d x 2 ) ( \frac{{d^2P(x)}}{{dx^2}} ) (dx2d2P(x))是非负的。
  2. ( d 2 ( log ⁡ P ( x ) ) d x 2 ) ( \frac{{d^2(\log P(x))}}{{dx^2}} ) (dx2d2(logP(x)))是负的。

由于所有的概率值 ( P ( x ) ) (P(x)) (P(x)) 的总和为1,因此其一阶导数 ( f r a c d P ( x ) d x ) ( frac{{dP(x)}}{{dx}} ) (fracdP(x)dx)的积分为0。这意味着对数函数的一阶导数 ( d ( log ⁡ P ( x ) ) d x ) ( \frac{{d(\log P(x))}}{{dx}} ) (dxd(logP(x)))的积分也为0。

综合以上结果,我们可以得出结论:熵 ( H ( X ) ) ( H(X) ) (H(X))的二阶导数是负的,即 ( H ( X ) ) ( H(X) ) (H(X))是凹函数。

这个证明表明,无论概率分布 ( P ( x ) ) ( P(x) ) (P(x))是如何变化的,其熵的凹性质始终成立,这是信息论中一个重要的性质。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/602656.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【计算机网络】因特网概述

一.发展的三个阶段 二.ISP介绍 因特网服务提供者&#xff08;Internet Service Provider&#xff09;&#xff0c;简称ISP&#xff0c;普通用户是通过 ISP 接入到因特网的&#xff0c;ISP 可以从因特网管理机构申请到成块的 IP 地址&#xff0c;同时拥有通信线路以及路由器等连…

Linux 第二十三章

&#x1f436;博主主页&#xff1a;ᰔᩚ. 一怀明月ꦿ ❤️‍&#x1f525;专栏系列&#xff1a;线性代数&#xff0c;C初学者入门训练&#xff0c;题解C&#xff0c;C的使用文章&#xff0c;「初学」C&#xff0c;linux &#x1f525;座右铭&#xff1a;“不要等到什么都没有了…

AR人脸道具SDK解决方案,实现道具与人脸的自然融合

AR人脸道具SDK解决方案&#xff0c;实现道具与人脸的自然融合美摄科技以其卓越的技术实力和创新能力&#xff0c;为企业带来了全新的AR人脸道具SDK解决方案。这一解决方案将为企业打开全新的市场机会&#xff0c;为用户带来前所未有的互动体验。 颠覆传统&#xff0c;开启AR人…

如何使用cPanel的Transfers功能迁移cPanel账户

近期由于我们的原虚拟主机提供商不再支持低版本的PHP&#xff0c;我们准备将所有的cPanel账户都迁移到在Hostease购买的独立服务器中&#xff0c;新购买的独立服务器配置了cPanel&#xff0c;下面我就介绍如何使用cPanel的Transfers功能&#xff0c;将旧服务器的cPanel账户迁移…

5月的现货黄金价格还会涨吗

近期美国经济陷入滞胀的预期升温&#xff0c;市场对美联储年内降息的预期有所走低&#xff0c;然而目前美国10年期国债的实际收益率已处于2%左右的历史高位&#xff0c;降息空间最终还是打开&#xff0c;带来实际利率的趋势下行——在去全球化的背景下&#xff0c;美元信用持续…

Tuxera NTFS for Mac Mac用户无缝地读写NTFS格式的硬盘和U盘

在数字化时代&#xff0c;数据交换和共享变得日益重要。然而&#xff0c;对于Mac用户来说&#xff0c;与Windows系统之间的文件交换可能会遇到一些挑战。这是因为Mac OS默认不支持Windows常用的NTFS文件系统。幸运的是&#xff0c;Tuxera NTFS for Mac为我们提供了一个优雅的解…

JAVA代码审计2个小tips

1、lib文件过多时&#xff0c;快速定位lib代码文件 如已知java-callgraph找出的类名 但不知道在哪个lib文件时可利用该工具快速获取到相关lib&#xff0c;适用于大量不知道lib文件的情况。 SearchClassInJar.jar 2、快速定位api路由思路 静态&#xff1a; springmvc框架 …

内容安全(AV)

防病毒网关&#xff08;AV&#xff09;简介 基于网络侧 识别 病毒文件&#xff0c;工作范围2~7层。这里的网关指的是内网和外网之间的一个关口&#xff0c;在此进行病毒的查杀。在深信服中就有一个EDR设备&#xff0c;该设备就是有两种部署&#xff0c;一个部署在网关&#xf…

[Kubernetes] KubeKey 部署 K8s v1.28.8

文章目录 1.K8s 部署方式2.操作系统基础配置3.安装部署 K8s4.验证 K8s 集群5.部署测试资源 1.K8s 部署方式 kubeadm: kubekey, sealos, kubespray二进制: kubeaszrancher 2.操作系统基础配置 主机名内网IP外网IPmaster192.168.66.2139.198.9.7node1192.168.66.3139.198.40.17…

【竞技宝】英超:曼联4球惨败水晶宫,滕哈赫下课倒计时

曼联在本轮客场挑战水晶宫,这场比赛对于红魔来说就是不折不扣的复仇之战。因为,曼联曾经主场输给过水晶宫。所以,曼联再次遇到水晶宫,自然是憋着一口气要复仇。只是,曼联重压之下彻底迷失,被水晶宫4比0击溃。或许赛前有部分红魔球迷,会预料到曼联可能会输球,但是他们绝对不会想…

【Golang】VSCode进行GO的调试

原来的launch.json {"version": "0.2.0","configurations": [{"name": "Golang","type": "go","request": "launch","program": "${workspaceFolder}","…

[QNX] BSP 网络性能优化:调优io-pkt和ClockPeriod提升网速

0 概要 本文介绍如何在QNX系统上优化网络性能&#xff0c;主要通过调整io-pkt和ClockPeriod参数来实现。通过优化&#xff0c;网络吞吐量可以得到显著提升。 1 优化方法 1.1 调整io-pkt的mclbytes参数: io-pkt是QNX系统中常用的网络协议栈&#xff0c;其mclbytes参数指定了…

LearnOpenGL(八)之光照

一、冯氏光照模型 冯氏光照模型(Phong Lighting Model)主要由环境(Ambient)、漫反射(Diffuse)和镜面(Specular)光照这三部分组成&#xff0c;各效果如下&#xff1a; 1、环境光照 即使在黑暗的情况下&#xff0c;世界上通常也仍然有一些光亮&#xff08;月亮、远处的光&#…

只允许内网访问时,如何设置hosts

1、Hosts文件简介 hosts文件是一个没有扩展名的计算机文件&#xff0c;用于将主机名与对应的 IP 地址关联起来。在操作系统中&#xff0c;hosts文件通常用于在本地解析域名&#xff0c;以便将域名映射到特定的IP地址。这个文件可以用来屏蔽广告、加速访问特定网站、解决DNS解析…

微服务项目实战-黑马头条(十三):持续集成

文章目录 项目部署_持续集成1 今日内容介绍1.1 什么是持续集成1.2 持续集成的好处1.3 今日内容 2 软件开发模式2.1 软件开发生命周期2.2 软件开发瀑布模型2.3 软件的敏捷开发 3 Jenkins安装配置3.1 Jenkins介绍3.2 Jenkins环境搭建3.2.1 Jenkins安装配置3.2.2 Jenkins插件安装3…

第十四届蓝桥杯大赛软件赛省赛(Python大学A组)

2023年蓝桥杯 省赛真题Python大学A组 试题A&#xff1a;特殊日期 试题B&#xff1a;分糖果 试题C&#xff1a;三国游戏 试题D&#xff1a;平均 试题E&#xff1a;翻转 试题F&#xff1a;子矩阵 试题G&#xff1a;阶乘的和 …

张大哥笔记:先挣小钱,再赚大钱

先挣小钱&#xff0c;再赚大钱&#xff01;挣小钱&#xff0c;无需向上社交&#xff01; 现在很流行向上社交&#xff0c;反正只要前面加上一个向上&#xff0c;就感觉很牛逼的样子&#xff0c;有必要吗&#xff1f;我认为是没有必要的。 人活着不是为了社交&#xff0c;而是找…

大模型日报|今日必读的 4 篇大模型论文

大家好&#xff0c;今日必读的大模型论文来啦&#xff01; 1.清华、智谱AI 团队推出无限超分辨率模型 Inf-DiT 近年来&#xff0c;扩散模型在图像生成方面表现出了卓越的性能。然而&#xff0c;由于在生成超高分辨率图像&#xff08;如 40964096&#xff09;的过程中内存会二…

银河麒麟QT项目打包详细教程

银河麒麟QT项目打包详细教程 一、QT项目打包 下载linuxdeployqt&#xff0c;下载地址&#xff1a;https://github.com/probonopd/linuxdeployqt/releases 安装Linuxdeployqt 2.1 为了安装方便&#xff0c;将下载下来的文件名称改短些 mv linuxdeployqt-6-x86_64.AppImage lin…

数据分析从入门到精通 1.numpy剑客修炼

会在某一瞬间突然明白&#xff0c;有些牢笼是自己给自己的 —— 24.5.5 一、数据分析秘笈介绍 1.什么是数据分析 是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来&#xff0c;总结出所研究对象的内在规律。使得数据的价值最大化 案例&#xff1a; 分析用户的消…