【信息熵理论-01】最大熵的分布

文章目录

  • 一、说明
  • 二、如何认识所谓的“熵”
  • 三、熵最大化问题
    • 3.1 设置最大化
    • 3.2 利用变分微积分
  • 四、更广泛的影响和见解

一、说明

   我觉得用最大熵来获取概率分布的方法很给力。您采用一些已知或约束,然后在这些条件下最大化信息熵,瞧!你有一个独特的概率分布。很酷的是,这些最大熵分布非常常见,因此这是一种重新推导我们日常遇到的许多分布的巧妙方法。对我来说,仅此一点就值得付出代价。但从信息论的角度来看,这些将是偏差最小的先验分布(我们最大化我们的无知),因此随后的贝叶斯定理实验将 最大化获得的信息。此外,自然界中发现的许多物理模式都倾向于最大熵概率分布。因此,即使作为理解世界的一种方式,最大熵也是一个非常有用且深入的工具。

   以下是一些常见的概率分布以及如何根据最大熵原理推导出它们。

二、如何认识所谓的“熵”

   要想认识谓熵的概念,首先要认识“信息”的价值,所谓“信息”的“价值”我们可以如下描述:
1)越是概率小的事物,其信息更有价值。
2)对于一个固定的分布,其总熵是个固定值。
3)对于一系列可变化参数的分布,其总熵是个函数。

   对于连续函数: 熵是一个最初植根于热力学的概念,在信息论和统计学中具有重要意义。在概率分布的背景下,熵衡量与随机变量相关的不确定性或不可预测性。对于概率密度函数为 p(x) 的连续随机变量 X,熵 H 在数学上定义为:
E ( p ) = − ∫ a b p ( x ) [ l o g p ( x ) ] d x E(p)=-\int_{a}^{b}{p(x)[logp(x)]}dx E(p)=abp(x)[logp(x)]dx
离散分布中,我们给出一般的熵函数为:​

E = ∑ i = 1 N p i × ( l n ( 1 p i ) ) E = \sum^N_{i=1}p_i\times(ln(\frac{1}{p_i})) E=i=1Npi×(ln(pi1))

三、熵最大化问题

   熵最大化问题问:在给定均值μ和方差 σ2 的所有概率分布中,哪个分布使熵 H 最大化?这是信息论和统计力学中的一个经典问题,反映了最大熵原理作为一种推理方法。

3.1 设置最大化

   为了解决这个问题,我们通过一个功能优化框架来解决这个问题。我们的任务是最大化熵泛函:
J [ p ] = − ∫ p ( x ) l o g [ p ( x ) ] d x J[p]=-\int p(x) log[p(x)]dx J[p]=p(x)log[p(x)]dx
受规范化条件约束的约束
∫ p ( x ) d x = 1 \int p(x) dx=1 p(x)dx=1
平均约束:
∫ x p ( x ) d x = μ \int xp(x) dx=\mu xp(x)dx=μ
和方差约束:
∫ ( x − μ ) 2 p ( x ) d x = σ 2 \int (x-\mu)^2p(x) dx=\sigma^2 (xμ)2p(x)dx=σ2

   这些约束确保概率分布 p(x) 被正确归一化,具有正确的均值μ和指定的方差 σ2。这些是分析任何概率分布时必须满足的基本条件,尤其是在讨论熵等属性时。

3.2 利用变分微积分

   变分演算提供了求解此约束优化问题所需的工具。我们制定了一个拉格朗日量,其中包含拉格朗日乘数 λ0、λ1 和 λ2 的约束:
在这里插入图片描述
p(x) 的推导与求解

   L 相对于 p 的第一个变化导致了极值的条件。将导数设置为零,我们发现:
在这里插入图片描述
这导致我们将 p(x) 表示为:
在这里插入图片描述
应用约束可以简化乘数,从而得到:
在这里插入图片描述
在这里插入图片描述
因此,概率密度函数变为:
在这里插入图片描述
要最终确定 λ0,请使用归一化条件:

在这里插入图片描述

   求解此问题后,您发现 λ0 对应于高斯分布的归一化因子,从而确认:
在这里插入图片描述
   该推导最终表明,正态分布在给定均值和方差的约束下使熵最大化,体现了其在这些条件下以最“不确定”的方式分配概率质量的独特性质。

四、更广泛的影响和见解

   该证明不仅证明了为什么正态分布在许多统计应用中是一种自然选择,而且还说明了熵和统计推断之间的联系。这一结果对于理解复杂系统的行为至关重要,并且是从物理学到金融等领域的许多原理的基础。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/598501.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

前端基础学习html(2)

目录 表格标签&#xff1a; 列表标签&#xff1a; 表格标签&#xff1a; <!-- 表格基本架构 --><!-- tr表示一行&#xff0c;td表示一行内单元格 --><!--th为第一行表头加粗居中显示 --><table border"1"><thead><tr><th&g…

【Linux】17. 进程间通信 --- 管道

1. 什么是进程间通信(进程间通信的目的) 数据传输&#xff1a;一个进程需要将它的数据发送给另一个进程 资源共享&#xff1a;多个进程之间共享同样的资源。 通知事件&#xff1a;一个进程需要向另一个或一组进程发送消息&#xff0c;通知它&#xff08;它们&#xff09;发生了…

sqlmodel实现唯一性校验3,检查多列同时重复

之前的方案虽然能够解决重复性问题&#xff0c;但是没有覆盖到多列同时重复的情况。 比如&#xff0c;我们可以认为用户名是可以重复的。但是用户名和年龄不能同时重复&#xff0c;那么这种情况该怎么解决呢&#xff1f; 之前的代码如下&#xff1a; from sqlalchemy import…

python直接发布到网站wordpress之三批量发布图片

在前面的文章中&#xff0c;实现了使用python操作wordpress发布文字内容和图片内容。 python直接发布到网站wordpress之一只发布文字-CSDN博客 python直接发布到网站wordpress之二发布图片-CSDN博客 不过&#xff0c;此时发布图片的数量只能是一张图片。但在实际应用中&…

效率跨越式提升的工农业对机器人专业的需求

需求 需要用人的地方一定会逐步收缩。 原来需要人的地方也会逐步被机器人取代。 机器人这个专业最强的悖论就是可以部分取代人。 此处&#xff1a;用人的地方是指“工农业”&#xff0c;包括工业和农业。 机器人工程行业算制造业吗 机器人工程终身学习和工作计划 趋势 工匠…

1077 互评成绩计算

solution 总成绩 &#xff08;老师成绩 同学去掉最高分去掉最低分的平均分&#xff09;/2&#xff0c;其中总成绩四舍五入取整 #include<iostream> #include<algorithm> using namespace std; int main(){int n, m, worst, better, sum, g, x, cnt;scanf("…

【数学建模】天然肠衣搭配问题

2011高教社杯全国大学生数学建模竞赛D题 天然肠衣&#xff08;以下简称肠衣&#xff09;制作加工是我国的一个传统产业&#xff0c;出口量占世界首位。肠衣经过清洗整理后被分割成长度不等的小段&#xff08;原料&#xff09;&#xff0c;进入组装工序。传统的生产方式依靠人工…

每日OJ题_DFS解决FloodFill⑤_力扣417. 太平洋大西洋水流问题

目录 力扣417. 太平洋大西洋水流问题 解析代码 力扣417. 太平洋大西洋水流问题 417. 太平洋大西洋水流问题 难度 中等 有一个 m n 的矩形岛屿&#xff0c;与 太平洋 和 大西洋 相邻。 “太平洋” 处于大陆的左边界和上边界&#xff0c;而 “大西洋” 处于大陆的右边界和下…

自动控制原理MATLAB:控制系统模型构建

在MATLAB中&#xff0c;常用的系统建模方法有传递函数模型、零极点模型以及状态空间模型等。 1系统传递函数模型描述&#xff1a; 命令格式&#xff1a; systf(num,den,Ts); 其中&#xff0c;num、den为分子多项式降幂排列的系数向量,Ts表示采样时间&#xff0c;缺省时描述…

AI 数据观 | TapData Cloud + MongoDB Atlas:大模型与 RAG 技术有机结合,落地实时工单处理智能化解决方案

本篇为「AI 数据观」系列文章第二弹&#xff0c;在这里&#xff0c;我们将进一步探讨 AI 行业的数据价值。以 RAG 的智能工单应用场景为例&#xff0c;共同探索如何使用 Tapdata Cloud MongoDB Atlas 实现具备实时更新能力的向量数据库&#xff0c;为企业工单处理的智能化和自…

在小黑框如何用Python写出多行代码

平时使用python自带的小黑框编译器只能一行代码一行代码的写&#xff0c; 方法一 可以新建一个文本txt格式&#xff0c;然后打开在里面输入你想要的Python代码&#xff0c;然后把名字改成xxx.py&#xff0c;然后点击小黑框&#xff0c;输入 python 把Py文件拖过来回车就行 方…

Hive内部表、外部表

Hive内部表、外部表 1. 内部表&#xff08;Managed Table&#xff09;&#xff1a; 内部表是由Hive完全管理的表&#xff0c;包括数据和元数据。当你删除内部表时&#xff0c;Hive会同时删除表的数据和元数据。内部表的数据存储在Hive指定的默认位置&#xff08;通常是HDFS上…

VBA 创建透视表,录制宏,自动化报表

目录 一. 数据准备二. 需求三. 准备好报表模板四. 执行统计操作&#xff0c;录制宏4.1 根据数据源创建透视表4.2 填充数据到报表4.3 结束宏录制 五. 执行录制好的宏&#xff0c;自动化报表 一. 数据准备 ⏹数据源1 姓名学科成绩丁志敏语文91李平平语文81王刚语文64张伊语文50…

【前端】HTML基础(1)

文章目录 前言一、什么是前端二、HTML基础1、 HTML结构1.1 什么是HTML页面1.2 认识HTML标签1.3 HTML文件基本结构1.3 标签层次结构1.4 创建html文件1.5 快速生成代码框架 三、Emmet快捷键 前言 这篇博客仅仅是对HTML的基本结构进行了一些说明&#xff0c;关于HTML的更多讲解以及…

新能源电燃灶:为人类社会贡献高品质的健康生活

华火新能源电燃灶&#xff0c;作为一种创新的厨房设备&#xff0c;近年来逐渐走进了千家万户&#xff0c;成为了现代家庭厨房的新宠。它不仅改变了传统的烹饪方式&#xff0c;更在环保、节能、安全等方面为人类带来了诸多贡献。本文将从多个方面探讨华火新能源电燃灶对人类的贡…

知行之桥EDI系统跨平台版本安装报错及解决方案

本文将为大家介绍如何在Windows系统中安装知行之桥EDI系统跨平台版本的常见报错以及解决方案。如下图所示&#xff1a; 在知行软件官网的导航栏中点击 下载 按钮&#xff0c;即可看到知行之桥EDI系统不同版本的下载选项&#xff0c;点击右侧跨平台版本&#xff0c;选择 Windows…

移动硬盘无法被识别怎么办?恢复移动硬盘3个正确做法

移动硬盘已成为我们日常生活和工作中不可或缺的数据存储设备。然而当移动硬盘突然无法被电脑识别时&#xff0c;往往会让人倍感焦虑。面对这种情况我们不必过于慌张&#xff0c;下面一起来看看指南解决。 解决方法一&#xff1a;检查硬件连接与供电 检查接口连接&#xff1a…

uniapp离线在Xcode上打包后提交审核时提示NSUserTrackingUsageDescription的解决方法

uniapp离线在Xcode上打包后提交审核时提示NSUserTrackingUsageDescription的解决方法 问题截图&#xff1a; 亲测有效的方法 方法一&#xff1a; 选择通过uniapp的开发工具Hbuilder来进行在线打包&#xff0c;取消默认勾选的以下选项。 然后进行在线打包就不会存在提交审…

山东省文史书画研究会成立20周年系列活动徽标征集胜选名单公布

2024年5月1日&#xff0c;山东省文史书画研究会成立20周年系列活动徽标征集落下帷幕。征稿启事下发后&#xff0c;得到社会各界人士的广泛关注与参与&#xff0c;共收到设计方案608件。经过初评&#xff0c;选出5幅作品进入复评&#xff0c;并经过网络投票和专家投票相结合的方…

linux——主从同步

1. 保证主节点开始二进制日志&#xff0c;从节点配置中继日志 2. 从节点的开启一个 I/O 线程读取主节点二进制日志的内容 3. 从节点读取主节点的二进制日志之后&#xff0c;会将去读的内容写入从节点的中继日志 4. 从节点开启 SQL 线程&#xff0c;读取中继日志的内容&a…