协方差(Covariance)与得分函数:从Fisher信息矩阵看统计关联

协方差与得分函数:从Fisher信息矩阵看统计关联

协方差(Covariance)是统计学中一个基础但强大的概念,它描述了两个随机变量之间的关系。在Fisher信息矩阵中,协方差以一种特别的形式出现:得分函数的协方差。你可能注意到它的定义 ( I ( θ ) i j = E [ s i s j ] I(\theta)_{ij} = E\left[ s_i s_j \right] I(θ)ij=E[sisj] )(其中 ( s i = ∂ log ⁡ p ( x ∣ θ ) ∂ θ i s_i = \frac{\partial \log p(x|\theta)}{\partial \theta_i} si=θilogp(xθ) ))似乎“少了均值”,这是怎么回事?今天我们就从这个角度出发,聊聊协方差的本质、得分函数的特殊性,以及它们在实际中的应用。


什么是协方差?

协方差衡量两个随机变量 ( X X X ) 和 ( Y Y Y ) 如何一起变化,定义为:
Cov ( X , Y ) = E [ ( X − E [ X ] ) ( Y − E [ Y ] ) ] \text{Cov}(X, Y) = E[(X - E[X])(Y - E[Y])] Cov(X,Y)=E[(XE[X])(YE[Y])]

展开后:

Cov ( X , Y ) = E [ X Y ] − E [ X ] E [ Y ] \text{Cov}(X, Y) = E[XY] - E[X]E[Y] Cov(X,Y)=E[XY]E[X]E[Y]

  • 如果协方差为正,( X X X ) 增加时 ( Y Y Y ) 也倾向于增加。
  • 如果为负,则一个增加另一个减少。
  • 如果为零,说明两者在统计上“无关”(但不一定是完全独立的)。

通俗比喻

想象你在观察天气:( X X X ) 是温度,( Y Y Y ) 是降雨量。协方差告诉你,当温度升高时,降雨量是更可能增加(正协方差,像夏天多雨),还是减少(负协方差,像沙漠地区),或者没啥关系(零协方差)。


得分函数与Fisher信息矩阵

在Fisher信息矩阵中,协方差以得分函数的形式出现。得分函数是対数似然函数对参数的偏导数:

s i = ∂ log ⁡ p ( x ∣ θ ) ∂ θ i , s j = ∂ log ⁡ p ( x ∣ θ ) ∂ θ j s_i = \frac{\partial \log p(x|\theta)}{\partial \theta_i}, \quad s_j = \frac{\partial \log p(x|\theta)}{\partial \theta_j} si=θilogp(xθ),sj=θjlogp(xθ)

Fisher信息矩阵的元素定义为:

I ( θ ) i j = E [ s i s j ∣ θ ] I(\theta)_{ij} = E\left[ s_i s_j \bigg| \theta \right] I(θ)ij=E[sisj θ]

这被描述为“得分函数的协方差”,反映了参数 ( θ i \theta_i θi ) 和 ( θ j \theta_j θj ) 变化时似然波动的关联性。

为什么“少了均值”?

你可能会疑惑:普通的协方差定义是 ( E [ X Y ] − E [ X ] E [ Y ] E[XY] - E[X]E[Y] E[XY]E[X]E[Y] ),而这里只有 ( E [ s i s j ] E[s_i s_j] E[sisj] ),似乎少了 ( − E [ s i ] E [ s j ] -E[s_i]E[s_j] E[si]E[sj] ) 这一项。这是定义错误,还是有意为之?

答案在于得分函数的一个关键性质:它的期望为零。即:

E [ s i ∣ θ ] = E [ ∂ log ⁡ p ( x ∣ θ ) ∂ θ i ∣ θ ] = 0 E[s_i | \theta] = E\left[ \frac{\partial \log p(x|\theta)}{\partial \theta_i} \bigg| \theta \right] = 0 E[siθ]=E[θilogp(xθ) θ]=0

为什么期望为零?

证明很简单:

E [ s i ] = ∫ ∂ log ⁡ p ( x ∣ θ ) ∂ θ i p ( x ∣ θ )   d x = ∫ 1 p ∂ p ∂ θ i p   d x = ∫ ∂ p ∂ θ i   d x E[s_i] = \int \frac{\partial \log p(x|\theta)}{\partial \theta_i} p(x|\theta) \, dx = \int \frac{1}{p} \frac{\partial p}{\partial \theta_i} p \, dx = \int \frac{\partial p}{\partial \theta_i} \, dx E[si]=θilogp(xθ)p(xθ)dx=p1θippdx=θipdx

因为 ( p ( x ∣ θ ) p(x|\theta) p(xθ) ) 是概率密度,总积分恒为1:

∂ ∂ θ i ∫ p ( x ∣ θ )   d x = ∫ ∂ p ∂ θ i   d x = 0 \frac{\partial}{\partial \theta_i} \int p(x|\theta) \, dx = \int \frac{\partial p}{\partial \theta_i} \, dx = 0 θip(xθ)dx=θipdx=0

在正则条件下(积分和导数可交换),( E [ s i ] = 0 E[s_i] = 0 E[si]=0 )。同样,( E [ s j ] = 0 E[s_j] = 0 E[sj]=0 )。

回到协方差

既然 ( E [ s i ] = 0 E[s_i] = 0 E[si]=0 ),( E [ s j ] = 0 E[s_j] = 0 E[sj]=0 ):

Cov ( s i , s j ) = E [ ( s i − E [ s i ] ) ( s j − E [ s j ] ) ] = E [ s i s j ] − E [ s i ] E [ s j ] = E [ s i s j ] − 0 ⋅ 0 = E [ s i s j ] \text{Cov}(s_i, s_j) = E[(s_i - E[s_i])(s_j - E[s_j])] = E[s_i s_j] - E[s_i]E[s_j] = E[s_i s_j] - 0 \cdot 0 = E[s_i s_j] Cov(si,sj)=E[(siE[si])(sjE[sj])]=E[sisj]E[si]E[sj]=E[sisj]00=E[sisj]

所以,( I ( θ ) i j = E [ s i s j ] I(\theta)_{ij} = E[s_i s_j] I(θ)ij=E[sisj] ) 确实就是得分函数的协方差,没有“少”任何项,只是因为均值为零,协方差简化为期望积的形式。


得分函数协方差的意义

在Fisher信息矩阵中,( I ( θ ) i j I(\theta)_{ij} I(θ)ij ) 作为得分函数的协方差,有什么特别含义呢?

  • 对角元素(如 ( I i i I_{ii} Iii )):是 ( s i s_i si ) 的方差,衡量单个参数 ( θ i \theta_i θi ) 变化时似然波动的强度。值越大,数据对 ( θ i \theta_i θi ) 越敏感。
  • 非对角元素(如 ( I i j , i ≠ j I_{ij}, i \neq j Iij,i=j )):是 ( s i s_i si ) 和 ( s j s_j sj ) 的协方差,反映 ( θ i \theta_i θi ) 和 ( θ j \theta_j θj ) 之间的信息关联。如果 ( I i j = 0 I_{ij} = 0 Iij=0 ),说明两者“正交”,调整一个参数不影响另一个。

例如,在正态分布 ( N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) ) 中:

  • ( I μ σ 2 = E [ x − μ σ 2 ⋅ ( − 1 2 σ 2 + ( x − μ ) 2 2 ( σ 2 ) 2 ) ] = 0 I_{\mu\sigma^2} = E\left[ \frac{x - \mu}{\sigma^2} \cdot \left( -\frac{1}{2\sigma^2} + \frac{(x - \mu)^2}{2(\sigma^2)^2} \right) \right] = 0 Iμσ2=E[σ2xμ(2σ21+2(σ2)2(xμ)2)]=0 )
  • ( μ \mu μ ) 和 ( σ 2 \sigma^2 σ2 ) 正交,估计时互不干扰。

协方差的应用

协方差的概念不仅限于Fisher信息矩阵,在统计和机器学习中有广泛应用:

1. 参数估计的不确定性

Fisher信息矩阵的逆 ( I ( θ ) − 1 I(\theta)^{-1} I(θ)1 ) 给出了最大似然估计(MLE)的协方差矩阵近似:

Cov ( θ ^ ) ≈ I ( θ ) − 1 \text{Cov}(\hat{\theta}) \approx I(\theta)^{-1} Cov(θ^)I(θ)1

  • 对角元素是参数估计的方差。
  • 非对角元素是参数间的协方差,反映估计的耦合程度。

2. 数据分析

在数据分析中,协方差矩阵描述多个变量的关系。比如身高和体重可能有正协方差,而温度和降雨量可能有负协方差,帮助我们理解变量间的模式。

3. 主成分分析(PCA)

PCA通过协方差矩阵的特征分解,找到数据的主要变化方向,降维时保留最大方差。

4. 机器学习优化

在自然梯度下降中,Fisher信息矩阵(即得分函数的协方差矩阵)调整梯度方向。如果参数正交(非对角协方差为零),优化更高效,因为梯度方向分离。


总结

协方差是衡量变量关联性的基本工具,在Fisher信息矩阵中以得分函数的形式出现。( I ( θ ) i j = E [ s i s j ] I(\theta)_{ij} = E[s_i s_j] I(θ)ij=E[sisj] ) 之所以直接是期望积,是因为得分函数的均值为零,省去了减均值项。这种协方差不仅揭示了参数的信息含量,还在参数估计、数据分析和优化中发挥关键作用。下次看到协方差时,不妨想想:它背后的均值是不是零?这个小细节可能藏着大智慧!

后记

2025年2月24日23点13分于上海,在Grok3大模型辅助下完成。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/978137.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Uniapp-Vue3】导入uni-id用户体系

在uniapp官网的uniCloud中下载uni-id用户体系 或者直接进入加载,下载地址:uni-id-pages - DCloud 插件市场 进入以后下载插件,打开HbuilderX 选中项目,点击确定 点击跳过 点击合并 右键uniCloud文件夹下的database文件夹&#x…

如何免费使用稳定的deepseek

0、背景: 在AI辅助工作中,除了使用cursor做编程外,使用deepseek R1进行问题分析、数据分析、代码分析效果非常好。现在我经常会去拿行业信息、遇到的问题等去咨询R1,也给了自己不少启示。但是由于官网稳定性很差,很多…

VSCode+PlatformIO报错 找不到头文件

如图示,找不到目标头文件 demo工程运行正常,考虑在src文件夹内开辟自己的代码,添加后没有找到 找了些资料,大概记录如下: 1、c_cpp_properties.json 内记录 头文件配置 .vscode 中,此文件是自动生成的&a…

Python 网络爬虫实战全解析:案例驱动的技术探索

Python 网络爬虫实战全解析:案例驱动的技术探索 本文围绕 Python 网络爬虫展开,深入剖析其技术要点,并通过实际案例演示开发流程。从爬虫原理引入,逐步讲解如何使用 Python 中的requests和BeautifulSoup等库进行网页数据抓取与解…

List(3)

前言 上一节我们讲解了list主要接口的模拟实现,本节也是list的最后一节,我们会对list的模拟实现进行收尾,并且讲解list中的迭代器失效的情况,那么废话不多说,我们正式进入今天的学习 list的迭代器失效 之前在讲解vec…

在zotero里部署papaerschat插件,以接入现有大模型

papaerschat插件里集成了openAI的GPT3.5、gpt-4o、gpt-mini大模型以及Claude3、Gemini、Deepseek等大模型。通过接入这些大模型可以辅助我们阅读论文。以部署方式如下: 1.下载zotero的插件市场,用以管理zotero里的插件。下载地址: https://…

Memory Programming ...Error: File does not exist: Max.hex

Memory Programming ... Error: File does not exist: Max.hex 原因 删了确定就可以了

渗透测试【seacms V9】

搭建seacms环境 我选择在虚拟机中用宝塔搭建环境 将在官网选择的下载下来的文件解压后拖入宝塔面板的文件中 创建网站 添加站点 搭建完成seacmsV9 找到一个报错口 代码分析 <?php set_time_limit(0); error_reporting(0); $verMsg V6.x UTF8; $s_lang utf-8; $dfDbn…

仅需三分钟,使用Vue3.x版本组件式风格实现一个消息提示组件!

一、前言 在日常的前端项目开发中&#xff0c;我们时常需要使用到“消息提示”&#xff08;以下简称“消息”&#xff09;这个组件来帮助我们更好的给予用户提示&#xff0c;例如常见的“登录成功”、“操作成功”、“服务器异常”等等提示。 尽管市面上已经有一些组件库提供了…

敏捷开发实践指南:从理论到落地的全面解析

敏捷工程&#xff1a;现代软件开发的变革与实践 近年来&#xff0c;软件工程领域经历了从传统瀑布模型到敏捷开发的深刻转变。这种转变不仅是技术方法的升级&#xff0c;更是团队协作、需求管理和交付模式的革新。本文将从敏捷开发的核心理念、主流方法、实践案例及未来趋势等…

期权帮|股指期货基差和价差有什么区别?

锦鲤三三每日分享期权知识&#xff0c;帮助期权新手及时有效地掌握即市趋势与新资讯&#xff01; 股指期货基差和价差有什么区别&#xff1f; 一、股指期货基差 股指期货基差是指股指期货价格与其对应的现货指数价格之间的差额。 股指期货基差计算公式&#xff1a;基差 现…

【论文解读】《C-Pack: Packed Resources For General Chinese Embeddings》

论文链接&#xff1a;https://arxiv.org/pdf/2309.07597 本论文旨在构建一套通用中文文本嵌入的完整资源包——C-Pack&#xff0c;解决当前中文文本嵌入研究中数据、模型、训练策略与评测基准缺失的问题。论文主要贡献体现在以下几个方面&#xff1a; 大规模训练数据&#xf…

ARM 处理器平台 eMMC Flash 存储磨损测试示例

By Toradex秦海 1). 简介 目前工业嵌入式 ARM 平台最常用的存储器件就是 eMMC Nand Flash 存储&#xff0c;而由于工业设备一般生命周期都比较长&#xff0c;eMMC 存储器件的磨损寿命对于整个设备来说至关重要&#xff0c;因此本文就基于 NXP i.MX8M Mini ARM 处理器平台演示…

html中的元素(2)

在用块级元素完成网页的组织和布局以后&#xff0c;要为其中的每一个小区块添加内容&#xff0c;就需要用到行内元素&#xff1a; 1.字体样式元素 <!DOCTYPE html> <html> <head><meta charset"utf-8"><title>HTML5 保留的文本格式元…

代码随想录二刷|动态规划12

dp动态规划 动态规划五步曲 动态规划数组的含义 dp[i] 递推公式 动态规划数组的初始化 确定遍历顺序 手动模拟验证 动态规划遇到问题要打印dp数组&#xff0c;看和模拟结果哪里不一样 一 基础问题 斐波那契数 题干 斐波那契数 &#xff08;通常用 F(n) 表示&#xf…

linux 系统 安装禅道教程

禅道&#xff08;ZenTao&#xff09;是一款开源的项目管理软件&#xff0c;特别适用于敏捷开发和团队协作。它集成了需求管理、任务管理、缺陷管理、版本管理、文档管理等功能&#xff0c;旨在帮助团队更高效地管理项目&#xff0c;提升工作协同和开发效率。 禅道的主要特点&a…

CineMaster: 用于电影文本到视频生成的 3D 感知且可控的框架。

CineMaster是一种 3D 感知且可控的文本到视频生成方法允许用户在 3D 空间中联合操纵物体和相机&#xff0c;以创作高质量的电影视频。 相关链接 论文&#xff1a;cinemaster-dev.github.io 论文介绍 CineMaster是一种用于 3D 感知和可控文本到视频生成的新型框架。目标是让用…

Linux红帽:RHCSA认证知识讲解(四)修改远程配置文件,取消root禁用,便于使用root身份远程

Linux红帽&#xff1a;RHCSA认证知识讲解&#xff08;四&#xff09;修改远程配置文件&#xff0c;取消root禁用&#xff0c;便于使用root身份远程 前言一、远程连接的用途和原因二、通过 ssh 远程登陆系统三、默认限制及解决方案&#xff08;一&#xff09;非常规方法一&#…

OpenEuler学习笔记(三十五):搭建代码托管服务器

以下是主流的代码托管软件分类及推荐&#xff0c;涵盖自托管和云端方案&#xff0c;您可根据团队规模、功能需求及资源情况选择&#xff1a; 一、自托管代码托管平台&#xff08;可私有部署&#xff09; 1. GitLab 简介: 功能全面的 DevOps 平台&#xff0c;支持代码托管、C…

Rk3568驱动开发_点亮led灯(手动挡)_5

1.MMU简介 完成虚拟空间到物理空间的映射 内存保护设立存储器的访问权限&#xff0c;设置虚拟存储空间的缓冲特性 stm32点灯可以直接操作寄存器&#xff0c;但是linux点灯不能直接访问寄存器&#xff0c;linux会使能mmu linux中操作的都是虚拟地址&#xff0c;要想访问物理地…