现代信号处理学习笔记(三)信号检测

通过观测数据判断信号是否存在,这一问题称为信号检测。

目录

前言

一、统计假设检验

1、信号检测的基本概念

2、信号检测理论测度

比率测度

概率测度

3、决策理论空间

二、概率密度函数与误差函数

1、概率密度函数

2、误差函数与补余误差函数

三、检测概率与错误概率

1、定义

2、功效函数

四、Neyman-Pearson准则

五、一致最大功效准则

六、Bayes 准则

总结


前言

通过将信号检测视为统计假设检验问题,就可以采用一种通用的数学框架讨论和分析不同情况下的信号检测。本章正是从这一视角出发,对信号检测的有关理论、方法与应用展开讨论。


一、统计假设检验

从理论层面讲,信号检测理论(signal detection theory, SDT)是一种统计假设检验理论:通过分析来自实验的数据,对模棱两可的刺激源(或称响应)作出判决:它究竟是由某个已知过程产生的信号,抑或仅仅是噪声而已。信号检测理论广泛应用于差异悬殊的众多邻域。

1、信号检测的基本概念

传感过程由传输和感知两个过程组成:物理世界的信(号)源经过传输和转换,变成可以观测的数据;然后通过传感单元感知或观测。被感知的物理过程或现象称为刺激源,感知或传感结果称为观测数据。由于单个数据难以做出正确的统计决策,所以有必要使用一组观测数据,经由检测单元对该组观测数据做出统计推断或者决策。得到的推断或决策结果称为响应。这一响应通过显示单元输出。

从计算角度看,信号检测理论是一种计算框架(computational framework),它描述如何从噪声中抽取信号,同时对可能影响抽取过程的偏差和其他因素作出解释。

在信号检测中,现实情况分为信号存在和不存在两种情况,其中信号不存在对应为噪声存在。决策或判决结果要么“是”(肯定),要么“否”(否定),为择一判决。因此,会出现以下四种判决结果:

  1. 真正(True Positive, TP):

    说明信号存在,并且判决结果正确地肯定了信号的存在。
  2. 真负(True Negative, TN):

    说明信号不存在,且判决结果正确地否定了信号的存在。
  3. 假正(False Positive, FP):

    说明信号不存在,但判决结果错误地肯定了信号的存在,这通常称为“误报”或“假警报”。
  4. 假负(False Negative, FN):

    说明信号存在,但判决结果错误地否定了信号的存在,这通常称为“漏报”或“假负警报”。

某个刺激源或响应在实验总次数所占的比例(proportion)又称频次(frequency)或者概率(probability)。

信号检测理论中的四种响应发生的相对频次不是彼此无关的。

信号与噪声识别的主要错误来源有以下三种:

  1. 刺激源可能超出了标准的可视窗口(信号≤噪声):例如紫外线,可视窗口减小(实验或者生理上的),又如色盲等。
  2. 刺激源可能被外部噪声所“掩蔽”,造成信噪比减小。此时,又分为以下两种情况。噪声增大(外部噪声严重影响检测机制)或者空间/时间模糊性增加(例如泥浆溅射效应)。信号减小(外部噪声激活了抑制机制,导致信号的边缘掩蔽)。
  3. 换能器或传感器的变化(实验或神经诱导的增益控制效果规范化失败)。

2、信号检测理论测度

信号检测理论测度(SDT measure)可以用比率或者概率表示。

比率测度

使用比率表示的测度有命中率和虚警率。

命中率(Hit Rate):命中率表示正确检测到信号的比率,即在信号存在的情况下正确地肯定了信号的存在。命中率可以用以下公式表示:

虚警率(False Alarm Rate):虚警率表示在信号不存在的情况下错误地肯定了信号存在的比率,即假正例的比率。虚警率可以用以下公式表示:

概率测度

使用概率表示的测度通常用函数形式表示,称为测度函数。测度函数有两种:\o\o\oΦ函数和逆\o\oΦ函数(inverse phi function)。

3、决策理论空间

整个决策理论空间由以下四个子空间组成:

  • S=信号或参数空间
  • Ω=观测样本空间
  • D=决策空间
  • A=行为或结果空间

二、概率密度函数与误差函数

概率密度函数(Probability Density Function, PDF):

  • 定义: 概率密度函数是用来描述随机变量的可能取值的概率分布的数学函数。对于连续型随机变量,概率密度函数是描述该变量在某一取值范围内的概率分布的函数。通常用符号 f(x) 表示。
  • 特点: 概率密度函数必须满足两个条件,即在整个定义域内的取值必须是非负的,并且整个定义域上的积分等于1。

误差函数(Error Function):

  • 定义: 误差函数是一种特殊的数学函数,通常用 erf(x) 表示。在数学、工程和统计学等领域中经常用到误差函数,它描述了一个随机变量的误差在正态分布中的累积概率。
  • 表达式: 误差函数的表达式如下: 
  • 特点: 误差函数的取值范围是在 -1 到 1 之间,而且它的图像呈 S 形,与正态分布的累积分布函数有关。

1、概率密度函数

总是令Ho,H1代表离散的随机事件,它们相互独立;而观测数据y1,…,yN为连续的随机变量。

2、误差函数与补余误差函数

三、检测概率与错误概率

1、定义

S1或者S0信号被正确判断,都属于二元假设检验的正确决策。正确决策发生的概率称为(信号的)检测概率(probability of detection),分为以下两种类型。

以上两个关系式的物理意义分别如下:

由于任何一个信号被正确和错误检测的总概率等于1,所以S0信号的正确检测概率PDo。很自然地应该是总检测概率1减去其错误检测概率α的结果,而S1信号的正确检测概率P,也很自然地等于总检测概率1减去其错误检测概率β。

2、功效函数

功效函数(Power Function)是统计假设检验中的一个重要概念。它与检验的显著性水平和样本大小相关,用来评估在某个统计检验下拒绝虚无假设的能力。在假设检验中,通常我们关注两个错误:第一类错误(Type I Error)和第二类错误(Type II Error)。

  1. 第一类错误(Type I Error): 拒绝了一个实际上是正确的零假设。显著性水平(Significance Level)用来控制第一类错误的概率,通常表示为 α。

  2. 第二类错误(Type II Error): 接受了一个实际上是错误的零假设。功效函数用来评估避免第二类错误的能力,通常表示为 1−β,其中 β 是第二类错误的概率。

功效函数(Power Function)定义为检验拒绝虚无假设的概率,给定实际上是真的备择假设成立。它通常用符号π(θ) 表示,其中 θ 是备择假设的参数。

π(θ)=P(拒绝 H0​∣H1​ 是真的)

信号检测的对象可以分为三种类型,它们分别采用不同的决策准则

四、Neyman-Pearson准则

在实际的信号检测中,有许多应用问题可以归类为这样一种二元假设检验:零假设检验Ho代表仅有噪声的假设,而备择假设检验H则代表观测数据中信号存在的假设。

Neyman-Pearson准则是统计假设检验中的一种方法,旨在在给定显著性水平下,使得检验的功效尽可能大。该准则是由统计学家Jerzy Neyman和Egon Pearson在20世纪20年代提出的。

Neyman-Pearson准则的基本思想是,对于一个给定的显著性水平 α(通常是0.05或0.01),我们设定一个拒绝域,使得在零假设为真时发生第一类错误(拒绝零假设,实际上零假设是正确的)的概率最小。同时,在备择假设为真时,检验的功效(避免第二类错误的能力)尽可能大。

Neyman-Pearson准则的步骤如下:

  1. 设定零假设 H0​ 和备择假设 H1​。

  2. 确定显著性水平 α。

  3. 计算拒绝域。 Neyman-Pearson准则指导我们选择一个拒绝域,使得在零假设为真时发生第一类错误的概率最小。

  4. 计算功效。 在备择假设为真的条件下,计算检验的功效,即避免第二类错误的能力。

这种准则通常应用于二项分布或正态分布等常见分布的假设检验中。它强调在控制第一类错误概率的同时,尽量提高检验的功效。然而,需要注意的是,Neyman-Pearson准则通常较为严格,因为它在设计中需要明确规定拒绝域,并且可能忽略了其他一些信息。在实际应用中,研究人员可能需要综合考虑多个因素,选择适合特定问题的检验方法。

五、一致最大功效准则

一致最大功效准则(Uniformly Most Powerful (UMP) Test)是一种假设检验的原则,其目标是在所有可能的参数值下,检验的功效(避免第二类错误的能力)都是最大的。这个准则在统计推断的理论中起着重要的作用。

UMP检验有一致性的性质,即在样本大小趋向无穷大时,它的功效趋于1。具体来说,UMP检验满足以下性质:

  1. 零假设下的最大功效: 在所有可能的参数值下,UMP检验具有最大的功效,即在零假设为真时发生第二类错误的概率最小。

  2. 一致性: 随着样本大小的增加,UMP检验的功效趋于1,表现出对备择假设的高敏感性。

UMP检验的设计通常要考虑分布族的形式,具体的参数值,以及显著性水平。UMP检验不一定对于所有问题都是唯一的,而且在实际应用中,有时可能难以找到UMP检验。它通常与一些特定的分布族和假设条件相关。

UMP准则的使用通常需要对问题进行详细的数学分析,可能包括拉格朗日乘数法、对数似然比等高级数学工具。UMP检验在统计学理论的发展中发挥了重要作用,为制定具有最佳性能的检验提供了一种理论框架。

六、Bayes 准则

贝叶斯准则基于以下贝叶斯定理:

其中:

  • P(H∣D) 是在观测到数据 D 的条件下,假设 H 成立的后验概率。
  • P(D∣H) 是在假设 H 成立的条件下,观测到数据 D 的概率,即似然。
  • P(H) 是先验概率,即在观测到数据之前,对假设 H 的信念。
  • P(D) 是归一化常数,确保后验概率的总和为1。

基于这个定理,贝叶斯准则的决策规则可以概括为:

  1. 计算先验概率 P(H): 在观测到数据之前,我们对不同假设的信念。
  2. 计算似然 P(D∣H): 在给定各个假设的条件下,观测到实际数据的可能性。
  3. 计算后验概率 P(H∣D): 根据观测到的数据,更新我们对不同假设的信念。
  4. 基于后验概率进行决策: 根据后验概率,选择具有最高概率的假设作为决策。

贝叶斯准则在处理不确定性和更新信息时非常有用,特别是在小样本情况下。然而,先验选择对于结果可能有较大的影响,这也是贝叶斯统计的一项挑战。


总结

通过观测数据判断信号是否存在,这一问题称为信号检测,它本质上是一种统计假设检验。所谓统计假设,就是关于我们感兴趣的一个总体的某个未知特征的主张。检验一个统计假设的根本任务即是:决定关于某个未知特征的主张是否为随机试验的观测样本所支持。通常,这一主张涉及的是采样的随机分布的某个未知参数或者某个未知函数。样本数据是否在统计意义上支持该主张的决定是根据概率作出的。简而言之,如果面对观测数据提供的证据,某个主张正确的机会大,就接受它;否则,便拒绝它。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/429117.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

TypeError: the JSON object must be str, bytes or bytearray, not dict

参考文章:https://blog.csdn.net/yuan2019035055/article/details/124934362 Python基础系列(一)搞懂json数据解析与字典之间的关系 代码: 报错信息: TypeError: the JSON object must be str, bytes or bytearray, not dict …

Python字符串中%d,%.f的用法

在字符串中,我们经常需要改变其中的一些几个字符,比如 第一个d%就是epoch1,会随着epoch的变化而变化。同理,后面的也是。打印出的结果就是 其中,epoch迭代了3次,从0开始。会发现 d%,是整数&…

.NET高级面试指南专题十四【 观察者模式介绍,最常用的设计模式之一】

简介: 观察者模式(Observer Pattern)是一种行为型设计模式,其目的是定义了一种一对多的依赖关系,当一个对象的状态发生变化时,所有依赖于它的对象都会得到通知并自动更新。 原理: 在观察者模式中…

002-CSS-三角形

三角形 普通三角形带阴影的三角形:box-shadow带阴影的三角形:filter 普通三角形 💡 Tips:设置 div 盒子宽高为零,使用单边框实现 .triangle {width: 0;height: 0;border: 20px solid transparent;border-top-color: …

把python完全卸载干净

1.winR,输入control回车,点击程序和功能,在搜索框输入python,右键点击卸载 2、找到Python安装路径,把所有文件全部删除。 安装路径可以打开CMD输入:where python 3、强制删除Python.exe 打开cmd&#xff…

使用Java生成JWT(JSON Web Token)的详细指南

介绍 在现代应用程序中,身份验证和授权是至关重要的。JSON Web Token(JWT)是一种开放标准(RFC 7519),它定义了一种紧凑且自包含的方式用于在各方之间安全地传输信息。在本文中,我们将学习如何使…

大厂报价查询系统性能优化之道!

0 前言 机票查询系统,日均亿级流量,要求高吞吐,低延迟架构设计。提升缓存的效率以及实时计算模块长尾延迟,成为制约机票查询系统性能关键。本文介绍机票查询系统在缓存和实时计算两个领域的架构提升。 1 机票搜索服务概述 1.1 …

在k8s上部署dolphinscheduler

(作者:陈玓玏) 一、 前提条件 已部署k8s,版本信息如下: k8s为单机部署;已部署nfs,版本如下; 二、 部署helm 以下步骤安装的是二进制版本,如果通过脚本安装&#…

Bert Encoder和Transformer Encoder有什么不同

前言:本篇文章主要从代码实现角度研究 Bert Encoder和Transformer Encoder 有什么不同?应该可以帮助你: 深入了解Bert Encoder 的结构实现深入了解Transformer Encoder的结构实现 本篇文章不涉及对注意力机制实现的代码研究。 注:…

在Linux以命令行方式(静默方式/非图形化方式)安装MATLAB(正版)

1.根据教程,下载windows版本matlab,打开图形化界面,选择linux版本的只下载不安装 2.获取安装文件夹 3.获取许可证 4.安装 (1)跳过引用文章的2.2章节 (2)本文的安装文件夹代替引用文章的解压IS…

CSS变量和@property

CSS变量 var() CSS 变量是由CSS作者定义的实体,其中包含要在整个文档中重复使用的特定值。使用自定义属性来设置变量名,并使用特定的 var() 来访问。(比如 color: var(--main-color);)。 基本用法 CSS变量定义的作用域只在定义该…

Rio: Order-Preserving and CPU-Efficient Remote Storage Access——论文泛读

EuroSys 2023 Paper 论文阅读笔记整理 问题 现代NVMe SSD和RDMA网络提供了更高的带宽和并发性,但现有的网络存储系统(例如,基于结构的NVMe),由于存储订购保证效率低下,无法充分利用这些新设备。在这些系统…

[DevOps云实践] 3大云厂商(AWS/GoogleCP/Azure)的服务对比一览

[DevOps云实践] 3大云厂商(AWS/GoogleCP/Azure)的服务对比一览 如今有很多人在使用云端或者把他们的基础架构迁移到云端。每个云服务提供商都有其优势和劣势,大部分情况下您的选择将基于您想要在云中构建什么。您公司的各个团队也很可能会倾向于为他们的特定项目使用不同的…

【论文解读】Robust Collaborative 3D Object Detection in Presence of Pose Errors

CoAlign 摘要引言方法实验结论 摘要 协同3D对象检测利用多个代理之间的信息交换,以在存在诸如遮挡之类的传感器损伤的情况下提高对象检测的准确性。然而,在实践中,由于定位不完善而导致的姿态估计误差会导致空间消息错位,并显著降…

使用html网页播放多个视频的几种方法

前言 因为项目测试需要,我需要可以快速知道自己推流的多路视频流质量,于是我想到可以使用html网页来播放视频,实现效果极其简单,方法有好几种,以下是几种记录: 注意:测试过,VLC需要使…

微服务:Feign篇

1.什么是Feign Feign是一种声明式、模板化的HTTP客户端,可用于调用HTTP API实现微服务之间的远程服务调用。它的特点是使用少量的配置定义服务客户端接口,可以实现简单和可重用的RPC调用。 先来看我们以前利用RestTemplate发起远程调用的代码&#xff…

卡密交易系统 卡密社区SUP系统源码 分销系统平台 分销商城系统开发

卡密社区SUP系统总控源码主站分销系统功能源码 跟以前的卡盟那种控制端差不多总控可以给别人开通,分销,主站,类似自己做系统商一样,自助发卡,卡密交易系统。 搭建环境Nginx1.22 mysql 5.7 php8.1 rids 7.2 安装方法…

【C++】十大排序算法之 插入排序 希尔排序

本次介绍内容参考自:十大经典排序算法(C实现) - fengMisaka - 博客园 (cnblogs.com) 排序算法是《数据结构与算法》中最基本的算法之一。 十种常见排序算法可以分为两大类: 比较类排序:通过比较来决定元素间的相对次序…

鸿蒙开发就业前景以及发展方向分析~

鸿蒙操作系统作为华为公司自主研发的操作系统,已经成为当下炙手可热的话题。作为一个全新的操作系统,鸿蒙开发为IT行业带来了巨大的就业机会。本文将围绕鸿蒙开发的就业前景以及发展方向展开讨论。 一、鸿蒙开发就业前景 随着鸿蒙操作系统的发布&#…

二叉树——从中序与后序遍历序列构造二叉树、654. 最大二叉树、617. 合并二叉树

从中序与后序遍历序列构造二叉树 给定两个整数数组 inorder 和 postorder ,其中 inorder 是二叉树的中序遍历, postorder 是同一棵树的后序遍历,请你构造并返回这颗 二叉树 。 示例 1: 在这里插入代码片 输入:inorder [9,3,15…