使用SPSS的McNemar检验两种深度学习模型的差异性

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

使用SPSS的McNemar检验两种深度学习模型的差异性

  • 前言
  • 简述:
  • 一、McNemar检验
    • 1.1来源
    • 1.2 两配对样本的McNemar(麦克尼马尔)变化显著性检验
    • 1.3 适用范围:
    • 1.4 基于对深度学习模型检测下的检测数据要求:
  • 二、使用SPSS的McNemar检验
    • 2.1 前置
    • 2.2 问题定义
    • 2.3 使用SPSS
      • 2.3.1 非参数检验-相关样本
      • 2.3.2 选择要比较的模型
      • 2.3.3 看结果
  • 参考文章:
  • 如有不足,还请各位大佬指正!


前言

前排提示:
我看到好多McNemar检验的文章没有说如何用到深度学习模型检测的,所以自己给自己做个笔记.本身不难,但是很多文章都写的好乱,例如没有解释为什么深度学习模型中留一法,或者单独留出测试集的k折模型只能用McNemar 测试检验模型差异性。以及零假设是什么,为什么要拒绝。
1.不使用python构建McNemar检验代码
2.使用spss的McNemar检验
方便快捷,适合即时使用

简述:

深度学习模型McNemar检验
对于只能执行一次的算法,McNemar 的测试是唯一具有可接受的 I 类错误的测试。
**数据:**两个对比模型的检测结果与样本对比后的结果(0,1)(0,1表征 T or F)
I 型错误是错误地拒绝实际为真的零假设。
零假设: A和B模型在性能上的差异不具有统计学意义,即差异不显著

一、McNemar检验

1.1来源

McNemar 检验是用于配对 名义数据的统计检验。它应用于具有二分特征的2 × 2列联表,具有匹配的主题对,以确定行和列的边际频率是否相等(即是否存在“边际同质性”)。它以Quinn McNemar 的名字命名,他于 1947 年引入了它。该测试在遗传学中的一个应用是用于检测连锁不平衡的传输不平衡测试。

1.2 两配对样本的McNemar(麦克尼马尔)变化显著性检验

McNemar 检验 是 2 * 2 表的配对检验。
McNemar变化显著性检验以研究对象自身为对照,检验其两组样本变化是否显著。
**原假设: 样本来自的两配对总体分布无显著差异。**即我们后面定义的零假设
要求: McNemar变化显著性检验要求待检验的两组样本的观察值是二分类数据,在实际分析中有一定的局限性。

1.3 适用范围:

具体而言,建议在那些被比较的算法只能评估一次的情况下进行测试,例如,在一个测试集上,而不是通过重采样技术重复评估,例如 k 折交叉验证。

对于只能执行一次的算法,McNemar 的测试是唯一具有可接受的 I 类错误的测试。
对于k折交叉验证,有两种纷争,一种是全部数据进行k折,一种是训练集K折,留出单独一份测试集。不能说哪方对哪方错。选择适合数据的就是对。
所以针对单独留出一份测试集的做法,可以按照定义使用McNemar检验

1.4 基于对深度学习模型检测下的检测数据要求:

数据:两个对比模型的检测结果与样本对比后的结果(0,1)(0,1表征 T or F)

要求:两数据配对,数据完整,不可改变数据顺序

二、使用SPSS的McNemar检验

我们需要对问题进行定义,然后再进行检验。

2.1 前置

在统计假设检验中,I 型错误是错误地拒绝实际为真的零假设。
对于只能执行一次的算法,McNemar 的测试是唯一具有可接受的 I 类错误的测试。

2.2 问题定义

问题:两个深度学习模型在同一测试集下的性能是否有差异性
白话,A比B模型优秀,但是我想知道A比B的优秀是具有统计学意义的。
此时的零假设:
A和B模型在性能上的差异不具有统计学意义,即差异不显著

要拒绝零假设,那么我们最后的检验p值要小于0.05
在这里插入图片描述

2.3 使用SPSS

2.3.1 非参数检验-相关样本

在这里插入图片描述

2.3.2 选择要比较的模型

在这里插入图片描述

然后运行

2.3.3 看结果

在这里插入图片描述

拒绝原假设,模型有差异性

参考文章:

ml-mastery-zh/docs/stat/mcnemars-test-for-machine-learning.md at master · apachecn/ml-mastery-zh · GitHub

McNemar’s检验(配对卡方检验):多种操作教程,总有一个适合你! - 知乎 (zhihu.com)
https://zhuanlan.zhihu.com/p/89205077

泛化性能的比较检验-4-McNemar检验(周志华西瓜书解析) - 知乎 (zhihu.com)
https://blog.csdn.net/orDream/article/details/122540099

SPSS详细操作:配对卡方检验(McNemar’s test) (qq.com)
https://mp.weixin.qq.com/s?__biz=MzI2OTQyMzc5MA==&mid=2247490227&idx=1&sn=16788997b4de52293942da8f40feb76c&chksm=eae1df72dd96566418535e93c537f5df90b2fbc2fa6e4702d4a8c0ce502cddec7f9b3d30b6e1&scene=21#wechat_redirect

麦克尼马尔检验(McNemar test)-CSDN博客
https://blog.csdn.net/orDream/article/details/122540099

如有不足,还请各位大佬指正!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/250721.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

机器学习之无监督学习

聚类:发掘纵向结构的某种模式信息,某些x属于相同的分布或者类别 特征学习:发掘横向结构的某种模式信息,每一行都可以看成是一种属性或特征 密度估计:发掘底层数据分布,x都是从某个未知分布p(x)采出来的&a…

Mysql数据库 19.Mysql 锁

MySQL锁 锁:锁是计算机用以协调多个进程间并发访问同一共享资源的一种机制,在数据库中,除传统的计算资源(CPU、RAM、I/O)的争用以外,数据也是一种供许多用户共享的资源,如何保证数据并发访问的一…

C#中的封装、继承和多态

1.引言 在面向对象的编程中,封装、继承和多态是三个重要的概念。它们是C#语言中的基本特性,用于设计和实现具有高内聚和低耦合的代码。本文将详细介绍C#中的封装、继承和多态的相关知识。 目录 1.引言2. 封装2.1 类2.2 访问修饰符 3. 继承4. 多态4.1 虚方…

高云GW1NSR-4C开发板M3核串口通信

1.PLLVR频率计算 高云的M3核要用到PLLVR核,其输出频率FCLKIN*(FBDIV_SEL1)/(IDIV_SEL1),但同时要满足FCLKIN*(FBDIV_SEL1)*ODIV_SEL)/(IDIV_SEL1)的值在600MHz和1200MHz之间。例如官方示例,其输入频率FCLKIN50MHz,要输出80MHz&am…

鸿蒙原生应用/元服务开发-Stage模型能力接口(三)

一、说明 AbilityLifecycleCallback模块提供应用上下文ApplicationContext的生命周期发生变化时触发相应回调的能力,包括onAbilityCreate、onWindowStageCreate、onWindowStageActive、onWindowStageInactive、onWindowStageDestroy、onAbilityDestroy、onAbilityFo…

一文弄懂自编码器 -- Autoencoders

1. 引言 近年来,自编码器(Autoencoder)一词在许多人工智能相关的研究论文、期刊和学位论文中被频繁提及。自动编码器于1980年推出,是一种用于神经网络的无监督学习技术,可以从未被标注的训练集中学习。 本文重点介绍…

指针进阶篇

指针的基本概念: 指针是一个变量,对应内存中唯一的一个地址指针在32位平台下的大小是4字节,在64位平台下是8字节指针是有类型的,指针类型决定该指针的步长,即走一步是多长指针运算:指针-指针表示的是两个指…

协方差和相关系数,还有信号与系统里的 互相关函数

协方差和相关系数参考:https://www.bilibili.com/video/BV1vK411N7Yp/ 协方差和相关系数的思想就是:同增同减,找相关的变量 协方差公式是如下图老师的板书 可以发现,当 X Y 同增同减趋势明显时,协方差的值就越大 所…

STM32_启动流程详解

目录标题 前言 启动流程概述复位中断函数详解SystemInit函数详解 __main函数详解 附录 stm32单片机的存储器映像中断向量表的映射 前言 最近在学习IAP远程OTA升级单片机固件程序,发现自己对单片机的启动流程还不是那么了解,就总结整理一下吧。 启动流程…

记录一次API报文替换点滴

1. 需求 各位盆友在日常开发中,有没有遇到上游接口突然不合作了,临时需要切换其他接口的情况?这不巧了,博主团队近期遇到了,又尴尬又忐忑。 尴尬的是临时通知不合作了,事前没有任何提醒; 忐忑…

位图、布隆过滤器、海量数据处理

文章目录 位图布隆过滤器海量数据处理 正文开始前给大家推荐个网站,前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 位图 概念:所谓位图,就是用每一…

【Spring】08 BeanNameAware 接口

文章目录 1. 简介2. 作用3. 使用3.1 创建并实现接口3.2 配置 Bean 信息3.3 创建启动类3.4 启动 4. 应用场景总结 Spring 框架为开发者提供了丰富的扩展点,其中之一就是 Bean 生命周期中的回调接口。本文将聚焦于其中的一个接口 BeanNameAware,介绍它的作…

深度学习中的预测图片中的矩形框、标签、置信度分别是什么意思。

问题描述:深度学习中的预测图片中的矩形框、标签、置信度分别是什么意思。 问题解答: 目标框(Bounding Box): 描述目标位置的矩形边界框。 类别标签: 表示模型认为目标属于哪个类别(例如&#…

opencv 十六 python下各种连通域处理方法(按面积阈值筛选连通域、按面积排序筛选连通域、连通域分割等方法)

本博文基于python-opencv实现了按照面积阈值筛选连通域、按照面积排序筛选topK连通域、 连通域细化(连通域骨架提取)、连通域分割(基于分水岭算法使连通域在细小处断开)、按照面积排序赛选topK轮廓等常见的连通域处理代码。并将代码封装为shapeUtils类,在自己的python代码…

[Verilog] 设计方法和设计流程

主页: 元存储博客 文章目录 1. 设计方法2. 设计流程 3 Vivado软件设计流程总结 1. 设计方法 Verilog 的设计多采用自上而下的设计方法(top-down)。设计流程是指从一个项目开始从项目需求分析,架构设计,功能验证&#…

openEuler商业化进展可观:累计装机量超610万套,市场持续扩容

12月15日至16日,以“崛起数字时代,引领数智未来”为主题的操作系统大会&openEuler Summit 2023在北京国家会议中心举办。大会旨在汇聚全球产业界创新力量,构筑坚实的基础软件根基,推动基础软件技术持续创新&#xff0c…

Redis设计与实现之整数集合

目录 一、内存映射数据结构 二、整数集合 1、整数集合的应用 2、数据结构和主要操作 3、intset运行实例 创建新intset 添加新元素到 intset 添加新元素到 intset(不需要升级) 添加新元素到 intset (需要升级) 4、升级 升级实例 5、关于升级 …

帆软FCRP模拟题

制作步骤可见此博主:https://blog.csdn.net/Ipkiss_Yongheng/article/details/125594366 完成文件下载:【免费】帆软FCRP官网模拟题代码资源-CSDN文库

大创项目推荐 垃圾邮件(短信)分类算法实现 机器学习 深度学习

文章目录 0 前言2 垃圾短信/邮件 分类算法 原理2.1 常用的分类器 - 贝叶斯分类器 3 数据集介绍4 数据预处理5 特征提取6 训练分类器7 综合测试结果8 其他模型方法9 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 垃圾邮件(短信)分类算…

5个创建在线帮助文档的好方法!

在线帮助文档是企业为用户提供支持服务的重要工具,它能够帮助用户更好地了解和使用产品,提高用户体验。然而,创建一份优秀的在线帮助文档需要掌握一定的技巧和方法。接下来就介绍一下创建在线帮助文档的5个好方法,帮助企业更好地为…