模型稳定性评估 简介

OOT

OOT(Out of Time)是在建模过程中用于描述模型在时间维度上的性能变化的术语。当模型在训练时使用的数据集与实际应用场景中的数据分布发生差异,特别是在时间上存在间隔时,就可能出现OOT问题。

OOT通常指的是模型在训练时使用的数据集与将来要在实际应用中使用的数据集有显著的时间差异,导致模型在未来的预测性能下降。这种情况可能由于数据的时效性、外部环境的变化等原因引起。

解决OOT问题的一种常见方法是使用群体稳定性指数(Population Stability Index,PSI)等工具来监测模型在不同时间段或数据分布上的性能变化。通过在模型上线前和上线后对模型性能进行监测,可以及时发现潜在的OOT问题并进行调整。

预防OOT问题的方法包括:

  • 及时更新训练数据: 确保模型的训练数据集包含最新的信息,以适应未来的数据分布。
  • 动态更新模型: 考虑使用增量学习或定期重新训练模型,以捕捉潜在的数据分布变化。
  • 监测模型性能: 定期监测模型在不同时间点或数据分布上的性能,使用PSI等指标进行评估。

通过这些方法,可以提高模型对未来数据的适应能力,减少由于时间上的变化而导致的性能下降问题。

PSI

PSI 指标就是群体稳定性指数(Population Stability Index)

通过 PSI 指标,可以得到不同样本(不同时间段给到模型的样本)下,模型在各分数段分布的稳定性。

用于衡量两个群体(比如两个时间点、两个子群体等)之间稳定性的指标。通常,PSI被广泛用于评估信用风险模型、预测模型等在不同时间点或不同群体中的性能变化。

PSI = SUM ( 实际占比 - 预期占比 ) * ln ( 实际占比 / 预期占比 )

在这里插入图片描述

  • P actual,i - 表示实际分布中第 i 个分箱的占比
  • P expected,i - 表示期望分布中第 i 个分享的占比

通常,期望分布可以是参考的基准分布,比如在时间点1的分布作为基准,而实际分布是在时间点2的分布。

结果:

  • PSI的值越大,表示两个群体之间的分布差异越大

通常,一些经验性的阈值可以用来解释PSI的结果,比如:

  • PSI<0.1: 稳定性很高
  • 0.1≤PSI<0.25: 稳定性一般
  • PSI≥0.25: 稳定性较差

稳定性是一个相对的概念,只有通过对比,才能知道模型是不是稳定。所以,想要计算模型的稳定性,需要先有一个参照物。

在信用评分模型中,为了进行对比,至少需要两个分布结果,一个是预期分布结果一个是实际分布结果。

流程:

  • 在模型验收前, 算法工程师需要对模型的稳定性进行评估.
    • 使用验证样本作为实际分布,
    • 使用训练样本作为预期分布
  • 在产品验收阶段, 产品经理
    • 使用模型上线时的 OOT 样本作为预期样本
    • 使用 非 OOT 时段的近期抽样样本作为实际样本

计算 PSI

  1. 分箱
    • 等频分箱
      • 每个分箱中的样本数量相等,分数段不同,并且分数段是根据人数占比计算得到的
    • 等距分箱
      • 每个分箱中分数段相同,人数不同,人数是按照分数平均切分的
  2. 计算实际分布
    • 测试样本距离当前日期越近越好
    • 选择进行测试的样本,把样本传入模型得到实际测试结果
    • 再根据上一步选择的分箱方式,将实际测试结果同样进行分箱,计算分箱后的占比
  3. 计算 PSI 数值
    • 实际占比 - 预期占比
    • 实际占比 / 预期占比
    • ln(实际占比 / 预期占比)
    • index = (实际占比 - 预期占比) * ln(实际占比 / 预期占比)
    • PSI = sum(index1 + index2 + ...+ indexn)

建议

  1. PSI 上线时关注, 上线后也要持续关注
  2. 关注 PSI 变化因素
    • 客群变化
    • 数据源变化
  3. 上线后, 根据业务场景对模型稳定性的要求, 对模型 PSI 进行按日 / 按月 / 按季度监控

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/269262.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

nestjs swagger文档调用需要鉴权的接口

目标 nestjs经常需要设置一些鉴权&#xff08;登录后&#xff09;才能访问的接口&#xff0c;但是生成的swagger文档可以发起接口请求&#xff0c;文档发起的请求默认是不携带登录token的&#xff0c;所以需要移除swagger文档发起请求的守卫拦截。 nestjs守卫拦截设置见另一篇…

C++力扣题目20--有效的括号

给定一个只包括 (&#xff0c;)&#xff0c;{&#xff0c;}&#xff0c;[&#xff0c;] 的字符串 s &#xff0c;判断字符串是否有效。 有效字符串需满足&#xff1a; 左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。每个右括号都有一个对应的相同类型的左括…

【FPGA】Verilog 实践:优先级编码器 | Priority encoder

0x00 优先级编码器&#xff08;Priority encoder&#xff09; "能将多个二进制输入压缩成更少数目输出的电路或算法的编码器" 优先级编码器是一种编码器&#xff0c;它考虑了两个或更多输入位同时变为 1 但没有收到输入的情况。当输入进来时&#xff0c;优先级编码…

直线中点算法

中点算法是基于隐函数方程设计的&#xff0c;使用像素网格中点来判断如何选取距离理想直线最近的像素点&#xff0c;直线的中点算法不仅与 Bresenham 算法产生同样的像素点集&#xff0c;二期还可以推广到圆和椭圆。 原理 直线的隐函数表示 F ( x , y ) y − k x − b 0 F(…

ClickHouse 入门与实战教程

目录 1. ClickHouse 简介 什么是 ClickHouse&#xff1f; ClickHouse 的优势和特点 适用场景 2. 安装 ClickHouse 3. ClickHouse 的基本概念 4. ClickHouse 的基本操作 创建数据库和表、插入和查询数据 使用 MergeTree 引擎处理时序数据 管理分区 创建带有分区的 Mer…

电路设计(6)——彩灯控制器的multism仿真

1.功能设计 使用两个运算放大器、两个计数器芯片&#xff0c;实现了彩灯的循环移位控制。 整体原理图如下所示&#xff1a; 运行效果截图如下&#xff1a; 小灯分为两组&#xff0c;一组十个&#xff0c;在脉冲的驱动下&#xff0c;轮流发光&#xff01; 2.设计思路 两个运放…

视觉学习(4) —— 添加地址传递数据

Modbus Slave 选择一个地址右键&#xff0c;选择发送的数据类型 视觉软件 一、添加地址 当地址为100时&#xff0c;先将首地址改为100&#xff0c;第0个地址为100&#xff0c;第1个地址为101&#xff0c;往后累加 若想使用100—150的地址&#xff0c;即首地址为100&#xff…

基于Java SSM框架实现电子药品商城系统项目【项目源码+论文说明】

基于java的SSM框架实现电子药品商城系统演示 摘要 随着社会的发展&#xff0c;计算机的优势和普及使得电子商城系统的开发成为必需。电子商城系统主要是借助计算机&#xff0c;通过对信息进行管理。减少管理员的工作&#xff0c;同时也方便广大用户对个人所需信息的及时查询以…

程序设计语言与语言处理程序基础

内容概要 编译与解释 正规式&#xff08;重点&#xff09; 例题 答案&#xff1a;D&#xff0c;C 有限自动机 例题 答案&#xff1a;C 表达式&#xff08;重点&#xff09; 把表达式构造成一颗树&#xff0c;然后再根据树的前序&#xff0c;中序&#xff0c;后序遍历来得出答…

递归如何书写?

目录 第一步&#xff1a;首先你分析问题&#xff0c;要有递归的思路&#xff0c;知道要递归什么来解决问题。 第二步&#xff1a;先按照思路&#xff08;第一层&#xff09;写出函数的定义与函数体 第三步&#xff1a;根据函数的定义与函数体进一步确定需要的参数 第四步&a…

golang基于window下实现文件遍历(效率高于filepath.Wlak)

golang基于window下实现文件遍历(效率高于filepath.Wlak) package mainimport ("fmt""os""path""path/filepath""syscall""time""unsafe" )const MAX_PATH 260type FILETIME struct {dwLowDateTime …

html之为什么使用表单,常用表单元素使用?

文章目录 一、为什么使用表单呢&#xff1f;二、常用表单元素使用三、总结 一、为什么使用表单呢&#xff1f; 为什么使用表单呢&#xff0c;使用表单是为了更好的收集用户数据&#xff0c;并且安全 二、常用表单元素使用 1、password密码框 密码框&#xff1a;会隐藏数据&a…

06.微服务组件 Gateway

1、Gateway 简介 在SpringCloud中网关的实现包括两种&#xff1a; Zuul是基于Servlet的实现&#xff0c;属于阻塞式编程。SpringCloudGateway是基于Spring5中提供的WebFlux心属于响应式编程的实现&#xff0c;具备更好的性能。 2、搭建网关服务 步骤一&#xff1a;创建gatewa…

TwIST算法MALTLAB主程序详解

TwIST算法MALTLAB主程序详解 关于TwIST算法的具体原理可以参考&#xff1a; 链接: https://ieeexplore.ieee.org/abstract/document/4358846 链接: https://blog.csdn.net/jbb0523/article/details/52193209 该算法的MATLAB源代码&#xff1a; 链接: http://www.lx.it.pt/~bi…

Unity查安卓Native Crash的方法,定位SO报错函数

需要用到两个工具Il2CppDumper和IDA_Pro&#xff0c;网上可以下到对应的软件 可以看到报错的位置是libil2cpp.so 0000000000AFF820 接下来要做的事情就是找到0000000000AFF820对应的函数是哪个 解包 Il2CppDumper解析so文件和符号表&#xff0c;查看对应的函数表 把apk后缀…

Cloudstack多个管理服务器节点

https://docs.cloudstack.apache.org/en/4.18.0.0/adminguide/reliability.html 参考翻译&#xff1a; 代理上支持多个管理服务器 在具有多个管理服务器的Cloudstack环境中&#xff0c;可以根据算法配置代理&#xff0c;将其连接到哪个管理服务器。这对于内部负载均衡器或高可…

大数据----MapReduce实现统计单词

目录 一、简介二、实现单词统计数据准备编程MapReduceJob 三、运行四、结果 一、简介 Hadoop MapReduce 是一个编程框架&#xff0c;它可以轻松地编写应用程序&#xff0c;以可靠的、容错的方式处理大量的数据(数千个节点)。 正如其名&#xff0c;MapReduce 的工作模式主要分…

docker部署mysql主主备份 haproxy代理(swarm)

docker部署mysql主主备份 haproxy代理&#xff08;swarm&#xff09; docker部署mysql主主备份 docker部署mysql主主备份&#xff08;keepalived&#xff09;跨主机自动切换 docker部署mysql主主备份 haproxy代理&#xff08;swarm&#xff09; 1. 环境准备 主机IPnode119…

28、清华大学脑机接口实验组SSVEP数据集:通过视觉触发BCI[飞一般的赶脚!]

前言&#xff1a; 哈喽&#xff0c;最近对清华大学脑机接口的数据进行了尝试&#xff0c;输入到了DL模型中&#xff0c;以下是本人对于清华BCI数据的个人见解。 数据地址&#xff1a; 清华大学脑机接口研究组 (tsinghua.edu.cn) 打开网站可以看到有很多个数据&#xff0c;官…

洛谷——【数据结构1-2】二叉树

文章目录 题目【深基16.例1】淘汰赛题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1基本思路&#xff1a;代码 【深基16.例3】二叉树深度题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1基本思路&#xff1a;代码 [USACO3.4] 美国血统 American Heritage题目描…