金融信贷风控特征计算详解

特征的含义?

特征可以说是风控系统中的最小单元,是风控工具的重要组成部分,我们也可以理解成变量。不过叫什么问题不大,团队内有相同的共识就行。

风控特征是我们做数字化线上风控中的重要组成部分,几乎可以说没有风控特征我们将无法制作模型,无法指定策略,无法指定预警规则,无法测算额度,也就是说,风控特征是我们进行一切线上化风控的前提。

那么特征有哪些呢?
在这里插入图片描述

我们来稍微举几个例子,年龄、性别、年收入这些都属于特征,而这些特征我们需要给予他们对应的类型。从变量分类的角度来分类,可以有int、long、double、string、boolean等类型。但我是设计成了数值型(普通数值型/汇总数值型)、字符串型和枚举型这三种,做了一层归集和删减。

但是,无论采取哪种分类方式,后续的设计能够闭环即可。

To C 信贷业务风控特征数据源

对于银行业来说,根据个人信贷用途的不同,可以将 To C信贷业务分为个人购房贷款、汽车贷款、留学贷款、助学贷款、个人消费贷款、个人经营性贷款等。我们这里指的 To C 业务主要是指个人消费贷款及以个人为授信主体的个人经营性贷款,这其中可以使用到主流风控特征数据源包含以下几个维度:

数据源说明
人行个人征信中国人民银行包括报告头、个人基本信息、信息概要、信贷交易信息明细、非信贷交易信息明细、公共信息明细、其他标注及声明信息、查询记录
个人征信百行征信、朴道征信信用明细信息、授信明细信息、查询记录、特别关注名单等
多头百融、同盾多头借贷信息、借贷意向信息、借贷行为信息、特殊名单等
司法汇法、法海、中数司法详情、严重违法、执行公开信息、失信老赖名单等
反欺诈腾讯腾讯反欺诈分
SDK极光APP安装卸载、使用情况等
银行流水银行内部数据收入金额、支出金额、账户余额变动、现金交易金额、全部交易金额、工资奖金金额、投资理财交易、转账类交易信息、贷款还款信息

To B 信贷业务风控特征数据源

To B 信贷业务由于企业资金需求相对大于个人,一直以来都是银行业信贷类业务收入的大头,但授信金额大也伴随的较高风险,因此需要更为专业的风控手段来抵御风险事件的发生。对于线上化产品来说,线上化自动审批并不适用于所有 To B 信贷业务。

对于小微信贷业务来说,其风险很大一部分的来源都是法人或实控人,因此与个人信贷业务更为相近,比较适用线上化自动审批来进行快速决策,这样可以大大缩短客户从进入银行到最终拿到贷款的时间。

但对于大额公司信贷来说,由于大公司的个体差异的比较大,风险事件也更为复杂,因此很难通过数据来归纳并直观判断客户的风险水平。

针对 To B 信贷业务,市面上比较主流的风控特征数据源涵盖以下几个维度:

数据源说明
人行企业征信中国人民银行实际控制人信息、信贷交易提示信息、非信贷交易及公共信息、未结清借贷交易汇总信息、已结清借贷交易汇总信息、负债历史汇总信息、还款表现信息
工商信息企查查、天眼查企业经营异常、企业历史变更、企业对外投资信息等
税务数据税务局企业基础信息、企业申报信息、增值税申报信息、欠税信息等
发票数据百旺发票票面信息、开票频次、开票状态等
水电费公共信息企业水电煤气费等公共信息
银行流水银行内部数据收入金额、支出金额、账户余额变动、现金交易金额、全部交易金额、工资奖金金额、投资理财交易、转账类交易信息、贷款还款信息

规则管理

了解规则是由特征、逻辑运算符、比较运算符、阈值和触发结果组成,以及规则其实是在处理条件语句的本质之后,那么前端设计就万变不离其宗了
在这里插入图片描述
上图就是规则管理的部分页面内容,其中比较重要的功能是规则测试。规则测试主要面向对象是业务和测试人员。

  • 业务人员:能够就配置的规则,立马知道规则执行是否有问题。
  • 测试人员:上文说过特征来源可能是自有数据,也有可能是供应商的数据。规则的测试分为取值正确性和规则逻辑性验证。规则测试主要解决规则逻辑性验证,确定好这部分正确后,就可着重对取值进行验证,在规则的验证过程中有的放矢

特征计算平台 Feature Store 简介

在大型金融机构中,由于组织架构较为复杂,不同条线之间往往存在重复造“轮子”的情况,建模人员加工的风险特征仅仅在某个产品上进行使用,不同机构条线间缺乏对风控特征的共享,因此,需要一个统一的特征管理平台,来规范特征的衍生、存储、使用及更新迭代管理,特征平台 Feature Store也因此应运而生。

对于特征平台的能力与边界,各家定义略微不同,《Feature Stores - A Hierarchy of Needs》,文中将特征平台的能力分为以下几个层次:

  • 特征管理:特征抽取、处理、存储、元数据管理,以便于特征溯源、分享和复用;
  • 特征消费服务:为线上部署的模型,提供高吞吐、低延迟的特征获取能力;
  • 离线/在线特征一致性保证:避免 Training - Serving Skew问题导致模型效果劣化;
  • 便利:易用、简单的交互和API;
  • 自治:特征回填、数据质量监控、联动模型效果评估等。

总结

本期重点介绍一下信贷风控特征市面上的主流数据源和基于这些数据源所构建的特征平台 Feature Store。

参考来源:https://zhuanlan.zhihu.com/p/554201480、https://news.sohu.com/a/718419262_114819

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/376911.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Flink入门修炼】1-2 Mac 搭建 Flink 源码阅读环境

在后面学习 Flink 相关知识时,会深入源码探究其实现机制。因此,需要现在本地配置好源码阅读环境。 本文搭建环境: Mac M1(Apple Silicon)Java 8IDEAFlink 官方源码 一、 下载 Flink 源码 github 地址:h…

[每周一更]-(第85期):NLP-实战操作-文本分类

NLP文本分类的应用场景 医疗领域 - 病历自动摘要: 应用: 利用NLP技术从医疗文档中自动生成病历摘要,以帮助医生更快速地了解患者的状况。 法律领域 - 法律文件分类: 应用: 使用文本分类技术自动分类法律文件&#xf…

Mysql的sql优化

一.查询优化 我们都知道,在建立索引的时候,要考虑where后面的查询条件字段、order by 排序后面的字段 、group by 分组排序后面的字段,对他们的字段建立合适的索引,但是我们需要思考怎么建立合适的索引,或者建立索引之…

计算机网络-华为无线网络配置

前面已经大致了解了无线通信的原理和无线组网的概念,今天来学习无线的配置过程与步骤。 一、无线组网配置流程 在开始配置前复习下前面讲过无线组网有涉及几个设备,AC无线控制器、AP无线接入点、POE交换机。无线组网与有线组网是相对独立的,不…

10:LED点阵显示汉字

LED点阵显示汉字 1、字模2、横向取模 1、字模 (1)如何记录组成字的LED点阵亮灭信息(16x16点阵一共有256点,显示一个特定的字需要其中有些点亮而另一些不亮,如何记录哪些点亮哪些点不亮?用字模)字模如何工作?256个点用…

机器学习 | 揭示EM算法和马尔可夫链的实际应用

目录 初识EM算法 马尔可夫链 HMM模型基础 HMM模型使用 初识EM算法 EM算法是一种求解含有隐变量的概率模型参数的迭代算法。该算法通过交替进行两个步骤:E步骤和M步骤,从而不断逼近模型的最优参数值。EM算法也称期望最大化算法,它是一个基…

负重20kg复合翼垂直起降无人机应用,复合翼无人机技术分析

主要任务应用 1.管线巡查 挂载可见光/红外二合一光电载荷和小型SAR设备,对既定线路进行昼夜巡视侦察,利用图像实时传回指挥控制中心,可用于石油管路、电力线路、舰艇航线及周围态势感知,利于依据现场实情进行战略决策和指令传达…

车载网络测试 - 总线基础 - CAN总线负载计算

我想做过CAN总线测试的都有遇到过拉高总线负载相关的测试,这个时候我们一般都会通过增加报文的数量或者减小报文的周期来实现,但是CAN总线上的负载到底是如何计算的呢?我想很多人都会有这个疑问吧,那么今天我们一起来看下如何计算…

10. Springboot集成Dubbo3(一)简单介绍

目录 1、前言 2、Dubbo3 2.1、什么是Dubbo3 2.2、Dubbo2 & Dubbo3 2.2.1、服务发现模型 2.2.2、RPC通信协议 2.2.2.1、Triple 协议 2.2.2.2、小结 2.2.3、云原生 2.2.4、maven依赖 2.2.5、性能 3、小结 1、前言 Dubbo是一个开源的Java分布式服务框架&#xff…

ProtonMail邮箱怎么样?国内有什么替代品?

ProtonMail作为业界知名的加密邮箱提供者,其安全性、隐私保护等特性让不少追求私密通信的用户趋之若鹜。然而对于国内用户而言,ProtonMail可能并非最佳选择,受限于许多因素,从语言支持到服务器位置再到可访问性,都可能…

个人博客说明

本人博客主要发布平台为博客园 https://www.cnblogs.com/carmi 更多详细,完整图片的文章还请师傅们动动小手到博客园去看吧。

泰克示波器——TBS2000系列界面整体介绍

目录 1.1 通道区域面板标识1.2 示波器测试输出(检测探针与设置的好坏)1.3 面板其他快捷按钮1.4 波器整体界面 1.1 通道区域面板标识 在通道面板的下方标识有示波器的通道属性以及参数值,如我使用的型号为“TBS2104X”的示波器,面…

【C#】.net core 6.0 设置根目录下某个文件夹可访问,访问创建的图片等资源

欢迎来到《小5讲堂》 大家好,我是全栈小5。 这是《C#》系列文章,每篇文章将以博主理解的角度展开讲解, 特别是针对知识点的概念进行叙说,大部分文章将会对这些概念进行实际例子验证,以此达到加深对知识点的理解和掌握。…

精酿啤酒:啤酒的后熟与包装过程的品质保障

啤酒的后熟与包装过程是确保产品品质的重要环节。对于Fendi Club啤酒来说,这一环节同样关键,它关系到啤酒的口感、风味和保质期的长短。 在啤酒的后熟过程中,Fendi Club啤酒酿造团队采用适当的温度和时间控制,让啤酒逐渐发展出更加…

ElastAlert 错误日志告警

文章目录 前言一、ElastAlert 概览1.1 简介1.2 ElastAlert 特性 二、ElastAlert 下载部署2.1 安装 Python3 环境2.2 下载 ElastAlert2.3 部署 ElastAlert 三、接入平台3.1 对外接口层3.2 服务层 前言 ElastAlert 是 Yelp 公司基于 python 开发的 ELK 日志告警插件,…

幻方(Magic Square)

幻方(Magic Square) 幻方概述 什么是幻方呢?幻方(Magic Square)就是指在nn(n行n列)的方格里填上一些连续的数字,使任意一行、任意一列和对角线上的数字的和都相等。例如有33的3行3…

【Linux】gdb调试与make/makefile工具

目录 导读 1. make/Makefile 1.1 引入 1.2 概念 1.3 语法规则 1.4 示例 2. Linux调试器-gdb 2.1 引入 2.2 概念 2.3 使用 导读 我们在上次讲了Linux编辑器gcc\g的使用,今天我们就来进一步的学习如何调试,以及makefile这个强大的工具。 1. mak…

VLAN间通信

VLAN间通信的三种方法 vlanif接口 最常用,又叫虚拟接口,这种方式一般使用三层交换机实现,它包含路由模块和交换模块,交换模块可以实现剥离和添加VLAN标签,路由模块实现路由功能 VLANif接口 为各自vlan的网关 # interface Vlani…

Page246~250 11.1GUI下的I/O基础

11.1.1 从“控制台”说起 “命令行交互界面”(简称CUI,也有人称为CLI)。 CUI需要我们记忆并在控制台输入命令文本内容,而GUI则以图形的方式呈现、组织各类命令,比如Windows的“开始”菜单,用户只需通过简单的键盘或鼠标操作&am…

跳格子3 - 华为OD统一考试

OD统一考试(C卷) 分值: 200分 题解: Java / Python / C 题目描述 小明和朋友们一起玩跳格子游戏, 每个格子上有特定的分数 score [1, -1, -6, 7, -17, 7], 从起点score[0]开始,每次最大的步…