智能运维场景 | 科技风险预警,能实现到什么程度?

[ 原作者:擎创夏洛克,本文略做了节选和改编 ]

每次一说到“风险预警”,就会有客户问我们能做怎样的风险预警。实际上在智能运维厂商来说,此风险非彼风险,不是能做银行的业务上的风险预警(比如贷款风险等),而是聚焦于科技系统的风险。

有些大的金融企业,科技风险有专门的风险部门来管控。实际应用中,风险部门需要读取运维数据的分析结果,来达到预警的成效。然而,共享一套运维数据,运维部门用它来做日常监管控配、风险部门用它来做预警,也不是件容易的事。

好在,已经有客户开始这么做、并且得到了很好的收益。


擎创夏洛克的风险预警场景主要面向业务系统,以风险管控为主要视角,通过风险指标、健康度风险模型、风险识别矩阵三大模块构建而成。能够形成“事前预警、事中监控、事后分析”的自动化、可视化能力,为生产事件风险识别、风险防控洞察保驾护航,提高二道防线的生产运营风险管理能力。

我们所看到的普遍需求背景

1.监管要求提高

随着《数字中国整体建设布局规划》的出台,以及《金融科技发展规划2022-2025》的政策指导,监管机构及金融企业对信息科技风险管理的二道防线要求提升,需要进一步加强风险评估和监测力度,提升风险管控能力。

2. 现有工具手段不足

现下很多金融企业的科技风控部门仍主要通过人工采集运营及运维指标数据,时效性迟、准确度低、监控范围有限,无法做到实时的监控和根因定位,整体风险把控能力不足。

风险预警场景的三个主要功能

图片

1.风险监控:实现在风险事件之前,依托运维大数据及健康度风险模型算法,对风险进行识别,对故障点进行排查和定位,提升事中风险定位能力。

2.风险预警:实现智能风险点探查、指标故障阈值条件设定及指标基线偏离度计算,针对风险点,提前向生产运行部门发出风险预警提示和通知。

3.风险复盘:围绕数据分析中心、报表统计中心等,对问题或事故进行复盘和总结,对相关模型、参数、规则等进行有目的地优化完善,反哺风险监测能力。

以某实例示意

关键词:风险识别、健康度、风险预警

某头部商业银行业务系统中的手机银行部分,由于应用进程的内存泄漏,导致服务器内存使用率和占用率快速上升。一线运维团队在擎创夏洛克应用健康详情界面中发现了红色健康提示,通过生产运维中心监控系统的引导快速完成定位问题,且同时通知了二线专家进行修复,避免了可能的服务中断问题。

图片

上述案例中,主要应用了风险预警和风险监控两大模块,实现多维观测,根据健康度风险模型,围绕系统、业务、服务等重要指标进行全局实时地监测,主动识别风险点并及时进行告警通知;进而通过看板快速查看问题系统的运行状态,找到风险发生或可能发生的主要原因以及可能影响的事故范围,辅助运维人员提前将事故扼制。

看似轻描淡写,但放在真实的生产环境中如果没有合适的风险防范工具,是有可能造成运营事故的。无论事故大小,对于业务运营而言都是损失,是企业客户不愿见到的。

图片

智能运维场景的重要性不多赘述,但我们发现很多企业客户在建设过程中,常常容易陷入越多越好、越快越好的误区中。

建设思路推荐

单论风险预警场景,我们有如下建设思路推荐:

1  - 制定风险指标体系 -

无规矩不成方圆,优先应该聚焦风向指标,打造指标的异常检测和趋势预测能力,为健康度模型提供基础数据,排摸重点系统的数据情况,制定适用于风险管理的指标体系。

2  - 构建健康评分模型 -

依托指标体系,围绕基本面和风险盘构建健康评分模型体系,为风险识别矩阵提供能力支持;量化评估依据,通过分级权重提升健康评分的准确度及可配置性。

3  - 实现风险识别矩阵 -

以风险指标、健康评分体系为基础,构建风险识别矩阵模型,通过风险矩阵快速识别风险点和影响面,实现风险“事前、事中、事后”的闭环管控,全面提升生产运营风险的防范能力。

· 风险预警场景建设收益

1  常态化风险监测能力up↑

通过数据聚合、分析、结合AI算法模型,提升自动化监测风险中及时预警、通知能力。提升事前风险预警能力。

2  风险场景化分析能力up↑

构建场景化分析能力,通过智能化数据分析,为故障定位提供宏观的证据链,辅助各平台快速解决问题。

3  生产运营风险管理能力up↑

从事前、事中、事后全方位建立风险防控体系,从风险管控角度,实现生产系统数据的融合贯通,打破各自为政、信息孤岛的局面,促进生产系统数据标准化。

———— THE End ————

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/534963.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

自动化测试框架 Selenium(3)

目录 1.前言 2.等待方式 2.1死等 2.2智能等待 3.游览器操作 3.1游览器最大化 3.2设置游览器的宽 高 3.3 游览器的前进和后退 3.4游览器滚动条 1.前言 本篇博客,我们将继续Selenium自动化测试的学习.在前面的章节中,俺介绍了Selenium是怎么回事,和键盘鼠标操作.还有url和…

2024年第十七届 认证杯 网络挑战赛 (A题)| 保暖纤维的保暖能力 |数学建模完整代码+建模过程全解全析

当大家面临着复杂的数学建模问题时,你是否曾经感到茫然无措?作为2022年美国大学生数学建模比赛的O奖得主,我为大家提供了一套优秀的解题思路,让你轻松应对各种难题。 让我们来看看认证杯 网络挑战赛 (A题)&#xff01…

ruoyi-nbcio-plus基于vue3的flowable的支持自定义业务流程处理页面detail.vue的升级修改

更多ruoyi-nbcio功能请看演示系统 gitee源代码地址 前后端代码: https://gitee.com/nbacheng/ruoyi-nbcio 演示地址:RuoYi-Nbcio后台管理系统 http://122.227.135.243:9666/ 更多nbcio-boot功能请看演示系统 gitee源代码地址 后端代码&#xff1a…

Qt | 信号与槽 原理、连接、断开(面试无忧)

1、信号和槽是用于对象之间的通信的,这是 Qt 的核心。为此 Qt 引入了一些关键字,他们是slots、signals、emit,这些都不是 C++关键字,是 Qt 特有的,这些关键字会被 Qt 的 moc转换为标准的 C++语句。 2、Qt 的部件类中有一些已经定义好了的信号和槽,通常的作法是子类化部件…

2023年上半年信息系统项目管理师——综合知识真题与答案解释(1)

2023年上半年信息系统项目管理师 ——综合知识真题与答案解释(1) 零、00时光宝盒 1009 Rejections 1009 拒绝 Once, there was an old man, who was broke, living in a tiny house and owned a beat-up car. 有一次,有一个老人,他破产了&#…

谷歌google浏览器无法更新Chrome至最新版本怎么办?浏览器Chrome无法更新至最新版本

打开谷歌google浏览器提示:无法更新Chrome,Chrome无法更新至最新版本,因此您未能获得最新的功能和安全修复程序。点击「重新安装Chrome」后无法访问此网站,造成谷歌浏览器每天提示却无法更新Chrome至最新版本。 谷歌google浏览器无…

Netty源码解析-服务启动过程

文章目录 前言简单Netty服务器启动代码示例主线NioEventLoopGroup初始化关键代码 前言 Netty是一个高性能、异步事件驱动的网络应用框架,用于快速开发可维护的高性能协议服务器和客户端。它的服务启动过程涉及多个组件和步骤,下面我将对Netty的服务启动…

OpenAI推出GPTBot网络爬虫:提升AI模型同时引发道德法律争议

文章目录 一、GPTBot 简介二、功能特点三、技术细节3.1、用户代理标识3.2、数据采集规则3.3、数据使用目的3.4、网站屏蔽方法3.5、数据过滤 四、GPTBot 的道德和法律问题五、GPTBot 的使用方法和限制六、总结 一、GPTBot 简介 OpenAI 推出的网络爬虫GPTBot旨在通过从互联网上收…

腾讯云向量数据库——RAG七天入门课笔记

目录 前言一、RAG介绍1-0、引言-大语言模型的不足1-1、向量数据库定义1-2、工作原理1-3、优点1-4、与传统数据库的区别1-5、RAG应用痛点 二、数据处理的难点——解析和拆分2-1、复杂文档格式-解析过程中的问题2-2、复杂文档解决流程2-3、Chunk拆分的问题以及如何改进 三、相似性…

【GitHub技术全面解析及游戏开发者的应用】

GitHub技术全面解析及游戏开发者的应用 GitHub作为全球最大的开源代码托管平台,不仅为软件开发者提供了一个强大的工具,也为游戏开发者带来了前所未有的便利。在游戏开发领域,GitHub的技术可以帮助开发者更高效地管理代码、协作开发、分享资…

10 - 镜像管理之:部署高可用harbor

之前介绍了部署单点harbor,这里重点说下Harbor高可用集群方案的部署,目前主要有两种主流的Harbor高可用集群方案: 1)双主复制 2)多harbor实例共享后端存储 1 Harbor双主复制高可用集群 1.1 主从同步 harbor官方默认提供…

arm64位系统中编译ffmpeg

大致过程仍然和x86平台一致: ./configure xxxxmakemake install 所需要变化的是需要在 ./configure xxxx 后面多加几个编译选项 cd ffmpeg ./configure (x64下的依赖配置:......)--prefixbin --archaarch64 --target-oslinux --enable-cross-compile …

redis的客户端操作

文章目录 前言Java客户端Jedis准备工作引入JedisJedis的基本使用方法String类型的操作List类型操作Hash类型操作Set类型操作Zet类型的操作 JavaSpring客户端创建项目引入SpringDataRedis配置 redis 服务地址创建 Controller具体实例 前言 Redis是用单线程来处理多个客户端的访…

【linux深入剖析】深入理解软硬链接 | 动静态库的制作以及使用

🍁你好,我是 RO-BERRY 📗 致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 🎄感谢你的陪伴与支持 ,故事既有了开头,就要画上一个完美的句号,让我们一起加油 目录 1.理解软硬链接1.1 操作观…

Linux_网络编程套接字_2

文章目录 一、预备知识认识端口认识TCP协议认识UDP协议网络字节序 二、socket编程接口1.socket常见API2.socket结构总结 3.其他接口1.IP地址《》整数 inet_addr等等2.读取报文 - recvfrom 三、简单的UDP网络程序 - 聊天室1.源代码展示 四、TCP1.编写TCP服务器程序1.创建套接字 …

三行命令解决Ubuntu Linux联网问题

本博客中Ubuntu版本为23.10.1最新版本,后续发现了很多问题我无法解决,已经下载了另外一个版本22.04,此版本自带网络 一开始我找到官方文档描述可以通过命令行连接到 WiFi 网络:https://cn.linux-console.net/?p10334#google_vig…

网络协议——RSTP(快速生成树)与MSTP(多实例生成树)

一. RSTP 1. STP的不足 1、依靠计时器超时的方式进行收敛导致它的收敛时间需要30到50秒 2、端口状态和端口角色没有细致区分,指导数据转发依靠的不是端口状态而是端口所扮演角色。 3、如果拓扑频繁变化导致用户通信质量差,甚至通信中断&#xf…

【THM】What the Shell?(什么是壳?)-初级渗透测试

什么是shell? 在我们深入了解发送和接收 shell 的复杂性之前,了解 shell 的实际含义非常重要。用最简单的术语来说,shell 是我们与命令行环境 (CLI) 交互时使用的工具。换句话说,Linux中常见的 bash 或 sh 程序都是 shell 的例子,Windows 上的 cmd.exe 和 Powershell 也是…

简单了解JVM

一.JVM简介 jvm及Java virtual machineJava虚拟机,它是一个虚构出来的计算机,一种规范。其实抛开这么专业的句子不说,就知道 JVM 其实就类似于一台小电脑运行在 windows 或者 linux 这些操作系统环境下即可。它直接和操作系统进行交互&#…

BUUCTF---misc--snake

1.下载附件,解压后是一张蛇的图片 2.查看属性,没有有用信息,用winhex打开,在文末找到了PK字样,图片被压缩了。 3.用binwalk命令,查看,有压缩包 4.用foremost命令分离,将文件保存到te…