以场景驱动CMDB数据治理经验分享

数据治理是 CMDB 项目实施中难度最大、成本最高的环节,是一个长期治理的过程,而行业很少提出 CMDB 数据治理的技术实现方案。CMDB 数据治理不仅需要解决配置管理工程性的技术问题,还要基于运维组织的特点,建立适应性的配置运营能力、设置专岗专责、梳理配置目录、制定配置项管理机制、落地流程、自动化策略、定期建立配置数据质量监测或分析、触发配置问题治理任务、技术运营等工作。

1.专岗负责

明确分层次的专岗专责。

此处的专岗负责制包括CMDB治理统筹专岗、执行任务团队专岗、执行治理任务专岗三级。其中,统筹专岗对数据治理整体治理水平的持续提升负责,来自横向优化角色;执行团队专岗负责传递、督促治理工作落实,对职能团队的治理情况起督促性作用,来自于职能团队;执行任务专岗责任配置项及配置属性的正确性,来自于职能岗位。

线上化建立专岗间协同。

基于“纵向到底、横向到边”的思路,CMDB能够纳管的IT资产范围越来越多,引发配置项问题的源头也会不断出现,具体的治理实施过程是一系列琐碎的工作。确保每一个数据问题都能够解决,需要从问题发现、问题修正、修复核实、“漏洞”优化建立一个全在线的解决方案。

图片

责任细分到每一个任务。

专岗负责制需要针对每一项数据问题任务化,每一项任务最好能够具体到某一个特定的人。一个任务如果允许多个责任人(非会签),容易引发分工、责任不明确、责任人之间意见分歧等导致任务进展缓慢的问题。

2.流程保障

规范化的流程是机制能够顺利落地的保障基础。规范化是一种行为标准,能够约束个体的行为,建立一个有序的协同秩序,帮助协同中各个角色保持统一的协同意识,形成一个集团军作战的能力,提升组织整体工作效率。在一些小型团队里可能会更加强调单兵作战能力,但是当组织形成一定规模后,必要的规范化流程是必不可少的一部分。所以,我们会看到同业中很多运维团队在阶段性的。

为了推动规范化的落地,可以考虑建立“制度、标准、规程、时序”四级的机制。其中,制度重点关注行业、企业通用性的规范对于配置管理的要求。技术标准重点关注对制度进行分解,形成具体指导落地的配置管理与技术规范要求,重点关注角色、职责、协同、例行化工作等。

规程是为了应对流程的迭代效率引入的流程管理要求,因为运维是高度强调复盘文化的组织,且对于复盘中发现的协同、操作等流程问题,以及工具平台、场景设计等技术问题,需要保持快速的迭代,防止问题的重复出现。CMDB数据治理规程的上线与修订需要保持高度的敏捷,来源可能是领导对于IT资产管理的一个临时决策,可能是事件复盘发现的配置问题,可能是合规检查发现的配置问题,也可能是某个数据消费场景发现的问题。当规程的执行步骤能够原子化为一个重复的数据操作或自动化脚本执行时,则要独立出来形成自动化时序。

3.数据融合

CMDB的数据治理是一个问题发现、问题修正、修正复核、“漏洞”优化的过程,整个过程需要对配置数据、机器运行数据、流程协同数据进行融合。一方面,单独的IT资产配置数据在很多场景下无法判断数据是否正确,关联数据能够还能够让配置数据质量问题的可解释性更好;另一方面,数据质量问题任务是否完成,应该尽量由数据本身自动化复核来关闭;同时,配置数据消费场景也需要结合其他数据。

在技术实现上,可以考虑在CMDB、运行数据、流程协同之上建立一份数据融合后的配置治理主题数据。基于配置问题的时序策略可以直接从这份标准化的主题数据中,采用无代码的方式配置出具体的任务与任务完成的复核。

4.场景驱动

CMDB数据质量问题任务的尽快修正一直都是配置治理运营的难题。很多同业都提到 执行治理任务专岗对配置问题的修正重视程度不高。为了落实任务的处理,可以采用专项运动式活动与常态性工作结合的运营方式。

技术治理场景是专项运动式活动的一种落地方式,技术治理场景借助管理要求,在短期内能够让各职能团队更容易接受,且能够吸引管理决策层的注意,更有利于治理工作的落地。同时,技术治理场景在设计上,是基于价值驱动,能够让琐碎的数据治理工作聚焦到一个主题,让治理成效最大化,并通过数字化绩效形式表达出来。

比如:

  • 基于主机效能管理的FinOps运营场景,在价值上推动了IT资产成本优化过程中, 可以将主机未按要求关联系统,主机未及时下架等问题挖掘出来,在配置质量上优化了IT资产配置纵向部署关系的配置治理;

  • 基于主机时钟源、重启时间、过保时间、单电源等风险管理场景,在价值上推动了稳定性风险的防范过程中,可以将自发现代理问题、集群类型属性等配置问题挖掘出来。

  • 基于系统上下游关系的应急、变更协同管理场景上,在价值上推动了协同的自动化,在提升协同效率过程中,可以将系统上下游关系有误、角色未保鲜等问题挖掘出来。

以技术治理场景为切入点与常态性数据质量问题任务,在实现思维上有一些区别。其中,技术治理场景认为“数据是对的”,场景分析对应到的负责人看到数据反映其技术管理成效低下,会驱动负责人主动去修正。常态性化数据质量问题任务是直接告诉数据责任方数据是错的,不修正会“考核”你。

总的来说,技术治理场景基于成效的价值驱动,在某些时候,能够形成自驱性的数据质量优化,促进落地效率,推动配置数据保鲜。

5.闭环运营

一项成功的工作机制应该是能够形成闭环,并驱动持续优化。

CMDB数据治理是一项琐碎的数据挖掘的工作,需要利用一些连接工具把琐碎的事串起来。ChatOps、任务就是协同的连接利器。以ChatOps为例,ChatOps具备很多连接优点,比如:

  • 企业IM是用户高频使用的协同工作空间;

  • ChatOps精准地触达到具体的人;

  • 协同群具备极为扁平的协同能力;

  • 协同群聊有公示作用,驱动治理工作落地“卷”起来;

  • 协同群聊能够更好建立在线的升级;

  • 具有专项工作属性的群提升效同效率;

  • ChatOps机器人能够代替人做自动化的工作;

  • 机器人驱动的人机协同,简化员工沟通上的工作(很多技术工程师不太愿意做太多沟通性的工作)。

技术运营离不开配套的数字化看板及专项报告。其中,数字化看板关注实时的数据分析,专项报告关注某项技术治理场景的工作成效。在设计技术运营数字化内容时,可以考虑关注以下几点:

  • 用户想看的信息:要明确看板与报告的用户是谁,不建议做一个适用于所有角色的报告,设计能够解决用户痛点与期望的数据洞察。

  • 你想用户看到的信息:这类数据未必是用户自己想看到的,但是技术运营方出于运营目的要表达出来的信息,通常可以从表现“不好情况”的问题数据,比如按成效低下排TOP几。

  • 你想表现出的成效信息:要让专项工作的人有成就感,或争取更多资源,需要将工作成效表现出来,比如最终的效果数据,或持续获取的效果变化均可。

另外,针对经常出现用户看不懂看板数据的问题,在设计上,可以参考在用PPT讲故事的形式,设计一个多页看板的内容顺序套路:概况、技术治理信息1、技术治理信息2、技术治理N、技术治理成效。

最后,自己要把技术运营当回事,持续的、主动的将技术运营的信息精准的触达到人,并在一些公开场合用数字化方式表达出来。

LinkSLA智能运维管家开启90天无忧运维,为您的系统运行保驾护航!

文章来自twt社区,作者:彭华盛

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/575448.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

查看HDF5文件软件(HDFView)

HDFView:下载地址 note:我们需要下载 win10 、App软件(win10在win11也能运行),因为App软件是轻量版,不需要安装就可以使用。 eg: 下载完后解压就可以使用。

空间数据索引的利器:R-Tree原理与实现深度解析

空间数据索引的利器:R-Tree原理与实现深度解析 R-Tree的原理插入操作分裂操作查询操作 R-Tree的伪代码R-Tree的C语言实现讨论结论 R-Tree是一种平衡树,用于空间数据索引,特别是在二维或更高维度的几何对象存储和检索中。它由Antony Guttman和…

书生·浦语 大模型(学习笔记-9)OpenCompass 大模型评测实战

目录 一、评测实现双赢 二、评测遇到的问题 三、如何评测大模型(大概总结4大类方法) 四、评测工具链及流水线 五、实战评测 GPU的环境安装 查看支持的数据集和模型 启动评测(会缺少protibuf库,提前安装) 测评结果 一、评…

【蓝桥2025备赛】容斥原理

容斥原理 背景:两个集合相交 高中的韦恩图,我们知道两个集合相交时我们可以通过简单的计算来认识相关的性质 集合相交的区域是 A ∩ B A\cap B A∩B ,集合的并集是 A ∪ B A\cup B A∪B ,那怎么用集合表示 A ∪ B A\cup B A∪B 我们可以看作是A集合…

正点原子[第二期]Linux之ARM(MX6U)裸机篇学习笔记-6.3

前言: 本文是根据哔哩哔哩网站上“正点原子[第二期]Linux之ARM(MX6U)裸机篇”视频的学习笔记,在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了正点原子教学视频和链接中的内容。…

mybatis的使用技巧9——mysql按年、季度、月、周等不同时间维度查询或分组统计

在实际项目开发过程中,按不同时间维度查询业务数据的操作异常频繁。比较多的操作如支持按时间周期范围做列表数据的筛选,或者是按年月日等维度的图表展示,亦或者是首页的概况,三维大屏的展示等,都离不开不同时间周期查…

网络靶场实战-Qiling Fuzz实例分析

背景 在上一小节中,介绍了qiling框架的背景和基础使用,并以相关的CTF和qilinglab实例进行练习加深对qiling框架的使用,后续并简单介绍了qiling fuzz的功能。 在这一小节,我们将对qiling fuzz iot设备进行测试以及以实例的方式对…

中级信息系统管理工程师-必会题锦集

文章目录 中级信息系统管理工程师-必会题锦集题目一CPU[解析]试题二 CPU[解析] 中级信息系统管理工程师-必会题锦集 题目一CPU CPU中(1)不仅要保证指令的正确执行,还要能够处理异常事件。 A. 运算器 B. 控制器 C. 寄存器组 D. 内部总线 [解…

1.C++入门(上)

目录 1.C关键字 2.命名空间 作用域方面的优化 a.命名空间定义 b.命名空间使用 3.C 输入&输出 1.C关键字 C有63个关键字,C语言有32个关键字,存在重叠如荧光笔标出 2.命名空间 作用域方面的优化 如果变量,函数和类的名称都存在于全…

SpringBootWeb请求

文章目录 前言一、Postman介绍 二、简单参数三、实体参数四、数组集合参数五、日期参数六、JSON参数七、路径参数 前言 在上一篇文章中,已经基于SpringBoot的方式开发一个web应用,浏览器发起请求 /hello 后 ,给浏览器返回字符串 “Hello Wor…

C++笔试强训day7

目录 1.字符串中找出连续最长的数字串 2.岛屿数量 3.拼三角 1.字符串中找出连续最长的数字串 链接 我的思路很简洁,就是双指针遍历,然后不断更新左位置left和右位置right和长度len。 然后我写代码的时候代码思路没跟上原本思路,直接把所有…

遇坑分享24.4.25

在对数组进行排序算法时&#xff0c;如果我使用多个下标进行元素交换的时候&#xff0c;可能会出错。 以下面的直接选择排序&#xff08;排列升序&#xff09;为例&#xff1a; public static void selectSort1(int[] arr){int left0;int rightarr.length-1;while(left<rig…

2024HWqax线上产品培训试题(天眼)

最近做了qax笔试题&#xff0c;分享一下&#xff0c;仅供学习参考&#xff0c;侵删

力扣HOT100 - 200. 岛屿数量

解题思路&#xff1a; 岛屿题目一般使用dfs。 1.判断是否越界 2.用0&#xff0c;1&#xff0c;2三个状态标识当前格子的状态&#xff08;三个状态比两个状态更清晰&#xff09; 3.向周围四个方向遍历 class Solution {public int numIslands(char[][] grid) {int cnt 0;fo…

【Spring篇 | 补充】三级缓存解决循环依赖

文章目录 7.三级缓存解决循环依赖7.1何为循环依赖&#xff1f;7.2三级缓存解析7.3三级缓存解决循环依赖7.3.1实例化A7.3.2创建B的需求7.3.3实例化B7.3.4注入A到B7.3.5B创建完成7.3.6回溯至A7.3.7清理二级缓存 7.4为什么不能用二级缓存解决循环依赖&#xff1f; 7.三级缓存解决循…

删除docker的容器与镜像

如果您想要卸载通过 docker pull influxdb 命令下载的 InfluxDB 容器&#xff0c;您需要执行以下步骤&#xff1a; 1. **停止正在运行的 InfluxDB 容器**&#xff1a; 首先&#xff0c;您需要停止任何正在运行的 InfluxDB 容器。您可以使用以下命令来查找正在运行的 InfluxD…

Xilinx 7系列 clock IP核的使用(二)

在 Clocking Wizard 中的输出时钟设置部分&#xff0c;主要目的是生成并配置系统所需的特定时钟频率和信号。这一功能在硬件设计和开发中非常关键&#xff0c;因为它允许用户精确地控制各个部分的时钟信号&#xff0c;以满足特定的性能、功耗和时序要求。 1 配置输出时钟 要启…

宝宝洗衣机买什么样的好?诚意推荐四款实力超群的婴儿洗衣机

近几年家用洗衣机标准容积的大大增加&#xff0c;从5Kg、6Kg升级到9Kg、10Kg。大容量洗衣机满足了家庭中清洗大件衣物、床上用品的需求。但由于普通大型洗衣机所洗衣物混杂&#xff0c;很多时候由于宝宝小件衣物数量不多&#xff0c;却也并不适合放在一起扔进大型洗衣机中清洗。…

macOS 一些系统图标的存放位置 icns

macOS 一些系统图标的存放位置 icns macOS 中有很多好看的图标&#xff0c;有时候就想用一下它&#xff0c;我来告诉你他们的具体位置。 系统图标位置&#xff0c;像各种通用文件类型的图标都在这里面&#xff0c;里面好多高清的系统图标 /System/Library/CoreServices/Core…

使用PlantUML绘制活动图、泳道图

最近在学PlantUML 太漂亮了 给大家欣赏一下 我也记录一下 startuml |使用前| start :用户打开旅游App; |#LightSkyBlue|使用后| :用户浏览旅游信息; |#AntiqueWhite|登机前| :用户办理登机手续; :系统生成登机牌; |使用前| :用户到达机场; |登机前| :用户通过安检; |#Light…