优维全面可观测产品能力分解⑥:运维状态可观测

本文是《优维全面可观测产品能力分解》系列文章的第六篇:『运维状态可观测』。基于可观测的数据体系,「运维状态可观测」是实现于运维状态的一次深入可观测。

在日常运维场景中,系统/应用运维人员重点关注的是系统/应用是否可用,使用是否流畅及是否够用。基于此,「运维状态可观测」提供三大观测能力,包含可用性管理、性能管理、容量管理。其中,【可用性管理】则是结合SRE的SLO&SLI体系,呈现所有系统的可用性目标和可用性指标情况;【性能管理】是从性能的角度全面查看系统、服务和接口的性能情况,并快速识别出系统瓶颈;【容量管理】是从容量规划、容量呈现、容量运营等角度,实现对系统、应用的动静态容量管理。

1

可用性管理

可用性管理是确保任何IT服务一致且成本高效地提供客户所需的一致可靠服务级别的过程。可用性管理涉及最大程度地减少服务损失,并确保在服务丢失时采取适当措施。优维提供的【可用性管理】综合了服务的拨测成功率和SLO进行对比分析,通过可视化的形式,呈现所有系统的可用性目标与可用性指标,帮助企业有效衡量服务的可用性。

在可用性管理能力开发之前,基于实践观察,优维技术团队从三个方面梳理了当前企业在可用性管理上的痛点所在:

  • 系统及应用服务缺少可用性标准。
  • 无法实时掌握系统及应用服务的稳定性,也无法知道可用性是下降还是上升。
  • 无法横向对比系统的可用性,哪个系统做的好,哪个系统做的差。

基于对企业在可用性管理上的痛点洞察,优维研发的【可用性管理】在统一的标准规范指引下,设定系统及应用服务的可用性目标及计算工时,以目标倒推系统的可用性维护。其次,可查看年、月、周、天为单位的系统/应用服务的可用性,并支持周对比、月对比,从而查看可用性是在提升还是下降,以便进一步制定可用性治理手段。并提供系统间可用性排行榜,明确红榜黑榜。

在场景应用上,满足不同IT人员对可用性管理的需求。

  • 产品负责人:可制定某个时间周期内系统的服务等级目标SLO,以便其能够定义用户在使用业务系统时所期望的服务质量水平,并提供一个标准作为开发和运维团队的参考与评估。
  • 业务运维负责人:可根据不同系统特征(A类、B类、C类),围绕SLO制定可衡量服务质量/服务可用性水平的SLI,通过SLI具体指标去描述SLO,进而衡量SLO的达成情况。
  • 应用系统运维负责人:能够和运维团队一起制定应用系统内容要统计应用服务权重与接口服务黑/白名单,以便其根据企业管理要求或业务特征,通过权重/黑白名单的配置,排除干扰数据,提升可用性计算的合理性与准确性。同时,还可查看某个时间周期内,各个应用系统的可用性分析视图,以便其制定应用系统运维后续的可用性改进措施。

2

性能管理

目前对很多行业来说,IT技术正在支撑着关键的业务应用,为此关键业务应对性能有较高要求,性能下降往往对业务造成巨大损失。面对这些问题,需要一系列工具和方法,能够对IT系统的性能进行监控与管理,并对可能出现的性能问题进行及时、准确的分析和处理。从而改善服务品质,减少操作失败和灾难发生的风险,减少维护运营的整体成本,提高系统的可用性、缩短响应时间,提高用户的满意度。

因此,性能管理的重要性不言而喻,而在实际的系统运维维护的过程中,企业在性能管理上依然面临着以下问题:

  • 缺乏统一的系统性能评估手段,导致性能认知及系统建设方法不统一。
  • 性能问题解决效率慢,无法准确定位到木桶短板。

为此,优维在系统性能的观测与管理上,通过提供系统/应用的性能管理视图,以CMDB系统/应用树来呈现性能状态。同时,构建面向系统/应用服务的应用性能评估体系(Apdex),便于IT运维人员快速识别系统性能瓶颈。从业务到技术,从全局到局部,层层分析定位,帮助运维人员有效定位性能木桶短板。

在核心能力上,优维【性能管理】提供的「性能看板」功能模块,可进行系统/多服务横向对比,查看全量系统/应用服务概览,也可拆分多个生产环境,查看单系统/单应用服务的详情看板;同时,提供系统间性能排行榜,明确红黑榜Top5。另外,【性能管理」支持基于Apdex通用标准,自定义配置阈值。

3

容量管理

容量管理的核心职责是提供一个符合企业成本与利益的、及时的策略来保证IT服务与基础设施,始终达到或者超过当前业务的需求,促使业务的健康发展与IT服务的降本增效。优维研发的【容量管理】是从容量规划、容量呈现、容量运营等角度,实现对系统、应用的动静态容量管理。


通过对企业客户的深入调研,优维从四个方面有针对性的为企业提供容量管理服务。

  1. 由于企业业务不断变化,关联系统的容量支撑不得而知。为此,优维的【容量管理】可基于业务容量的变化情况,全面预估服务及容量是否能支撑业务需要。
  2. 企业缺乏系统及应用服务容量水平的实时监控。针对这一痛点,优维【容量管理】可实时掌握系统及应用服务的性能容量和资源容量状况,并定时提醒运维负责人做出改进。
  3. 企业在面临重大活动及节假日(禁止变更),系统/资源容量难以提前评估支撑。企业可利用优维【容量管理】查看活动及节假日的业务变化情况,全面评估及预测系统/资源容量水平,制定容量应对手段,从而很好的支撑业务。
  4. 缺乏主动容量管理,不足以预留足够的时间应对周期性业务变化。对此,优维【容量管理】通过建立周期性容量规划和预测机制,全面评估容量情况,制定改进计划,并落实解决。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/480998.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

大数据开发扩展shell--尚硅谷shell笔记

大数据开发扩展shell 学习目标 1 熟悉shell脚本的原理和使用 2 熟悉shell的编程语法 第一节 Shell概述 1)Linux提供的Shell解析器有: [atguiguhadoop101 ~]$ cat /etc/shells /bin/sh/bin/bash/sbin/nologin/bin/dash/bin/tcsh/bin/csh2&#xff09…

男性三十三岁,头晕头疼,心慌和后背发紧,竟被它治好了!

植物神经紊乱是一种影响现代人健康的常见问题,它源于植物神经系统功能失调,导致身心健康出现一系列不适症状。植物神经紊乱对身体健康的影响是多方面的,它可能导致睡眠问题、情绪波动和自律神经功能紊乱等多种不适症状,严重影响个…

深度学习,CRNN+CTC和Attention OCR你更青睐哪一种?

深度学习在OCR领域的应用已经取得了瞩目的成果,而选择合适的算法对于提升OCR的识别准确率至关重要。在众多算法中,CRNN和Attention OCR犹如两颗璀璨的明珠,备受瞩目。 CRNN,这位结合了卷积神经网络(CNN)和…

如何在 iPad 上恢复已删除的历史记录?

iPad 配备了一个名为 Safari 的内置网络浏览器。这是一种在旅途中保持联系和浏览网页的强大且便捷的方式。但如果您不小心删除了浏览历史记录,则尝试恢复它可能会很令人沮丧。 幸运的是,您可以通过多种方法在 iPad 上恢复已删除的 Safari 历史记录。您应…

【自然语言处理七-经典论文-attention is all you need】

然语言处理七-经典论文-attention is all you need 摘要原文译文小结 1:引言原文译文小结 2:背景原文译文小结 3:模型架构原文译文小结 3.1 编码器和解码器原文译文小结 3.2 注意力原文译文小结3.2.1 缩放点积注意力原文总结 3.2.2 多头注意力…

计算机网络——数据链路层(数据链路层功能概述)

计算机网络——数据链路层(数据链路层功能概述) 数据链路层的功能数据链路层的基本概念封装成帧和透明传输 我们之前已经学完了物理层的所有内容,今天开始我们要进入数据链路层的学习,如果有小伙伴对物理层的内容感兴趣的话&#…

【Web】记录巅峰极客2023 BabyURL题目复现——Jackson原生链

目录 前言 分析 EXP SignedObject打二次反序列化 打TemplatesImpl加载恶意字节码 前文:【Web】浅聊Jackson序列化getter的利用——POJONode 前言 题目环境:2023巅峰极客 BabyURL 之前AliyunCTF Bypassit I这题考查了这样一条链子: BadAttributeV…

C语言 自定义类型:结构体

目录 前言 一、结构体类型 1.1 结构体的声明 1.2 结构体变量的创建和初始化 1.3 结构体的特殊声明 1.4 结构体的自引用 二、结构体的对齐 2.1 对齐规则 2.2 内存对齐的原因 2.3 修改默认对齐数 2.4 结构体传参 三、结构体实现位段 3.1 位段的内存分配 3.2 段的跨平…

39 openlayers 对接地图图层 绘制点线面圆

前言 这里主要是展示一下 openlayers 的一个基础的使用 主要是设计 接入地图服务器的 卫星地图, 普通的二维地图, 增加地区标记 增加 省市区县 的边界标记 基础绘制 点线面园 等等 测试用例 <template><div style"width: 1920px; height:1080px;" &g…

软考高级:软件架构评估概述和例题

作者&#xff1a;明明如月学长&#xff0c; CSDN 博客专家&#xff0c;大厂高级 Java 工程师&#xff0c;《性能优化方法论》作者、《解锁大厂思维&#xff1a;剖析《阿里巴巴Java开发手册》》、《再学经典&#xff1a;《Effective Java》独家解析》专栏作者。 热门文章推荐&am…

计算机网络:分层体系结构

计算机网络&#xff1a;分层体系结构 基本分层概述各层次的任务物理层数据链路层网络层运输层应用层 数据传递过程分层体系常见概念实体协议服务 基本分层概述 为了使不同体系结构的计算机网络都能互联&#xff0c;国际标准化组织于 1977 年成立了专门机构研究该问题。不久他们…

鸿蒙一次开发,多端部署(十一)交互归一

对于不同类型的智能设备&#xff0c;用户可能有不同的交互方式&#xff0c;如通过触摸屏、鼠标、触控板等。如果针对不同的交互方式单独做适配&#xff0c;会增加开发工作量同时产生大量重复代码。为解决这一问题&#xff0c;我们统一了各种交互方式的API&#xff0c;即实现了交…

基于ssm的勤工助学管理系统+数据库+报告+免费远程调试

项目介绍: 基于ssm的勤工助学管理系统。Javaee项目&#xff0c;ssm项目。采用M&#xff08;model&#xff09;V&#xff08;view&#xff09;C&#xff08;controller&#xff09;三层体系结构&#xff0c;通过Spring SpringMvc Mybatisplus VuelayuiMaven来实现。有管理员和老…

国内AI领域的新星:Kimi与GPT的较量,谁主沉浮?

近期&#xff0c;国产大型人工智能模型Kimi频繁成为众多行业领袖讨论的焦点。这些来自不同领域的专家和领袖们&#xff0c;似乎都在对Kimi的性能和能力给予高度评价。在这两年国产AI模型的快速发展中&#xff0c;尽管市场上涌现出了许多新面孔&#xff0c;但真正能够在技术和应…

Tomcat整体架构

一、Tomcat介绍 开源的java web应用服务器&#xff0c;实现了java EE的部分技术规范&#xff0c;如 java servlet、javaServer Pages、 JavaWebSocket等&#xff1b; 核心&#xff1a;http服务器Servlet容器 二、Tomcat两个核心功能 1、处理Socket连接&#xff0c;负责网络字节…

jQuery 其他方法

文章目录 1. jQuery 拷贝对象2. 多库共存3. jQuery 插件3.1 瀑布流插件3.2 图片懒加载技术3.3 bootstrap JS 组件3.4 bootstrap JS 插件*案例--todolist布局 1. jQuery 拷贝对象 拷贝过去的对象属性值会覆盖原来对象的值。 **浅拷贝&#xff1a;**简单数据类型就直接被拷贝&am…

第十三届蓝桥杯物联网试题(省赛)

做后感悟&#xff1a; OLED显示函数需要一直显示&#xff0c;所以在主函数中要一直循环&#xff0c;为了确保这个检错功能error只输出一次&#xff0c;最好用中断串口进行接收数据&#xff0c;数据收完后自动进入中断函数中&#xff0c;做一次数据检查就好了&#xff0c;该开灯…

正基塑业邀您参观2024长三角快递物流供应链与技术装备展览会

2024.7.8-10 杭州国际博览中心 科技创新&#xff0c;数字赋能 同期举办&#xff1a;数字物流技术展 新能源商用车及物流车展 电商物流包装展 冷链物流展 展会介绍 2024长三角快递物流供应链与技术装备展览会&#xff08;杭州&#xff09;&#xff0c;于2024年7月8-10日在杭州…

QGraphicsView 实例3地图浏览器

主要介绍Graphics View框架&#xff0c;实现地图的浏览、放大、缩小&#xff0c;以及显示各个位置的视图、场景和地图坐标 效果图: mapwidget.h #ifndef MAPWIDGET_H #define MAPWIDGET_H #include <QLabel> #include <QMouseEvent> #include <QGraphicsView&…

Tomcat 服务器部署和 IDEA 配置 Tomcat

(一) Tomcat 简介 Tomcat是Apache软件基金会一个核心项目&#xff0c;是一个开源免费的轻量级Web服务器&#xff0c;支持Servlet/JSP少量JavaEE规范。 概念中提到了JavaEE规范&#xff0c;那什么又是JavaEE规范呢? JavaEE: Java Enterprise Edition,Java企业版。指Java企业级…