服务台需要跟踪的3个重要指标MTBF+MTTF+MTTR

衡量标准是IT服务管理的核心,可提供有关运营的见解,并帮助确定需要持续改进的领域。通常的服务台指标有助于展示内部运营效率。例如,衡量在规定时间内解决问题的工单数量的 SLA 是展示服务台效率的关键因素。另一方面,故障指标可帮助团队找出 IT 基础设施中的薄弱环节,并帮助评估对故障事件的响应。这有助于 IT 团队最大限度地减少故障可能对关键系统造成的连带影响。

IT服务管理

需要跟踪的关键失败指标是什么?在本文中,我们将看到探讨以下三个关键绩效指标:

1、平均无故障工作时间(MTBF)

当 IT 基础设施资产(无论是网络、服务器还是工作站等)频繁发生故障时,会对 IT 和业务服务的可用性产生连带影响。这些中断会导致收入和声誉的损失。如果某项 IT 资产经常出现故障,通常需要进行维修或更换。在此之前,调查并了解资产经常宕机的原因,以及是在什么情况下宕机,有助于制定资产维护计划,提高系统可用性。

平均无故障工作时间(MTBF)是帮助确定宕机原因的指标,有助于减少宕机时间或制定快速恢复计划,提高 IT 系统的可用性。如果某项 IT 资产的 MTBF 很低,就意味着该资产会经常停机,导致 IT 和业务中断。

MTBF 示例

在一家企业中,每当应用新的 Windows 固件更新时,存储驱动器的新更新总是失败。这种情况发生了几次,平均无故障工作时间变得越来越短。在对问题进行分析后,团队确定是第三方驱动程序导致执行更新所需的 API 无法实施或存在故障。当计划进行新的更新时,如果第三方驱动程序没有实施必要的 API,有两种可能的解决方案可供探索。比如将 API 与 SATA 和 NVMe 存储协议的 Windows 替代方案进行交换,或从原始设备制造商处获取新的、更好支持的驱动程序版本,都有助于实施更新、修复漏洞并堵塞安全漏洞。监控和跟踪驱动程序升级以及停机时间都有助于提高存储驱动器的可用性。

如何提高 MTBF

实施观察资产健康状况的流程,以跟踪和监控故障,有助于找出故障原因。

分析问题的根本原因,以提高认识、解决长期原因并提高资产性能。

制定快速反应战略,有效解决并减少影响运营的停机时间。目标是减少停机次数,延长停机时间。

2、平均失效前时间(MTTF)

资产经常出现故障会中断企业的 IT 运营,导致 IT 基础设施性能下降。MTTF 指标有助于确定资产、设备或组件的使用寿命。对于 MTTF 较低的 IT 资产和组件,通常更换 IT 组件比修复组件更省时,并能最大限度地降低运营影响和成本。

这尤其适用于与基础设施关键运行元素(如大型机服务器堆栈或网络接入点)相关联的 IT 组件。如果资产的 MTTF 不理想且经常出现故障,则表明 IT 资产不可靠,需要频繁更换,以免影响 IT 运营。

MTTF 示例

在一家 IT 软件开发公司,当数据和网络服务器堆栈中的交换机连接或断开电缆时,网络电缆就会松动、断开或损坏。由于数据传输中断,导致文件损坏。网络团队的进一步分析表明,CAT6 RJ45 跳线上的无卡塑料盖不断断裂。这是因为电缆是从使用廉价材料的制造商那里采购的。随后,IT 团队用质量更好的电缆替换了旧电缆,以确保今后移动电缆时不会出现数据丢失或损坏等问题。这是一个典型的例子,但定期跟踪电缆的 MTTF 有助于 IT 团队了解关键资产(如组件)的影响,从而就维修和更换做出明智的决策。

如何提高 MTTF

通过采购高质量的资产和停用低质量、低成本的资产来延长资产的使用寿命。

通过定期检查与关键资产相关的组件,防止大规模中断业务运营。

实施及时库存流程,估算资产的运行时间,从而降低资产存储的间接成本。

3、平均修复时间 (MTTR)

当关键 IT 系统发生故障时,IT 团队必须尽快恢复系统运行。延迟恢复 IT 系统会导致收入损失并影响关键业务运营。一个组织良好的恢复和响应系统可以帮助 IT 团队应对计划外停机,并有效地恢复运行。MTTR 衡量的是修复资产或排除故障并使其恢复运行能力所需的平均时间。

停机成本随着 MTTR 的增加而增加。MTTR 高说明恢复和响应操作不够迅速有效。系统故障是不可避免的,但 MTTR 能让团队对资产故障做出及时和战略性的反应。

MTTR 示例

一家软件公司正在开发的一款视频游戏因代码漏洞而遭到零时差攻击。这次攻击破坏了 Wi-Fi 和监控系统等操作。这导致攻击者访问了组织的网络域和机密业务文件。网络安全团队告知员工有关零日攻击的信息,以及他们可以在哪里报告这些攻击。该组织的所有 IT 资产都配备了下一代杀毒软件 (NGAV)。这次攻击导致局域网和员工自助服务门户瘫痪,使组织的运营陷入瘫痪。在攻击发生后一小时内,网络安全团队得到了 NGAV 的通知和帮助,NGAV 利用威胁分析和用户行为模式,识别出了可疑活动。网络安全团队立即运行补丁管理脚本,修正了代码中的漏洞,并锁定了内部网络,以避免进一步影响运营和数据窃取。

如何降低 MTTR

通过识别瓶颈、指定资产维修或更换,实行高效的资产管理战略,有助于推动更好的决策,还能够可以节省资金和存储空间。

明确技术人员的责任和角色,简化事故检测和解决流程。

为技术人员提供详细的标准操作程序,以减少停机期间的误传和混乱。

使用集中管理资产维护和监控信息的企业资产管理解决方案来衡量 MTTR。这还有助于优化资产利用率、收集资产数据和预测可能的停机时间。

结语

这些指标可帮助团队识别运营中的瓶颈及其对事件的响应能力,它们通过准确定位持续性事件的根本原因,帮助 IT 团队实现更高的运营效率。IT 团队可以清楚地了解 IT 运营受到影响的领域,从而改进其事件响应策略。企业可以将这些指标作为关键绩效指标而不仅仅是绩效目标来实施。这些指标指出了流程简化和运营改进的领域,而不仅仅是要达到的目标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/185198.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

《微信小程序开发从入门到实战》学习二十七

3.4 开发参与投票页面 3.4.2 借用伪造数据开发功能 为了便于开发,新建一个编译模式: 之前没看文章,每次都习惯性填完投票创建的信息提交再跳转看效果。好累。 添加变异模式开发真方便。 另外,点击提交后没跳转到投票页面&#…

CCCCCCC指针CCCCC

本文介绍[ shared_ptr / unique_ptr / weak_ptr ]的使用,以及shared_ptr 引用计数和weak_ptr 弱引用计数。 1. 智能指针概述 C程序设计中使用堆内存是非常频繁的操作,堆内存的申请和释放都由程序员自己管理。程序员自己管理堆内存可以提高了程序的效率…

查企业联系电话的方法

对于销售来说,获取准确、全面的企业联系方式,无疑是开发客户的基础与保障,因为任凭能力再高,说服能力多强,没有与客户接触的机会,这些都是无稽之谈。但是大家都知道,道理都懂,但是要…

C++算法 —— 贪心(3)

文章目录 1、买卖股票的最佳时机2、买卖股票的最佳时机Ⅱ3、K次取反后最大化的数组和4、按身高排序5、优势洗牌6、最长回文串7、增减字符串匹配 1、买卖股票的最佳时机 121. 买卖股票的最佳时机 这里最容易想到的就是暴力枚举,两层for循环,i 0&#xf…

分布式链路追踪实战篇-日志库集成opentelemetry的思路

由上文分布式链路追踪入门篇-基础原理与快速应用可以知道分布式链路追踪的作用,但是距离应用到项目中,我们还需要对项目中一些关键组件进行opentelemetry的集成,例如日志库,ORM、http框架、rpc框架等。 一、日志库如何集成opentel…

设计模式-创建型模式-工厂方法模式

一、什么是工厂方法模式 工厂模式又称工厂方法模式,是一种创建型设计模式,其在父类中提供一个创建对象的方法, 允许子类决定实例化对象的类型。工厂方法模式是目标是定义一个创建产品对象的工厂接口,将实际创建工作推迟到子类中。…

美创联合浙江省农业农村厅斩获“IDC中国20大杰出安全项目”!

11月23日,由IDC主办,以“安全风险管控:新形势下的数据安全保护”为主题的2023全球CSO网络安全峰会(中国站)隆重召开。 会上,IDC “中国20大杰出安全项目(CSO20)” 重磅揭晓&#xff…

Linux中df命令使用

在Linux中,df命令用于显示磁盘空间的使用情况。它的基本语法如下: df [选项] [文件或目录]这个命令可以用来查看当前系统上各个磁盘分区的使用情况。如果没有指定文件或目录,则所有当前被挂载的文件系统的可用空间将被显示。 df命令的一些常…

手把手用GPT开发小程序全流程!就是这么easy~

大家好,我是五竹。 前段时间用GPT开发了一款小程序:GPT真牛批!三天开发一个小程序,三天积累了2000的用户,上周末抽空又接入了流量主,感兴趣的同学可以围观一下。 今天就来带大家走一遍用GPT开发一款小程序的全过程&a…

手把手webpack搭建前端架子

这里以react为例> (一)初始化package.json package name: 你的项目名字叫啥 version: 版本号 description: 对项目的描述 entry point: 项目的入口文件(一般你要用那…

【回眸】Tessy单元测试软件使用指南(一)安装篇

安装 在官网上下载安装包,安装完成后打开进入这个界面 注册申请license:在作为服务端的电脑上安装Tessy。安装完成后,启动Tessy会自动生成license服务器的注册码。(注册码用于申请试用或永久的license文件)这个对于我…

树莓派上使用Nginx通过内网穿透实现无公网IP访问内网本地站点

前言 安装 Nginx(发音为“engine-x”)可以将您的树莓派变成一个强大的 Web 服务器,可以用于托管网站或 Web 应用程序。相比其他 Web 服务器,Nginx 的内存占用率非常低,可以在树莓派等资源受限的设备上运行。同时结合c…

NX二次开发UF_CSYS_set_wcs 函数介绍

文章作者:里海 来源网站:https://blog.csdn.net/WangPaiFeiXingYuan UF_CSYS_set_wcs Defined in: uf_csys.h int UF_CSYS_set_wcs(tag_t csys_id ) overview 概述 Sets the work coordinate system to the prototype coordinate system whose tag y…

竞赛选题 题目:基于FP-Growth的新闻挖掘算法系统的设计与实现

文章目录 0 前言1 项目背景2 算法架构3 FP-Growth算法原理3.1 FP树3.2 算法过程3.3 算法实现3.3.1 构建FP树 3.4 从FP树中挖掘频繁项集 4 系统设计展示5 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 基于FP-Growth的新闻挖掘算法系统的设计与实现…

【PDF.js】2023 最新 PDF.js 在 Vue3 中的使用

因为自己写业务要定制各种 pdf 预览情况(可能),所以采用了 pdf.js 而不是各种第三方封装库,主要还是为了更好的自由度。 一、PDF.js 介绍 官方地址 中文文档 PDF.js 是一个使用 HTML5 构建的便携式文档格式查看器。 pdf.js 是社区…

【HuggingFace Transformer库学习笔记】基础组件学习:pipeline

一、Transformer基础知识 pip install transformers datasets evaluate peft accelerate gradio optimum sentencepiece pip install jupyterlab scikit-learn pandas matplotlib tensorboard nltk rouge在host文件里添加途中信息,可以避免运行代码下载模型时候报错…

vue中下载文件后无法打开的坑

今天在项目开发的时候临时要添加个导出功能我就写了一份请求加导出得代码, 代码: //导出按钮放开exportDutySummarizing (dataRangeInfo) {const params {departmentName: dataRangeInfo.name,departmentQode: dataRangeInfo.qode}//拼接所需得urlcons…

Tomcat注册为服务后,如何配置Tomcat内存大小

前提条件:tomcat已经注册为服务。 1.winR,输入regedit打开注册表 2.找到Tomcat注册表路径: HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Apache Software Foundation\Procrun 2.0\Tomcat80603.找到jvm内存配置路径: HKEY_LOCAL_MACHINE\SOFTW…

Redis高可用之主从复制及哨兵模式

一、Redis的主从复制 1.1 Redis主从复制定义 主从复制是redis实现高可用的基础,哨兵模式和集群都是在主从复制的基础之上实现高可用; 主从复制实现数据的多级备份,以及读写分离(主服务器负责写,从服务器只能读) 1.2 主从复制流…

Windows从源码构建tensorflow

由一开始的在线编译,到后面的离线编译,一路踩坑无数。在此记录一下参考过的文章,有时间整理一下踩坑记录。 一、环境配置 在tensorflow官网上有版本对应关系 win10 bazel 3.1.0 msys2 tensorflow2.3.0 python3.5-3.8 MSVC2019 protobuf3.9.…