哈喽~朋友们,这么快又见面啦。前阵子我们给CEO老杨安排了一场年末大讲,主要是跟大家聊聊智能运维的“智”与“能”以及剖析时下热点----运维大模型。后台收到了不少朋友的反馈,小编看了大受鼓舞并暗下决心----新的一年,希望能多安排几场这样的机会与大家分享。感谢大家喜欢~
新来的朋友想观看演讲视频的,可前往我们gong粽号:【擎创夏洛克AIOps】,进行观看。需要演讲资料的朋友可关注gong粽号后发送【年末大讲】即可,期待与大家下次见面。
话不多说,我们直接往下看
一、运维一体化浪潮
在我国快速推进数字化、信息化、国产化的科技变革浪潮中,AIOps智能运维正加速与其他产业进行融合。伴随新技术的生根发芽、新业务需求的快速迭代以及诸多政策的引导,企业智能运维的建设和升级变得迫在眉睫。
老杨从这一年的实践探索中进行心得总结、经验沉淀,并值年末之际已于线上与大家完成深度分享。本文仅做简单摘要回顾,详情内容请点击文内视频进行了解!
回望2023年的智能运维市场,我们发现它已经处在了目标更明确的阶段,即企业看到了局部建设只能解决局部问题的弊端,正在摒弃专业工具堆砌的方式,从更全局的角度去实现全覆盖、精细化、高协作、快联动的运维一体化建设转型。
擎创一体化运维管理体系
老杨认为要顺应趋势,进行新一代运维一体化建设,首先在思路上进行转型。在建流程的基础上,重点改善运维协作和数据管理流程。同时,联合垂直领域专业工具横向融合业务场景,建成监、管、控、配、析五位一体的统一运维平台,跨越式晋级数据能力,解决孤岛、提升分析效率。
二、可观测&应急场景实践
统一可观测最早是由Gartner提出来的概念,它主要面向指标、日志和调用链这三大支柱数据,目的是通过对数据的分析清晰了解系统的运行状态,对发生的事件能够透过现象看本质,快速找到根因辅助排障。
存异:传统应用架构下的可观测,是追求实用和利旧性,专注在协作问题上的整合式观测;而云原生环境下,需要更动态、端到端、请求级颗粒度的可观测,要更具备业务驱动力。
求同:观测视角更多,用户角色分工更细致。
可观测视角
运行视角:告警全面接入,压缩去噪降本,自动化处置提效
业务视角:运维服务于业务,合理归类业务监测颗粒度,交易链路端到端可观测
应用视角:统一应用观测视角,应用架构一览尽收,多维度数据联动分析
专业视角:统一专业领域监控视图,专业领域指标体系化,合理跳转利旧已有工具
管理视角:管理职责明晰,统一策略配置,持续复核检查,复盘反馈优化
应急场景是企业保障业务连续性的重要一环,需要从多视角出发,在高效算法的支撑下为运维提供处置推荐场景,快速完成定障,并可以形成事后复盘和知识沉淀。对于企业而言,应急场景中业务恢复时间就是最大的价值,因此我们推荐可以按照以下思路进行场景的规划建设(详见图片)。
应急处置场景建设
三、老生常谈:数据治理
作为数据治理的倡导者和成熟度标准规范的编撰者,擎创科技一直在帮助企业做数据治理的咨询和服务。经过数年的探索和实践,擎创总结出了“点线面结合”的方法论,即整体面依标准、指导线看场景、专注点钻领域。
五大数据治理域
整体面:基于《金融机构信息系统运维数据治理能力成熟度模型与评估》全面评估各个能力项分值和成熟度
指导线:场景效果和解决的问题是度量各领域数据能力和价值的最好抓手
专注点:针对关注的告警、性能、配置、质量、模型五大领域进行重点分析和改进项识别
四、未来趋势:运维大模型
最后,谈一谈今年最为火爆的运维大模型。擎创认为大模型的构建首先要通过对开源大模型的参数进行微调,结合私域数据构建企业的运维知识库,再通过检索增强、知识增强、指令生成等方式,丰富大模型的运维能力。
运维大模型建设
通过各种实际问题去训练升级它的专业能力,使得大模型成为全面化运维专家的角色,为企业运维提供高效的解决方案和极具价值的决策辅助。
擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司专注于通过提升企业客户对运维数据的洞见能力,为运维降本增效,充分体现科技运维对业务运营的影响力。
行业龙头客户的共同选择
了解更多运维干货与行业前沿动态
可以右上角一键关注
我们是深耕智能运维领域近十年的
连续多年获Gartner推荐的AIOps标杆供应商
下期我们不见不散~