北京某新能源汽车是某世界500强汽车集团旗下的新能源公司,也是国内首个获得新能源汽车生产资质、首家进行混合所有制改造、首批践行国有控股企业员工持股的新能源汽车企业,其主营业务包括纯电动乘用车研发设计、生产制造与销售服务。
项目现状
在企业全面迈向数字化转型的进程中,业务信息系统的数量持续攀升,作为其支撑的IT基础架构也随之变得愈发复杂和庞大。这一变化也对运维部门监控运维工作的质量和效率提出了更为严格的要求。
设备类型:交换机、服务器、主机、虚拟化、防火墙、IPS(入侵防御系统)、上网行为、WAF(Web应用防火墙)等。
设备品牌:华为、锐捷、启明星辰、微步、安恒等
网络场景:生产+办公环境网络集中管理,400台设备
项目期望
车企的运维工作涉及生产环境和办公环境的整体维护与支持。随着业务量的持续增长,各业务之间的集成度和复杂度日益提高。因此,如何保障生产业务的稳定运行、提升运维效率以及增强业务可靠性,已成为运维部门最为关注的核心议题。
- 集中管理生产环境和办公环境中的IT设施,实现对不同品牌、型号设备的纳管,且支持对新设备的兼容;
- 具备直观的网络拓扑图,能够在一张图上呈现生产+办公环境内的IT设备;
- 具有丰富的设备监控指标,如CPU使用率、内存使用率、网口流量等,支持获取设备更全面的运行信息;
- 可以在拓扑观测到设备的实时状态,提供丰富的告警通知形式,解决因告警触达不及时造成的业务风险;
- 在实现设备监控的同时,具备专线、链路的监控能力,改善因专线、链路管理不深入造成的流量负载问题。
智和信通方案
根据企业的网络现状和使用场景,智和信通采取“统一部署、集中管理”的模式,对用户生产和办公网络进行监控管理。
全面响应网络设备、安全设备、服务器等监控需求
方案提供可扩展的设备、资源、监控指标模型库,将用户生产、办公网络内交换机、服务器、主机、虚拟化、防火墙、IPS(入侵防御系统)、上网行为、WAF(Web应用防火墙)等设备统一纳入平台管理。
同时,通过扩展模型的自定义能力,根据用户设备如华为、锐捷、启明星辰、微步、安恒等,结合设备应用场景,进行差异化监控策略配置。
自动生成网络拓扑,实时观测网络状态
通过智能自动发现技术,将分布在办公楼、冲压楼、焊装楼、涂装楼、分装楼、生产车间、维修车间等环境内的网络设备一键扫描出来,并在扫描的过程中识别设备厂商和型号。获取设备内部资源与外部连接关系,自动匹配故障、性能监视器,自动对其进行监控。
支持通过拖拽、钻取等方式对自动生成的网络拓扑进行美化调优。在拓扑中以不同图标区分设备品牌型号,以不同颜色呈现设备实时状态和故障等级,如设备掉线呈现灰色。
实时监控设备运行状态,分析历史性能
实时监测全网设备的运行状况,针对不同类型的设备设定差异化的监控指标。例如,对于交换机,重点关注其CPU、内存的使用情况以及网络接口的流量和带宽;而对于核心交换机,则需额外关注其磁盘状态和容量情况。
提供综合信息、实时性能分析及历史性能分析等界面,通过曲线图、柱状图或表格等形式展现设备性能的变化情况,并支持按日、周、月进行查看或对比分析。
智能告警管理策略和多渠道告警通知
通过自定义配置告警阈值,主动地从众多的事件和状态中,系统将零散的状态信息,总结成当前状态,并进行状态分析对异常状态进行告警。第一时间获取准确的告警信息,快速标示已执行操作的告警,迅速定位告警设备。
提供界面颜色、提示声、光效闪烁、信息列表、Email、短信、钉钉、企业微信、个人微信等多种通知渠道,告警通知无延迟,告警渠道全覆盖。告警可以向上逐步追溯,按照从全局→网络→设备→资源的管理习惯来组织故障显示。
告警收敛降噪和统一故障分析
通过构建统一故障中心,在统一采集与分析来自不同模块的监控数据,整合网络内各类事件信息、设备故障以及流量异常等告警信息,并采用智能化手段进行分析、压缩、并归关联等告警收敛降噪操作,确保能够及时向指定责任人传达相关故障告警以便第一时间采取相应措施进行处置。
此外,还将依据时间、资源以及性能等多个维度,对实时、历史告警进行分析,并通过图表形式进行呈现,实现对所有告警情况的统一管理和深入剖析。通过对变化趋势、告警之间的联系及其解决方案等方面的综合考量,从多个角度全面理解当前告警状态,为决策提供有力支持。
可视化运维大屏,全面剖析运维数据
提供可视化数据分析能力,对网络海量数据进行图形化分析展示。通过直观的图表和图形化手段清晰有效地传达运维数据分析结果,帮助用户从宏观到微观更快地了解网络运维现状,做出更具时效性的决策。
在提供多款不同风格、不同内容的运维大屏的基础上,智和信通依据用户真实需求,定制两款专用大屏,重点展示用户专线流量情况和全网综合设备运行态势。
应用价值
北京智和信通监控运维方案,基于核心产品智和网管平台SugarNMS,全面覆盖并管理用户生产与办公环境中的各类网络设备、安全设施、服务器及主机等信息技术基础设施,并成为提升企业运营效率、保障生产线稳定运行的重要工具。
通过实时监控IT基础设施和服务的性能指标,如CPU使用率、内存占用、磁盘空间、网络流量等,运维团队能够及时发现潜在问题并采取措施进行修复或优化。通过主动式的维护有效减少意外宕机事件的发生,提高系统的整体稳定性。
同时方案不仅聚焦于传统的IT资源管理,更进一步融入了AI智能分析与预测功能。自动识别网络异常,提前预警潜在故障,显著降低了因设备故障导致的业务中断风险,保障关键业务7x24小时不间断运行。
此外,方案还提供了丰富的可视化报表与运维大屏,帮助运维人员一目了然地掌握整个网络的健康状况。无论是实时性能监控还是历史数据分析,都能够轻松实现。这不仅极大地提高了决策效率,还帮助管理者快速响应业务需求,优化资源配置。
北京智和信通的监控运维方案,通过深度整合IT资源监控、故障预警、自动化运维及数据分析等核心功能,并融合人工智能与大数据分析技术,实现了对复杂IT环境的精准洞察与高效管理。凭借全面性、智能化和高效率的特点,该方案已成为用户信赖的运维管理伙伴,助力企业在数字化浪潮中稳健前行。