智和信通助力某大型服饰集团建设综合监控运维

        某大型服饰集团成立于90年代,是广受认可的国民生活时尚品牌,近年来随着集团公司业务规模的不断扩大,信息化作为支撑集团公司业务发展的重要技术手段,信息系统无论在规模上还是在复杂程度上均有了很大程度的增加。

项目现状

        当前信息系统庞大规模与复杂的结构,为数字中心的运维管理能力带来极大挑战。由于数字中心还是以分散的工具化产品、结合手工为主的运维模式,导致目前运维工作多是局部的、分散的,各项运维工作之间缺乏联动,没有形成整体的运维管理体系。

        设备类型:交换机、防火墙、负载均衡、AC、无线AP、上网行为管理等。

        设备品牌:华为、华三、思科、锐捷、戴尔、飞塔、F5、网康、深信服、优特普、极进extreme、iKuai、博科brocade、山石网科、Radware、TP-LINK等

        设备数量:2500台

项目期望

        面对运维现状,数据中心期望有一整套完整的监控运维平台,实现对整个集团公司的IT基础设施进行全面、集中管理。有效地从根本上解决运维工作中存在的基础资源台账管理不统一、数据不准确,监控手段有限、系统故障发现不及时,问题定位难、解决慢等突出问题。

  • IT设备分布在多个城市的不同园区,急需解决网络架构、设备间链接关系无法可视化呈现的难题,清晰定位设备节点位置;
  • 现有设备类型繁多,且随着信息化的建设,设备类型和数量在不断增长,更需要一款可扩展、可兼容不断变化的设备的监控运维产品;
  • 实时监测网络流量,尤其是每个园区与互联网连接的出口流量;
  • 运维人员长期处于“救火”状态,出现问题往往耗时耗力地需要从头排查,极易造成服务性能下降或业务停机时间偏长;
  • 改善依靠部分运维管理工具和人工日常巡检相结合的管理方式,释放因IT资产增加而逐渐增大的运维压力;
  • 提升对网络资源实际使用情况的实时感知能力,减少因性能瓶颈造成的业务缓慢、死机等被动响应的情况;
  • 实现对业务系统从基础硬件到上层服务的体系化监控,定位业务异常根因。

智和信通方案

        考虑到用户复杂的网络场景,智和信通确定采用分布式部署的方案进行平台部署,在每个园区分别部署一台采集服务器采集本园区内设备的各类性能、故障信息;在IDC机房部署智和网管平台进行全量集中管理。

跨地域多园区网络集中管理、可视化展示

        通过智能发现技术,将跨地域多园区中的IT设备自动发现出来,并以图形化、具象化的拓扑形式展现设备间的联动关系与实时状态信息,帮助运维人员实时了解网络架构及全网运行状态,快速感知资源、链路、流量等异常信息。

多品牌型号设备统一纳管、差异监控

        在拓扑图的基础上,进一步展示设备的细节,将用户网络内不同类型、不同品牌、不同型号的设备统一纳管,并根据用户需求差异化配置监控指标,指标包括但不限于以下内容。

  • 交换机状态、响应时间、运行时间、电源状态、CPU使用率、内存使用率、网口状态、接收/发送流量、发送/丢包率、接收/发送带宽使用率等;
  • 防火墙:响应时间、CPU使用率、内存使用率、温度网口状态、接收/发送流量、发送/丢包率、接收/发送带宽使用率等;
  • 无线AC状态、响应时间、运行时间、电源状态、CPU使用率、内存使用率、网口状态、接收/发送流量、发送/丢包率、接收/发送带宽使用率、AP指标等;
  • 无线AP:状态、响应时间、IP地址、设备名称、接口数量、内存大小、SSID、接收/发送流量、接收/发送带宽、射频传输重传帧比率、射频传输错误帧比率、射频传输总帧数、关联的站点总数、关联失败的站点总数、当前连接用户数、当前断开连接用户数、成功验证的用户的在线时间等;
  • 负载均衡状态、响应时间、运行时间、CPU使用率、内存使用率等;
  • 行为管理:状态、响应时间、cpu使用率、内存使用率、硬盘使用率、活跃用户数、上线用户数、高速缓存状态、日志中心服务状态

统一告警管理和故障自愈

        方案通过统一的故障中心,将各个模块中的监控信息统一采集、分析,实现整个网络中各种事件信息、设备故障、业务异常、流量异常等告警,以智能化手段进行标准化的分析、压缩、并归关联等,通过站内消息、邮件、钉钉的方式实时传达告警信息,保证落实到指定人员进行处理。

        与此同时,结合平台的运维编排功能,通过拖拽编排的形式将用户对常规告警的处置方式转化为依托平台的自定义工作流,在发生告警时,自动触发处置流程,从而实现故障自愈。

IT设备全自动化巡检

        结合用户真实的巡检工作要求,自定义配置巡检策略,细化巡检范围,自动执行巡检操作,并将巡检结果通过邮件的形式推送给任务负责人,实现对设备的定期检查。

设备异常trap和syslog转告警

        接收设备主动发送的各类事件与日志消息,集中存储、解析处理后,将错误、告警、攻击行为等异常信息转化为告警,及时地通知用户进行处置。通过统一界面集中管理事件与日志,提高其完整性和可追溯性,帮助用户快速定位问题并采取相应的解决措施。

运营业务拨测与分析

        通过构建业务分析模型,将集团内部的供应链系统、邮件系统、物流系统、直播分析系统、OA系统等纳入平台进行拨测分析。部署可视化业务拓扑,将业务相关的基础设施和应用可视化显示并有效量化,将其状态映射到他们所支持的业务上,直观反映IT基础设施的动态变化对业务造成的影响和威胁。

出口流量透视分析

        将出口设备纳入流量透视平台,通过sFlow协议从设备、接口、IP、服务、应用、会话、协议层级进行实时监测与回溯分析识别带宽消耗较大的应用程序、服务、协议或 IP 地址,避免网络容量过载,并提升最终用户网络体验。

运维数据可视化和领导视图

        利用图形、图表、图表等形式,直观呈现网络中运维数据分析、处理的结果,尤其是网络专线大屏,动图呈现专线线路的流入/流出速率、丢包率、延时、抖动等核心指标,为用户提供网络优化的方向和依据。

应用价值

        在部署智和网管平台后,数据中心将集团内交换机、防火墙、负载均衡、AC、无线AP、上网行为管理等IT设备进行集中管理,保障这些IT基础设施及其支撑的各类业务系统长期稳定运行。同时得益于智和网管平台强大的模型库扩展能力,数据中心实现了对不同品牌、型号设备在不同应用场景下的差异化监控,不仅能够实时对每台设备的运行状态进行关键指标的监测,还可以通过预设告警阈值,及时捕捉并处理潜在性能瓶颈和故障风险,有效预防业务中断。

        在对用户运维场景进行充分调研后,通过平台内自动化运维编排功能,通过编写运维工作流,实现了日常巡检、故障自愈、软件升级、设备配置备份与恢复等日常运维任务,在极大地减轻运维人员负担的同时,提高了工作效率,保障操作的一致性和准确性。

        在保障监控准确性的同时,智和信通也兼顾了用户体验,通过大量的数据分析和可视化功能,运维人员可以直观地查看IT设备的性能趋势、故障分布、业务系统健康度等关键数据,为决策提供有力数据支撑。

        展望未来,随着集团信息化建设的不断扩展和数字化转型的逐步深入,数据中心也将面临更多元化的挑战。北京智和信通作为数据中心的一体化监控平台,也将持续引入更先进的智能技术,以更智能的方式预测并应对数据中心未来可能存在的风险,助力集团的IT基础设施成为支撑业务持续发展的坚定基石。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/897432.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【嵌入式实时操作系统开发】智能家居入门4(FreeRTOS、MQTT服务器、MQTT协议、STM32、微信小程序)

前面已经发了智能家居入门的1、2、3了,在实际开发中一般都会使用到实时操作系统,这里就以FreeRTOS为例子,使用标准库。记录由裸机转到实时操作系统所遇到的问题以及总体流程。相较于裸机,系统实时性强了很多,小程序下发…

1 -《本地部署开源大模型》如何选择合适的硬件配置

如何选择合适的硬件配置 为了在本地有效部署和使用开源大模型,深入理解硬件与软件的需求至关重要。在硬件需求方面,关键是配置一台或多台高性能的个人计算机系统或租用配备了先进GPU的在线服务器,确保有足够的内存和存储空间来处理大数据和复…

Linux杀毒-KVRT

🚀目录 (一) 简介🚀(二) 下载地址😟方式一:访问官网下载方式二:wget下载 (三) 使用方式1.修改执行权限2.命令行下进行扫描动作全盘扫描扫描指定目录 可视化界面下进行扫描动作 (四)更多操作&…

使用Python抓取房源信息

1. 引言 在当今大数据时代,网络爬虫成为获取信息的重要手段之一。本文将以某家二手房为例,演示如何使用Python爬虫抓取房源信息,并将这些信息保存到Excel文件中。 目标网站 2. 准备工作 2.1 安装必要的库 在开始之前,请确保你…

QT日志库:log4Qt及Qt自带日志库使用

介绍 Log4Qt是使用Trolltech Qt Framework的Apache Software Foundation Log4j包的C 端口。它旨在供开源和商业Qt项目使用。所以 Log4Qt 是Apache Log4J 的Qt移植版,所以看Log4J的资料应该是最直接有效的(因为 Log4Qt的直接资料太少了)。 Log4Qt主要是用来记录日志(…

DCS项目调试踩坑记录

最近在调试一个DCS项目(集散控制系统),实际上就是一个新建厂区的控制系统。PLC用的是西门子1500,控制画面使用组态王7.5。 在调试过程中,发现给西门子DB块的变量转移到组态王太难了,因此记录一下&#xff0…

【IEEE独立出版 | 厦门大学主办】第四届人工智能、机器人和通信国际会议(ICAIRC 2024)

第四届人工智能、机器人和通信国际会议(ICAIRC 2024)定于2024年12月27-29日在中国厦门举行。会议旨在为从事“人工智能、机器人和通信”研究的专家学者、工程技术人员、技术研发人员提供一个共享科研成果和前沿技术,了解学术发展趋势&#xf…

TCRT5000红外循迹传感器指南

开始先发送红外线 当返回的红外线的信号量小于规定值时,D0输出0,反之输出1 黑色的物体吸收红外光比其他物体多,所以检测到黑色物体D0会输出0,可以以此来循迹 逆时针调节电位器可以使得规定值上升,需要接受更多信号才能输出1 顺…

【前端】如何制作一个自己的网页(15)

有关后代选择器的具体解释&#xff1a; 后代选择器 后代选择器使用时&#xff0c;需要以空格将多个选择器间隔开。 比如&#xff0c;这里p span&#xff0c;表示只设置p元素内&#xff0c;span元素的样式。 <style> /* 使用后代选择器设置样式 */ p span { …

大数据-184 Elasticsearch - 原理剖析 - DocValues 机制原理 压缩与禁用

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; 目前已经更新到了&#xff1a; Hadoop&#xff08;已更完&#xff09;HDFS&#xff08;已更完&#xff09;MapReduce&#xff08;已更完&am…

数字后端零基础入门系列 | Innovus零基础LAB学习Day4

Module 10 利用Global Router来分析设计是否可绕通 LAB10-1 跑一个placement 本章节目的是load进一个floorplan&#xff0c;跑通一个placement并完成post-placement的timing优化 导入设计和floorplan 这步之前的lab已经做过了&#xff0c;大家再按照下面的步骤再练习巩固下…

信息安全工程师(62)网络蠕虫分析与防护

网络蠕虫分析 网络蠕虫是一种智能化、自动化&#xff0c;综合了网络攻击、密码学和计算机病毒技术的恶意程序或代码&#xff0c;它无须计算机使用者干预即可运行。这种蠕虫能够扫描和攻击网络上存在系统漏洞的节点主机&#xff0c;并通过局域网或国际互联网从一个节点传播到另一…

【UE5】通过程序化网格体组件实现剖切功能

效果 步骤 1. 新建两个Actor类蓝图&#xff0c;分别命名为“BP_CutActor”、“BP_CutPlane”&#xff0c;分别表示被剖切的网格体和剖切的片面。 2. 打开“BP_CutActor”&#xff08;被剖切的网格体&#xff09;&#xff0c;添加静态网格体组件、程序化网格体组件&#xff0c;…

(三)第一个Qt程序“Qt版本的HelloWorld”

一、随记 我们在学习编程语言的时候&#xff0c;各种讲解编程语言的书籍中通常都会以一个非常经典的“HelloWorld”程序展开详细讲解。程序虽然简短&#xff0c;但是“麻雀虽小&#xff0c;五脏俱全”&#xff0c;但是却非常适合用来熟悉程序结构、规范&#xff0c;快速形成对编…

原型模式和建造模式的区别

原型模式&#xff08;Prototype Pattern&#xff09;和建造者模式&#xff08;Builder Pattern&#xff09;虽然都是创建型设计模式&#xff0c;但它们的应用场景和实现方式有着显著的区别。以下是二者的详细对比&#xff1a; 1. 意图和应用场景 原型模式&#xff1a; 意图&a…

【论文阅读】2022 TChecker Precise Static Inter-Procedural Analysis for Detecting

总览 “TChecker: Precise Static Inter - Procedural Analysis for Detecting Taint - Style Vulnerabilities in PHP Applications” 由香港中文大学的 Changhua Luo、Penghui Li 和 Wei Meng 撰写。论文介绍了 TChecker 工具&#xff0c;用于检测 PHP 应用中的污点式漏洞&am…

【Linux】为什么环境变量具有全局性?共享?写时拷贝优化?

环境变量表具有全局性的原因&#xff1a; 环境变量表之所以具有全局性的特征&#xff0c;主要是因为它们是在进程上下文中维护的&#xff0c;并且在大多数操作系统中&#xff0c;当一个进程创建另一个进程&#xff08;即父进程创建子进程&#xff09;时&#xff0c;子进程会继承…

动态路由:RIP实验

1.划分IP 2.配置环回 3.接口配置IP地址 4.进入RIP中&#xff0c;关闭手工汇总&#xff0c;选择版本号&#xff0c;宣告 5.ping命令查看是否全网通 6.在R3上配置缺省路由 [R3-rip-1]default-route originate 在边界路由器上下发缺省 7.为了安全配置手工认证 [R1-Gigab…

qt QVariant详解

QVariant是Qt框架中一个功能强大的变体类&#xff0c;它提供了一种通用的方式来存储Qt对象及其他类的值&#xff0c;能够以类似于指针的方式存储任意类型的值。 一、 主要特性 通用性&#xff1a;QVariant可以存储几乎所有数据类型&#xff0c;包括基本数据类型&#xff08;如…

刷题小记9:回溯

回溯算法模板&#xff1a; void backtracking(参数) {if (终止条件) {存放结果;return;}for (选择&#xff1a;本层集合中元素&#xff08;树中节点孩子的数量就是集合的大小&#xff09;) {处理节点;backtracking(路径&#xff0c;选择列表); // 递归回溯&#xff0c;撤销处理…