IT 运营管理(ITOM)可以定义为监督 IT 基础架构的各种物理和虚拟组件的过程;确保其性能、运行状况和可用性;并使它们能够与基础架构的其他组件无缝协作。IT 运营管理(ITOM)在大型 IT 管理模型中也发挥着积极作用,包括 IT 基础设施管理(ITIM)、数据中心基础设施管理(DCIM)等。
如今,无论行业如何,企业都在很大程度上依赖于 IT,组织的 IT 基础架构需要强大且敏捷。这只能通过对 IT 运营进行准确高效的管理来实现,以确保这些运营以最佳水平运行。
对于依赖其网络来支持其日常运营的组织来说,网络的运行情况可以决定其业务的成败。作为网络管理员,核心目标是确保成功执行日常业务运营,这包括优化网络以实现最佳性能并最大限度地减少服务中断。
实现这些目标可归结为几个因素:LAN 和 WAN 性能、带宽可用性和消耗、VPN 可用性和性能、应用程序运行状况和服务级别协议。
为确保正确维护这些关键因素,管理员需要:
- 维护网络设备清单。
- 根据需要预配新硬件。
- 实时监控网络设备和服务。
- 确定性能问题。
- 以最少的工作量和时间解决问题。
这只能在网络监控工具的帮助下完成,但是,市场上有如此多的网络监控工具,如何选择为您的 IT 环境提供最大价值的工具?让我们讨论一下网络监控工具、它们的基本要求、一些不错的功能以及从长远来看对您的 IT 团队有帮助的特殊功能。
网络监控工具:基础要素
- 网络发现:根据用户定义的条件自动发现所有网络设备,从而减少工作量,让管理员专注于手头更紧迫的任务。
- 设备清单:维护所有网络设备的清单,包括 DNS 名称、IP 地址和供应商详细信息等详细信息,可帮助管理员密切关注网络并防止未经授权的访问。
- SNMP/WMI监控:由于大多数网络都由支持 SNMP 的硬件组成,因此这有助于监控一系列网络硬件的可用性和性能。
- 接口监控:物理接口和虚拟接口是任何网络的关键,因此必须监控接口流量、错误、丢弃、利用率、数据包大小等,以便在网络拥塞影响最终用户之前识别网络拥塞。
- 网络拓扑映射:包括网络拓扑在内的可视化可帮助管理员了解网络的来龙去脉,此外,它还可以帮助管理员轻松快速地发现网络问题。
- 自定义监控:每个 IT 环境都是独一无二的,没有任何网络监控工具可以提供您开箱即用所需的一切。IT 团队为非常专业的需求构建自定义硬件,这就是自定义监控派上用场的地方。
- 警报:网络故障的实时警报有助于将平均修复时间降至最低。此外,通过对警报的关键性质进行颜色编码,管理员可以立即将注意力集中在对业务运营更重要的问题上。
- 疑难解答工具:查找问题的根本原因是 IT 管理员工作的主要部分。Ping、Traceroute、SNMP Ping、Remote Desktop、Trap Viewer 等故障排除工具可帮助管理员有效地跟踪、分析和解决网络性能问题。
- 报告:网络不同网段的报告可帮助管理员定期审核网络性能并确定需要改进的领域。
- 故障转移或高可用性:实时网络监控工具对 IT 管理员来说非常重要,它们提供全天候网络可见性。当网络监视器工具失败时会发生什么情况?一切都变得混乱,因此最好有一个冗余机制。故障转移系统正是这样做的,并在主系统发生故障时接管网络监视活动。
- 技术支持:没有任何工具是完美的,IT 管理员经常会遇到与网络监控工具相关的技术问题。这可能是配置问题或特定功能未按预期执行。这可以通过产品专家和客户支持技术人员通过聊天、电话或远程会话来克服。
- 文档:产品文档是经常被忽视的东西,通过供应商的产品帮助文档,可以很容易地消除对产品功能、机制和配置的大多数疑问。这样可以节省时间和精力。
这些是大多数网络监控工具中的基本要求,这些可以帮助 IT 管理员度过一天,如果网络监控工具中不存在这些功能中的任何一个,则不值得考虑将该工具用于您的 IT 环境。
网络监控工具:必备功能
- 网络流量管理:带宽瓶颈会抑制员工的工作效率并导致服务中断,通过监视和管理占用更多带宽的用户和应用程序,IT 管理员可以提供一流的用户体验。
- 应用程序性能监控:只有当管理员了解关键业务应用程序的运行状况和性能时,才能改善最终用户体验,获得的可见性应提供对 Web 应用程序、数据库、容器、用户体验等的实时监控的见解。
- 网络自动化:自动执行 IT 管理员的日常工作,例如日常维护任务和 L1 故障排除任务,使他们能够更专注于关键问题并为用户提供更好的体验。
- VoIP监控:使用数据包丢失、抖动、MOS 和 RTT 等指标来监控 LAN 和 WAN 基础设施中的 VoIP 呼叫质量,可帮助您识别较差的 VoIP 性能,并确定是否需要将新的 VoIP 线路添加到网络中。
- VPN监控:随着新的在家工作政策的出台,确保员工 VPN 连接强大现在是日常运营的重要组成部分,监控活动的 VPN 主机、VPN 隧道和 VPN流量对于强大的 VPN 连接至关重要。
- 虚拟环境和 HCI 监控:几乎每个 IT 团队都采用虚拟和超融合基础架构 (HCI) 来高效利用其资源,为确保最佳性能,管理员需要监控主机、虚拟机运行状况、识别僵尸虚拟机并防止虚拟机蔓延。
- WLC监控:如今,网络支持越来越多的移动设备,为了扩大组织网络的覆盖范围,管理员需要添加和监控更多接入点 (AP),管理 WLC 和监控恶意 SSID 和 AP 对于控制组织的无线网络也至关重要。
通过上面讨论的功能,可以更深入地了解您的网络及其性能,这有助于管理员了解哪些因素对业务服务的影响最大以及如何影响,以便了解要优化的内容以及在何处预置其他硬件。
网络监控工具:卓越的功能
- 网络配置管理:对网络稳定性的主要威胁是缺乏有关确保网络设备正常运行的配置的详细信息,管理员需要跟踪谁在何时进行了哪些配置更改,备份、计划和还原配置更改同样重要。
- 防火墙日志管理:防火墙是抵御外部威胁的第一道防线。它可以阻止特洛伊木马、间谍软件和其他恶意程序,实时监控防火墙规则、管理防火墙策略、跟踪防火墙日志,识别潜在威胁,保障网络安全。
- IP 地址管理:如果不能有效地跟踪和管理 IP 地址空间,则可能会发生 IP 冲突和可用 IP 地址用完,这也会严重影响业务运营和员工生产力,实时跟踪 IP 地址并识别 IP 冲突有助于最大限度地减少服务中断。
- 多站点监控:随着组织的扩张,他们通常会设置多个远程办公室。中央管理团队可以管理所有 IT 操作,但使用多个网络监控工具是不可行的。理想的解决方案应该从集中式控制台监视多个远程位置。
这些功能有助于防止网络威胁和服务交付中断,同时提高网络的弹性,它们使您的网络变得敏捷,并在发生网络灾难时轻松更快地恢复。
为了监控上面讨论的所有参数,将需要一个网络设备监控工具、一个服务器和应用程序监控工具、一个网络流量监控工具、一个配置和变更管理工具、一个防火墙安全解决方案、一个 IP 地址管理解决方案和一个 VoIP 监控解决方案。
当管理员使用不同的点工具来监控多个方面时,以下方面变得具有挑战性:
- 配置多个工具以适合您的 IT 环境。
- 在多个工具之间切换以进行监控。
- 在由不同点工具引发的大量警报中操作。
- 关联警报,并从迷宫般的通知中找出根本原因。
满足ITOM需求的网络监控工具
OpManager 综合网络监控解决方案,可以监控Windows服务器、Linux服务器、存储设备、Windows服务,处理和扩展多台设备。该网络软件通过智能自动化、基于 ML 的预测和广泛的协议支持,使网络监控变得毫不费力。以下是包含一些网络监控应用程序:
- 存储容量预测:借助基于 ML 的预测技术,这款网络监控和报告软件可以精确定位设备存储何时达到分配存储的 80%、90% 和 100%,并帮助规划购买决策。
- 通知配置文件:允许管理员通过Slack通道、故障单、电子邮件、短信和网络警报来通知网络故障(如果它们未被确认),因此不会忽略任何警报。
- 警报升级:可以为任务关键型设备(如应用服务器)配置告警升级规则,因此与可用性、运行状况和性能相关的任何故障都会根据用户定义的标准通过电子邮件或短信上报给更高的权限。
- 支持多个供应商:支持超过53,000个供应商模板,可以有效地管理来自Cisco、Juniper、Fortigate等供应商的网络设备,还可以自定义这些模板,以满足组织的独特需求。
- 支持多种协议:支持通信协议(如ICMP)和LAN管理协议(如SNMP、WMI、CLI等)。
- 发现规则引擎:发现规则引擎自动将设备模板和规则与用户定义的网络设备相关联,从而自动执行日常任务,并节省宝贵的时间和资源。
- 内置故障排除工具:提供了多种工具,如Ping、SNMP Ping、Proxy Ping、Traceroute、WMI查询工具、CLI查询工具等,有助于解决网络问题。
- 仪表板:提供直观的仪表板,在一个屏幕上提供整个IT基础设施的360度视图,并使故障识别更加容易。
- 可视化:使用地图和业务视图确定多个分支机构中关键服务的可用性,使用 OpManager 可以轻松地直观地监控远程位置,并在网络服务中断之前实时收到警报。
- 多级阈值:提供带有颜色代码的多级阈值,因此管理员可以识别令人眼花缭乱的网络故障并迅速采取行动。