管理功能分为管理站manager和代理agent两部分。
网络管理:
网络管理系统中,每一个网络节点都包含有一组与管理有关的软件,叫做网络管理实体NME。
管理站的另外一组软件叫做网络管理应用NMA,提供用户接口,根据用户命令显示管理信息,通过网络向NME发出请求或指令。以便获取有关设备的管理信息,或者改变设备的配置状态。
网络中的其他节点在NME的控制下与管理站通信,交换管理信息,这些节点中的NME模块叫做代理模块,网络中的任何被管理的设备(主机、交换机、路由器、集线器等)都必须实现代理模块。
所有代理在管理站的监视和控制下协同工作,实现集成的网络管理。(集中式网络管理)
网络中至少有一个节点(主机或路由器)充当管理站的角色。
网络管理软件包括:用户接口软件、管理专用软件、管理支持软件。
用户通过网络管理接口和管理专用软件交互作用,监视和控制网络资源。
接口软件不仅存在于管理站上,有可能存在于代理系统中,以便对网络资源实施本地配置、测试和排错。
有效的管理系统需要统一的用户接口。
接口软件需要具有一定的信息处理能力。
网络管理功能分为网络监视和网络控制两部分。称为网络监控。
网络监视是指收集系统和子网的状态信息,分析被管理设备的行为,以便发现网络运行中存在的问题。
网络控制指的是修改设备参数或者重新分配网络资源,以便改善网络的运行状态。
管理信息:
1.静态信息:系统和网络的配置信息。由网络元素直接产生。
例如:路由器的端口数、端口编号,工作站的标识、CPU的类型。
2.动态信息:与网络中出现的时间和设备的工作状态有关。通常由产生有关事件的网络元素收集和存储的。
例如:网络中传送的分组数、网络连接的状态。
3.统计信息:从动态信息推导出的信息。可以由任何能够访问动态信息的系统产生。
例如:平均每分钟发送的分组数、传输失败的概率。
这些信息组成管理信息库MIB。
配置数据库中存储着计算机和网络的基本配置信息。
传感器数据库中存储着传感器的设置信息。
配置数据库和传感器数据库共同组成静态数据库。
传感器是一组软件,用于实时地读取被管理设备的有关参数。
动态数据库存储着由传感器手机的各种网络元素和网络事件的实时数据。
统计数据库中的管理信息是由动态信息计算出来的。
网络控制系统:
监控应用程序是监控系统的用户接口,它完成性能监视、故障监视、计费监视等功能。
管理功能负责和其他网络元素中的代理进程通信,把需要的监控信息提供给监控应用程序。
管理对象表示被监控的网络资源中的管理信息,所有管理对象遵从网络管理标准的规定。
管理对象中的信息通过代理功能提供给管理站。
监控代理功能是专门针对管理信息进行计算和统计分析,并把计算结果提供给管理站。
在管理站来看,监控代理的作用和一般代理是一样的,然而它管理着多个代理系统。
体系结构:
监视器的状态和行为对整个网络监控系统的性能起着决定性作用,因而监视器也应该时刻监视自身的通信情况。
网络监视器:用于采集网络数据流并提供数据分析能力的工具。
监视网络的目的是对数据流进行分析,发现网络通信中的问题。(以太网采用广播通信)
一般情况下,监视器与代理系统处于不同的网络元素中,通过网络交换管理信息。
一个管理站/监视器可以监控多个代理系统,也可以只监视一个代理系统。
一个代理系统可能代理一个或多个网络元素,甚至代理整个局域网。
监视器可能与被监控的网络元素处于同一个子网中,也可能通过远程网络互联。
通信机制:
对监视器有用的信息是由代理收集和存储的,代理把信息传递给监视器的方式有两种。
1.轮询:请求-响应式的交互作用,由监视器向代理发出请求,询问它所需要的信息数值,代理响应监视器的请求,从它保存的管理信息库中取得信息给监视器。
2.事件报告:由代理主动发送给管理站的消息。代理可以根据管理站的要求(周期、内容等)定时的发送状态报告。
也可能在检测到某些特定事件(状态改变)或非正常事件(出现故障)时生成事件报告,发送给管理站。
对于及时发现网络中的问题很有用,特别是对于监控状态信息不经常改变的管理对象更有效。
传统的通信管理网络主要依赖事件报告,而SMTP强调轮询方法。OSI管理系统采用了这两种极端方法的中间道路。
网络管理功能域:
故障管理、配置管理、计费管理、性能管理、安全管理。(性能、故障、计费属于网络监视功能,配置、安全属于网络监控功能)
1.性能管理:两个指标:面向服务的性能指标、面向效率的性能指标。(面向服务的性能指标的优先级较高)
面向服务的性能指标:
1.可用性:网络系统、网络元素、网络应用对用户可利用时间的百分比。
系统的可靠性与网络元素的可靠性、网络元素的组织形式有关。
2.响应时间:用户从输入请求到系统在终端上返回计算结果的时间。
3.正确性:网络传输的正确性。
面向效率的性能指标:
1.吞吐率:一段时间内完成的数据处理量(Mbps或分组),或者是接受用户会话的数量、处理呼叫的数量等。
2.利用率:网络资源利用的百分率,与网络负载有关。
当负载增大时,资源利用率增大,分组排队的时间和网络响应的时间变长,甚至会引起 吞吐率降低。
2.故障管理:
1.故障检测和预警功能:
2.故障预测功能:
3.故障诊断和定位功能:
3.计费管理:跟踪和控制用户对网络资源的使用,并把有关信息存储在运行日志数据库中,为收费提供依据。
4.配置管理:初始化、维护和关闭网络设备或子系统。被管理的网络资源包括网络设备(服务器、路由器)和底层逻辑对象(传输层定时器)。
可以设置网络参数的初始值或默认值,使网络设备初始化时自动形成预定的互联关系。
当网络运行时,监视设备的工作状态,并根据用户的配置命令或其他管理功能的请求改变网络配置参数。
网络资源包括物理资源和逻辑资源。
物理资源:主机、路由器、网桥、通信链路、modem。
逻辑资源:定时器、计数器、虚电路。
设备的属性:名称、标识符、地址、状态、操作特点、软件版本。
网络管理是分布在网络上的应用程序和数据库的集合。
安全管理:系统或网络的安全设施由一系列安全服务和安全机制的集合组成。
网络管理中的安全管理指的是保护管理站和代理之间信息交换的安全。
有关安全的管理对象:密钥、认证信息、访问权限信息、安全服务和安全机制的操作参数的信息等。
网络管理协议:
简单网络管理协议SNMP:
应用层协议、UDP。
作用:把管理应用程序的服务调用变成对应的SNMP协议数据单元,并利用UDP发送出去。
由于UDP不可靠,所以SNMP的实现的建议是对每个管理信息要装配成数据包独立发送,而且报文应该不超过484字节。
在SNMP管理中,管理站和代理之间交换的管理信息构成了SNMP报文。
报文由3部分组成:版本号、团体名、协议数据单元PDU。
团体名用于身份验证。
SNMP有5种管理操作,但只有4种PDU格式。
管理站发出3种请求报文:GetRequest、GetNextRequest、SetRequest。(采用的格式是一样的)
代理的应答报文只有一种:GetResponse。
5种PDU:TrapPDU、GetRequestPDU、GetNextRequestPDU、SetQuestPDU、GetResponsePDU.
除了TrapPDU之外的4种PDU格式都是相同的。
SNMP网络管理是一种分布式应用,管理站和代理之间的关系可以是一对多的关系、或者多对一的关系。
用团体名验证来控制访问权限是不可靠的,而且团体名以明文的形式传输。所以SNMP的实现只允许get和trap操作,通过set操作控制网络设备是被严格限制的。
SNMPV2:支持集中的和分布式网络管理。
6种协议数据单元:TrapPDU、GetRequestPDU、GetNextRequestPDU、SetRequestPDU、InformRequest、ResponsePDU.
错误状态和错误索引字段被置为0.
GetRequestPDU:检查管理信息库中的变量,一次可以检索多个变量的值。
接收到该PDU的SNMP实体以请求标识符相同的GetResponse报文响应。
V1只要有一个变量值检索不到就不返回任何值。
V2允许部分响应,如果由于其他原因而处理失败,返回一个错误状态genErr,对应的错误索引指向有问题的变量。
GetNectRequestPDU:检索变量名指示的下一个对象实例,用在对表对象的搜索中。
V2与V1 的差别在于改变了响应的原子性。
原子性:只要有一个变量检索不到,就不返回任何值。
GetBlukRequestPDU:V2对原标准的主要增强,目的是以最少的交换次数检索最大量的管理信息。
SetRequestPDU:语义是设置或改变管理站数据库MIB变量的值,其差别是处理响应的方式不同。
TrapPDU:陷入是由代理发给管理站的非确认性消息。
V2的陷入采用与GET等操作相同的PDU格式。
InformRequestPDU:V2增加的管理站之间的通信机制是分布式网络管理所需要的功能,为此引入通知报文和管理站数据库MIB。
PDU格式与GET等操作相同。变量表绑定的内容与陷入报文一样,但是这个消息需要应答。
SNPV3:在前两版的基础上重新定义了网络管理框架和安全机制,新开发的网络管理系统都支持SNMPV3。
管理站和代理的东西在V3中统一叫做SNMP实体,实体是体系结构的一种实现,由一个或多个SNMP引擎和一个或多个SNMP应用组成。
SNMP实体:P621图11-27
SNMP引擎:发送、接受、认证、加密报文,控制对管理对象的访问。
有唯一的标识snmpEngineID。
由于SNMP引擎和SNMP实体有一一对应的关系,所以snmpEngineID也是SNMP实体的唯一标识。
构成:
1.调度器:发送/接收SNMP报文。
2.报文处理子系统:按照预定的格式准备要发送的报文,或者从接收的报文中提取数据。
3.安全子系统:提供安全服务,(报文的认证、加密)可以有多个安全模块,以便提供不同的安全服务。
4.访问控制子系统:提供授权服务,即确定是否允许访问一个管理对象,或者是否可以对某个管理对象实施特殊的管理操作。
应用程序:
1.命令生成器:建立SNMP Read/Write请求,并处理这些请求的响应。
2.命令响应器:接收SNMP Read/Write请求,对管理数据进行访问,并按照协议规定的操作产生响应报文,返回给读/写命令的发送者。
3.通知发送器:监控系统中出现的特殊事件,产生通知类报文,并且要有一种机制,以决定向何处发送报文,使用说明SNMP版本和安全参数等。
4.通知接收器:监听通知报文,并对确认型通知产生响应。
5.代理转发器:在SNMP实体之间转发报文。
常用命令:
1.ping:通过发送ICMP回声请求报文来检验与另一台计算机的连接,用于排除连接故障的命令。
使用ping命令必须安装并运行TCP/IP协议,可以使用IP地址或主机名来表示目标设备。
2.arp:用来显示和修改地址解析协议缓存表的内容。
缓存表项是IP地址与网卡地址对。
计算机上安装的每个网卡各有一个缓存表。
3.netstat:用于显示TCP连接、计算机正在监听的端口、以太网统计信息、IP路由表、ipV4统计信息(IP、ICMP、TCP、UDP)、IPv6统计信息(IPV6、ICMPV6、TCP over IPV6、UDP overIPV6)。
如果不使用参数,就显示活动的TCP连接。
4.tracert:确定到达目标的路径,并显示通路上每一个中间路由器的IP地址。
5.pathping:结合了ping和tracert两个命令的功能,可以显示通信线路上每个子网的延迟和丢包率。所以用户可以据此确定哪些路由器或子网存在通信问题。
6.nbtstat:显示NetBT(NetBIOS overTCP/IP)协议的相关信息,包括本地计算机和远程计算机的NetBIOS名字表,以及NetBIOS名字缓存。也可以刷新NetBIOS名字缓存,刷新已经注册了的WINS名字。
7.route:显示和修改本地的IP路由表,如果不带参数,则给出帮助信息。
8.netsh:命令行脚本实用程序,可用于修改计算机的网络配置。也可以建立批文件来运行一组命令,或者把当前的配置脚本用文本文件保存起来,以后可以用来配置其他服务器。
9.nslookup:显示DNS查询信息,诊断和排除DNS故障。(交互式、非交互式两种工作方式)
10.net:Windows中的网络服务都使用以net开头的命令。
RAID:
独立/廉价磁盘冗余阵列。
在不停机的情况下支持以下功能:
1.自动检查硬盘故障。
2.重建硬盘的坏道信息。
3.磁盘热备份。
4.磁盘热替换。
5.扩充硬盘容量。
RAID规范为RAID0~RAID7,技术特点各不相同,目前投入商用的为以下几个:
RAID0:需要两个以上硬盘驱动器,每个磁盘划分成不同的区块。
数据访问采用交叉存取、并行传输的方式。
没有差错控制措施。
不能用于对数据稳定性要求较高的场合。
适合用于图像编辑,或其他要求传输速度比较高的场合。
速度最快的。
RAID1:具有磁盘镜像功能。
可利用并行读写特性将数据分块并同时写入主磁盘和镜像盘。
磁盘容量利用率只有50%,牺牲磁盘容量获取可靠性的提高。
能够同时对两个盘进行读/写操作,提供镜像技术提高系统容错能力。
通常情况下,RAID1的功能由软件实现。
适用于系统需要极高的可靠性的场景,如进行数据统计。
RAID1技术支持热替换,即在不断电的情况下对故障磁盘进行更换,更换完毕后只需要从镜像盘上恢复数据即可。
RAID2和RAID3:都是将数据分块存储在不同的硬盘上实现多模块交叉存取,并在数据访问时提供差错校验功能。
RAID2采用海明码差错校验,需要单独的磁盘存放校验与恢复信息。实现技术代价昂贵。
RAID3采用奇偶校验方式,只能差错不能纠错。需要3个以上的驱动器,一个磁盘存放奇偶校验码,其他磁盘作为数据盘实现多模块交叉存取。
RAID3主要用于图形图像处理等要求吞吐率较高的场合,对于大量的连续数据可提供良好的传输速率,但对于随机数据,奇偶校验盘会成为写操作的瓶颈。
利用单独的奇偶校验盘来保护数据可以使磁盘利用率提高到(n-1)/n。
RAID5:分布式奇偶校验的独立磁盘结构。用来纠错 的校验信息分布在各个数据盘上,没有专门的校验盘。
读出效率很高,写入效率一般,对区块式的聚集访问效率不错。
提高了可靠性,提高了对磁盘的利用率,但是对于数据chau念书的并行性解决的不好而且控制器也设计的很复杂。
对于RAID5来说,大部分数据传输只对一块磁盘操作,可进行并行访问。
RAID0+1:是RAID0和RAID1的组合形式,也称为RAID10,是存储性和数据安全兼顾的方案。
对数据100%备份提供数据安全保障,因此磁盘空间利用率为50%。
适用于既有大量数据需要存取,同时又对数据安全性要求严格的领域,如:银行、金融、商业超市、仓储库房、档案管理。
实际生活中,常见的是RAID0、RAID1、RAID5、RAID10,由于在大多数场合,RAID5包含了RAID2~4的优点,所有RAID2~4基本退出市场,一般认为RAID2~4只用于开发研究领域。
JBOD模式:在逻辑上把几个物理磁盘连接起来,组成一个大的逻辑磁盘。
不提供容错,其容量等于所有磁盘容量的总和。
严格意义上来说,不属于RAID的范围。
网络存储:
开放系统的数据存储分为内置存储和外挂存储,外挂存储分为直连式存储和网络化存储,网络化存储有网络接入存储和存储区网络。
直连式存储:在服务器上外挂一个大容量硬盘,存储设备和服务器主机之间采用SCSI通道连接,带宽为10Mbps、20Mbps、40Mbps、80Mbps。
难以扩展存储容量,而且不支持数据容错功能,当服务器出现故障时,会造成数据丢失。
网络接入存储NAS:将存储设备连接到现有的网络上来提供存储和文件访问服务的设备。
分摊了数据处理和存储管理的功能,计算机负责数据处理,存储子系统负责数据的存储和管理。
能够提供灵活的解决方案。
存储区域网络SAN:连接存储设备和存储管理子系统的专用网络,专门提供数据存储和管理功能。
采用光纤通道实现互联。通过光纤通道交换机连接存储阵列和文件服务器主机。
提供大容量的存储数据,地域上可以分散部署。
与NAS相比,SAN具有下面特点:
1.SAN具有无限的扩展能力。
用户可以自由扩展磁盘阵列、磁带库、服务器等设备,使得整个系统的存储空间和处理能力按照用户需求不断扩大。
2.SAN采用了为大规模数据传输专门设计的光纤通信技术,所以具有更高的传输速度和更快的处理能力。