前言
1、分层方式
首先我们知道,在计算机网络中,常用的协议分层方式:OSI和TCP/IP,以及实际生产中使用的协议划分方式。
在OSI中,各层的职责如下:
应用层
:对软件提供接口以使程序能使用网络服务,如事务处理程序、文件传送协议和网络管理等。(HTTP、Telnet、FTP、SMTP)
表示层
:程序和网络之间的翻译官,管理数据的解密加密数据转换、格式化和文本压缩。(JPEG、ASCII、GIF、DES、MPEG)
会话层
:负责在网络中的两节点之间建立和维持通信,以及提供交互会话的管理功能。(RPC、SQL、NFS)
传输层
:提供建立、维护和拆除传送连接的功能;选择网络层提供最合适的服务;在系统之间提供可靠的透明的数据传送,提供端到端的错误恢复和流量控制。(TCP、UDP、SPX)
网络层
:将网络地址(ip地址)翻译成对应物理地址(网卡地址),并决定如何将数据从发送方路由到接收方。(IP、ICMP、IGMP、IPX、ARP、RARP)
数据链路层
:物理地址寻址、数据的成帧、流量控制、数据的检错、重发。(IEEE 802.3/.2、HDLC、PPP、ATM)
物理层
:物理连网媒介,如电缆连线连接器。(RS232、V.35、RJ-45、FDDI)
一、负载均衡
负载均衡(Load Balance)的指将负载(工作任务)进行平衡、分摊到多个操作单元上进行运行,例如FTP服务器、Web服务器、企业核心应用服务器和其它主要任务服务器等,从而协同完成工作任务。负载均衡构建在原有网络结构之上,它提供了一种透明且廉价有效的方法扩展服务器和网络设备的带宽、加强网络数据处理能力、增加吞吐量、提高网络的可用性和灵活性。
负载均衡重点在于由原来的单个节点承接流量,变成多个节点分担流量,减少请求响应时间,提高应用程序的可用性和可伸缩性。
主要划分方式:根据采用的设备对象区分、根据位于OSI中不同层次的划分,这里我们主要讲根据OSI中的层次划分。
- 二层负载均衡(mac地址):数据链路层,使用虚拟MAC地址方式,外部请求流量经过虚拟MAC地址,负载均衡收到流量请求后分配后端实际的MAC地址进行响应。
- 三层负载均衡(ip地址):网络层,使用虚拟ip地址方式,外部请求流量经过虚拟IP地址,负载均衡收到流量请求后分配后端实际的IP地址进行响应。
- 四层负载均衡(tcp、udp):传输层,使用IP+PORT接收外部流量请求,转发到对应的机器上。
- 七层负载均衡(http):应用层,使用虚拟的URL或IP地址接收外部流量请求,转发到对应的处理服务器。
4.1 四层负载均衡
四层负载均衡器也称为四层交换机,从上面我们知道,四层负载均衡基于三层的负载均衡,发布三层的IP地址(虚拟IP),再加上四层的端口号,从而决定哪些流量需要做负载均衡,是基于IP+PORT的策略。
四层负载均衡主要用于分析IP及TCP/UDP协议,原理如下:
- 通过IP+PORT决定流量的去向。
- 对流量请求进行NAT处理,转发至后台服务器。
- 记录TCP、UDP流量分别是由哪台服务器处理,后续该请求连接的流量都通过该服务器处理。
也就是说,现在,假设应用前有一层四层负载均衡器,那么外部TCP、UDP请求的流量到达具体应用前会在四层负载均衡处进行解析处理。具体如下:
- 外部发送TCP请求进入负载均衡设备。
- 负载均衡设备接收到第一个来自客户端的SYN请求,选择后台服务器,将报文中的目标IP地址进行修改(修改为转发后的后台服务器),转发到该服务器。
- TCP三次握手进行客户端和服务器的连接。
在四层网络数据通信中,应用程序主要通过套接字(Socket) API 接口,使用 TCP 或 UDP 协议进行传输。应用程序向操作系统内核发送请求后,内核负责把数据包传递到传输层,然后将数据封装成 TCP 或 UDP 数据包。传输层将数据包发送到网络层,网络层对 IP 数据包进行封装,然后通过路由协议发送到目的地。网络层会根据协议规则进行负载均衡和路由选择,以确保数据包能够到达目标地址。
常见的四层负载均衡器:
- F5:硬件负载均衡器,成本较高。
- Nginx:轻量级四层负载均衡器,可缓存。(nginx四层是通过upstream模块)
- Haproxy:模拟四层转发。
- LVS(Linux Virtual Server):即Linux虚拟服务器,是一个比较重量级的四层负载均衡器。
4.2 七层负载均衡
七层负载均衡基于虚拟的URL或主机IP的负载均衡,能够解析应用层的报文。同时,它也支持四层负载均衡的功能,支持四层负载均衡器的功能,而且能解析应用层信息,如HTTP协议、URI、Cookie等信息,原理如下:
- 通过虚拟url或主机IP进行流量识别,根据应用层信息进行解析,决定是否需要进行负载均衡。
- 代理后台服务器与客户端建立连接,如Nginx可代理前后端,与前端客户端TCP连接,与后端服务器建立TCP连接。
在七层网络通信中,应用程序使用更具体的协议(如 HTTP、FTP、SMTP 等)通过套接字(Socket)API 接口进行网络通信。应用程序通过特定的 API 调用,按照指定协议进行数据传输。内核接收到数据后会将数据交给相应的协议模块进行处理。每个协议模块负责解析其对应协议的数据,并根据协议规则进行处理和组装,最终将数据包通过网络层传递到目标地址。7层负载均衡器可以根据报文内容,再配合负载均衡算法来选择后端服务器,因此也称为“内容交换器”。比如,对于Web服务器的负载均衡,7层负载均衡器不但可以根据“IP+端口”的方式进行负载分流,还可以根据网站的URL、访问域名、浏览器类别、语言等决定负载均衡的策略。例如,有两台Web服务器分别对应中英文两个网站,两个域名分别是A、B,要实现访问A域名时进入中文网站,访问B域名时进入英文网站,这在4层负载均衡器中几乎是无法实现的,而7层负载均衡器可以根据客户端访问域名的不同选择对应的网页进行负载均衡处理。
常见的七层负载均衡器:
- Nginx:基于http协议(nginx七层是通过proxy_paas)
- Haproxy:七层代理,会话保持、标记、路径转移等。
4.3 四层和七层负载均衡的区别
对比4层负载均衡器和7层负载均衡器运行的整个过程,可以看出,在7层负载均衡器模式下,负载均衡器与客户端及后端的服务器会分别建立一次TCP连接,而在4层负载均衡器模式下,仅建立一次TCP连接。
- 分层位置:四层负载均衡在传输层及以下,七层负载均衡在应用层及以下。
- 性能:四层负载均衡架构无需解析报文消息内容,在网络吞吐量与处理能力上较高;七层可支持解析应用层报文消息内容,识别URL、Cookie、HTTP header等信息。
- 原理:四层负载均衡是基于ip+port;七层是基于虚拟的URL或主机IP等。
- 功能类比:四层负载均衡类似于路由器;七层类似于代理服务器。
- 安全性:四层负载均衡无法识别DDoS攻击;七层可防御SYN Cookie/Flood攻击。