UDP有数据边界,TCP是没有数据边界,是流协议。如何拆包,就要靠应用层来处理。
四层网络模型,消息在进入每一层时都会多加一个报头。mac头部记录的是硬件的唯一地址,IP头记录的是从哪来和到哪去,传输层头记录到是到达目的主机后具体去哪个进程。
需要拆包发送的原因?
MTU:Maximum Transmit Unit最大传输单元。由网络接口层(数据链路层)提供给网络层最大一次传输数据的大小;一般MTU=1500byte.
MSS:Maximum Segment Size,TCP提交给IP层最大分段大小,不包含TCPHeader,只有TCP的负载,也就是消息体。假设MTU为1500Byte,则MSS=1500-20(IP头部)-20(TCP Header)=1460Byte,应用层发送的消息超过1460Byte就会切片发送。
为什么会粘包?
TCP是一种面向连接的,可靠的,基于字节流的传输层通信协议。粘包就是基于字节流这个特点。这些字节流是一堆二进制数据,没有任何边界。由于数据太小,每次小数据量发送,会占用网络资源,及时很小的包发送,如果应用层很忙,没有来得及及时取出,TCP Recv Buffer中可能会有msg2和msg3,这样还是会粘包。
粘包出现的根本原因是不确定的消息边界,应用层面对一堆二进制流,不知道多少个01才是一个消息。
如何解决粘包?
只要在发送端发送消息的时候带上识别消息边界的信息,接收端就可以根据这些信息识别出消息的边界,区分出每个消息。
应用层做的:
- 包封装成固定大小
- 在包的末尾加指定特殊字符\r\n
- 消息头+消息尾 头部有体的大小
UDP不存在粘包问题吗?
UDP是无连接,不可靠,基于数据包的传输层通信协议。
基于数据报是指无论应用层交给UDP多长的报文,UDP都照样发送,即一次发送一个报文。如果数据太长,需要切片,那是IP层的事情。UDP发送几次,接收端就会接收几次。
TCP协议通过以下机制避免粘包和拆包的问题:
1. 为每个TCP连接维护一个发送缓冲区和接收缓冲区,可以按照字节序列传输数据,保证发送和接收的数据是一一对应的,并且TCP协议保证了数据的可靠性。
2. TCP采用流量控制机制,防止发送方过快发送数据导致接收方丢失数据。当发送方发送数据时,会根据接收端的缓冲区状态和网络条件动态调整发送窗口大小,从而避免了发送方过快发送数据的情况。
相比之下,UDP协议不会维护发送和接收缓冲区,也没有流量控制机制,因此数据包的传输完全取决于网络的状态,若数据包较大,经过网络传输时可能会被分为多个数据包,但UDP协议并不保证接收端收到这些数据包的顺序,也没有重传机制,因此可能会导致数据包的丢失或者乱序,这是UDP协议的缺陷之一。