文章目录
- 一、端口号
- 二、UDP协议
- 1.UDP协议格式
- 2.UDP协议的特点
- 3.UDP缓冲区
- 三、UDP注意事项
一、端口号
端口号是在网络中标识一台主机上进行通信程序的唯一性的,在TCP/IP协议中,用源IP、源端口号、目的IP、目的端口号、协议号这样一个五元组来标识一个通信。
端口号是有规则划分的,0-1023
是知名端口号,像HTTP、FTP、SSH等这些广为使用的应用层协议,它们的端口号都是固定的。1024-65535
是操作系统动态分配的端口号,这些是客户端程序的端口号,操作系统就是在这个范围内分配给客户端的。
一些知名的端口号比如:ssh服务器使用22端口、ftp服务器使用21端口、telnet服务器使用23端口、http服务器使用80端口、https服务器使用443端口。在Linux中,我们可以在/etc/services
文件中查看知名端口号。
需要注意的是,一个进程可以绑定多个端口号,但是一个端口号不能被多个进程同时绑定。所以我们在自己写服务的时候,一定要避开这些知名端口号,否则我们的服务就会启动不起来。
二、UDP协议
1.UDP协议格式
UDP协议格式如下图所示,由16位源端口号、16位目的端口号、16位UDP长度、16位UDP校验和、数据正文这几部分组成。UDP的报头长度是确定的,16位UDP长度表示整个数据报(UDP首部+UDP数据)的最大长度。16位UDP校验和是用来校验的,如果校验和出错,那么UDP整个数据报就会被直接丢弃。
2.UDP协议的特点
- 无连接:UDP协议是无连接的,只需要知道对端的IP地址和端口号就可以直接进行传输,不需要建立连接。
- 不可靠传输:没有确认机制,没有重传机制,如果因为网络故障该段无法发送到对方,UDP协议层也不会给应用层返回任何错误信息。不可靠传输是UDP协议的特点,虽然看起来像是缺点,但也因不可靠传输让UDP的维护成本比较低,因为它不需要为了可靠传输而做更多其它工作。
- 面向数据报:面向数据报也是UDP协议的另一个特点。所谓面向数据报意思就是,应用层交给UDP多长的报文,UDP原样接收,既不拆分,也不合并。可以简单理解为UDP要么不接受报文,一旦接收了报文,一定是接收完整的报文。举个例子,比如说发送端调用一次sendto函数发送100个字节,那么接收端也必须调用一次recvfrom函数接收100个字节,接收端不可以循环调用10次recvfrom函数每次只接收10个字节。这就有点像寄信,别人给我们寄来一封信,我们接收到的一定是一封完整的信,而不是每次只读取几个文字。
3.UDP缓冲区
UDP协议没有真正意义上的发送缓冲区,我们调用sendto函数通过网络发送数据时,本质上其实并不是直接就能通过网络发送到对端,而是将我们的数据发送到操作系统内核中,操作系统内核再根据自己的发送策略在合适的时机通过网络将我们的数据发送给对端。UDP其实根本不需要所谓的发送缓冲区,因为UDP协议发送的数据格式太简单了,它只需要将数据发送给操作系统内核,操作系统内核直接给它添加上定长的数据报头,添加完成之后操作系统就直接将数据交给网络协议栈到达网络层了,不需要维护可靠性不需要暂时将数据暂存起来等操作。
UDP具有接收缓冲区,但是这个接收缓冲区不能保证收到的UDP数据报的顺序和发送UDP数据报的顺序一致,因为在网络层面这些UDP数据报可能先出发但中途耽误了一些时间,所以接收缓冲区无法保证这个顺序和发送时的顺序一致。如果我们需要关心数据报的顺序,只能在发送端应用层维护每一个数据报的发送编号,到了接收端再根据数据报的发送编号进行重新排序。如果UDP的缓冲区满了,再到达的UDP数据就会被丢弃。
三、UDP注意事项
UDP协议首部中有一个16位的最大长度,也就是说一个UDP能传输的数据最大长度是64k(包含UDP首部),然后64k在当今互联网中是一个非常小的数字,所以如果我们需要传输的数据超过64k,就需要在应用层手动分包,多次发送,并在接收端手动拼接。
在一些直播场景中,一般采用的是UDP协议,原因是如果有大量的观众在观看直播,每个用户都为其维护一个连接的话,用户量一旦大起来,服务器可能会承受不住。所以UDP的无连接特点在这种场景下非常适用,不需要再给每个用户建立连接,即使UDP是不可靠传输,在传输过程中可能会出现丢包等情况,但这种情况最多导致直播过程中画面模糊、声音变卡,而这些相比较于服务器崩溃来说是可以接受的,所以采用UDP协议比较合适。