前言
在之前,我们学习了UDP通信与套接字编程,了解到需要使用端口号来表示网络中的数据需要传输到哪个进程,同时使用套接字的进行了UDP的通信。但当时在应用层,我们仅仅是浮于表面进行了初步的使用,今天我们来深入的理解端口号与UDP协议是如何实现的。
一、端口号
端口号(Port)标识了一个主机上进行通信的不同的应用程序。
在TCP/IP协议中, 用 "源IP", "源端口号", "目的IP", "目的端口号", "协议号" 这样一个五元组来标识一个通信(可以通过netstat -n查看);
netstat是一个用来查看网络状态的重要工具。
语法:netstat -[选项]
功能:查看网络状态
常用选项:
- n 拒绝显示别名,能显示数字的全部转化成数字
- l 仅列出有在 Listen (监听) 的服務状态
- p 显示建立相关链接的程序名
- t (tcp)仅显示tcp相关选项
- u (udp)仅显示udp相关选项
- a (all)显示所有选项,默认不显示LISTEN相关
知道了IP就知道了是那台主机。
知道了端口就知道是那个进程(页面)在请求资源。
知道了协议号就清楚传输或解析时应该按照那种协议进行。
如下查询到了一个五元组
端口号范围划分
0 - 1023: 知名端口号, HTTP, FTP, SSH等这些广为使用的应用层协议, 他们的端口号都是固定的。
1024 - 65535: 操作系统动态分配的端口号. 客户端程序的端口号, 就是由操作系统从这个范围分配的
因此,正常情况我们想要绑定0-1023的端口就会报错,sudo 超级用户才可以,我们一般绑定1024-65535就好。
有些服务器是非常常用的, 为了使用方便, 人们约定一些常用的服务器, 都是用以下这些固定的端口号:
- ssh服务器, 使用22端口
- ftp服务器, 使用21端口
- telnet服务器, 使用23端口
- http服务器, 使用80端口
- https服务器, 使用443
二、UDP
我们先来看看UDP的报头,报头内容比较简单,只有源端口号(确定从哪里来)、目的端口号(确定到哪里去)、UDP长度、UDP校验和(检查UDP是否传输错误)。同时他们都是占用了16位,总共是8字节。
UDP采样的是固定报头长度,8字节,因此能够轻松实现有效载荷和报头的分离 。
我们在之前学网络套接字时,一直说UDP是面向数据报的,为何是面向数据包的呢?
因为UDP报头里面存放着UDP正文数据的长度,他是UDP报头+正文数据的长度,读取到这个长度,就能截取这个长度的数据,然后一起进行发送。
客户端可以进行发送UDP报文,服务器就要接受UDP报文,服务器可能在同时时间接收到很多UDP报文,应用层还没来得及去读取这些报文,那么操作系统也必须对这些报文进行管理。
操作系统既有描述该报文的结构体,又有保存报文数据的缓冲区,通过链表将数据保存并管理起来。
udp报文结构体
udp报文管理结构体
现在,我们就能确切的知道UDP是如何保存,如何向上层交付报文的了。
也能更清楚UDP为何有如下特点了
UDP的特点
- 无连接: 知道对端的IP和端口号就直接进行传输, 不需要建立连接;
- 不可靠: 没有确认机制, 没有重传机制; 如果因为网络故障该段无法发到对方, UDP协议层也不会给应用层返回任何错误信息;
- 面向数据报: 不能够灵活的控制读写数据的次数和数量。应用层交给UDP多长的报文, UDP原样发送, 既不会拆分, 也不会合并。
UDP的注意事项
- 同时,UDP没有真正意义上的发送缓冲区。调用sendto会直接交给内核,由内核将数据传给网络层协议进行后续的传输动作。
- UDP具有接收缓冲区,但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致; 如果缓冲区满了,再到达的UDP数据就会被丢弃。
- 我们注意到,UDP协议首部中有一个16位的最大长度。也就是说一个UDP能传输的数据最大长度是64K(包含UDP首部)。然而64K在当今的互联网环境下, 是一个非常小的数字。
- 如果我们需要传输的数据超过64K,就需要在应用层手动的分包,多次发送,并在接收端手动拼装。
基于UDP的应用层协议
- NFS: 网络文件系统
- TFTP: 简单文件传输协议
- DHCP: 动态主机配置协议
- BOOTP: 启动协议(用于无盘设备启动)
- DNS: 域名解析协议