目录
一、IP协议
二、IP协议格式
三、网段划分
四、私网IP地址和公网IP地址
五、路由
一、IP协议
IP指网际互连协议,Internet Protocol的缩写,是TCP/IP体系中的网络层协议。
IP协议主要作用是提供一种能力,将数据从A主机传送到B主机的能力。
比如上图,数据需要从主机B到主机C。那么数据首先要从主机B到路由器F,再到路由器G等等,这样一步一步才能最终到达主机C的。而IP协议的用处就是解决数据怎么在网络中,通过路径选择,从一个主机到达目的主机的。
二、IP协议格式
IP协议如何进行报头和有效载荷的分离(如何解包)?
首先,我们要知道,IP协议的报头是可以携带选项的,所以选项也属于报头的一部分。IP协议采用定长报头的方式,即选项之上的部分大小为固定的20字节。我们在读取了选项之上的部分后,可以拿到4位首部长度,再乘以4它就是报头的总大小,用其减去20字节,就是选项大小。然后就可以读取完成选项。拿到16位总长度减去4位首部长度就是有效载荷了。
注:4位首部长度的单位是4字节。(和TCP一样)
IP协议如何向上进行交付?
由于传输层协议不止一种,因此当IP从底层获取到一个报文并对其进行解包后,IP需要知道应该将分离后得到的有效载荷交付给上层的哪一个协议。
8位协议:用来标识是TCP还是UDP。通过该字段,就可以知道向上交付时,交付给TCP协议还是UDP协议。
该字段是发送方的IP层从上层传输层获取到数据后填充的,比如是上层TCP交给IP层的数据,那么该数据在封装IP报头时的8位协议填充的就是TCP对应的编号。
其他字段
4位版本:指定IP协议的版本(IPv4/IPv6),对于IPv4来说,就是4。
16位总长度:IP报文(IP报头+有效载荷)的总长度,用于将各个IP报文进行分离。
8位服务类型:3位优先权字段(已经弃用),4位TOS字段,和1位保留字段(必须置为0)。4位TOS分别表示,最小延时,最大吞吐量,最高可靠性,最小成本。
16位首部校验和:使用CRC进行校验, 来鉴别头部是否损坏。
32位源IP地址:表示发送端所对应的IP地址。
32位目的IP地址:表示接收端所对应的IP地址。
8位生存时间:数据报到达目的地的最大报文跳数,一般是64,每经过一个路由器的转发,TTL -= 1,一直减到0还没到达,那么就丢弃报文,这个字段主要是用来防止出现路由循环。
报文在网络传输过程中,可能因为某些原因导致报文无法到达目标主机,比如报文在路由时出现了环路路由的情况,或者目标主机已经异常离线了,此时这个报文就成了一个废弃的游离报文。
为了避免网络当中出现大量的游离报文,于是在IP的报头当中就出现了一个字段,叫做8位生存时间。每当报文经过一次路由,这里的生存时间就会减一,当生存时间减为0时该报文就会被自动丢弃,此时这个报文就会在网络中消散。
分片和组装(16位标识,3位标志,13位片偏移)
经过网络层的封装,数据最终会交付给下层的数据链路层。由数据链路层进行网络上的转发。可是,数据链路层由于物理特征的原因,一般无法转发太大的数据,即数据链路层一次可以转发到网络的报文大小是有限制的(一般为1500,MTU,最大传输单元)。
所以,为了保证数据能够正常在网络中传输,我们就有必要将大小超过MTU的报文进行分片,将其分成一个一个的大小不超过MTU的数据,进行发送。而这个操作是由网络层IP协议完成的。既然能够分片,未来一定需要将分片组装起来,形成一个完整的报文,而组装则是在对方IP协议网络层完成的。 组装和分片就与IP报头中的16位标识,3位标志,13位片偏移,这三个字段有关了。
16位标识:填充的是IP报文的序号。每一个报文的16位标识完全不一样,所以可以帮助确定哪几个分片属于哪一个相同的报文。即同一个报文的分片,16位标识是相同的。
3位标志: 第一位保留(保留的意思是现在不用,但是还没想好说不定以后要用到)。第二位置为1表示禁止分片,这时候如果报文长度超过MTU,IP模块就会丢弃报文。第三位表示"更多分片",如果报文没有进行分片,则该字段设置为0,如果报文进行了分片,则除了最后一个分片报文设置为0以外,其余分片报文均设置为1。
13位片偏移:是分片相对于原始IP报文开始处的偏移。其实就是在表示当前分片在原报文中处在哪个位置。实际偏移的字节数是这个值 * 8 得到的。因此,除了最后一个报文之外, 其他报文的长度必须是8的整数倍(否则报文就不连续了)。
站在接收方的角度,我们如何使用三个字段,解决分片与组装的问题。
1、 需要具有识别报文和报文不同的能力。
不同的报文的标识是不同的。同一个报文的分片,16位标识是相同的。所以,如果未来有大量的分片,我们可以根据16位标识,把标识相同的分片放在一起,它们是属于同一个报文的。
2、需要具有识别报文是否被分片的能力。
如果接收方收到了多个16位标识相同的数据,那么报文很可能是分片了的。再看3位标志的第二位是0,那么是可以分片的。再看3位标志的第三位,如果是1,那么表示就是一个分片报文,因为位于最后的分片该比特位位0,所以我们还需要看13位片偏移,最后一个分片的13位片偏移一定不为0。
总结:3位标志第三位为1,有更多分片,说明是一个分片。虽然3位标志第三位为0,但是13位片偏移不为0,说明是一个分片。
3、需要识别出哪些分片是报文的开始部分,哪些是报文的中间部分,哪些是报文的结尾部分。
开始部分:3位标志第三位比特位为1 && 片偏移为0。
中间部分:3位标志第三位比特位为1 && 片偏移不为0。
结尾部分:3位标志第三位比特位为0 && 片偏移不为0。
4、异常处理:在组装的过程中,任何一个分片丢失了,我们都需要能够识别出来。
首先,我们要知道:分片自身大小 + 分片自身偏移量 = 下一个报文偏移量。
比如,对于上图的报文,我们分片后得到三个分片。接收方收到后, 先根据16位标识知道他们属于同一个报文。然后根据偏移量排序,偏移量为0的是报文开始,然后偏移量加上自身大小为1000,说明下一个分片的偏移量是1000,找到中间部分分片,接着,中间部分的分片偏移量加上自身大小为1500,说明下一个分片的偏移量为1500。这样就能够按顺序将分片组装了。
假如中间部分的分片丢失了,在开始的分片确认后,其偏移量加上自身大小为1000,可是接收方并没有找到偏移量为1000的分片,这时我们就可以判断中间部分的分片丢失了。而如果我们能够一直计算到结尾,那么就表示我们拿到了报文的全部分片。
分片之后,是每个分片都有一个IP报头,还是只需要第一个分片有IP报头就行了?
必须要每一个分片都有自己的IP报头!因为接收方一定是通过16位标识,3位标志和13位片偏移来识别找出分片,并进行组装的,而这三个字段都在IP报头中。所以每一个分片都要有自己的IP报头。
分片具体示意如下图:
为什么不建议对报文进行分片?
如果一个报文在网络传输过程中没有经过分片,那么只要接收端收到了这一个报文,我们就可以认为该数据被对方可靠的收到了。而如果一个报文在网络传输过程中进行了分片,那么只有当接收端收到了全部的分片并将其成功组装起来,这时我们才认为该报文被对方可靠的收到了。
但如果众多的分片报文当中有一个分片出现了丢包,就会导致接收端就无法将报文成功组装起来,这时接收端会将收到的分片报文全部丢弃,此时传输层TCP会因为收不到对方应答而进行超时重传。
只要有一个分片报文丢包了也就等同于这个报文整体丢失了,因此分片会增加传输层重传数据的概率。又因为传输层并不知道底层IP对数据进行了分片,当传输层发送出去的报文得不到应答时,传输层就只能将该报文整体进行重传。
综上所述,报文在发送时不建议进行分片。
为了尽量避免报文被分片,作为传输层的TCP协议就需要尽量将大小合适的TCP报文向下交付给IP协议。
三、网段划分
IP地址由网络号和主机号两部分构成。
网络号:保证相互连接的两个网段具有不同的标识。
主机号:同一网段内,主机之间具有相同的网络号,但是必须有不同的主机号。
不同的子网其实就是把网络号相同的主机放到一起。如果在子网中新增一台主机,则这台主机的网络号和这个子网的网络号一致,但是主机号必须不能和子网中的其他主机重复。
所以,我们在进行数据转发的时候,要根据网络号确定目标网络,根据主机号确定目的主机。网络号用来表示不同的区域。网络号在不同的查找过程中是不断变大且收敛的。
为什么要有网络号?
举个例子:小明是某大学2022级计算机学院计算机专业的学生,它的学号为2022017119。如果现在我们想要找到小明,那么根据2022我们知道了他是2022级的学生,再往后看2022017代表了他是计算机学院计算机专业的学生,最后再带上最后三位,我们就知道了他是2022级计算机学院计算机专业,序号为119的学生了。通过学号,在查找的过程中,我们把学号位数不断扩大,进而能够不断缩小查找范围。
IP地址的网络号和学号也是同样的作用。我们可以通过网络号直接定位到我们要去的网段,在查找过程中就能一次排除大量和目标主机不在同一网段的主机,然后再去该网段中查找,这样就可以大大提高检索的效率。
有了以上的概念,我们就可以进行网段划分了。
网段划分
最开始,划分网段的方案就是将IP地址分成下面的五类。
数据范围:
A类 0.0.0.0到127.255.255.255
B类 128.0.0.0到191.255.255.255
C类 192.0.0.0到223.255.255.255
D类 224.0.0.0到239.255.255.255
E类 240.0.0.0到247.255.255.255
可是,随着网络的飞速发展,这种划分方案的局限性很快就显现出来了,大多数组织都申请B类网络地址,导致B类地址很快就被分配完了,而A类却浪费了大量地址。某个组织申请了一个B类地址,理论上一个子网内能允许6万5千多个主机,A类地址的子网内的主机数更多。然而在实际网络架设中,不会存在一个子网内有这么多主机的情况,因此大量的IP地址都被浪费掉了。而且全球范围内的主机越来越多,那么必然面临着IP地址不够用的情况。
所以,就有了新的划分方案,称为CIDR。
CIDR(Classless Interdomain Routing)
这种方式也就是基于子网掩码的划分方式。引入一个额外的子网掩码来区分网络号和主机号。子网掩码也是一个32位的正整数,通常用一串 "0" 来结尾。将IP地址和子网掩码进行 "&" 操作, 得到的结果就是网络号。
比如在某一子网中将IP地址的前24位作为网络号,那么该网络对应的子网掩码的32个比特位中的前24位就为1,剩下的8个比特位为0,将其用点分十机制表示就是255.255.255.0。
假设该子网当中有一台主机对应的IP地址是192.168.128.10,那么将这个IP地址与该网络对应的子网掩码进行“按位与”操作后得到的就是192.168.128.0,这就是这个子网对应的网络号。
用子网掩码与子网当中主机的IP地址进行“按位与”操作时,本质就是保留了主机IP地址中前24个比特位的原貌,将剩下的8个比特位的值清0了而已,也就是将主机号清0了,所以“按位与”后的结果就是该网络对应的网络号。
简单举个例子,如下图:
假设欧洲的某个用户发送了一个消息给中国四川的某个用户,其目的IP是 0011 0111 ......,将其与路由器的子网掩码 1111 0000 ........,进行按位与,得到 0011 0000 ......,一查路由表,发现是中国,就转发给中国网段的路由器所在的子网。中国网段的路由器拿到目的IP后,将其与自己的子网掩码 1111 1111 0000 0000 ......,按位与,得到 0011 0111 0000 0000 ......,说明目的IP是中国四川的,然后就将报文转发给四川网段的路由器,让它再进行转发。
当然,路由并不是真的这么简单就完了,上面的例子只是便于理解,并不是完整具体的路由操作。下面我们继续深入。
特殊的IP地址
1、将IP地址中的主机地址全部设为0,就成为了网络号,代表这个局域网。
2、将IP地址中的主机地址全部设为1,就成为了广播地址,用于给同一个链路中相互连接的所有主机发送数据包。
3、127.*的IP地址用于本机环回(loop back)测试,通常是127.0.0.1。
四、私网IP地址和公网IP地址
如果一个组织内部组建局域网,IP地址只用于局域网内的通信,而不直接连到Internet上,理论上使用任意的IP地址都可以,但是RFC 1918规定了用于组建局域网的私有IP地址:
10.*:前8位是网络号,共16,777,216个地址。
172.16.到172.31.:前12位是网络号,共1,048,576个地址。
192.168.*:前16位是网络号,共65,536个地址。
包含在这个范围中的,都称为私有IP,其余的则称为全局IP(或公网IP)。
数据如何发送到服务器?
首先,我们需要知道:实际网络通信的基础设施都是运营商搭建的,我们访问服务器的数据并不是直接发送到了对应的服务器,而是需要经过运营商建设的各种基站以及各种路由器,最终数据才能到达对应的服务器。 所以,网段划分、子网划分等工作实际都是运营商做的。
路由器(工作在网络层)是连接两个或多个网络的硬件设备,它能够构建子网,在路由器上有两种网络接口,分别是LAN口和WAN口。
LAN口:表示连接本地网络的端口,主要与家庭网络中的交换机、集线器或PC相连。对应的地址叫做LAN口IP,也叫做子网IP。
WAN口:表示连接广域网的端口,一般指互联网。对应的的IP地址叫做WAN口IP,也叫做外网IP。
也就是说,一个路由器可以有多个IP地址。路由器LAN口连接的主机,都属于当前这个路由器构建的子网中。
依据下图。不同的路由器,其构建的子网IP其实都是一样的(通常都是192.168.1.1)。但是它们对外来说,自己本身也是别人构建的子网中的一台主机,所以对应的WAN口IP是不一样的,这样就能区分不同的网段。子网内的主机IP地址不能重复,但是在不同子网中的两台主机的IP地址就可以是相同的了。
比如,主机1和主机2构建的子网IP是一样的,但是他们对外通信的WAN口IP不同。在主机1和主机2自己的子网中,也存在IP地址相同的主机。
因为私网IP可以重复也就意味着我们可以在不同的局域网使用相同的IP地址,而在通信的广域网中分配不同的IP,缓解了IP的不足。
由于私网IP不能出现在公网当中,因此子网内的主机在和外网进行通信时,路由器会不断将数据包IP首部中的源IP地址替换成路由器的WAN口IP,这样逐级替换,最终数据包中的源IP地址成为一个公网IP,这种技术成为NAT(Network Address Translation,网络地址转换)。
所以,数据到服务器的基本过程如下图:
那么响应结果怎么回到客户端主机呢?这里我们还无法解释,只有等到后面才能解释。
两个不同局域网当中的主机进行通信
数据要从一个局域网发送到另一个局域网,是先将数据经过公网发送到了服务器,然后再由服务器将数据处理后经过公网转发到了另一个局域网,进而交给对应的主机。
五、路由
路由的过程,就是一跳一跳(Hop by Hop) "问路" 的过程。所谓 "一跳" 就是数据链路层中的一个区间,具体在以太网中指从源MAC地址到目的MAC地址之间的帧传输区间。
IP报文的传输过程中会遇到很多路由器,这些路由器会帮助报文进行路由转发,每当报文遇到一个路由器后,对应路由器都会查看该报文的目的IP地址,并查看其维护的路由表,告知该报文下一跳应该往哪跳。
我们可以使用route命令查看Linux服务器上的路由表。
Destination表示该路由器连接的网络地址,也就是其所在网段的IP地址。
Gateway代表的是下一跳地址。
Genmask代表的是子网掩码。
Flags中,U标志表示此条目有效(可以禁用某些条目)G标志表示此条目的下一跳地址是某个路由器的地址,没有G标志的条目表示目的网络地址是与本机接口直接相连的网络,不必经路由器转发。
Iface代表的是转发接口。
路由过程
default,默认网关最后查询。
当IP报文到达路由器时,路由器就会用该报文的目的IP地址,依次与路由表中的子网掩码 Genmask进行“按位与”操作,然后将结果与子网掩码对应的目的网络地址Destination进行比对,如果相同则说明该报文下一跳就应该跳去这个子网,此时就会将该报文通过对应的发送接口Iface发出。
如果将该报文的目的IP地址与子网掩码进行“按位与”后,没有找到匹配的目的网络地址,此时路由器就会将这个报文发送到默认路由,也就是路由表中目标网络地址中的default。可以看到默认路由对应的Flags是UG,实际就是将该数据转给了另一台路由器,让该数据在另一台路由器继续进行路由。
这样最后就能够找到目的主机了。