前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站
🌈C++专栏: 南桥谈C++
🌈C语言专栏: C语言学习系列
🌈Linux学习专栏: 南桥谈Linux
🌈数据结构学习专栏: 数据结构杂谈
🌈数据库学习专栏: 南桥谈MySQL
🌈Qt学习专栏: 南桥谈Qt
🌈菜鸡代码练习: 练习随想记录
🌈git学习: 南桥谈Git
IP协议
IP的意义:IP地址将数据从B主机跨网络可靠的发送给主机C
这里和传输层联系一下:传输层提供的是策略,网络层提供能力。
IP地址格式:XXX.YYY.ZZZ.AAA
,ip=网络号+主机号
在Linux系统中,可通过ifconfig
来查看当前IP地址:(云服务器中查出来的是内网IP)
IP协议报头格式
报头和数据如何进行分离?
4 位首部长度: IP 头部的长度是多少个 32bit, 也就是长度 4的字节数. 4bit 表示最大的数字是 15, 因此 IP 头部最大长度是 60 字节。
如果此时IP首部长度就是20字节,4位首部长度应该是5,对应的二进制为0101
在读到一个IP报文时,先无脑读出20个标准长度,然后读出4位首部长度,这4位首部长度-标准长度就是选项,然后再将选项和数据进行分离;如果4位首部长度-标准长度为0,表示没有选项,那么剩下的就是数据。
IP报文如何分用?
8位协议:表示上层协议的类型
IP根据8位协议向上交付。
4位版本:指定 IP 协议的版本, 对于 IPv4 来说, 就是 4
8 位服务类型: 3
位优先权字段(已经弃用), 4
位 TOS
字段, 和1
位保留字段(必须置为 0
). 4
位 TOS
分别表示: 最小延时, 最大吞吐量, 最高可靠性,最小成本. 这四者相互冲突, 只能选择一个. 对于 ssh/telnet
这样的应用程序, 最小延时比较重要; 对于ftp
这样的程序, 最大吞吐量比较重要.
8 位生存时间: 数据报到达目的地的最大报文跳数. 一般是64
. 每次经过一个路由, TTL -= 1
, 一直减到 0
还没到达, 那么就丢弃了. 这个字段主要是用来防止出现路由循环。
16 位标识(id): 唯一的标识主机发送的报文. 如果 IP 报文在数据链路层被分片了, 那么每一个片里面的这个 id 都是相同的.
3 位标志字段: 第一位保留(保留的意思是现在不用, 但是还没想好说不定以后要用到). 第二位置为 1 表示禁止分片, 这时候如果报文长度超过 MTU, IP 模块就会丢弃报文. 第三位表示"更多分片", 如果分片了的话, 最后一个分片置为 0, 其他是 1. 类似于一个结束标记.
13 位分片偏移: 是分片相对于原始 IP 报文开始处的偏移.其实就是在表示当前分片在原报文中处在哪个位置. 实际偏移的字节数是这个值 8得到的. 因此, 除了最后一个报文之外, 其他报文的长度必须是 8 的整数倍(否则报文就不连续了).
网段划分
IP地址=网络号+主机号
-
网络号: 保证相互连接的两个网段具有不同的标识
-
主机号: 同一网段内, 主机之间具有相同的网络号, 但是必须有不同的主机号
-
不同的子网其实就是把网络号相同的主机放到一起
-
如果在子网中新增一台主机, 则这台主机的网络号和这个子网的网络号一致, 但是主机号必须不能和子网中的其他主机重复
路由器功能:
- 路由功能
- 构建子网(路由器自己构建的私有IP)
通过合理设置主机号和网络号, 就可以保证在相互连接的网络中, 每台主机的 IP 地址都
不相同。手动管理子网内的 IP, 是一个相当麻烦的事情:有一种技术叫做 DHCP
, 能够自动的给子网内新增主机节点分配 IP 地址, 避免了手动管理 IP 的不便。一般的路由器都带有DHCP
功能. 因此路由器也可以看做一个 DHCP
服务器。
两种网段划分方式:
- 传统划分: 把所有 IP 地址分为五类
- A 类 0.0.0.0 到 127.255.255.255
- B 类 128.0.0.0 到 191.255.255.255
- C 类 192.0.0.0 到 223.255.255.255
- D 类 224.0.0.0 到 239.255.255.255
- E 类 240.0.0.0 到 247.255.255.255
随着 Internet 的飞速发展,这种划分方案的局限性很快显现出来,大多数组织都申请 B 类
网络地址, 导致 B 类地址很快就分配完了, 而 A 类却浪费了大量地址.
- 新的划分方案, 称为 CIDR
- 引入一个额外的子网掩码来区分网络号和主机号
- 子网掩码也是一个 32 位的正整数. 通常用一串
0
来结尾 - 将 IP 地址和子网掩码进行 按位与 操作, 得到的结果就是网络号
- 网络号和主机号的划分与这个 IP 地址是 A 类、 B 类还是 C 类无关
IP 地址和子网掩码还有一种更简洁的表示方法,例如140.252.20.68/24
,表示 IP 地址为140.252.20.68
, 子网掩码的高 24 位是 1,也就是255.255.255.0
上述两种网络划分方式市面上大多数教材都有提到。
为什么需要进行网段划分?
- IP是一个有用且有限的资源,因此需要经过合理的划分来给不同区域使用。
- 通过划分好的网段,可以高效支持未来的报文路径查找,大大提高查找目标主机的效率。
特殊的IP地址
-
将 IP 地址中的主机地址全部设为 0, 就成为了网络号, 代表这个局域网
-
将 IP 地址中的主机地址全部设为 1, 就成为了广播地址, 用于给同一个链路中相互连接的所有主机发送数据包
-
127.*
的 IP 地址用于 本机环回(loop back)测试,通常是 127.0.0.1
IP 地址的数量限制
IP 地址(IPv4)是一个 4 字节 32 位的正整数. 那么一共只有 2 的 32 次方 个 IP地址, 大概是 43 亿左右. 而 TCP/IP 协议规定, 每个主机都需要有一个 IP 地址由于一些特殊的 IP 地址的存在, 数量远不足 43 亿; 另外 IP 地址并非是按照主机台数来配置的, 而是每一个网卡都需要配置一个或多个 IP 地址.
CIDR 在一定程度上缓解了 IP 地址不够用的问题(提高了利用率, 减少了浪费, 但是 IP地址的绝对上限并没有增加), 仍然不是很够用。三种解决方案:
- 动态分配 IP 地址: 只给接入网络的设备分配 IP 地址. 因此同一个 MAC 地址的设备, 每次接入互联网中, 得到的 IP 地址不一定是相同的;
- NAT 技术
- IPv6: IPv6 并不是 IPv4 的简单升级版. 这是互不相干的两个协议, 彼此并不兼容; IPv6 用 16 字节 128 位来表示一个 IP 地址; 但是目前 IPv6 还没有普及。
私有IP和公有IP
如果一个组织内部组建局域网,IP 地址只用于局域网内的通信,而不直接连到 Internet 上,理论上 使用任意的 IP 地址都可以,但是 RFC 1918 规定了用于组建局域网的私有 IP 地址。
- 10.*,前 8 位是网络号,共 16,777,216 个地址
- 172.16.* 到 172.31.*,前 12 位是网络号,共 1,048,576 个地址
- 192.168.*,前 16 位是网络号,共 65,536 个地址
包含在这个范围中的, 都成为私有 IP, 其余的则称为全局 IP(或公网 IP)。
每一个主机都有自己的私有IP,不能出现在公网中,但是私有IP可以重复。虽然 存在公网,但是上网的 时候都必须先接入一个指定的私网(内网)中,一般都是运营商可以接入公网中。
家用路由器可以配置两个 IP 地址, 一个是 WAN
口 IP, 一个是 LAN
口 IP(子网IP),路由器 LAN
口连接的主机, 都从属于当前这个路由器的子网中,WAN
口连接的是运营商。不同的路由器, 子网 IP 其实都是一样的(通常都是 192.168.1.1). 子网内的主机IP 地址不能重复. 但是子网之间的 IP 地址就可以重复了.
运营商路由器称之为出入口路由器,WAN
口IP是公网的IP。
因此网络世界=内网+公网构成的。
理解私有IP不能出现在公网上:
以下图为例,主机的源端口为192.168.1.201
,目的端口为122.77.241.3
,当前主机所处的网络号为192.168.1.0
,但是目的端口所处的网络号为122.77.241.0
,因此需要通过家用路由器转出去,转到运营商路由器。运营商路由器此时的子网为10.1.1.1
,不是目标端口的子网号,因此需要通过运营商路由器转出去,在公网环境转发到服务器中。
因此,任何一台主机都能知道和自己直连的网络号(子网)是多少
内网中的IP地址是可以重复的,可以变向的提高IP地址使用上限。但是私有IP不能出现在公网上,因此上述通信模式并不能完全正确完成通信。
NAT技术
如何完全正确的完成通信?
主机将报文交给家用路由器时,将报文中源IP替换成自己的WAN口IP,这样避免了私有IP出现在公网中。同样的,家用路由器将报文交给运营商服务器时,在运营商服务器中将报文源IP修改成运营商服务器的WAN的IP。最后通过广域网环境交给服务器。
像这种源IP不断转换的工作我们称之为NAT技术,NAT技术只在内网做转换,解决了从内网到公网的问题。
路由
路由是在一个复杂的网络结构中,找到一条通往终点的路径。
- 当 IP 数据包, 到达路由器时, 路由器会先查看目的 IP。
- 路由器决定这个数据包是能直接发送给目标主机, 还是需要发送给下一个路由器。当前路由器决定该报文先去下一个路由器的时候,该路由器称之为缺省路由。
- 依次反复, 一直到达目标 IP 地址。
因此路由过程中有两种情况:一是到达目的主机,二是缺省路由。还有一种特殊情况是该路由器连接的是终点的子网,后续需要进行子网内的转发即可。
在Linux中可以通过route
指令查看自己的路由表:
路由表的 Destination
是目的网络地址,Genmask
是子网掩码,Gateway
是下一跳地址,Iface
是发送接口,Flags
中的 U
标志表示此条目有效(可以禁用某些 条目),G
标志表示此条目的下一跳地址是某个路由器的地址,没有 G
标志的条目表示目的网络地址是与本机接口直接相连的网络,不必经路由器转发。
假设某路由表配置如下:
-
转发过程例 1: 如果要发送的数据包的目的地址是
192.168.56.3
- 跟第一行的子网掩码做与运算得 到
192.168.56.0
,与第一行的目的网络地址不符合 - 再跟第二行的子网掩码做与运算得 到 192.168.56.0,正是第二行的目的网络地址,因此从 eth1 接口发送出去
- 由于 192.168.56.0/24 正 是与 eth1 接口直接相连的网络,因此可以直接发到目的主机,不需要经路由器转发
- 跟第一行的子网掩码做与运算得 到
-
转发过程例 2: 如果要发送的数据包的目的地址是
202.10.1.2
- 依次和路由表前几项进行对比, 发现都不匹配
- 按缺省路由条目, 从 eth0 接口发出去, 发往 192.168.10.1 路由器
- 由 192.168.10.1 路由器根据它的路由表决定下一跳地址