目录
一、以太网
二、以太网帧格式
三、 MTU
1、MTU概念
2、 MTU对IP协议的影响
3、MTU对UDP协议的影响
4、 MTU对于TCP协议的影响
四、MAC地址
五、 ARP协议
1、ARP协议的作用
2、ARP协议的工作流程
3、ARP数据报的格式
4、中间人
数据链路层解决的,是在同一个子网内,如何发送数据的问题。
跨网络的本质,就是在很多子网内进行路由和转发。
一、以太网
- "以太网" 不是一种具体的网络,而是一种技术标准。既包含了数据链路层的内容,也包含了一些物理层的内容。例如:规定了网络拓扑结构,访问控制方式,传输速率等。
- 例如以太网中的网线必须使用双绞线。传输速率有10M,100M,1000M等。
- 以太网是当前应用最广泛的局域网技术。和以太网并列的还有令牌环网,无线LAN等。
二、以太网帧格式
- 源地址和目的地址是指网卡的硬件地址(也叫MAC地址),长度是48位,是在网卡出厂时固化的。
- 帧协议类型字段有三种值,分别对应IP、ARP、RARP。
- 帧末尾是CRC校验码。
以太网中,任何时刻,只能有一台主机给另一台主机发送数据帧,否则可能会发生数据碰撞的问题。因此局域网又称为碰撞域。
三、 MTU
1、MTU概念
MTU相当于发快递时对包裹尺寸的限制。这个限制是不同的数据链路对应的物理层,产生的限制。
- 以太网帧中的数据长度规定最小46字节,最大1500字节,ARP数据包的长度不够46字节,要在后面补填充位。
- 最大值1500称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU。
- 如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的MTU了,则需要对数据包进行分片(fragmentation)。
- 不同的数据链路层标准的MTU是不同的。
- 设置MTU是因为局域网内同一时刻只允许一台主机发送消息,否则可能会导致数据碰撞,如果一个数据帧过长,则会导致碰撞发生的几率,且发生碰撞,整个数据帧都要重传。
2、 MTU对IP协议的影响
由于数据链路层MTU的限制,对于较大的IP数据包要进行分包。
- 将较大的IP包分成多个小包,并给每个小包打上标签。
- 每个小包IP协议头的 16位标识(id) 都是相同的。
- 每个小包的IP协议头的3位标志字段中,第2位置为0,表示允许分片,第3位来表示结束标记(当前是否是最后一个小包,是的话置为0,否则置为1)。
- 到达对端时再将这些小包,会按顺序重组,拼装到一起返回给传输层。
- 一旦这些小包中任意一个小包丢失,接收端的重组就会失败。但是IP层不会负责重新传输数据。
3、MTU对UDP协议的影响
- 一旦UDP携带的数据超过1472(1500 - 20(IP首部) - 8(UDP首部)),那么就会在网络层分成多个IP数据报。
- 这多个IP数据报有任意一个丢失,都会引起接收端网络层重组失败。那么这就意味着,如果UDP数据报在网络层被分片,整个数据被丢失的概率就大大增加了。
4、 MTU对于TCP协议的影响
- TCP的一个数据报也不能无限大,还是受制于MTU。TCP的单个数据报的最大消息长度,称为MSS(Max Segment Size)。
- TCP在建立连接的过程中,通信双方会进行MSS协商。
- 最理想的情况下,MSS的值正好是在IP不会被分片处理的最大长度(这个长度仍然是受制于数据链路层的MTU)。
- 双方在发送SYN的时候会在TCP头部写入自己能支持的MSS值。
- 然后双方得知对方的MSS值之后,选择较小的作为最终MSS。
- MSS的值就是在TCP首部的40字节变长选项中(kind=2)。
四、MAC地址
- MAC地址用来识别数据链路层中相连的节点。
- 长度为48位,即6个字节。一般用16进制数字加上冒号的形式来表示(例如: 08:00:27:03:fb:19)
- 在网卡出厂时就确定了,不能修改。mac地址通常是唯一的(虚拟机中的mac地址不是真实的mac地址,可能会冲突。也有些网卡支持用户配置mac地址)
主机A向主机D发送数据时,会把报文报头中的目的MAC地址设置为D的MAC地址。实际上A的数据报发出后,该局域网中的所有主机都能收到该数据报,每一台主机都会把数据报的报头分离出来,并把目的MAC地址与自己做对比,如果不同则直接丢弃该报文,相同则把有效载荷交给上层。
网卡可以设置为混杂模式,即不对报文的目标MAC地址进行认证,直接把有效载荷向上交付。这也是大部分局域网抓包软件的原理。
因为局域网中可能会出现数据碰撞的问题,因此为了解决这个问题,首先要先发现问题。主机A在发送完数据后,也会自己接收一份自己刚刚发送的数据,并进行报文拆分后检查校验码与自己之前发送的是否相同,如果相同,则没有发生碰撞,如果不同,就等一会再发一次。这个等待的时间是随机的,局域网中每个主机不同。这种网络资源可以类比到系统中的临界资源。
局域网中主机数量越多,发生碰撞的概率越大。为了降低发生碰撞的概率,可以在局域网中增加交换机来划分碰撞域,把碰撞域划分成几个区域,一个区域内的数据帧不会被发送到其他区域。
对比理解MAC地址和IP地址:
- IP地址描述的是路途总体的 起点 和 终点。
- MAC地址描述的是路途上的每一个区间的起点和终点。
把数据从主机A发送到主机B,需要知道对方的MAC地址,因此就需要根据对方的IP地址转换成MAC地址。这需要用到ARP协议。
五、 ARP协议
ARP不是一个单纯的数据链路层的协议,而是一个介于数据链路层和网络层之间的协议。
1、ARP协议的作用
ARP协议建立了主机 IP地址 和 MAC地址 的映射关系。
- 在网络通讯时,源主机的应用程序知道目的主机的IP地址和端口号,却不知道目的主机的硬件地址。
- 数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件地址与本机不符,则直接丢弃。
- 因此在通讯前必须获得目的主机的硬件地址。
2、ARP协议的工作流程
- 源主机发出ARP请求,询问“IP地址是192.168.0.1的主机的硬件地址是多少”,并将这个请求广播到本地网段(以太网帧首部的硬件地址填FF:FF:FF:FF:FF:FF表示广播)。
- 目的主机接收到广播的ARP请求,发现其中的IP地址与本机相符,则发送一个ARP应答数据包给源主机,将自己的硬件地址填写在应答包中。
- 每台主机都维护一个ARP缓存表,可以用arp -a命令查看。缓存表中的表项有过期时间(一般为20分钟),如果20分钟内没有再次使用某个表项,则该表项失效,下次还要发ARP请求来获得目的主机的硬件地址。这样做是因为一个局域网内IP地址是公有的,有可能MAC1对应的设备退出后,MAC2设备用使用了同一个IP地址,导致数据发送不了。
3、ARP数据报的格式
- 注意到源MAC地址、目的MAC地址在以太网首部和ARP请求中各出现一次,对于链路层为以太网的情况是多余的,但如果链路层是其它类型的网络则有可能是必要的。
- 硬件类型指链路层网络类型,1为以太网。
- 协议类型指要转换的地址类型,0x0800为IP地址。
- 硬件地址长度对于以太网地址为6字节。
- 协议地址长度对于和IP地址为4字节。
- op字段为1表示ARP请求,op字段为2表示ARP应答。
任何主机收到ARP,先看op,确认是请求还是应答。
4、中间人
因为所有主机收到APR后都会直接查根据应答看op字段,判断是请求还是应答,如果是应答,就会根据应答在本主机内构建IP地址与MAC地址的映射关系。这样一来就有可能有一个中间人主机M向主机A发送ARP应答,把路由器的IP与自己的MAC地址放到一起发给主机A,这样主机A就会误以为路由器的IP地址对应的MAC地址是M的MAC地址,从而以后本该发给路由器的数据都发给主机M了。同样的操作再对路由器做一次,这样路由器发给主机A的数据都会发送给主机M。这就叫做ARP欺骗。