网络发展
对于我们国家来讲,网络的发展,不仅仅是互联网公司在发展,提供重要推动力的还有三大运商
随之而来的是新设备的诞生。比如集线器,网线,光纤,调制解调器,路由器,防火墙,服务器...
独立模式: 计算机之间相互独立
网络互联: 多台计算机连接在一起, 完成数据共享
局域网LAN: 计算机数量更多了, 通过交换机和路由器连接在一起
广域网WAN: 将远隔千里的计算机都连在一起
认识 "协议"
"协议" 是一种约定
比如:在以前的年代,假设小明读书时只能通过座机与父母沟通,接电话不用钱,打电话收费,于是勤俭持家的小明就和父母做个约定:电话响一声-->寄生活费 响两声-->报平安 响2声以上-->我要和你们电话聊
为什么要有协议:
因为在网络通信时,两台主机距离变长了,由此引发了新的问题:
1. 丢包了怎么办?
2. 目标机器的定位问题
3. 如何让我们的报文,在经历了无数个设备之后,还能准确的把数据推送给远端机器
为了解决以上问题,所以有了协议的出现
计算机之间的传输媒介是光信号和电信号. 通过 "频率" 和 "强弱" 来表示 0 和 1 这样的信息. 要想传递各种不同的信 息, 就需要约定好双方的数据格式
我们要知道:计算机生产厂商有很多,计算机操作系统, 也有很多,计算机网络硬件设备, 还是有很多,如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来, 约定一个共同的标准, 大家都来遵守, 这就是网络协议
网络vs系统
网络一定要能保证各种不同的机器,都要能无障碍接入互联网,由此需要定制全面的网络协议-->编码实现协议(涉及面非常广,如:从硬件上来说规定了所有硬件的电器特性,也规定了软件特性等)
网络通信的问题
由于主机网络通信时,距离的拉长:
a. 怎么保证把数据先交给下一跳主机?
b. 在转发中,如何进行路径选择,目标主机定位的问题?
c. 如果报文中间出现错误,或者丢失?
d.送达的数据还要解决如何使用数据的问题
a,b,c问题的提出是为了:让数据可靠地从A送到B -->a,b,c,d中,每一个问题都要有协议来解决-->协议很多
网络的解决方案--网络的层状结构
软件上,绝大部分的解决方案都是层状的-->完成软件的解耦合,未来我们非常方便地进行软件的维护(更新,替换,优化等)
网络和系统的关系
windows或者是linux这台机器上,可能在发消息,收消息,所以linux操作系统一定会收到许多报文(比如打开网页,一边下载,一边听歌,所以电脑一直在收消息)操作系统要管理这些报文(就是数据):先描述再组织,先描述-->每个报文都是描述该报文的结构体对象,再组织-->把所有的报文按链表/队列形式组织起来,对报文的管理转变成对链表/队列的增删查改
网络协议栈本质就是对这种数据结构的增删查改
网络协议初识
协议分层
打电话例子:
在上面的例子中,协议只有两层,但是实际的网络通信会更加复杂, 需要分更多的层次
分层最大的好处在于 "封装"
OSI七层模型
OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放式系统互联参考模型, 是一个逻辑上的定义和规范
把网络从逻辑上分为了7层. 每一层都有相关、相对应的物理设备,比如路由器,交换机
但是实际工程实践中,我们按照的是按照TCP/IP四层模型(简化了OSI标准)
TCP/IP五层(或四层)模型
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇
TCP/IP通讯协议采用了5层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求
物理层: 负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞 线)、早期以太网采用的的同轴电缆 (现在主要用于有线电视)、光纤, 现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决 定了最大传输速率、传输距离、抗干扰性等. 集线器(Hub)工作在物理层
数据链路层: 负责设备之间的数据帧的传送和识别. 例如网卡设备的驱动、帧同步(就是说从网线上检测 到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作. 有以太 网、令牌环网, 无线LAN等标准. 交换机(Switch)工作在数据链路层
网络层: 负责地址管理和路由选择. 例如在IP协议中, 通过IP地址来标识一台主机, 并通过路由表的方式规 划出两台主机之间的数据传输的线路(路由). 路由器(Router)工作在网路层
传输层: 负责两台主机之间的数据传输. 如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机
应用层: 负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问 协议(Telnet)等. 我们的网络编程主要就是针对应用层
物理层我们考虑的比较少. 因此很多时候也可以称为 TCP/IP四层模型
TCP/IP四/五层模型也可以称作TCP/IP协议栈/网络协议栈
一般而言:
对于一台主机, 它的操作系统内核实现了从传输层到物理层的内容
对于一台路由器, 它实现了从网络层到物理层
对于一台交换机, 它实现了从数据链路层到物理层
对于集线器, 它只实现了物理层
但是并不绝对. 很多交换机也实现了网络层的转发; 很多路由器也实现了部分传输层的内容(比如端口转发)
网络传输基本流程
网络传输流程图
同一个网段内的两台主机进行文件传输:
跨网段的主机的文件传输. 数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器
数据包封装和分用
不同的协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报 (datagram),在链 路层叫做帧(frame)
应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部(header),称为封装
首部信息中包含了一些类似于首部有多长, 载荷(payload)有多长, 上层协议是什么等信息
数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部, 根据首部中的 "上层协议 字段" 将数据交给对应的上层协议处理
下图为数据封装的过程:
下图为数据分用的过程:
关于局域网
局域网中多台主机能够直接通信,那么通信原理是什么?
每台主机都有网卡,每一个网卡都有mac地址(理论上来说,全球唯一)
Mac地址的意义:用于局域网内的通信,标识主机的唯一性
局域网通信的原理:在一个局域网当中,某台主机发出的信息可以被所有在该局域网中的主机接收到,mac地址来区分最终让谁接收成功
如果局域网中很多主机都在同时发消息,这种情况叫做数据碰撞,(举个容易理解的例子:就像在教室里,如果所有的人都在说话,那么整个教室都是嘈杂的,听不清具体的内容)一旦如此,消息都废掉了
所以当两台主机都在发消息时,发生数据碰撞,双方要执行碰撞避免算法,此外我们把局域网也叫做碰撞域
这种基于碰撞域,碰撞检测,碰撞避免的局域网通信,是基于概率的,我们把它叫做以太网
局域网通信时,局域网相当于主机们的一部分共享资源,可能会有数据不一致问题,要正确地发送数据,任何时刻,只允许一台主机在局域网中发消息。
局域网可以看作临界资源,所有主机都发送消息,叫做访问临界区代码,数据发生碰撞,叫做数据不一致,执行碰撞避免算法,让某台主机单独发送消息,叫做独占系统资源
由此,可以知道系统和网络分不开。
网络中的地址管理
认识IP地址
IP协议有两个版本, IPv4和IPv6,在本篇博客中凡是提到IP协议, 没有特殊说明的, 默认都是指IPv4
IP地址是在IP协议中, 用来标识网络中不同主机的地址
对于IPv4来说, IP地址是一个4字节, 32位的整数
我们通常也使用 "点分十进制" 的字符串表示IP地址, 例如 192.168.0.1 ; 用点分割的每一个数字表示一个字节, 范围是 0 - 255
认识MAC地址
MAC地址用来识别数据链路层中相连的节点
长度为48位, 6个字节. 一般用16进制数字加上冒号的形式来表示(例如: 08:00:27:03:fb:19)
在网卡出厂时就确定了, 不能修改. mac地址通常是唯一的(虚拟机中的mac地址不是真实的mac地址, 可能会冲突; 也有些网卡支持用户配置mac地址)