目录
🌈 前言🌈
📁 什么是网络
📁 协议
📂 概念
📂 OSI参考模型
📂 TCP/IP模型
📂 TCP/IP 和 系统分层的关系
📁 网络传输的基本流程
📂 MAC地址
📂 IP地址
📂 封装,解封装,分用
📂 IP地址 VS MAC地址
📁 socket编程
📂 端口号
📂 网络字节序
📂 socket 常见API
📂 socket 结构
📁 总结
🌈 前言🌈
本期【网络世界】介绍的是计算机网络基本概念,其中如目录所示的所有内容,包含了概念定义,网络通信的基本流程,此外还有介绍网络编程socket的API。
此外,像一些比较重要的内容,例如TCP/IP协议集,IP地址,MAC地址,端口号,封装解封装分用的过程,是本期的主要内容。
本文参考书籍:《深入理解计算机系统》,《计算机网络自顶向下方法》
📁 什么是网络
网络指的是由若干计算机和其他设备通过通信链路连接起来,以便彼此之间可以进行数据交换和资源共享的系统。计算机网络通常通过通信协议来规定数据传输的方式和规则,确保数据能够有效地从发送者传输到接收者。
其中,网络的根据距离划分为:局域网(LAN)、城域网(MAN)、广域网(WAN)
根据连接方式:点对点网络、客户端-服务器网络
根据拓扑结构:星型,总线型,环形,树型,网型等网络。
📁 协议
计算机是人的一种工具,通过多台计算机协同工作来完成某种任务,形成了网络。人与人之间交流是通过某种语言来实现的。例如英语,有语法,语义,时序。计算机与计算机之间实现网络通信也是如此,遵循某种规则,这个规则就是协议。
📂 概念
协议是指在通信、交流或行动中,各方为了达成共同目标而约定的规则、程序或约定。在不同的领域和语境下,协议的定义和使用有所不同,但其核心概念是为了确保参与者之间能够有效地交流、协作或达成一致而制定的规范性文件或约定。
在计算机科学和网络通信领域,协议通常指的是通信协议,用于规定数据传输的方式、格式和规则。
例如,我们规定高电平代表1,低电平代表0,这就是一种协议的体现。协议需要被指定,并且被许多人遵守。
在实际通信过程中,会遇到各种不同类型的问题,这就需要来制定协议来解决问题,根据问题的不同,天然的就将协议划分成很多层。
此外,协议分层也可以带来很多好处,例如设计上更好的进行模块化,解耦合,使得软件维护成本更低。
📂 OSI参考模型
OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放 式系统互联参考模型,是一个逻辑上的定义和规范;把网络从逻辑上分为了 7 层. 每一层都有相关、相对应的物理设备,比如路由 器,交换机;它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚, 理论也比较完整. 通过七个层次化的结构模型使不同的系统不同的网络之间实现可 靠的通讯;
OSI参看模型非常完美,但是因为种种原因,并不能得到完美实现,进而没能推广开来。应用最为广泛的就是接下来介绍的TCP/IP模型
📂 TCP/IP模型
TCP/IP是一组协议簇,还包括了许多协议,只不过取了应用最重要的两个协议为名,TCP为传输层协议,IP为网络层协议。
网络是一个抽象的概念,所以我们很少直接考虑物理硬件,所以一般来说TCP/IP视为四层:网络接口层,网络层(网际层),传输层,应用层。
下图是具体机器,对应的层次。
📂 TCP/IP 和 系统分层的关系
这里我们可以对协议有个朴素的理解:在计算机内部,所谓协议,就是通信双方都认识的结构化的数据类型。
例如,主机A有个数据(a=10,b=20,c=30),发给主机B,主机B能识别吗?可以,双方都遵循相同的协议,就拥有相同的结构体类型struct protocol。也就是说同样的代码实现协议,用同样的自定义数据类型,天然就拥有共识,能够识别对方发来的数据,这就是协议。
总结一下,我们应用的是TCP/IP模型,所以之后我们都默认协议指的就是TCP/IP协议集。TCP/IP协议本质就是一种解决方案。TCP/IP协议能分层,前提就是问题本身能够分层。协议在计算机内通过代码实现,本质就是一个结构体类型。
📁 网络传输的基本流程
我们来看看基本的网络是如何运行的,我们日常生活中路由器,交换机是如何工作的。
📂 MAC地址
我们先来看看局域网通信,双方如果在同一局域网内,可以直接通信。就类似与同学们在教室内,相互聊天交流。但是,我们必须知道对方是谁,所以必须有一个保证唯一性的标识符,在局域网内,称为MAC地址。
如今,应用最为广泛的局域网标准是以太网标准。
在以太网中,任何时刻只允许一台主机发送数据,如果有多台同时发送,会产生数据干扰,称为数据碰撞,所有发送数据的主机要进行碰撞检测和碰撞避免。在局域网通信中,主机对收到的保温确认是否发给自己,是通过目标的MAC地址判定。
📂 IP地址
在局域网内是通过MAC地址来确认,如果是跨局域网通信呢,就要使用IP地址,IP地址和MAC地址都是为了表示主机唯一性的标识符。IP地址是网络层的概念,MAC地址是数据链路层的概念。
IP 协议有两个版本, IPv4 和 IPv6. 我们整个的课程, 凡是提到 IP 协议, 没有特殊说明的, 默认都是指 IPv4
跨网段的主机的数据传输. 数据从一台计算机到另一台计算机传输过程中要经过一个或 多个路由器。
📂 封装,解封装,分用
其中每层都有协议,所以当进行传输数据的流程时,要进行封装和解封装。
下面,我们明确一下概念
报头,就是对应协议层的结构体字段,一般称为报头;
除了报头,剩下的叫做有效载荷。
报文 = 报头 + 有效载荷
两台计算机通过TCP/IP协议进行通讯的过程:
在网络传输的过程中,数据不是直接发送给对方主机的,而是先要自定向下将数据交付给下层协议,最后由底层发送,然后由对方主机的底层来进行接受,在自底向上进 行向上交付,下面是一张示意图。
以上就是,封装和解封装的过程。在解封装的过程中,每一个有许多协议,计算机如何知道将数据交给哪个协议处理呢?这就根据首部信息,进行分用。
📂 IP地址 VS MAC地址
结合封装,理解路由器通过IP地址进行路由转发的过程,从而理解网络传输的基本流程。
上层不断封装,交付给网络层,网络层就会在封装 源IP(主机A) 和 目的IP(主机B),会进行路由选择,判断与目的IP是否在同一个局域网内,如果不在就是跨网段通信,将数据传给路由器(路由器配有多块网卡,连入多个网段)。
此时封装到数据链路,封装 源MAC(主机A) 和 目的MAC(路由器),再通过物理设备(网线...)将数据传给路由器,路由器会进行路由选择,将数据发送给 目的IP,在路由器内部也是会进行解封装和封装的过程,此时源IP(主机A) 和 目的IP(主机B)不变,源MAC(路由器) 和 目的MAC(主机B)发生变化。
由此,我们可以了解网络传输的基本流程,就是不断封装,解封装的过程。
目的 IP 是一种长远目标,Mac 是下一阶段目标,目的 IP 是路径选择的重要依 据,mac 地址是局域网转发的重要依据。
IP 网络层存在的意义:提供网络虚拟层,让世界的所有网络都是 IP 网络,屏蔽最底层网络的差异。
因此,不管底层网络结构是以太网,还是令牌环网都可以进行通信,上层不关心底层。
📁 socket编程
Socket编程是一种用于网络通信的编程接口,它提供了一种在不同计算机之间进行数据传输的方式。在大多数操作系统中,Socket编程可以通过各种编程语言实现。
📂 端口号
我们为什么要有网络,因为要进行协同工作,在计算机内,进程是CPU调度的基本单位,简单理解为通过进程来完成工作。
所以,将数据传给目的主机不是目的,传给目的主机中相应的进程才是。所以,就有了端口号的概念,这是一个传输层的标识符,标识一个进程。
因此,在计算机网络中,通过 IP地址 + 端口号 的方式,就可以确定网络中那个唯一的进程。
端口号(port)是传输层协议的内容。
端口号是一个 2 字节 16 位的整数;端口号用来标识一个进程, 告诉操作系统, 当前的这个数据要交给哪一个进程来 处理;一个端口号只能被一个进程占用。
另外, 一个进程可以绑定多个端口号; 但是一个端口号不能被多个进程绑定;
传输层协议(TCP 和 UDP)的数据段中有两个端口号, 分别叫做源端口号和目的端口号. 就是在描述 "数据是谁发的, 要发给谁";
综上,IP 地址用来标识互联网中唯一的一台主机,port 用来标识该主机上唯一的 一个网络进程。 IP+Port 就能表示互联网中唯一的一个进程。
所以,通信的时候,本质是两个互联网进程代表人来进行通信,{srcIp, srcPort,dstIp,dstPort}这样的 4 元组就能标识互联网中唯二的两个进程 。 所以,网络通信的本质,也是进程间通信。我们把 ip+port 叫做套接字 socket。
📂 网络字节序
内存中的多字节数据相对于内存地址有大端和小端之分, 磁盘文件中的 多字节数据相对于文件中的偏移地址也有大端小端之分, 网络数据流同样有大端小端之 分. 那么如何定义网络数据流的地址呢?
网络规定字节序是大端字节序,发送主机通常将发送缓冲区中的数据按内存地址从低到高的顺序发出;接收主机把从网络上接到的字节依次保存在接收缓冲区中,也是按内存地址从 低到高的顺序保存;
如果当前发送主机是小端, 就需要先将数据转成大端; 否则就忽略, 直接发送即可;
为使网络程序具有可移植性,使同样的 C 代码在大端和小端计算机上编译后都能正常运 行,可以调用以下库函数做网络字节序和主机字节序的转换。
这些函数名很好记,h 表示 host,n 表示 network,l 表示 32 位长整数,s 表示 16 位 短整数。
例如 htonl 表示将 32 位的长整数从主机字节序转换为网络字节序,例如将 IP 地 址转换后准备发送。
如果主机是小端字节序,这些函数将参数做相应的大小端转换然后返回;
如果主机是大端字节序,这些函数不做转换,将参数原封不动地返回。
📂 socket 常见API
C
// 创建 socket 文件描述符 (TCP/UDP, 客户端 + 服务器)
int socket(int domain, int type, int protocol);
// 绑定端口号 (TCP/UDP, 服务器)
int bind(int socket, const struct sockaddr *address,
socklen_t address_len);
// 开始监听 socket (TCP, 服务器)
int listen(int socket, int backlog);
// 接收请求 (TCP, 服务器)
int accept(int socket, struct sockaddr* address,
socklen_t* address_len);
// 建立连接 (TCP, 客户端)
int connect(int sockfd, const struct sockaddr *addr,
socklen_t addrlen);
📂 socket 结构
套接字可以时间网络通信,也可以实现本主机内通信,如果是网络通信采用struct sockaddr_in,本主机内进程通信采用struct sockaddr_un,但是为了通用性,API一律采用struct sockaddr 来接收,使用时进行强转。
虽然 socket api 的接口是 sockaddr, 但是我们真正在基于 IPv4 编程时, 使用的数据结 构是 sockaddr_in; 这个结构里主要有三部分信息: 地址类型, 端口号, IP 地址.
in_addr 用来表示一个 IPv4 的 IP 地址. 其实就是一个 32 位的整数;
📁 总结
以上,就是本期内容,讲解了网路的基本概念;了解了TCP/IP模型,理解问什么要有协议,协议作用;网络通信的基本流程,什么是MAC地址,IP地址,封装,解封装,分用的定义;此外,介绍了网络编程socket常见的API,以及底层结构体定义。
如果感觉本期内容对你有帮助,欢迎点赞,收藏,关注Thanks♪(・ω・)ノ