网络原理-UDP/TCP详解

一. UDP协议

UDP协议端格式

由上图可以看出,一个UDP报文最大长度就是65535. 

• 16位长度,表示整个数据报(UDP首部+UDP数据)的最大长度(注意,这里的16位UDP长度只是一个标识这个数据报长度的字段,并不是这个数据报传输的数据)

• 如果校验和出错,就会直接丢弃。

 校验和:通过网线传输时,电信号使用高低电平来表示0和1.。但是,如果外部环境干扰,就有可能导致低电平->高电平,高电平->低电平,造成比特翻转=>数据就传输错了。校验和就是通过数据报中的数据内容通过计算得到的。值得注意的是:如果校验和不对,此时你的数据一定不对,如果校验和对,但是数据也有一定概率是错误的。

面向数据报:应用层交给UDP长的报文,UDP原样发送,既不会拆分,也不会合并。

用UDP传输100个字节的数据报:

如果一次发送端发送100个字节,那么接收端也必须一次接收100个字节;而不能循环10次接收,每次接收10个字节。

缓冲区:UDP只有接收缓冲区,没有发送缓冲区

UDP没有真正意义上的发送缓冲区,发送的数据会直接交给内核,由内核将数据传给网络层协议进行后续的传输动作;

DUP具有接收缓冲区,但是这个接收缓冲区不能保证收到的DUP报的顺序和发送DUP报的顺序一致;如果缓冲区满了,再到达的DUP数据就会被丢弃;

二. TCP协议

TCP协议段格式:

2.1 TCP原理 

2.1.1 确认应答机制

TCP 将每个字节的数据都进行了编号。即位序列号。

发送方的序号为最后一个字节的编号,确认序号为无意义的数据;

接收方的序号和发送方的序号无关,确认序号为接收数据的序号+1。

(在接收缓冲区中,优先级队列通过序号来确定数据的发送先后顺序 )

接收方就可以通过ack的确认序号,告诉发送方哪些数据已经收到了。

2.1.2 超时重传机制

主机A发送数据给B之后,可能因为网络拥堵等原因,数据无法到达主机B;

如果主机A在一个特定时间间隔内没有收到B发来的确认应答,就会重发。

但是,主机A未收到B发来的确认应答,也可能是因为主机B收到了数据,但是ACK丢失了;

因此若ACK丢失了,主机B会收到很多重复数据。那么TCP协议需要能够识别哪些包是重复的包,并且把重复的丢弃掉。这时候我们就可以利用前面提到的序号来达到去重的效果。

超时重传后,重复发送的数据报仍可能会丢失,TCP为了保证无论在任何环境下都能比较高性能的通信,因此会动态的计算这个最大超时时间。

如果重发一次,仍得不到应答,TCP就会将这个超时时间延长后再重发,在不停的延长超时时间后,当累积到一定的重传次数后,TCP就会重置连接,如果重置连接失效,TCP就会关闭连接,放弃网络通信。

2.1.3 连接管理机制(三次握手,四次挥手)

建立连接:三次握手

握手指的是通信双发,进行一次网络交互,相当于客户端和服务器之间,通过三次交互,建立了连接关系。 

syn称为同步报文段。意思就是一方要向另一方,申请连接。

在报文头部中有6个特殊的比特位,如果设为1,则表示特定含义。

其中第二位,是ACK,如果这一位为1,表示当前TCP数据报是一个应答报文;

其中第五位,是SYN,如果这一位为1,表示当前TCP数据报是一个同步报文;

如果一个TCP数据报,第二位和第五位都是1,则当前这个报文时SYN+ACK

三次握手这个过程,本质上时投石问路,验证了客户端和服务器,各自的发送能力和接收能力是否正常 

断开连接:四次挥手

FIN:结束报文段

四次挥手中的ack和fin是否可以合并?

在三次握手中,ack和syn时同一时刻触发的(都是内核来完成的)

四次挥手,ack和fin则是在不同时机触发的。

ack是内核完成的,会在收到fin的时候第一时间返回

fin则是应用程序代码控制的。在调用到socket的close方法时候才会出发fin

finally{ 
    //thread.sleep(1000);
    socket.close();
}

这个close的执行时机,可能是立即,也可能是隔很久,却决于你的代码怎么写。

如果立即 close,趁着刚才ack还没发呢,这里就可以合并,如果是隔很久再close,此时fin就只能单独发了。

注:这里的close只是进程关闭了,但是连接(连接是内核维护的)还在,客户端发送的ack,服务器仍然可以收到。

2.1.4 滑动窗口(效率机制)

对于每一个发送的数据段,都要给一个ACK确认应答,收到ACK后再发送下一个数据段。.由于这样的一收一发的方式性能较低,那么我们一次发送多条数据,就可以大大的提高性能。(其实是将多个段的等待时间重叠在一起了。

窗口大小指的是无需等待应答而可以继续发送数据的最大值.上图的窗口大小就是4000个字节(4个段)。

发送前四个段的时候,不需要等待任何ACK,直接发送。

操作系统内核为了维护这个滑动窗口,需要开辟发送缓冲区来记录当前还有哪些数据没有应答;只有确认应答过的数据,才能从缓冲区删掉。

• 窗口越大,则网络的吞吐率就越高。

如果出现了丢包的情况,如何重传?分两种情况:

情况一:数据包已经抵达,ACK被丢了。

这种情况下,部分ACK丢了并不要紧,因为可以通过后续的ACK进行确认。如果1001的 ACK没有接收到,收到了2001的ACK,那么就说明已经接收到了2001以前的数据。

情况二:数据包直接丢了。 

当某一段报文丢失之后,发送端会一直收到1001这样的ACK,就像是在提醒发送端“我想要的是"1001"一样;

当发送端主机连续收到三次同样的“1001”这样的应答,就会将对应的数据1001~2000重新发送

这个时候接收端收到了1001之后,再次返回的ACK就是7001了,因为2001~7000接收端其实之前就已经收到了,被放到了接收端操作系统内核的接收缓冲区中。

2.1.5 流量控制(安全机制)

接收端处理数据的速度是有限的。如果发送端发送的太快,导致接收端的缓冲区被打满,这个时候如果发送端继续发送,就会造成丢包,继而引起丢包重传等一些列连锁反应。 

因此TCP支持根据接收端的处理能力,来决定发送端的发送速度。这个机制就叫做流量控制

• 接收端将自己可以接收的缓冲区大小放入TCP首部中的“窗口大小”字段,通过ACK端通知发送端,此时发送端就可以根据这个窗口大小来批量发送这些数据了。

• 接收端一旦发现自己的缓冲区快满了,就会将窗口大小设置成一个更小的值通知给发送端;

• 发送端接收到了这个窗口之后,就会减慢自己的发送速度

• 如果接收端缓冲区满了,就会将窗口设置为0;这时发送方就不再发送数据,但是仍需要定期发送一个窗口探测数据段,使接收端把窗口大小告诉发送端。

上述过程是把返回的窗口大小,当作实际的窗口,实践中可能会有出入。

发送方的窗口大小=min(流量控制,拥塞控制)。

2.1.6 拥塞控制(安全机制) 

虽然TCP有了滑动窗口这个大杀器,能够高效可靠的发送大量的数据.但是如果在刚开始阶段就发送大量的数据,仍然可能引发问题.

因为网络上有很多的计算机,在传输的过程中,需要经历许多的节点,可能当前的网络状态就已经比较拥堵了,但是此时在不清楚当前网络状态下,贸然发送大量的数据,是很有可能引起雪上加霜的.于是,不管在客户端与服务器之间是经历怎样的路径,把这个路径当做黑盒一样的东西,每次发送不同数量的请求,来试验出最佳的发送窗口.

TCP引入 慢启动 机制,先发送少量的数据,探探路,摸清当前的网络拥堵状态,再决定按照多大的速度传输数据

• 发送开始的时候,定义拥塞窗口大小为1

• 每次收到一个ACK应答,拥塞窗口加1

• 每次发送数据包的时候,将拥塞窗口和接收端主机反馈的窗口大小作比较,取较小的值作为实际发送的窗口

 为了让拥塞窗口不增长的那么快,变引入了一个叫做慢启动的阈值,当拥塞窗口超过这个阈值的时候,不再按照指数的方式增长,而是按照线性方式增长

• 当TCP开始启动的时候,慢启动阈值等于窗口最大值;

• 在每次超时重发的时候,慢启动阈值会变成原来的一般,同时拥塞窗口重置回1.

2.1.7 延迟应答

如果接受数据的主机立刻返回ACK应答,这时候返回的窗口肯能比较小.

• 假设接收缓冲区为1M,一次收到了500k的数据,如果立刻应答,返回的窗口就是500k

• 但实际上可能处理端处理的速度很快,10ms之内就把500k的数据从缓冲区消费掉了

• 在这种情况下,接收端处理还远没有达到自己的极限,即使窗口再放大一些,也能处理过来

• 如果接受端稍微等一会再应答,比如等待200ms再应答,那么这个时候返回的窗口大小就是1M

窗口越大,网络吞吐量就越大,传输效率就越高.我们的目标是在保证网络不拥塞的情况下尽量提高传输效率.

但是并不是所有的包都可以延迟应答

数量限制:每隔N个包就应答一次;

时间限制:超过最大延迟时间就应答一次

具体的数量和超时时间,操作系统不同也有差异;一般N取2,超时时间取200ms(根据业务需求可自定义)

2.1.8 捎带应答

在延迟应答的基础上,我们可以发现,很多情况下,客户端服务器在应用层也是一发一收的.意味着客户端给服务器说了"How are you" , 服务器中程序处理过请求后也会给客户端返回一个"Fine,thank you" , 那么这个时候ACK就可以搭顺风车,和服务器回应的"Fine, thank you" 一起返回给客户端 

 上述ACK是内核收到数据报后直接返回的,Fine....是应用程序,通过write写的数据,通过一系列代码执行到才返回,这俩时机本来是不同的.但是延时应答,使此时的ACK 就可能稍等一会再发送就很有可能和response 合并成一个数据报.四次挥手,有可能是三次挥手,就是捎带应答起到的效果.

2.2 粘包问题

在TCP协议头中,没有如同UDP一样的“报文长度”这样的字段,但是有一个序号这样的字段,站在传输层的角度,TCP是一个一个报文过来的。按照序号放在缓冲区中。站在应用层的角度,看到的只是一串连续的字节数据。那么应用程序看到了这么一连串的字节数据,就不知道从哪个部分开始到哪个部分结束,是一个完整的数据包。

如何解决粘包问题?归根结底就是一句话,明确两个包之间的边界。

• 对于定长的包,保证每次都按照固定大小读取即可;例如上面的Request结构,是固定大小的,那么就从缓冲区从头开始按sizeof(Request) 依次读取即可

对于变长的包,可以定义分隔符,来区分包(应用层协议,是程序员自己来定的,只要定义保证分隔符不和正文冲突即可)

对于变长的包,还可以在包头的位置,约定一个包总长读的字段,从而知道了包的结束位置

对于UDP协议来说,是否也存在“粘包问题”?

• 对于UDP,如果还没有上层交付数据,UDP的报文长度仍然在。同时,UDP是一个一个把数据交付给应用层。就有很明确的数据边界。

•  站在应用层的角度,使用DUP的时候,要么收到完整的UDP报文,要么不收,不会出现“半个”的情况。

2.3 TCP异常情况

2.3.1 进程关闭/进程崩溃

进程没了,socket 是文件,随之被关闭,虽然进程没了,但是连接还在,仍然可以继续四次挥手

2.3.2 主机关机(正常流程关机)

先杀死所有的用户进程,然后就和进程关闭一样。

虽然可以出发四次挥手,如果能够在关闭之前完成更好。

如果没有发完,比如,对方发的 fin 过来了,咱们没来得及ack就关机了,此时对端就会重传fin,重传几次之后,发现都没有ack,尝试重置连接,如果还不行,就直接释放连接。

2.3.3 主机掉电(把电源)

瞬间机器就关了,来不及进行任何挥手操作。此时分两种情况:

1)对端是发送端

对端就会收不到ack=>超时重传=>重置连接=>释放连接

2)对端是接收端

对端是没法立即知道,你这边是还没来得及发新的数据,还是直接没了。即使发送端没有写入操作,TCP自己也内置了一个保活机制“心跳包”。虽然是接收端,但是接收端会定期给发送端发送一个心跳包(ping),正常情况下就会返回一个(pong),如果每个 ping 都有及时的 pong,这个时候就说明当前对端的状态良好,如果 ping 过去之后,没用 pong ,说明心跳没了,这边怕是打概率挂了(pong也有概率丢的,因此会连续几次都丢了才会判定连接断开)。

注:发送方也是有心跳包的,但是通过对方返回的ack来判定会更快一些。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/136837.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

设计模式之十一:代理模式

代理可以控制和管理访问。 RMI提供了客户辅助对象和服务辅助对象,为客户辅助对象创建和服务对象相同的方法。RMI的好处在于你不必亲自写任何网络或I/O代码。客户程序调用远程方法就和运行在客户自己本地JVM对对象进行正常方法调用一样。 步骤一:制作远程…

【Redis系列】Redis的核心命令(上)

哈喽,大家好,我是小浪。那么上篇博客教会了大家如何在Linux上安装Redis,那么本篇博客就要正式开始学习Redis啦,跟着俺的随笔往下看~ 1、启动Redis 那么如何启动Redis呢?最常用的是以下这个命令: redis-cl…

Linux提取RPM包文件

在讲解如何从 RPM 包中提取文件之前,先来系统学习一下 cpio 命令。cpio 命令用于从归档包中存入和读取文件,换句话说,cpio 命令可以从归档包中提取文件(或目录),也可以将文件(或目录&#xff09…

Java基础知识第四讲:Java 基础 - 深入理解泛型机制

Java 基础 - 深入理解泛型机制 背景:Java泛型这个特性是从JDK 1.5才开始加入的,为了兼容之前的版本,Java泛型的实现采取了“伪泛型”的策略,即Java在语法上支持泛型,但是在编译阶段会进行所谓的“类型擦除”&#xff0…

基于springboot的在线文档管理系统

基于springboot的在线文档管理系统 摘要 基于Spring Boot的在线文档管理系统是一种通过使用Spring Boot框架构建的现代化应用程序,旨在有效地组织、存储和分享文档内容。该系统通过利用Spring Boot的快速开发和简化配置的优势,提供了一个稳健的基础架构&…

clouldcompare工具使用

文章目录 1.界面1.1 布局1.3 视觉显示方向1.4 放大镜1.5 建立旋转中心2.快速入门2.1 剪裁2.2 多点云拼接 1.界面 1.1 布局 参考:https://blog.csdn.net/lovely_yoshino/article/details/129595201 1.3 视觉显示方向 1.4 放大镜 1.5 建立旋转中心 2.快速入门 2.1 …

c++求三个数的最小公倍数

答案&#xff1a; #include <iostream> using namespace std; int main() {int n1, n2, n3, max;cin >> n1 >> n2 >> n3;max (n1 > n2 > n3) ? n1 : n2;do{if (max % n1 0 && max % n2 0 && max % n3 0){cout << ma…

Python开发者的利器:掌握多种执行JS的方法

更多资料获取 &#x1f4da; 个人网站&#xff1a;ipengtao.com JavaScript&#xff08;JS&#xff09;是一种常用的脚本语言&#xff0c;通常用于网页开发&#xff0c;但有时也需要在Python中执行或调用JavaScript代码。这种需求可能是因为希望与网页进行交互&#xff0c;或者…

ASP.NETWeb开发(C#版)-day1-C#基础+实操

目录 .NET实操&#xff1a;创建项目执行 C#基础语法数据类型变量实操001_变量如何在一个解决方案 中创建另一个项目实操002结构实操003-if else实操004-多分支多行注释按钮实操&#xff1a;循环 面向对象基础如何在同一个项目下创建新的.cs文件实操-类的定义与访问实操-练习实操…

Git版本控制系统之分支与标签(版本)

目录 一、Git分支&#xff08;Branch&#xff09; 1.1 分支作用 1.2 四种分支管理策略 1.3 使用案例 1.3.1 指令 1.3.2 结合应用场景使用 二、Git标签&#xff08;Tag&#xff09; 2.1 标签作用 2.2 标签规范 2.3 使用案例 2.3.1 指令 2.3.2 使用示例 一、Git分支&…

JavaScript从入门到精通系列第三十四篇:基于JavaScript实现邮件正则

文章目录 一&#xff1a;电子邮件正则 1&#xff1a;电子邮件规则 2&#xff1a;编写代码校验 大神链接&#xff1a;作者有幸结识技术大神孙哥为好友&#xff0c;获益匪浅。现在把孙哥视频分享给大家。 孙哥链接&#xff1a;孙哥个人主页 作者简介&#xff1a;一个颜值99分&…

从0到1实现一个前端监控系统(附源码)

目录 一、从0开始 二、上报数据方法 三、上报时机 四、性能数据收集上报 收集上报FP 收集上报FCP 收集上报LCP 收集上报DOMContentLoaded 收集上报onload数据 收集上报资源加载时间 收集上报接口请求时间 五、错误数据收集上报 收集上报资源加载错误 收集上报js错…

如何确定线程栈的基址?

起 很早之前&#xff0c;我遇到过几个与栈相关的问题&#xff0c;当时总结过几篇关于线程栈的文章&#xff0c;分别是 《栈大小可以怎么改&#xff1f;》、《栈局部变量优化探究&#xff0c;意外发现了 vs 的一个 bug &#xff1f;》、《栈又溢出了》、《有趣的异常》。在这几…

链表OJ题(4)

目录 10.链表的回文结构 11.随机链表的复制 &#x1f642;找中间节点一定要考虑偶数个和奇数个的问题。 &#x1f642;指针指向的前中后。 &#x1f642;链表节点的位置个数/链表的节点中的数字。&#x1f197;&#x1f197; 今天最后两道链表OJ题目。 10.链表的回文结构…

<MySQL> MySQL表数据的 CRUD 基础操作 —— 增(Create)、查(Retrieve)、改(Update)、删(Delete)

目录 一、CRUD 二、增加&#xff08;Create&#xff09; 2.1 新增插入数据 insert 2.2 操作演示 2.3 多行插入更高效 2.4 插入时间类型的数据 2.5 使用“库函数” 三、查询&#xff08;Retrieve&#xff09; 四、修改&#xff08;Update&#xff09; 4.1 修改数据 …

Linux如何修改主机名(hostname)(亲测可用)

文章目录 背景Linux如何修改主机名&#xff08;hostname&#xff09;方法方法1. 使用 hostnamectl 命令示例 2. 编辑 /etc/hostname 文件注意事项 背景 我创建虚拟机的时候没设置主机名&#xff0c;现在显示localhost&#xff0c;有点尴尬&#x1f605;&#xff1a; 需要重新设…

55基于matlab的1.高斯噪声2.瑞利噪声3.伽马噪声4.均匀分布噪声5.脉冲(椒盐)噪声

基于matlab的1.高斯噪声2.瑞利噪声3.伽马噪声4.均匀分布噪声5.脉冲&#xff08;椒盐&#xff09;噪声五组噪声模型&#xff0c;程序已调通&#xff0c;可直接运行。 55高斯噪声、瑞利噪声 (xiaohongshu.com)

Java Web——前端HTML入门

目录 HTML&CSS3&JavaScript简述 1. HTML概念 2. 超文本 3. 标记语言 4. HTML基础结构 5. HTML基础词汇 6. HTML语法规则 7. VS Code 推荐使用的插件 8. 在线帮助文档 HTML&CSS3&JavaScript简述 HTML 主要用于网页主体结构的搭建&#xff0c;像一个毛坯…

基于springboot实现桥牌计分管理系统项目【项目源码】计算机毕业设计

基于springboot实现桥牌计分管理系统演示 JAVA简介 JavaScript是一种网络脚本语言&#xff0c;广泛运用于web应用开发&#xff0c;可以用来添加网页的格式动态效果&#xff0c;该语言不用进行预编译就直接运行&#xff0c;可以直接嵌入HTML语言中&#xff0c;写成js语言&#…

【408】计算机学科专业基础 - 数据结构

数据结构知识 绪论 数据结构在学什么 如何用程序代码把现实世界的问题信息化 如何用计算机高效地处理这些信息从而创造价值 数据结构的基本概念 什么是数据&#xff1a; 数据是信息的载体&#xff0c;是描述客观事物属性的数、字符及所有能输入到计算机中并被计算机程序…