Linux学习之Tcp与Udp

目录

UDP

Udp协议的格式

UDP的传输特性

UDP的缓冲区

  基于UDP的应用层协议

 TCP协议

TCP的报文格式

1.ACK确认应答机制

2.超时重传

3.TCP的链接管理机制

为什么要三次握手呢?

理解TIME_WAIT状态

 流量控制(可靠性+效率)

滑动窗口

拥塞控制

TCP的特点


UDP

我们系看看udp协议:

Udp协议的格式

 UDP报文一共16字节,由UDP首部和UDP数据组成,在进行校验时,如果校验出错,就会选择丢弃。

首部格式:8字节
源端口:2字节
目的端口:2字节
长度:2字节,含UDP首部和载荷
校验:2字节

UDP的传输特性

 UDP的传输过程类似于寄信。

UDP在传输信息时,如果检验出错,就会丢弃报文,并不会通知对方,因此传输特性为:

无连接性:传输数据时,是不会向对方请求建立连接的,直到ip地址和端口号就进行传输。

不可靠:因为无连接,那么数据在传输过程中,是无法保证能准确到达目的地,没有确认机制,也没有重传机制,如果校验有错,报文直接就没了,也不知到原因,也收不到。

面向数据报:不能够灵活的控制读写数据的次数和数量。每次发送数据都可以认为是再发邮件,且要一次就把邮件的内容全读取到。

 在我们之前学习Tcp套接字的时候,我们知道Tcp在数据传输过程中,是要去定制协议的,每一次都需要对发送或者读取的数据进行定长,定格式,一次就发一串报文接受也一样,需要对数据序列化与反序列化。而对于UDP这都是不需要做的,发多少,就收多少。

UDP的缓冲区

在编写UDP套接字的时候,我们基本就了解到在发送消息和接收消息的时候,我们貌似只用了一个缓冲区,既可以读,也可以写,我们称为全双工。

实际上UDP并没有真正意义上的发送缓冲区,在调用sendto时会直接交给给内核,由内核将数据传给网络协议进行后续的传输。

但UDP具有接收缓冲区,但是并不保证接受报和发送报的数据顺序是否一致,且缓冲区满了数据就会被丢弃。

注意事项:

 UDP 协议首部中有一个 16 位的最大长度 . 也就是说一个 UDP 能传输的数据最大长度是 64K( 包含 UDP 首 部). 然而64K 在当今的互联网环境下 , 是一个非常小的数字 . 如果我们需要传输的数据超过64K, 就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装 ;

  基于UDP的应用层协议

NFS: 网络文件系统
TFTP: 简单文件传输协议
DHCP: 动态主机配置协议
BOOTP: 启动协议 ( 用于无盘设备启动 )
DNS: 域名解析协议

 TCP协议

相对于UDP协议,TCP协议就更加的重要了,TCP---传输控制协议面积对数据传输会做详细的控制,对于数据什么时候发,发多少,发错了怎么办全由TCP自主决定。

宏观上就是将数据拷贝到的缓冲区,之后交给协议传输,发送方再从缓冲区处拷贝数据,即本质就是数据拷贝。

TCP的报文格式

不同层时,对数据的的描述方式也不一样,对于传输层骂我们一般叫做数据段。

TCP传输面向字节流
报文首部:固定20字节,最长60字节
源端口:2字节
目的端口:2字节
SN:序号,4字节,报文段所发送的第一个字节的序号
ACK:确认号,4字节,期望收到对方下一个报文段的第一个字节的序号
Data Offset:数据偏移,4位,即首部长度,无选项时为0x5
控制位:12位,后五位依次为:ACK,PSH,RST,SYN,FIN
第一次握手:0x02(SYN)
第二次握手:0x12(SYN+ACK)
第三次握手:0x10(ACK)
第一次挥手:0x19(ACK+PSH+FIN)
第二次挥手:0x10(ACK)
第三次挥手:0x19(ACK+PSH+FIN)
第四次挥手:0x10(ACK)
窗口:2字节,发送方的接收窗口大小
校验:2字节
紧急指针:2字节
选项:MSS选项(4字节)
前两次握手时一般需要协商MSS,因此数据偏移和控制位分别为0x6002和0x6012-第三次握手和所有四次挥手一般无选项
三次握手
第一次:ACK1=0(无ACK标志)
第二次:ACK2=SN1+1
第三次:SN3=ACK2=SN1+1,ACK3=SN2+1
四次挥手
第二次:SN2=ACK1,ACK2=SN1+1
第三次:SN3=SN2,ACK3=ACK2
第四次:SN4=ACK3=SN1+1,ACK4=SN3+1

TCP的前20字节为它的标准报头,之后的为数据的有效载荷。 

那么如何对数据的报头和有效载荷进行分离呢:固定长度+自描述字段

第一层是16源端口号与16位目的端口号(32位序号)(32位的确认序号)

序列号与确认字段号都是为了保证数据可靠传输:

 此外还有确认序号,表示确认字段号前的数据我已经接收到了。

至于为什么要有两个序号这是因为:极有可能是确认应答的报文,也有可能时数据加确认报文。

第二层首先是单位大小位4字节的首部长度,之后16位的窗口大小

 先以前两层来看,如果发送发一直向接收方发送数据,因为发送方并不知道接收方的承受能力,所以当缓冲区的数据溢满了,此时就有可能来不及接收数据,(发送方还在发),就会出现数据大面积丢失的情况。为了确保数据发送是安全可靠的,因此需要根据接收方的缓冲区,控制发送数据的速率,这种方式就叫做流量控制。

其次每次发送还需要有确认应答机制保证数据传输。除此之外,如果还存在数据发送后丢包,还会有超时重发机制。综上我们再来看看报文的接收与发送。

所以发送方发送后每一要回收应答,从而确定自己的传输速率(根据接收方接收缓冲区的大小),而这里16位字段存储的就是接收方剩余空间的大小。

6 位标志位 :
URG: 紧急指针是否有效
ACK: 确认号是否有效
PSH: 提示接收端应用程序立刻从 TCP 缓冲区把数据读走
RST: 对方要求重新建立连接 ; 我们把携带 RST 标识的称为 复位报文段(存在二次握手最后发数据,及连接建立不一致(网络问题))
SYN: 请求建立连接 ; 我们把携带 SYN 标识的称为 同步报文段
FIN: 通知对方 , 本端要关闭了

 连接建立是否成功就看能不能收到第三次发送的确报文;链接一旦连接建立好,由于有多个客户端,所以我们还需要对链接进行管理。

综上基本上TCP的包头的字段的主要功能就是这些了。

现在我们再来细看关于TCP的一些确保数据安全传输的机制:

1.ACK确认应答机制

ACK应答机制我们在6个标志位字段已经了解过了,如发送方通过三次握手建立连接中,就是通过设置报文中的ACK字段,表明已确认收到报文,以及在数据的发送过程中。

2.超时重传

 实际上数据在传输的过程,我们并不会知道关心数据是不是丢包了,还是在阻塞者,我们只有当接收方收到才知道传输没问题,但我们怎么去确信数据是丢包了还是阻塞?因此通过设定固定的时间间隔,如果超时(可能阻塞----路由选择的路径太差,可能网络断开丢包了),都会重新传输该报文。

3.TCP的链接管理机制

 刚开始,发送方想要和接收方发送数据前,需要先建立连接,通过三次握手:

发送方先向接收方发送建立连接的请求SYN,接收方接受后发送确认建立连接ACK+SYN,之后发送发收到,发送确认收到建立连接的报文ACK。

之后就进行数据传输。

所以在我们编写套接字的时候,接口connect就是去形成一个建立连接请求的报文,而accept只关心三次握手成功时,返回的文件缓冲区connfd。

最后关闭连接的时候,通过四次挥手关闭连接:想要关闭的一方向接收方发送FIN报文,请求断开连接,接收方接收到后发送确认收到ACK,之后在向对方发送取消l连接的报文FIN,之后发送方再次发送ACK确认收到保文,并将自己的状态为立马ime_wait。套接字就是通过closed发送FIN报文。

链接有全连接对列,也有半连接对列--被建立连接的一方(维护的时间不长)。listen接口的第二个参数代表全链接队列的长度+1。

为什么全连接队列不能长呢--当上层很忙的时候,下层还不断有新的连接,那么没时间去处理对列,那么就会白白占用资源。

为什么要三次握手呢?

实际上真的是三次握手吗?发送方先发送SYN建立连接,接收方接受到后向对方发送ACK,之后再次向发送方发送建立链接的请求,只不过在发送时,我们将这两条报文合二为一了,即ACK+SYN

(应答时附带建立SYN报文),之后收到再次发送ACK,确认建立。

看到这里我们发现,其实四次挥手也可以压缩为三次挥手。

至于为什么不压缩,对于连接时,SYN与ACK不存在时间差,你给我发,我就跟你建立连接。但是在挥手时,你给我说再见,我不会直接就跟你说再见,我指挥先收到你的再见,根据情况,在看是否真的就和你说再见。

1.建立三次握手有一点就是 验证全双工通道是否流畅。

2.如果只有一次握手,存在SYN泛洪攻击,一直发建立连接,服务端需要资源来接受,就存在连接资源被打满的情况,如果是两次握手,发送方先发送给服务端,服务端先建立连接后发送报文给客户端,此时客户端才建立连接,这还是会存在客户端出现异常导致服务端在建立连接消耗资源。

只要出现影响,后果全让服务端来承受,因为客户端的基数大。

但当三次握手时,我们能知道给你发送的确认,你是否收到,报文是否丢失。

理解TIME_WAIT状态

现在做一个测试 , 首先启动 server, 然后启动 client, 然后用 Ctrl-C 使 server 终止 , 这时马上再运行 server, 结果是 :
这是因为,虽然server的应用程序终止了,但TCP协议层的连接并没有完全断开,因此不能再次监 听同样的server端口.
我们用netstat命令查看一下:
TCP协议规定,主动关闭连接的一方要处于TIME_ WAIT状态,等待两个MSL(maximum segment lifetime) 的时间后才能回到CLOSED状态.
我们使用Ctrl-C终止了server, 所以server是主动关闭连接的一方, 在TIME_WAIT期间仍然不能再次监听。
同样的server端口;
MSL在RFC1122中规定为两分钟,但是各操作系统的实现不同, 在Centos7上默认配置的值是60s;
可以通过 cat /proc/sys/net/ipv4/tcp_fin_timeout 查看msl的值;
那如何解决这个问题呢?
使用setsockopt()设置socket描述符的 选项SO_REUSEADDR为1, 表示允许创建端口号相同但IP地址不同的多个 socket描述符。

 那么为什么断开的时候,断开的一方需要等待呢?

1.让通信双方的历史数据消散。

2.让我们断开连接,四次挥手有较好的容错性。

 流量控制(可靠性+效率)

接收端处理数据的速度是有限的. 如果发送端发的太快, 导致接收端的缓冲区被打满, 这个时候如果发送端继续发送,就会造成丢包, 继而引起丢包重传等等一系列连锁反应. 
因此TCP支持根据接收端的处理能力, 来决定发送端的发送速度. 这个机制就叫做流量控制(Flow Control);
接收端将自己可以接收的缓冲区大小放入 TCP 首部中的 "窗口大小" 字段, 通过ACK端通知发送端;
窗口大小字段越大, 说明网络的吞吐量越高;
接收端一旦发现自己的缓冲区快满了, 就会将窗口大小设置成一个更小的值通知给发送端;
发送端接受到这个窗口之后, 就会减慢自己的发送速度;
如果接收端缓冲区满了, 就会将窗口置为0; 这时发送方不再发送数据, 但是需要定期发送一个窗口探测数据段, 使接收端把窗口大小告诉发送端

在超时重传的时候,首先会想接收方发送一个窗口检测,判断双方是否能通信,如果你发不了,我收不到,那大概率就是网络的问题了,此时就断开链接了。

滑动窗口

我们已经了解到了确认应答机制是为了保证数据的可靠性,发送一次数据包,收到后就要向我发送ACK,没发一次,对应就要发ACK,如果距离太远,那么数据传输的效率就比较低了。

因此在实际发送数据时,发送方会将发送的数据进行分批次发出去,接收方接受这些请求再一个个发送确认报文,由于某些问题,接收方接受了,但没发送确认,根据超时传输再次发送,此时还没发送确认的数据就还是会保存到缓冲区当中,所以需要对缓冲区进行分区,这里我们简单的分区:

对于发送缓冲区:

发送滑动窗口的大小一般为接收方的窗口的大小。一般使用双指针对区域进行划分,如果区域需要扩大或者缩小,指针就可以向前或者向后滑动--因此被称为滑动窗口。

在该窗口内的报文,可以立即发送,可以不需要收到应答。

但是如果存在滑动窗口中间丢包怎么办?如果不是头一个ACK丢失,即使丢包了,滑动窗口也能确认丢包之后的ACK,因为存在确认序号。即使丢了,也能向后继续更新。

所以每次都是尽快的将数据从内核拿出来, 腾出更大的缓冲区,这样窗口也就大了。

拥塞控制

虽然 TCP 有了滑动窗口这个大杀器 , 能够高效可靠的发送大量的数据 . 但是如果在刚开始阶段就发送大量的数据 , 仍 然可能引发问题:
因为网络上有很多的计算机 , 可能当前的网络状态就已经比较拥堵 . 在不清楚当前网络状态下 , 贸然发送大量的数据 , 是很有可能引起雪上加霜的. TCP引入
慢启动 机制 , 先发少量的数据 , 探探路 , 摸清当前的网络拥堵状态 , 再决定按照多大的速度传输数据 ;

TCP的特点

与UDP相比,TCP具有发送缓冲区,在将数据拷贝至发送缓冲区时,会有tcp下层协议决定,之后接收方从接收缓冲古拷贝数据。总结就是TCP是一个由接受和发送缓冲区的,全双工的,数据发送控制的一个协议。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/583815.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java8中的Stream流相关用法学习

目录 一、Stream是什么 二、创建Stream 三、中间操作 3.1 filter() 3.2 map() 3.3 flatMap() 3.4 distinct() 3.5 limit() 四、终端操作 4.1 findAny(), 和 orElse() 4.2 sorted() 4.3 forEach() 4.4 count() 4.5 collect() 4.6 groupingBy() 4.7 average() 4…

RAG-Driver: 多模态大语言模型中具有检索增强上下文学习的通用驱动解释

RAG-Driver: 多模态大语言模型中具有检索增强上下文学习的通用驱动解释 摘要Introduction RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model. 摘要 由“黑箱”模型驱动的机器人需要提供人类…

Java对接高德api搜索POI 2.0 关键字搜索

目录 一、注册账号 二、搜索小demo 1.首先要引入依赖 2. 然后查看打印结果即可 三、搜索接口代码 1.引入依赖 2.yml配置 2.Controller 3.静态工具类 四、运行测试 一、注册账号 高德开放平台 | 高德地图API 注册高德开发者;去控制台创建应用&#xff…

【Python网络爬虫】python爬虫用正则表达式进行数据清洗与处理

🔗 运行环境:PYTHON 🚩 撰写作者:左手の明天 🥇 精选专栏:《python》 🔥 推荐专栏:《算法研究》 #### 防伪水印——左手の明天 #### 💗 大家好🤗&#x1f91…

机器学习:深入解析SVM的核心概念(问题与解答篇)【三、核函数】

核函数 **问题一:为什么说是有限维就一定存在高维空间可分呢?**原始空间与特征空间为什么映射到高维空间可以实现可分核函数的作用 **问题二:最终怎么得到函数**从对偶问题到决策函数的步骤:结论 **问题三:为什么说特征…

c#数据库: 6.查询成绩合格的学生/7.输出全部学生信息

SQL Server Management Studio Management Studio 中的学生信息表: 查询上图成绩合格的学生信息,并将信息从控制台输出 using System; using System.Collections.Generic; using System.Data; using System.Data.SqlClient; using System.Linq; using System.Text…

【弱监督语义分割】AllSpark:从transformer中的未标记特征重生标记特征,用于半监督语义分割

AllSpark: Reborn Labeled Features from Unlabeled in Transformer for Semi-Supervised Semantic Segmentation 摘要: 目前最先进的方法是用真实标签训练标注数据,用伪标签训练未标注数据。然而,这两个训练流程是分开的,这就使…

《Fundamentals of Power Electronics》——正激变换器

正激变换器电路如图6.24所示: 该变压器隔离型转换器基于Buck电路,需要一个晶体管,因此常被使用在比全桥和半桥功率等级低的应用中。其非脉动输出电流与其他降压衍生变换器相同,使正激变换器非常适合涉及高输出电流的应用。晶体管最…

Slave SQL线程与PXB FTWRL死锁问题分析

1. 问题背景 2.27号凌晨生产环境MySQL备库在执行备份期间出现因FLUSH TABLES WITH READ LOCK未释放导致备库复制延时拉大,慢日志内看持锁接近25分钟未释放。 版本: MySQL 5.7.21PXB 2.4.18 慢查询日志: 备份脚本中的备份命令:…

QT 开发COM(ActiveX)组件基础介绍和方案验证

一、COM简介 1.1 COM是什么? COM,Component Object Model,即组件对象模型,是一种以组件为发布单元的对象模型,这种模型使各软件组件可以用一种统一的方式进行交互。COM 既提供了组件之间进行交互的规范,也…

LSTM-KDE的长短期记忆神经网络结合核密度估计多变量回归区间预测(Matlab)

LSTM-KDE的长短期记忆神经网络结合核密度估计多变量回归区间预测(Matlab) 目录 LSTM-KDE的长短期记忆神经网络结合核密度估计多变量回归区间预测(Matlab)效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.LSTM-KDE的长短期…

微服务入门学习笔记(黑马商城)

课程转跳:SpringCloud微服务Day1-01.微服务课程介绍_哔哩哔哩_bilibili 一、服务拆分 新建一个maven项目将商品服务拆分出去 更改包扫描 新建一个数据库用于商品服务,同样将表拆分出去 更改配置文件的服务名和数据库名 启动多个实例: 复制配…

解决Pycharm全局搜索与输入法简繁切换快捷键冲突问题

Pycharm中全局搜索快捷键Ctrl Shift F 如图所示: 微软输入法简繁切换快捷键设置: 解决办法: 关掉输入法的切换功能即可,或者更改简繁切换快捷键,毕竟简繁切换使用频率极低。

特别的时钟:上次那个时钟布局和计算有问题,重新修改一下,用JS创建180多个li标签,自动生成数字

<!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>特别的时钟</title> </head> <st…

Github Action Bot 开发教程

Github Action Bot 开发教程 在使用 Github 时&#xff0c;你可能在一些著名的开源项目&#xff0c;例如 Kubernetes&#xff0c;Istio 中看到如下的一些评论&#xff1a; /lgtm /retest /area bug /assign xxxx ...等等&#xff0c;诸如此类的一些功能性评论。在这些评论出现…

合泰杯(HT32F52352)RTC的应用(计时)--->掉电不丢失VBAT(代码已经实现附带源码)

摘要 在HT32F52352合泰单片机开发中&#xff0c;rtc在网上还是挺少人应用的&#xff0c;找了很久没什么资料&#xff0c;现在我根据手册和官方的代码进行配置理解。 RTC在嵌入式单片机中是一个很重要的应用资源。 记录事件时间戳&#xff1a;RTC可以记录事件发生的精确时间&…

踏上R语言之旅:解锁数据世界的神秘密码(四)

文章目录 前言一、多元线性回归1.多元线性回归模型的建立2.多元线性回归模型的检验 二、多元线性相关分析1.矩阵相关分析2.复相关分析 三、回归变量的选择方法1.变量选择准则2.变量选择的常用准则3.逐步回归分析 总结 前言 回归分析研究的主要对象是客观事物变量间的统计关系。…

Macs Fan Control Pro for mac激活版:macOS 平台的风扇控制软件

Macs Fan Control Pro是一款用于 macOS 平台的风扇控制软件&#xff0c;它允许用户监控和调整 Mac 电脑的风扇转速。以下是该软件的一些特点和功能&#xff1a; Macs Fan Control Pro for mac激活版下载 风扇监控&#xff1a;Macs Fan Control Pro 提供实时的风扇转速监控&…

vue+elementui(笔记)

vueelementui 表格 <div class"tableStyle"><el-table :data"pointsSettingsTableData" style"width: 70%" :stripe"true" size"mini"header-cell-class-name"headerClassName" :cell-style"{ tex…

Llama3 在线试用与本地部署

美国当地时间4月18日&#xff0c;Meta 开源了 Llama3 大模型&#xff0c;目前开源版本为 8B 和 70B 。Llama 3 模型相比 Llama 2 具有重大飞跃&#xff0c;并在 8B 和 70B 参数尺度上建立了 LLM 模型的新技术。由于预训练和后训练的改进&#xff0c;Llama3 模型是目前在 8B 和 …