网络原理-------TCP协议

文章目录

  • TCP协议
    • TCP协议段格式
    • TCP原理
      • 确认应答机制 (安全机制)
      • 超时重传机制 (安全机制)
      • 连接管理机制 (安全机制)
      • 滑动窗口 (效率机制)
      • 流量控制 (安全机制)
      • 拥塞控制 (安全机制)
      • 延迟应答 (效率机制)
      • 捎带应答 (效率机制)
    • 基于TCP的应用层协议

TCP协议

TCP, 即 Transmission Control Protocol, 传输控制协议. 是要对数据进行一个详细的控制.

TCP协议段格式

在这里插入图片描述

  • 源/目的端口号: 表示数据是从那个进程来, 到哪个进程去.
  • 32位序号: 它指示了TCP报文中第一个数据字节的序列号.
  • 32为确认号: 表示接收方期望从发送方接收到的下一个字节的序号.
  • 4位TCP报头长度: 表示TCP头部有多少个32bit (有多少个4字节); 所以TCP头部的最大长度为 15 * 4 = 60.
  • 6位标志位:
    • URG: 紧急指针是否有效
    • ACK: 确认号是否有效
    • PSH: 提示接收端应用程序立刻从缓冲区把数据读走
    • RST: 对方要求重新建立连接, 我们把携带RST标识的称为复位报文段
    • SYN: 请求建立连接, 我们把携带SYN标识的称为同步报文段
    • FIN: 通知对方, 本端要关闭了, 我们把携带FIN标识的称为结束报文段
  • 16位窗口大小: 用于数据流的流量控制, 可以表示接收方可以接受的未确认数据的字节数量; 避免网络拥塞.
  • 16位校验和: 发送端填充, CRC校验. 接收端校验不通过, 则认为数据有问题. 此处的校验和不光包含TCP首部, 也包含TCP数据部分.
  • 16位紧急指针: 标识哪部分数据是紧急数据.

TCP原理

TCP对数据提供的管控机制, 主要体现在两个方面: 安全和效率.

这些机制和多线程的设计原则类似: 保证数据安全的前提下, 尽可能的提升传输效率.

确认应答机制 (安全机制)

在这里插入图片描述

TCP将每个字节的数据都进行了编号, 即序列号.

在这里插入图片描述

每一个ACK都带有对应的确认序列号,意思是告诉发送者,我已经收到了哪些数据;下一次你从哪里开
始发.

超时重传机制 (安全机制)

在这里插入图片描述

主机A给主机B发送数据后, 可能因为网络拥堵等原因, 数据无法到达主机B

如果主机A在一个特定时间间隔内没有收到主机B发来的确认应答, 就会进行重传

但是主机A未收到主机B的确认应答也可能是因为ACK丢失了.

在这里插入图片描述

因此TCP会收到很多重复的数据, 那么TCP协议需要识别出哪些包是重复的包, 并把重复的包丢弃掉.

这时用我们前面的确认号, 就可以很轻易的做到.

那么, 超时的时间该如何规定呢?

最理想的情况下, 找到一个最小的时间, 保证 “确认应答” 一定能在这个时间内返回.

但是这个时间的长短, 根据网络环境的不同, 是有差异的.

如果设定的时间太长, 会影响整体的重传效率.

如果设定的时间太短, 有可能会频繁发送重复的包.

TCP为了保证在任何环境下, 都能保持叫高性能的通信, 因此会动态计算这个最大超时时间.

Linux中(BSD Unix和Windows也是如此),超时以500ms为一个单位进行控制, 每次超时重发的时间都是500ms的整数倍.

如果重发一次后, 仍然得不到应答, 等待2*500ms后在进行重传

如果仍得不到应答, 就等待4*500ms进行重传, 指数型递增.

累积到一定重传次数, TCP就会认为网络或对端主机出现异常, 强制关闭连接.

连接管理机制 (安全机制)

在正常情况下, TCP要经过三次握手建立连接, 四次挥手断开连接.

在这里插入图片描述

客户端与服务器状态转化:

  • 服务器[CLOSED -> LISTEN] 服务器调用listen后进入LISTEN状态, 等待客户端连接
  • 客户端[CLOSED -> SYN_SENT] 客户端调用connect, 发送同步报文段
  • 服务器[LISTEN -> SYN_RCVD] 一旦监听到连接请求 (同步报文段), 就将该连接放入内核等待队列中, 并向客户端发送SYN确认报文
  • 客户端[SYN_SENT -> ESTABLISHED] connect调用成功, 则进入ESTABUSHED状态, 开始读写数据
  • 服务器[SYN_RCVD -> ESTABLISHED] 服务器一旦接收到客户端的确认报文, 就进入ESTABLISHED状态, 可以进行读写数据了
  • 客户端[ESTABLISHED -> FIN_WAIT_1] 客户主动调用close时, 向服务器发送结束报文段, 同时进入FIN_WAIT_1
  • 服务器[ESTABLISHED -> CLOSE_WAIT] 当客户端主动关闭连接 (调用close), 服务器会收到结束报文段, 服务器返回确认报文段并进入CLOSET_WAIT
  • 客户端[FIN_WAIT_1 -> FIN_WAIT_2] 客户端收到服务器对结束报文段的确认, 则进入FIN_WAIT_2, 开始等待服务器的结束报文段
  • 服务器[CLOSE_WAIT -> LAST_ACK] 进入CLOSE_WAIT后说明服务器准备关闭连接 (需要处理完之前的数据), 当服务器真正调用close关闭连接时, 会向客户端发送FIN, 此时服务器进入LAST_ACK状态, 等待最后一个ACK到来
  • 客户端[FIN_WAIT_2 -> TIME_WAIT] 客户端收到服务器发来的FIN (结束报文段), 进入TIME_WAIT, 并发出LAST_ACK
  • 服务器[LAST_ACK -> CLOSED] 收到ACK彻底关闭连接
  • 客户端[TIME_WAIT -> COSED] 客户端要等待一个2MSL (Max Se’gment Life, 报文最大生成时间) 的时间, 才会进入CLOSE状态

为什么TIME_WAIT的时间是2MSL?

MSL是TCP报文最大生存时间, 因此TIME_WAIT持续存在2MSL的话, 就能保证在两个传输方向上的未被接受或迟到的报文段都已消失 (否则服务器立即重启, 可能会收到来自上一个进程的迟到的数据, 但是这种数据可能是错误的, 延时, 重传, 或者乱序); 同时也是在理论上保证最后一一个报文可靠到达 (假设最后一个ACK丢失, 那么服务器会重新再发一个FIN, 这时虽然客户端不在了, 但是TCP连接还在, 依然可以重发LAST_ACK)

滑动窗口 (效率机制)

确认应答策略是, 对每个发送的数据段, 都要给一个ACK确认应答, 收到ACK后再发送下一个数据段. 这样的话就有一个很大的缺点, 就是性能较差, 尤其是数据往返时间较长的时候.

在这里插入图片描述

既然这样一发一收的方式性能低, 那么我们一次发送多条数据, 就可以大大的提高性能 (其实是将多个段的等待时间重叠在一起).

在这里插入图片描述

  • 窗口大小指的是无需等待确认应答而可以继续发送数据的最大值, 上图的窗口大小就是4000个字节 (四个段).
  • 发送前四个字段的时候, 不需要等待任何ACK, 直接发送.
  • 收到第一个ACK, 滑动窗口向后移动, 继续发送第五个的数据, 以此类推.
  • 操作系统内核为了维护这个滑动窗口, 需要开辟 发送缓冲区 来记录当前还有哪些数据没有应答, 只有确认应答过的数据, 才能从缓冲区删掉
  • 窗口越大, 网络的吞吐率就越高

在这里插入图片描述

那么如果出现了丢包, 如何进行重传? 这里分两种情况讨论:

情况一: 数据包已经到达, ACK被丢了.

在这里插入图片描述

这种情况下, 部分ACK丢了并不要紧, 因为可以通过后续的ACK进行确认;

**情况二:**数据包直接丢了

  • 当某一段报文丢失后, 发送端会一直收到 “1001” 这样的ACK, 就是在提醒发送端;

  • 如果发送端主机连续三次收到了同一个 “1001” 这样的回答, 就会将对应的 1001-2000 的数据重新发送;

  • 这时候接收端接收到1001-2000的数据后, 返回的就是 “7001” 了, 因为 2001-7000 的数据接收端在之前就收到了, 被放到了接收端操作系统内核的接受缓冲区

这种机制被称为 “高速重发控制” (也叫 “快重传”)

流量控制 (安全机制)

接收端处理数据的速度是有限的, 如果发送方发送数据太快, 导致接收端的缓冲区被打满, 这个时候如果发送端继续发送数据, 就会造成丢包, 继而引起丢包重传等一系列连锁反应.

因此TCP支持根据接收端的处理能力, 来决定发送端的发送速度. 这个机制就叫流量控制 (Flow Control);

接收端将自己可以接受的缓冲区大小放入TCP首部中的 “窗口大小” 字段, 通过ACK通知发送端;

窗口大小字段越大, 说明网络的吞吐率越高;

接收端一旦发现自己的缓冲区要满了, 就会将窗口大小设置为更小的值通知发送端;

发送端接收到这个小窗口大小后就会减慢自己的发送速度;

如果接收端发送缓冲区满了, 就会将窗口大小设置为0; 这时发送端就不再发送数据, 但是需要定期发送一个窗口探测数据段, 是接收端把窗口大小告诉发送端.

在这里插入图片描述

接收端如何把窗口大小告诉发送端呢? 回忆一下我们的TCP首部中, 有一个16位窗口字段, 就是存放了窗口大小信息;

那么问题来了, 16位数字最大表示65535, 那么TCP窗口最大就是65535吗?

并非如此, TCP首部40字节选项中还包含了一个窗口扩大因子M, 实际窗口大小是窗口字段的值左移M位;

拥塞控制 (安全机制)

TCP引入慢启动机制, 先发少量的数据, 探探路, 摸清当前的网络拥堵状态, 再决定按照多大的速度传输数据;

在这里插入图片描述

此处引入一个概念为拥塞窗口;

发送开始的时候, 定义拥塞窗口大小为1;

每次收到一个ACK应答, 拥塞窗口加一;

每次发送数据包的时候, 将拥塞窗口和接收端主机反馈的窗口大小作比较, 取较小的值作为实际发送的窗口;

像上面这样的拥塞窗口增长速度, 是指数级别的. "慢启动"只是指初始时慢, 但是增长速度非常快.

为了不增长的那么快, 因此不能使拥塞窗口单纯的加倍;

为此引入一个慢启动的阈值;

当拥塞窗口超过这个阈值的时候, 不再按照指数方式增长, 而是按照线性方式增长

在这里插入图片描述

当TCP开始启动的时候, 慢启动阈值等于窗口最大值;

在每次超时重发的时候, 慢启动阈值会变成原来的一半, 同时拥塞窗口置回一;

少量的丢包, 我们仅仅是触发超时重传; 大量的丢包我们就认为网络拥塞;

当TCP通信开始后, 网络吞吐量会逐渐上升; 随着网络发生拥堵, 吞吐量就会立刻下降;

总结一下:

拥塞控制, 就是TCP协议想尽可能把数据传输给对方, 但是又要避免给网络造成太大压力的折中方案.

延迟应答 (效率机制)

如果接受数据的主机立即返回ACK应答, 这时返回的窗口可能比较小:

假设接受端缓冲区为1M, 一次收到了500k的数据; 如果立刻应答, 返回的窗口就是500k;

但实际上可能处理端的处理速度很快, 10ms之内就把500k的数据从缓冲区消掉了;

在这种情况下, 接受处理端还远没达到自己的极限, 即使窗口再放大一些, 也能处理过来;

如果接收端稍微等一会儿再应答, 比如等待200ms, 那么这个时候返回的窗口大小就是1M;

窗口越大, 网络吞吐率就越大, 传输效率就越高. 我们的目标是在保证网络不拥塞的情况下尽量提高传输效率;

我们的方案是:

数量限制: 每个N个包就应答一次;

时间限制: 超过最大延时时间就应答一次;

具体数量和超过时间, 依操作系统不同也有差异; 一般N取2, 最大延时时间取200ms;

在这里插入图片描述

捎带应答 (效率机制)

在延迟应答的基础上, 我们发现很多情况下, 客户端和服务器在应用层也是 “一发一收” 的. 那么当服务器给客户端回消息的时候, ACK就可以 “搭顺风车” 和服务器回应的一起返回给客户端.

在这里插入图片描述

基于TCP的应用层协议

  • HTTP
  • HTTPS
  • SSH
  • Telent
  • FTP
  • SMTP

当然, 也包括自己写TCP程序时自定义的应用层协议;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/657108.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

The Sandbox DAO:投票决定元宇宙的未来!

赋予用户治理权,打造由社群运营的开放式数码国度 随着The Sandbox DAO的启动,我们邀请全球社群——这个新数字国度的公民们——提出建议并参与治理,共同塑造开放元宇宙的未来。 介绍 在The Sandbox,我们正在建立一个开放的元宇宙…

数据恢复与取证软件: WinHex 与 X-Ways Forensics 不同许可证功能区别

天津鸿萌科贸发展有限公司从事数据安全业务20余年,在数据恢复、数据取证、数据备份等领域有丰富的案例经验、专业技术及良好的行业口碑。同时,公司面向取证机构及数据恢复公司,提供数据恢复实验室建设方案,包含数据恢复硬件设备及…

【C++初阶】--- C++入门(中)

目录 一、缺省参数1.1 缺省参数概念1.2 缺省参数分类 二、函数重载2.1 函数重载概念2.2 C支持函数重载的原理 --- 名字修饰 三、引用3.1 引用概念3.2 引用特性3.3 常引用3.4 使用场景3.5 引用和指针的区别 一、缺省参数 1.1 缺省参数概念 缺省参数是声明或定义函数时为函数的…

003 仿muduo实现高性能服务器组件_前置知识

​🌈个人主页:Fan_558 🔥 系列专栏:仿muduo 🌹关注我💪🏻带你学更多知识 文章目录 前言时间轮timewheel设计正则表达式介绍(了解知道怎么使用)通用型any容器的实现 小结 …

5-26作业

网络聊天室 服务器&#xff1a; 1 #include <myhead.h>2 int main(int argc, const char *argv[])3 {4 if(argc!3)5 {6 printf("请输入IP和端口号\n");7 return -1;8 }9 int sfd socket(AF_INET, SOCK_DGRAM, 0);10 if(…

6千古诗文必背名句大全ACCESS\EXCEL数据库

古诗&#xff0c;是古代诗歌的一种体裁&#xff0c;又称古体诗或古风&#xff0c;指的是产生于唐代以前并和唐代新出现的近体诗&#xff08;又名今体诗&#xff09;相对的一种诗歌体裁。其特点是格律限制不太严格。 从小我们就被教“熟读唐诗三百首,不会吟诗也会吟”&#xff…

男士内裤什么品牌质量好?男内裤品牌排行榜汇总

大家都知道&#xff0c;为了私处健康&#xff0c;每天都必须换内裤。而且&#xff0c;使用频率较高的内裤最好 3&#xff5e;6 个月换一批&#xff0c;一旦变形、材质变干硬或污渍洗不净&#xff0c;就得及时扔&#xff01;但有一说一&#xff0c;现在男性同胞们想挑选到合适自…

MySQL数据表的“增删查改“

我们学习数据库, 最重要的就是要学会对数据表表进行"增删查改"(CRUD).(C -- create, R -- retrieve, U -- update, D -- delete) 目录 一. "增"(create) 1. 普通新增 2. 指定列新增 3. 一次插入多行 4. 用insert插入时间 5. 小结 二. "查"…

css样式,点击 箭头方向上下转换

实现效果&#xff1a; 点击切换箭头方向 实现代码 <divclass"modelPart"click"showClick"><div class"modelPart_left"><img:srcaidefalutIconclass"sNodeIcon"><div>{{ selectModel }}</div><div …

【Java EE】网络原理——HTTP请求

目录 1.认识URL 2.认识“方法&#xff08;method&#xff09;” 2.1GET方法 2.1.1使用Fiddler观察GET请求 2.1.2 GET请求的特点 2.2 POST方法 2.2.1 使用FIddler观察POST方法 2.2.2 POST请求的特点 3.认识请求“报头”&#xff08;header&#xff09; 3.1 Host 3.2 C…

【edge浏览器】控制台报错信息隐藏-恢复

问题描述 解决方法&#xff1a;只需要清空筛选器

进程和用户管理

查看进程的命令 ps top pstree 发送信号命令 kill 使用是后加-l 用户管理命令 添加用户:sudo adduser 用户名 修改组:sudo usermod -G 用户名1 用户名2 修改家目录:sudo usermod -d /home/用户名 -m 用户名 删除用户名:sudo deluser --remove -home 用户名

Java 使用WebMagic爬取网页(简单示例)

框架简介 WebMagic是一个基于Java的开源网络爬虫框架&#xff0c;它提供了很多简单易用的API接口&#xff0c;可以帮助使用者快速构建出高效、可扩展的网络爬虫程序&#xff0c;WebMagic由四个组件(Downloader、PageProcessor、Scheduler、Pipeline)构成&#xff0c;核心代码非…

GitHub打不开的解决方案

1、打开https://sites.ipaddress.com/github.com/找到DNS Resource Records&#xff0c;复制github的ip地址&#xff0c;先保存起来&#xff1a; 140.82.112.32、打开https://sites.ipaddress.com/fastly.net/找到DNS Resource Records&#xff0c;复制其中一个ip地址&#xf…

OC IOS 文件解压缩预览

热很。。热很。。。。夏天的城市只有热浪没有情怀。。。 来吧&#xff0c;come on。。。 引用第三方库&#xff1a; pod SSZipArchive 开发实现&#xff1a; 一、控制器实现 头文件控制器定义&#xff1a; // // ZipRarViewController.h // // Created by carbonzhao on 2…

ARTS Week 31

Algorithm 本周的算法题为 1556. 千位分隔数 给你一个整数 n&#xff0c;请你每隔三位添加点&#xff08;即 "." 符号&#xff09;作为千位分隔符&#xff0c;并将结果以字符串格式返回。 示例 1&#xff1a;输入&#xff1a;n 123456789输出&#xff1a;"123.…

(四)MySQL 事务

欢迎访问 事务有哪些特性&#xff1f; 事务是由 MySQL 的引擎来实现的&#xff0c;我们常见的 InnoDB 引擎它是支持事务的。 不过并不是所有的引擎都能支持事务&#xff0c;比如 MySQL 原生的 MyISAM 引擎就不支持事务&#xff0c;也正是这样&#xff0c;所以大多数 MySQL 的…

凤香的“蜜”密

执笔 | 文 清 编辑 | 古利特 “遇水则漏&#xff0c;遇酒生香”。酒海&#xff0c;一种大型盛酒容器&#xff0c;因盛酒量以“吨”计算&#xff0c;故称“海”&#xff0c;传于唐宋&#xff0c;兴盛于明清&#xff0c;距今有1400多年的历史。文人墨客笔下&#xff0c;也多有…

部署Prometheus + Grafana实现监控数据指标

1.1 Prometheus安装部署 Prometheus监控服务 主机名IP地址系统配置作用Prometheus192.168.110.27/24CentOS 7.94颗CPU 8G内存 100G硬盘Prometheus服务器grafana192.168.110.28/24CentOS 7.94颗CPU 8G内存 100G硬盘grafana服务器 监控机器 主机名IP地址系统配置k8s-master-0…

融合基因组序列识别scATAC-seq的细胞类型

利用scATAC-seq技术进行单细胞分析&#xff0c;可以在单细胞分辨率下深入了解基因调控和表观遗传异质性&#xff0c;但由于数据的高维性和极端稀疏性&#xff0c;scATAC-seq的细胞注释仍然具有挑战性。现有的细胞注释方法大多集中在细胞峰矩阵上&#xff0c;没有充分利用潜在的…