【Linux】网络基础2

文章目录

  • 网络基础2
    • 1. 应用层
      • 1.1 协议
      • 1.2 HTTP 协议
        • 1.2.1 URL
        • 1.2.2 urlencode和urldecode
        • 1.2.3 HTTP协议格式
        • 1.2.4 HTTP的方法
        • 1.2.5 HTTP的状态码
        • 1.2.6 HTTP 常见的header
        • 1.2.7 最简单的HTTP服务器
    • 2. 传输层
      • 2.1 端口号
        • 2.1.1 端口号范围划分
        • 2.1.2 认识知名端口号
        • 2.1.3 netstat
        • 2.1.4 pidof
    • 3. UDP 协议
      • 3.1 UDP协议格式
      • 3.2 UDP的特点
      • 3.3 基于UDP的应用层协议
    • 4. TCP协议
      • 4.1 TCP协议段格式
      • 4.2 确认应答ACK机制
      • 4.3 超时重传机制
      • 4.4 连接管理机制
      • 4.5 滑动窗口
      • 4.6 流量控制
      • 4.7 拥塞控制
      • 4.8 延迟应答
      • 4.9 捎带应答
      • 4.10 面向字节流
      • 4.11 粘包问题
      • 4.12 TCP异常情况
      • 4.13 TCP小结

网络基础2

1. 应用层

满足日常需求的应用程序都是在应用层

1.1 协议

协议是一种约定。socket api在读写程序的时候都是按照字符串的方式发送的,如果传输一些结构化数据该怎么办?

只要保证一端发送数据的时候,在另一端能够正确的解析。这就是应用层协议

1.2 HTTP 协议

HTTP协议(超文本传输协议)

1.2.1 URL

平时俗称的“网址”就是URL
w4kley9xud-1691718642986.png

1.2.2 urlencode和urldecode

像这样的字符串已经被URL当做特殊意义理解了,因此不能随意出现在URL当中
某个参数需要带特殊字符,就必须先对这些特殊字符进行转义
转义规则如下:
将需要转义的字符转为16进制,然后从右到左,取4位(不足4位直接处理)。每两位做一位,前面加上%

1.2.3 HTTP协议格式

HTTP请求:
px8020wnap-1691719356122.png

  • 首行:请求方法 URL 版本
  • Header:请求的属性,冒号分割的键值对,每组属性之间使用\n分割,遇到空行表示header部分结束
  • Body:空行后面的内容都是body,允许为空字符串如果body存在,则在头部中有一个Content -Length来标识Body的长度
    HTTP响应:
    nj8yujtmkb-1691719589985.png
  • 首行:版本号 状态码 状态码解释
  • Header:请求的属性,冒号分割的键值对,每组属性之间使用\n分割,遇到空行表示header部分结束
  • Body:空行后面的内容都是body,如果body返回一个html页面,那么页面内容就是在body当中

1.2.4 HTTP的方法

ebpiu207yn-1691719762109.png
其中最常用的就是GET和POST方法

1.2.5 HTTP的状态码

ysoq24t5y6-1691719928993.png

403状态码表示服务器理解请求,但拒绝执行请求。这通常是因为请求的资源对用户是禁止访问的,例如需要身份验证的页面或没有访问权限的页面。403状态码与401状态码的区别在于,401状态码表示未经身份验证的用户,而403状态码表示已经身份验证的用户,但没有访问权限。
302状态码表示重定向。当服务器收到客户端的请求后,会返回302状态码和一个Location头部,指示客户端重定向到另一个URL。这通常用于临时性的重定向,例如当一个网页被移到了新的URL上时,服务器可以返回302状态码和新的URL,以便客户端自动跳转到新的URL。
303状态码表示重定向,与302状态码类似。它通常用于POST请求后的重定向,以防止客户端重复提交表单数据。当服务器收到POST请求后,如果希望客户端重定向到另一个URL来获取结果,服务器会返回303状态码和一个Location头部,指示客户端进行GET请求以获取结果。这样可以防止客户端在刷新页面时重新提交表单数据。

1.2.6 HTTP 常见的header

  • Content-Type, 数据类型
  • Content-Length, Body的长度
  • Host,客户端告知服务器所请求的资源是在那个主机的那个端口上
  • User-Agent:声明用户的操作系统和浏览器的版本信息
  • referer: 当前页面是从那个页面跳转过来的
  • location:搭配3XX 状态码,告诉客户端接下来去哪里访问
  • Cookie, 用于在客户端存储少量信息,通常实现会话的功能

1.2.7 最简单的HTTP服务器

实现一个最简单的服务器,返回客户端一个hello world

#include <iostream>
#include <cstring>
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
#include <sys/un.h>
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <netinet/in.h>
#include <arpa/inet.h>

int main(int argc, char *argv[])
{
    if (argc != 3)
    {
        std::cout << "输入参数过少" << std::endl;
        return 0;
    }
    int sock = socket(AF_INET, SOCK_STREAM, 0);
    struct sockaddr_in local;
    memset(&local, 0, sizeof(local));
    local.sin_family = AF_INET;
    local.sin_addr.s_addr = inet_addr(argv[1]);
    local.sin_port = htons(atoi(argv[2]));
    bind(sock, (struct sockaddr*)&local, sizeof(local));
    listen(sock, 32);
    while (true)
    {
        struct sockaddr_in client;
        memset(&client, 0, sizeof(client));
        socklen_t len = sizeof(client);
        int n = accept(sock, (struct sockaddr*)&client, &len);
        if (n < 0) continue;
        char buf[1024];
        const char* hello = "<h1>hello world</h1>";
        sprintf(buf, "HTTP/1.0 200 Ok\nContent-Length:%lu\n\n%s", strlen(hello), hello);
        write(n, buf, sizeof(buf));
    }
    return 0;
}

2. 传输层

负责把数据从发送端传输到接收端

2.1 端口号

端口号标识了主机进行通信的不同的应用程序
lj8va87f1a-1691728050114.png
u05paqg9k2-1691729004985.png

2.1.1 端口号范围划分

  • 0-1023 知名端口号,HTTP、FTP、SSH广为使用的应用层协议,端口号都是固定的
  • 1024-65535:操作系统动态分派的端口号,客户端程序的端口号

2.1.2 认识知名端口号

  • ssh服务,使用22端口号
  • ftp服务,使用21端口号
  • telnet服务,使用23端口号
  • http服务:使用80端口号
  • https服务:使用443端口号

cat /etc/services

一个进程可以绑定多个端口号,但是一个端口号不能绑定多个进程

2.1.3 netstat

netstat是用来查看网络状态的重要工具

  • n 显示别名,能显示数字的全部转化为数字
  • l 仅列出在listen状态的
  • p 显示建立相关链接的程序名
  • t 仅显示TCP相关的
  • u 显示udp相关的
  • a 显示所有选项默认不显示Listen

2.1.4 pidof

查看服务器的进程id

3. UDP 协议

3.1 UDP协议格式

yab1ae8gh2-1691730775984.png

  • 16位UDP长度,表示整个数据报(UDP首部+UDP数据)的最大长度
  • 如果校验和出错,就会直接丢弃

3.2 UDP的特点

udp传输的过程类似于寄信:

  • 无连接:知道对方的IP和端口进行传输,不需要建立连接
  • 不可靠:没有确认机制,没有重传机制;如果因为网络无法发送给对方,UDP也不会给应用层任何错误信息
  • 面向数据报:不够灵活的控制读写数据的次数和数量

面向数据报
应用层交给UDP多长的报文,UDP原样发送,既不会拆分也不会合并
用udp传输100个字节的数据:

如果发送端一次调用sendto,发送100个字节,那么接收端必须调用一次对应的recvfrom,接收100个字节,不能循环的调用10次recvfrom ,每次接收10个字节

UDP的缓冲区
Udp没有真正意义上的发送缓冲区,调用函数之后直接交给内核,由内核将数据传给网络层协议进行后续的传输动作。UDP如果接收缓冲区满了之后,再达到的UDP数据就会被丢弃

UDP的socket既能读也能写,这个概念就叫做全双工

3.3 基于UDP的应用层协议

  • NFS:网络文件系统
  • TFTP:简单文件传输协议
  • DHCP:动态主机配置协议
  • DNS:域名解析协议

4. TCP协议

TCP全称为“传输控制协议”,要对数据的传输进行一个详细的控制

4.1 TCP协议段格式

6gxb36fzji-1691734533996.png

  • 4位TCP报头长度:表示TCP报头有多少个32位bit (有多少个4字节),所以TCP头部最大长度是60字节 15 * 4

  • 6 为标志位:

    • URG:紧急指针是否有效
    • ACK:确认号是否有效
    • PSH:提示接收端应用程序立刻从TCP接收缓冲区读走数据
    • RST:对方要求重新建立连接,把携带RST标识称为复位报文段
    • SYN:建立请求连接,携带SYN标识的称为同步报文
    • FIN:通知对方,本端要关闭了,携带FIN标识的称为结束报文段
  • 16位校验和:发送端填充,CRC校验,接收端校验不通过,则认为数据有问题,这个不光包含TCP首部也包含TCP数据部分

  • 16位紧急指针:标识那部分数据是紧急数据

4.2 确认应答ACK机制

o6yacm7k22-1691735577987.png
TCP将每个字节的数据都进了编号,称为序列号:
nb5oi5b6p3-1691735648989.png
每一个ACK都带有对应的确认序号列,意思是告诉发送者,收到了哪些数据,下一次从哪里开始发送

4.3 超时重传机制

78evruvp7f-1691736492112.png
如果主机A在一个特定时间间隔内没有收到B发来的确认应答,就会重新发送
但是,主机A未收到主机B的确认应答,可能是因为ACK丢失了
msabh15u5h-1691736613986.png
因为主机B会收到很多重复数据,那么TCP协议需要识别哪些包是重复的包,并且把重复的包丢弃掉。这时候可以利用前面提到的序列号,就可以很容易做到去重的效果

超时时间如果确定?

找到一个最小的时间,保证“确认应答一定能在这个时间内返回”,但是这个事件段的长短,随着网络环境的不同也是有差异的。如果设置的时间太长,会影响整体的重传效率,如果设置的时间太短,有可能频繁发送重复的包

TCP为了保证无论在任何环境下都比较高性能的通信,因此会动态的计算这个时间

  • 超时以500ms为一个单位进行控制,每次判定超时重发的超时时间都是500ms的整数倍
  • 如果等待一次后,仍然得不到应答,等待2 * 500 ms在重传
  • 如果仍然得不到应答,以指数形式递增
  • 累计到一定的重传次数,TCP认为网络或者对端主机出现异常,就会关闭连接

4.4 连接管理机制

在正常情况下,TCP要经过三次握手建立连接和四次挥手断开连接
aljwoq2uwc-1691737208110.png

4.5 滑动窗口

对每个发送的数据段,都要给一个ACK应答。收到ACK后再发送下一个数据段,这样做的一个比较大的缺点是,性能比较差尤其是数据段返回需要的时间比较长
8b6zxxfu4j-1691737792114.png
既然这样一发一收的性能比较低,我们可以一次性发送多条数据,就可以大大提高性能(其实是将多个段的等待时间重叠在一起)
9cjfoivwl4-1691737874113.png
操作系统内核为了维护这个滑动窗口,需要开辟发送缓冲区来记录哪些数据没有应答,只有确认应答的数据,才能从缓冲区删掉
窗口越大,则网络的吞吐率越高
j6mh9pbphf-1691738036987.png
如果出现了丢包,如何重传?
这样需要分情况考虑:
情况一:数据报到了,但是ACK丢了
24z8uzf8zh-1691738198993.png
这种情况下,部分ACK丢了不要紧,可以通过后续的ACK进行确认
情况二:数据报丢了
9q3kkynnqm-1691738251109.png
如果发送端主机连续三次收到同样的ACK应答,就会将对应的数据重新发送。
被收到接收端操作系统的接收缓冲区内
这种机制被称为“高速重发控制”(也叫快重传

4.6 流量控制

接收端处理数据的速度是有限的,如果发送端发送的太快。导致接收端的缓冲区被打满,这个时候如果发送端继续发送,就会造成丢包继而引起丢包重传一系列连锁反应

TCP 支持根据接收端的处理能力,来决定发送端的发送速度,这个机制叫做流量控制

  • 接收端将自己可以接收的缓冲区大小放入TCP首部的“窗口大小”字段,通过ACK通知发送端
  • 窗口大小字段越大,说明网络的吞吐量越高
  • 接收端一旦发现自己的缓冲区快满了,就会将窗口设置成一个更小的值通知发送端
  • 发送端接收到这个窗口的大小之后,就会控制自己的发送速度
  • 如果接收方缓冲区满了,就会将窗口设置为0,这是发送方不在发送数据,但是定期发送窗口探测数据段,是接收端窗口大小告诉发送端
    ywydehaq07-1691738825114.png

4.7 拥塞控制

虽然TCP有了滑动窗口,可以高效发送大量的数据,但是在刚开始时就发送大量的数据可能引发问题
网络上可能有很多计算机,可能当前的网络状态就已经比较拥堵,在不清楚网络状态的情况下,贸然发送大量数据可能雪上加霜

TCP引入慢启动机制,先发少量的数据探探路,摸清当前网络的拥堵情况,在确定按照多大的速度传输数据
qsecpy5jzz-1691739364106.png
发送开始的时候定义拥塞窗口大小为1, 每次收到一个ACK应答拥塞窗口加1。每次发送数据报的时候,将拥塞窗口和接收端主机反馈的窗口大小做比较,取较小的值作为直接发送的窗口

这个地方有个慢启动的阈值,当拥塞窗口超过这个阈值的时候,不在按照指数方式增长,而是线性方式增长
f1dzy9eise-1691739610104.png

4.8 延迟应答

如果接收数据的主机立刻返回ACK应答,这时候返回的窗口可能比较小。如果接收端稍微等一会在应答,返回的窗口可能就很大
窗口越大,网络吞吐量就越高,目标是在保证网络不拥塞的情况下,尽量提高传输效率
每个包都延迟应答吗?

  • 数量限制:每隔N个就应答一次
  • 时间限制:超过最大延迟时间就应答一次
    ktxryryfzd-1691739979110.png

4.9 捎带应答

在延迟应答的基础上,我们发现很多情况下,客户端服务器在应用层也是“一发一收”的意味着客户端给服务器发送了一条消息,服务端也会返回一个消息。这个是会后ACK就可以搭顺丰车,和服务器返回的消息一起返回给客户端
ni9f7hfwj3-1691750195994.png

4.10 面向字节流

创建一个TCP的socket,同时在内核中创建一个接收缓冲区发送缓冲区

  • 调用write时,数据会先被写入发送缓冲区当中,如果发送的字节流太长会被拆分成多个TCP报文发出;如果发送的字节数太短就会在缓冲区里等待,等待缓冲区长度差不多了或者合适的时机发出去
  • 接收数据的时候,数据也是从网卡驱动到达内核接收缓冲区。然后调用read可以从缓冲区里读取数据
  • TCP的一个连接,既有发送缓冲区也有接收缓冲区,对于这一个连接,即可以读数据也可以发送数据这就是全双工

4.11 粘包问题

这里的“包”指的是应用层的数据报
在TCP协议头中,没有UDP一样的“报文长度”,但是有一个序号这样的字段。站在传输层的角度,TCP是一个报文一个报文发送过来的。按照序号排好放在缓冲区。站在应用层的角度看到的是一连串的数字应用程序看到这一连串的字节数据,就不知道那个部分开始啊到那个部分,是一个完整的数据报
如何解决粘包问题?
明确两个包之间的边界

4.12 TCP异常情况

进程终止:进程终止会释放文件描述符,仍然可以发送FIN。和正常关闭没什么区别
一旦接收端有写入操作,接收端发现连接已经不在了,就会进行reset。即使没有写入操作,TCP也会内置一个保活定时器,会定期询问对方还在不在,也会连接释放

4.13 TCP小结

可靠性:

  • 校验和
  • 序列号(按序到达)
  • 确认应答
  • 超时重发
  • 连接管理
  • 流量控制
  • 拥塞控制

提高性能:

  • 滑动窗口
  • 快速重传
  • 延迟应答
  • 捎带应答

listen的第二个参数,是为了保证系统资源不浪费

TCP连接管理使用两个队列:

  1. 半链接队列
  2. 全连接队列
    全连接队列的长度会受到listen的第二个参数的影响。这个队列的长度是listen的第二个参数+1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/71750.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

浏览器无法连接网络问题

问题描述 电脑其他程序都能正常联网&#xff0c;但是所有的浏览器都无法联网&#xff0c;同时外部网站都能ping通 问题诊断 查看电脑Internet连接的问题报告显示&#xff1a;该设备或资源(Web 代理)未设置为接受端口"7890"上的连接。 解决方案 经过检查发现不是IP地址…

PHP Mysql查询全部全部返回字符串类型

设置pdo属性 $pdo->setAttribute(PDO::ATTR_EMULATE_PREPARES, true);

中科亿海微浮点数转换定点数

引言 浮点数转换定点数是一种常见的数值转换技术&#xff0c;用于将浮点数表示转换为定点数表示。浮点数表示采用指数和尾数的形式&#xff0c;可以表示较大范围的数值&#xff0c;但存在精度有限的问题。而定点数表示则采用固定小数点位置的形式&#xff0c;具有固定的精度和范…

架构训练营学习笔记:6-1 微服务

序 这部分是了解的。传统企业使用soa较多。很多企业银行、电信对于Oracle 依赖大&#xff0c;强调稳定性。各个项目侧重外包&#xff0c;技术栈不统一。 soa 历史 这个之前电信的BOSS系统就是这种架构&#xff0c;不知道现在呢&#xff0c;核心计费系统billing是运行在tuxduo…

1.作用域

1.1局部作用域 局部作用域分为函数作用域和块作用域。 1.函数作用域: 在函数内部声明的变量只能在函数内部被访问&#xff0c;外部无法直接访问。 总结&#xff1a; (1)函数内部声明的变量&#xff0c;在函数外部无法被访问 (2)函数的参数也是函数内部的局部变量 (3)不同函数…

分布式协调组件Zookeeper

Zookeeper介绍 什么是Zookeeper ZooKeeper 是⼀种分布式协调组件&#xff0c;用于管理大型主机。在分布式环境中协调和管理服务是一个复杂的过程。ZooKeeper 通过其简单的架构和 API 解决了这个问题。ZooKeeper 允许开发人员专注于核心应用程序逻辑&#xff0c;而不必担心应用…

大数据扫盲(1): 数据仓库与ETL的关系及ETL工具推荐

在数字化时代&#xff0c;数据成为了企业决策的关键支持。然而&#xff0c;随着数据不断增长&#xff0c;有效地管理和利用这些数据变得至关重要。数据仓库和ETL工具作为数据管理和分析的核心&#xff0c;将帮助企业从庞杂的数据中提取有价值信息。 一、ETL是什么&#xff1f; …

【脚踢数据结构】内核链表

(꒪ꇴ꒪ )&#xff0c;Hello我是祐言QAQ我的博客主页&#xff1a;C/C语言,Linux基础,ARM开发板&#xff0c;软件配置等领域博主&#x1f30d;快上&#x1f698;&#xff0c;一起学习&#xff0c;让我们成为一个强大的攻城狮&#xff01;送给自己和读者的一句鸡汤&#x1f914;&…

Remote Sensing,2023 | 基于SBL的分布式毫米波相干雷达成像的高效实现

Remote Sensing,2023 | 基于SBL的分布式毫米波相干雷达成像的高效实现 注1&#xff1a;本文系“无线感知论文速递”系列之一&#xff0c;致力于简洁清晰完整地介绍、解读无线感知领域最新的顶会/顶刊论文(包括但不限于 Nature/Science及其子刊; MobiCom, Sigcom, MobiSys, NSDI…

WEB集群——LVS-DR 群集、nginx负载均衡

1、基于 CentOS 7 构建 LVS-DR 群集。 2、配置nginx负载均衡。 一、 LVS-DR 群集 1、LVS-DR工作原理 LVS-DR&#xff08;Linux Virtual Server Director Server&#xff09; 名称缩写说明 虚拟IP地址(Virtual IP Address) VIPDirector用于向客户端计算机提供服务的IP地址真实…

TCP网络服务器设计

最近设计了一个网络服务器程序&#xff0c;对于4C8G的机器配置&#xff0c;TPS可以达到5W。业务处理逻辑是简单的字符串处理。服务器接收请求后对下游进行类似广播的发送。在此分享一下设计方式&#xff0c;如果有改进思路欢迎大家交流分享。 程序运行在CentOS7.9操作系统上&a…

【uniapp】uniapp设置安全区域:

文章目录 一、效果图:二、实现代码: 一、效果图: 二、实现代码: {"path": "pages/index/index","style": {"navigationStyle": "custom","navigationBarTextStyle": "white","navigationBarTitle…

Unity之ShaderGraph 节点介绍 UV节点

UV节点 Flipbook&#xff08;翻页或纹理帧动画&#xff09; Polar Coordinates&#xff08;将输入 UV 的值转换为极坐标。&#xff09; Radial Shear&#xff08;径向剪切变形&#xff09; Rotate&#xff08;将UV 的值旋转&#xff09; Spherize&#xff08;鱼眼镜头的球形变…

CentOS7连接网络

1.下载centos7镜像文件 2.安装centos7 3.修改网卡,ens33. 注意: 这里使用的是dhcp,设置IPADDR192.168.31.64一方面是为了后面使用crt或者MobaXterm连接,另一方面它和windows电脑的网卡要一致.这样才可以连接到网络.win r,输入cmd,打开命令窗口输入ipconfig.可以看到IPv4: 102…

windows安装apache-jmeter-5.6.2教程

目录 一、下载安装包&#xff08;推荐第二种&#xff09; 二、安装jmeter 三、启动jmeter 一、下载安装包&#xff08;推荐第二种&#xff09; 1.官网下载&#xff1a;Apache JMeter - Download Apache JMeter 2.百度云下载&#xff1a;链接&#xff1a;https://pan.baidu.…

FLStudio21水果最新中文版升级下载

FLStudio21最新中文版是一款非常专业的后期编曲音频处理软件&#xff0c;对于音乐编辑处理的领域内的人而言&#xff0c;是非常能够满足需求的一款工具。FL Studio21拥有强大且专业的创作工具&#xff0c;这是先进的创作工具&#xff0c;让你的音乐突破想象力的限制。FL Studio…

数据结构-栈的实现(C语言版)

前言 栈是一种特殊的线性表&#xff0c;只允许在固定的一端进行插入和删除的操作&#xff0c;进行数据插入和删除的一端叫做栈顶&#xff0c;另一端叫做栈底。 栈中的数据元素遵循后进先出的的原则。 目录 1.压栈和出栈 2. 栈的实现 3.测试代码 1.压栈和出栈 压栈&#xff…

C数据结构与算法——无向图(邻接矩阵) 应用

实验任务 (1) 掌握图的邻接矩阵存储及基本算法&#xff1b; (2) 掌握该存储方式下的DFS和BFS算法。 实验内容 实现图的邻接矩阵存储结构实现基于邻接矩阵的相关算法及遍历算法 实验源码 #include <malloc.h> #include <stdio.h>#define MAXSIZE 1000 #define …

(6)(6.3) 复合连接的故障处理

文章目录 6.3 复合连接的故障处理 6.4 相关话题 6.3 复合连接的故障处理 带有 F7 或 H7 处理器并有 CAN 接口的自动驾驶仪使用的固件提供两个 USB 接口。一个用于正常的 MAVLink 连接&#xff0c;一个用于 SLCAN 串行连接到 CAN 接口进行配置和固件更新。这被称为复合型 USB…

WebRTC | 实现数据流的一对一通信

目录 一、浏览器对WebRTC的支持 二、MediaStream与MediaStreamTrack 三、RTCPeerConnection 1. RTCPeerConnection与本地音视频数据绑定 2. 媒体协商SDP 3. ICE &#xff08;1&#xff09;Candidate信息 &#xff08;2&#xff09;WebRTC收集Candidate &#xff08;3&…