HTTP/HTTPS协议

什么是HTTP协议

HTTP被称为超文本传输协议(里面不仅仅可以是字符串,还可以是图片,特殊字符等),这是一种应用非常广泛的应用层协议. HTTP协议诞生于1991年,现在是最主流使用的一种应用层协议.它从诞生到现在为止迭代了多个版本.

但目前最主流使用的还是HTTP1.1和HTTP2.0. HTTP协议是基于传输层的TCP协议来实现的(1.0, 1.1, 2.0都是基于TCP实现的, 而3.0则是基于UDP来实现的).

想我们平常打开一个网站,就是来通过HTTP协议来传输数据的. 像我们在游览器中输入百度的网址,游览器就会给百度的服务器发送有一个HTTP请求,百度服务器就会返回一个HTTP响应. 这个响应被解析后就会变成我们看到的网页内容.(这个过程中可能有多次HTTP请求)(HTTP协议的交互过程,就是经典的一问一答)

HTTP格式

了解HTTP格式,我们可以使用一个抓包工具,抓包工具本质上就是一个代理程序,可以获取到网络上传输的数据,显示出来,从而给程序猿一些参考.这里我们使用fiddler.打开fiddler,我们可以抓包到很多数据包,因为电脑上有很多程序在默默做很多事情. 

这里我们打开一个网站,其实浏览器和服务器之间HTTP交互不止一次,也是有很多次.第一次交互拿到的是这个页面的html,html需要依赖css和js,图片的等.等html被游览器加载后,又会触发到一些其他的http请求,获取到css,js等.......

这里我们搜索搜狗的网页.观察fiddler窗口.蓝色的表示返回的就是一个html. 

上面的窗口就是请求的明细,下面的窗口就是响应的明细.

点击raw就可以查看到http请求的原始数据:

http响应的原始数据:

这样显示是因为这个响应数据被压缩了.

HTTP请求格式

这里HTTP请求包含4部分:

1.首行

这里也由三个部分组成,由空格来分割.

2. 请求头(header)

从第二行开始到后面都是请求头,这里类似于TCP报头中的重要的属性一样. 是由文本方式来组成的.报头中包含了很多的键值对,每个键值对都占一行,键和值之间用:分割.这里的减值有什么含义都是HTTP协议来规定的.

3. 空行

请求头后面会有一个空行,这个表示结束标志.

4. 正文(body)

这是http的载荷部分,有的http有载荷,有的没有.

HTTP响应格式

1. 首行

2. 响应头

这里也是用减值对来表示的.每个键值对为一行.

3. 空行

4. 正文(body)

这里响应的载荷是html

HTTP请求

认识URL

url是一个很重要的概念. 它是描述一个网络上的资源位置.像搜狗的: https://www.sogou.com/ 就是一个最简单的url.

上述就是有一个完整的url.这里通过ip地址知道服务器在哪里,通过端口号知道程序是哪个,通过路径知道是访问哪个资源.

https: 协议名称.这个可以是有其他类型的

user.pass: 登入信息. 这个现在已经不会使用了,一般都被省略

服务器地址: 这里是域名,也可以是ip地址.

端口号: 端口号表示你要访问服务器哪个端口.如果没有,游览器会自动给一个默认的端口号.这里的端口用啥为默认值,取决于协议.

文件路径: 这里可能是一个真实的硬件文件也可能是一个虚拟文件.

查询字符串: 针对请求的内容进行补充. 它是客户端给服务器传递信息的重要途径.它是键值对结构,用&分割键值对,用 = 来分割键和值,这里的键值对内容都是程序员自定义的.

片段标识符: 主要用于页面内的跳转.

关于URL encode

像一些特殊字符 / ? 等被url当做特殊意义来理解,这些字符在url中就不能随意出现. 如果需要使用某个特殊字符,就需要先对特殊字符进行转义.且中文字符在url中也需要转义,因为中文字符是由utf-8或者GBK的编码方式构成的,它们其中的某个字节可能也会被当做特殊字符.

转义规则就是: 将需要编码的字符转为16进制,从右往左,取4位,每两位为一位,前面加上%,编码成%xy的格式.

认识方法

这里最常用的就是GET和POST方法. GET就是从服务器中拿一个东西过来(读操作),POST就是往服务器中放一个东西过去(写方式). 这些语义虽然是官方文档中的注释,但是在实际开发中,开发者可能不会按这一套来.可能POST可以是读操作,GET是写操作.

一般我们从游览器中输入url,这时游览器就会发送一个GET请求.我们可以通过fiddler来观察.这里我们以https://www.sogou.com为例:

这里我们就可以看到方法是GET.而GET请求有一些特点:

1.url的query string(用于补充信息) 可以为空,也可以不为空

2. header部分有多个键值对

3. body部分为空

而POST方法则多用于登录和上传的场景.这里以我登录一个QQ为例:

一般来说,GET通常是没有body,POST通常有body.GET习惯把需要的补充信息放到query string中(url中),而POST会把这些信息放到body中.

POST的特点:
1. psot在第一行

2. url的query string一般为空

3. header部分有多个键值对

4. body部分一般不为空.

POST和GET的区别(面试题)

这两者在本质上其实都没有区别.因为使用GET的场景可以使用POST.使用POST的场景也可以使用GET.这里区别于代码是怎么使用的. 

但是在使用习惯上是有区别的:

1. GET习惯于把数据放到url中的query string, POST习惯于把数据放到body中.

2. 在标准文档中的语义get是用来获取数据.post是用来给服务器传输数据的.

3. 关于幂等性. 标准文档中,建议GET请求实现为幂等的,POST则无要求.

4.GET请求是可以被收藏夹受藏的.但POST请求不可以.

认识报头(header)

Host

它表示服务器的地址和端口号. 

Content-Length与Content-Type

它,们表示body中的数据长度和body中的数据格式. 这两个键值对和body密切想相关,要是数据包没有body,他们就不会存在.

可以通过Content-Length来处理粘包问题. HTTP底层是基于TCP,也是连续传多个HTTP数据报,在接受方的接收缓冲区中也会积累多个包的数据.应用程序就可以通过这个Content-Length来明确包与包之间的边界.

而body可以传输很多种格式,程序猿都可以自己约定格式.Content-Type就是记录body的数据格式. 一般请求中的格式有:

application/json: body就是json格式

application/x-www-form-urlencoded: 通过html中的form标签构造出来的一种格式. 特点可以认为是把query string放到body里了.

multipart/form-data: 上传文件时使用的.

响应的格式有:

test/plain 纯文本

test/html html

test/css css

application/javascript js

.......

User - Agent(UA)

这里我们可以发现UA是有操作系统信息和游览器信息组成的. 在以前游览器和游览器之间有不能的效果,有的可以显示图片,有的不可以等等差异,服务器就可以通过UA信息来判定,你的设备老就不返回新特性,是新设备就返回新特性. 且它还有一个作用就是判定系统是PC系统还是移动端系统. 根据这个信息来返回不同的页面布局.

Referer

描述当前这个页面从哪里来.也就是它的父路径.

通过它就可以来知道哪些请求是通过谁的广告引流过来的.

Cookie

它的本质就是一个游览器这边本地持久存储数据的机制. 游览器作为电脑的程序可以直接读取本地文件.但是游览器上的网页是不能通过游览器提供的api来读写本地文件,因为游览器没有给网页提供这样的api. 但是游览器给网页提供了一个可以有限度的存储数据,但不能随意访问文件系统的api. 这里最经典的就是Cookie这样的存储机制.

请求中的Cooke字段就是把本地存储的Cookie信息发送到服务器那边.而响应中会有一个set-Cooke字段,就是服务器告诉游览器你要在本地保存哪些信息. 这就像去医院看病. 去到一个新的科室,就是客户端给服务器发送新的请求. 每次刷就诊卡,就是在使用Cooker中的信息,让服务器来对客户端有一个清晰的认识.而就诊卡就是客户端中的持久化存储数据的机制.

cooke的重要结论:

Cooke是服务器返回给浏览器的.通常都是首次访问后.

Cookie会存储到浏览器本地主机硬盘上,后序每次访问服务器都会带上Cooker.不同的客户端,保存的Cookie是不同的.即使使用同一个主机,使用不同的浏览器,Cooker大概率也不同.

Cookie中都是键值对格式的数据,都是程序猿自定义的.

Cookie在硬盘上保存,是按照不同的域名为维度来存储的.游览器访问百度,有一组cookie.访问搜狗,有一组cookie.

Cookie的用途是用来在客户端存储数据.最主要的就是存储用户的身份标识,服务器就可以通过标识来区分用户了.(其他的业务数据一般不会放到cookie中.cookie是可以随时删除的. 把业务数据放到服务器中,通过cookie中的身份标识来找到对应的数据; 且账号密码一般也不会放到cookie中, 游览器有另一个保存机制来保存密码)

状态码

状态码一般是用于响应当中的.表示响应的结果如何?HTTP中的状态码是标准约定好的.

这里我们介绍几个常用的状态码.

1. 200 OK: 表示成功访问

2. 404 Not Found: 表示访问的资源没有找到.

3. 405 Method Not Allowed: 表示服务器只支持GET请求,但是你发送的是POST.

4. 403 Forbidden: 请求的资源没有访问权限.

5. 500 Internal Server Error: 服务器内部错误,也就是服务器挂了

6. 504 Gateway Timeeout: 访问服务器超时,可能是服务器挂了,也可能是网挂了

7. 302 Move temporarily: 重定向(临时重定向). 类似与访问的是A,但是A告诉你,去找B,游览器就会去找B.

8. 301 永久重定向: 这里就是游览器会将重定向的结果记录下来,下次再去访问,就会直接访问重定向的目标地址.不必多跳转一次.

构造HTTP请求

通过PostMan

可以下载PostMan来直接来这个第三方库中生成HTTP请求.

 通过代码构造

public class HttpClient {
    private Socket socket;
    private String ip;
    private int port;
    public HttpClient(String ip, int port) throws IOException {
    this.ip = ip;
    this.port = port;
    socket = new Socket(ip, port);
    }
    public String get(String url) throws IOException {
    StringBuilder request = new StringBuilder();
    // 构造⾸⾏
    request.append("GET " + url + " HTTP/1.1\n");
    // 构造 header
    request.append("Host: " + ip + ":" + port + "\n");
    // 构造 空⾏
    request.append("\n");
    // 发送数据
    OutputStream outputStream = socket.getOutputStream();
    outputStream.write(request.toString().getBytes());
    // 读取响应数据
    InputStream inputStream = socket.getInputStream();
    byte[] buffer = new byte[1024 * 1024];
    int n = inputStream.read(buffer);
    return new String(buffer, 0, n, "utf-8");
    }
    public String post(String url, String body) throws IOException {
    StringBuilder request = new StringBuilder();
    // 构造⾸⾏
    request.append("POST " + url + " HTTP/1.1\n");
    // 构造 header
    request.append("Host: " + ip + ":" + port + "\n");
    request.append("Content-Length: " + body.getBytes().length + "\n");
    request.append("Content-Type: text/plain\n");
    // 构造 空⾏
    request.append("\n");
    // 构造 body
    request.append(body);
    // 发送数据
    OutputStream outputStream = socket.getOutputStream();
    outputStream.write(request.toString().getBytes());
    // 读取响应数据
    InputStream inputStream = socket.getInputStream();
    byte[] buffer = new byte[1024 * 1024];
    int n = inputStream.read(buffer);
    return new String(buffer, 0, n, "utf-8");
    }
    public static void main(String[] args) throws IOException {
    HttpClient httpClient = new HttpClient("42.192.83.143", 8080);
    String getResp = httpClient.get("/AjaxMockServer/info");
    System.out.println(getResp);
    String postResp = httpClient.post("/AjaxMockServer/info", "this is body"
    System.out.println(postResp);
    }
}

什么是HTTPS

HTTPS它就是HTTP的改进版,是在HTTP协议的基础上引入了一个加密层SSL.引入的原因就是运营商的劫持事件.如果是明文传输,它就可以在路由器中修改服务器返回的响应.而HTTPS就是通过加密来进一步的保证用户的信息安全.

HTTPS加密

这里的加密分为两种: 对称加密和非对称加密

对称加密:

它就是通过同一个密钥来把明文变成密文,也可以通过它把密文变成明文.

非对称加密:

它有两个密钥,公钥用来加密,私钥用来解密.

这时,服务端就可以在本地生成对称密钥,通过公钥(在第一次客户端请求,客户端就会叫服务器将公钥发送给它,这个就算给别人获取到了也并无大碍)来加密对称密钥,发送给服务器. 服务器就可以通过私钥来解密得到对称密钥.则接下来客户端和服务器的信息都可以通过对称密钥来加密和解密了.

中间人攻击

上面那种方法看似安全,其实还有很大的安全隐患,也是所谓的中间人攻击.服务器可以创建出一对公钥和私钥,黑客也可以用相同的方式来创建出一对公钥和私钥,冒充自己是服务器.

解决方法

这里的解决方式就是引入一个"证书". 客户端可以要求服务器提供一个证书.

这个证书是一个结构化的数据,里面包含了很多属性,最后用字符串的形式提供.

证书中会有一系列信息:

服务器的域名,公钥,证书有效期........

证书是搭建服务器的人从第三方的公证机构进行申请的.

这样客户端就不是需要拿非对称秘钥中的公钥了,也是要证书.

而对于证书中的公钥,黑客是不能进行修改的.因为客户端拿到证书后会进行检验真伪.证书里会有一个"签名",也就是校验和(这个校验和被公证机构那种自己的私钥进行了加密). 这个校验和就是使用一系列的算法把证书中的其他字段进行计算得到一个较短的字符串. 

而客户端拿到证书后会做两件事:

1. 按照同样的校验和算法,把证书的其他字段都重新计算一边,得到校验和1.

2. 使用系统中内置的公证机构的公钥,进行签名解密,得到校验和2.

要是这两个校验和相同,则就是证书没有被修改,要是不相同就是被修改了.

注意:

1)这里如果黑客直接修改公钥,不修改签名. 算出的校验和肯定不一样.

2)如果修改公钥也重新生成签名,由于黑客不知道公证机构的私钥,就无法重新加密签名.要是它拿自己的私钥加密,客户端那边的公证机构的公钥就会解密失败.

 到这里,安全系数就得到了极大的提高.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/410922.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

大学餐厅菜品推荐和点评系统设计与实现

**🍅点赞收藏关注 → 私信领取本源代码、数据库🍅 本人在Java毕业设计领域有多年的经验,陆续会更新更多优质的Java实战项目希望你能有所收获,少走一些弯路。🍅关注我不迷路🍅**一 、设计说明 1.1 研究背景…

Opencv(2)深浅拷贝与基本绘图(c++python

Opencv(2)深浅拷贝与基本绘图 文章目录 Opencv(2)深浅拷贝与基本绘图三、深浅拷贝四、HSV色域(1).意义(2).cvtColor()(3).inRange()(4).适应光线 三、深浅拷贝 浅拷贝是指当图像之间进行赋值时,图像数据并未发生复制,而是两个对象都指向同一块内存块。 …

Amazon Generative AI | 基于 Amazon 扩散模型原理的代码实践之采样篇

以前通过论文介绍 Amazon 生成式 AI 和大语言模型(LLMs)的主要原理之外,在代码实践环节主要还是局限于是引入预训练模型、在预训练模型基础上做微调、使用 API 等等。很多开发人员觉得还不过瘾,希望内容可以更加深入。因此&#x…

鲲鹏arm64架构下安装KubeSphere

鲲鹏arm64架构下安装KubeSphere 官方参考文档: https://kubesphere.io/zh/docs/quick-start/minimal-kubesphere-on-k8s/ 在Kubernetes基础上最小化安装 KubeSphere 前提条件 官方参考文档: https://kubesphere.io/zh/docs/installing-on-kubernetes/introduction/prerequi…

【教程】ONLYOFFICE 桌面应用程序 v8.0 版本更新全面解读

文章目录 📟 引言 官网:ONLYOFFICE 官方网站 近日,ONLYOFFICE 桌面应用程序迎来了 v8.0 版本的更新,为用户带来了许多新功能和改进,如全新的 RTL 界面、本地主题、Moodle 集成等。本文将详细介绍 ONLYOFFICE 桌面编辑…

微服务架构中的 隔离和超时控制

文章目录 隔离的应用场景隔离的措施机房隔离实例隔离分组隔离连接池隔离和线程池隔离第三方依赖隔离慢任务隔离 隔离的缺点更多思考 超时控制超时控制目标超时控制形态确定超时时间1、根据用户体验来确定2、根据响应时间来确定3、压力测试4、根据代码计算 超时中断业务更多思考…

QT信号槽实现分析

1.宏定义 qt中引入了MOC来反射,编译阶段变成 MOC–>预处理–>编译–>汇编–>链接 1-1、Q_OBJECT 这个宏定义了一系列代码,包括元对象和处理的函数 #define Q_OBJECT \public: \QT_WARNING_PUSH \Q_OBJECT_NO_OVERRIDE_WARNING \static c…

Python接口自动化测试 —— unittest批量用例管理!

我们日常项目中的接口测试案例肯定不止一个,当案例越来越多时我们如何管理这些批量案例?如何保证案例不重复?如果案例非常多(成百上千,甚至更多)时如何保证案例执行的效率?如何做(批…

git 拉取远程分支到本地

背景: 我的 github 上的远程仓库上除了 main 分支外还提交了好几个别的分支,现在我换机器了,git clone 原仓库后只剩 main 分支,我要把其他分支拉下来到本地。 1. 查看所有远程remote分支 git branch -r 比如我这里&#xff1…

回归测试详解

🍅 视频学习:文末有免费的配套视频可观看 🍅 关注公众号:互联网杂货铺,回复1 ,免费获取软件测试全套资料,资料在手,涨薪更快 什么是回归测试 回归测试(Regression testi…

openGauss学习笔记-229 openGauss性能调优-系统调优-配置Ustore

文章目录 openGauss学习笔记-229 openGauss性能调优-系统调优-配置Ustore229.1 设计原理229.2 核心优势229.3 使用指导 openGauss学习笔记-229 openGauss性能调优-系统调优-配置Ustore Ustore存储引擎,又名In-place Update存储引擎(原地更新&#xff09…

【笔记】【电子科大 离散数学】 2.命题

文章目录 数理逻辑定义 命题定义不是命题的例子 原子命题和复合命题定义约定 命题联结词否定联结词定义例子真值表 合取联结词定义例子真值表 析取联结词定义例子 蕴含联结词定义例子真值表 等价联结词定义例子真值表 命题符号化及其应用速查表格优先级复合命题符号化布尔检索演…

每日一题——LeetCode1512.好数对的数目

方法一 暴力循环 var numIdenticalPairs function(nums) {let ans 0;for (let i 0; i < nums.length; i) {for (let j i 1; j < nums.length; j) {if (nums[i] nums[j]) {ans;}}}return ans; }; 消耗时间和内存情况&#xff1a; 方法二&#xff1a;组合计数 var …

Redis高并发分布锁实战

Redis高并发分布锁实战 问题场景 场景一: 没有捕获异常 // 仅仅加锁 // 读取 stock15 Boolean ret stringRedisTemplate.opsForValue().setIfAbsent("lock_key", "1"); // jedis.setnx(k,v) // TODO 业务代码 stock-- stringRedisTemplate.delete(&quo…

2024年湖北省事业单位考试报名流程图解

⏰ 时间安排 ✔️ 注册&#xff1a;2024年2月19日至2月27日15:00 ✔️ 报名&#xff1a;2024年2月21日9:00至2月27日17:00 ✔️ 资格审查&#xff1a;2024年2月21日9:00至2月28日9:00 ✔️ 缴费确认&#xff1a;2024年2月28日9:00至3月1日24:00 ✔️ 岗位调整和改报&#…

什么是媒体发稿?发稿媒体分类及发稿流程

传媒如春雨&#xff0c;润物细无声&#xff0c;大家好&#xff0c;我是51媒体网胡老师。 媒体发稿是一种企业推广和宣传的手段&#xff0c;通过媒体渠道传递企业信息和形象。 媒体发稿的含义在于&#xff0c;当企业有新闻、事件或其他消息需要对外公布时&#xff0c;可以选择…

2024.2.25 -ElasticSearch 进阶

倒排索引 Elasticsearch的倒排索引机制是通过将文档中出现的词汇与它们所在的文档ID关联起来&#xff0c;实现快速查找包含特定词汇的文档。下面是一个具体的例子来说明倒排索引的工作原理&#xff1a; 假设我们有一个简单的文章集合&#xff0c;包含以下三篇文章&#xff1a…

【PyTorch][chapter 18][李宏毅深度学习]【无监督学习][ VAE]

前言: VAE——Variational Auto-Encoder&#xff0c;变分自编码器&#xff0c;是由 Kingma 等人于 2014 年提出的基于变分贝叶斯&#xff08;Variational Bayes&#xff0c;VB&#xff09;推断的生成式网络结构。与传统的自编码器通过数值的方式描述潜在空间不同&#xff0c;它…

通天星CMSV6 车载视频监控平台信息泄露漏洞

免责声明&#xff1a;文章来源互联网收集整理&#xff0c;请勿利用文章内的相关技术从事非法测试&#xff0c;由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失&#xff0c;均由使用者本人负责&#xff0c;所产生的一切不良后果与文章作者无关。该…

基于AI将普通RGB图像转换为苹果Vision Pro支持的空间照片

将 RGB 图像转换为空间图片 一、引言 随着AR和VR技术的普及,空间照片格式(.HEIC)逐渐受到关注。这种格式允许用户在AR/VR设备上体验到更为真实的立体空间效果。为了让更多的普通图片也能享受这种技术,我们开发了这款可以将普通RGB图像转换为苹果Vision Pro支持的.HEIC格式的…