一、HTTP协议
1 HTTP协议的定义
-
网络协议
- 网络协议是指计算机通信网络中两台计算机之间进行通信所必须共同遵守的规定或规则。
-
HTTP协议
- HTTP协议(超文本传输协议)是一种网络通信协议,它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器。默认端口:80
-
HTTPS协议
- HTTPS协议是一种通过计算机网络进行安全通信的传输协议,经由HTTP进行通信,利用SSL/TLS建立全信道,加密数据包。1HTTPS使用的主要目的是提供对网站服务器的身份认证,同时保护交换数据的隐私与完整性。默认端口:443
-
HTTP协议的主要特点
- 支持客户/服务器模式
- 简单快速:客户向服务器发送请求时,只需传送请求方法和路径。请求方法常用的有GET、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
- 灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
- 无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
- 无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
-
HTTPS协议的主要特点
- 内容加密:采用混合加密技术,中间者无法直接查看明文内容。
- 验证身份:通过证书认证客户端访问的是自己的服务器。
- 保护数据完整性:防止传输的内容被中间人冒充或者篡改。
- SSL证书需要购买申请,功能越强大的证书费用越高。
- SSL证书通常需要绑定IP,不能在同一IP上绑定多个域名,IPv4资源不可能支撑这个消耗。
- HTTPS连接缓存不如HTTP高效,流量成本高。
- HTTPS协议握手阶段比较费时,对网站的响应速度有影响,影响用户体验。
2 HTTP协议的组成
-
请求行
- 请求行由请求方法字段(GET/POST)、URL字段和HTTP协议版本组成。
-
URL字段
- URL字段也称为请求地址
-
HTTP协议的请求方法
- HTTP协议的请求方法有GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT。
- 常用的方法:
- GET方法:浏览器的地址栏中输入网址的方式访问网页时,浏览器采用GET方法向服务器获取资源。
- POST方法:要求被请求服务器接受附在请求后面的数据,常用于提交表单。
-
GET和POST区别
- 从参数的传递方面来看,GET请求的参数是直接拼接在地址栏URL的后面,而POST请求的参数是放到请求体里面的;
- 从长度限制方面来看,GET请求有具体的长度限制,一般不超过1024KB,而POST理论上没有,但是浏览器一般都有一个界限;
- 从安全方面来看,GET请求相较于POST,因为数据都是明文显示在URL上面的,所以安全和私密性不如POST;
- 从本质上来说,GET和POST都是TCP连接,并无实质的区别.但是由于HTTP/浏览器的限定,导致它们在应用过程中体现出了一些不同.GET产生一个数据包,POST产生两个数据包.对于GET请求,浏览器会把http header 和 data 一并发出去,服务器响应200(返回数据).而对于POST,浏览器先发送header,服务器响应100 continue,浏览器再发送data,服务器响应200
-
请求头部
-
请求头部由关键字/值对组成,每行一对,关键字和值用英文冒号 “ : ” 分隔。
-
请求头部通知服务器有关于客户端请求的信息,典型的请求头有:
-
User-Agent:产生请求的浏览器类型。
-
Accept:客户端可识别的内容类型列表。
-
-
Host:请求的主机名,允许多个域名同处一个IP地址,即虚拟主机。
-
Content-Type:请求体的MIME类型。MIME类型:描述消息内容类型的因特网标准,常见的有application/json、image/jpeg、application/octet-stream等。
-
-
-
请求正文
-
请求正文向服务器提交的请求数据,GET请求的参数一般是放在请求行后的键值对,post请求的参数类型多样(表单、json、xml、图片等)
-
响应行
-
响应行由响应状态码、响应信息和HTTP协议版本字段3个字段组成
-
响应状态码
- 响应状态码由三位数字组成,第一个数字定义了响应的类别,且有五种类型
- 1xx:指示信息–表示请求已接收,继续处理
- 2xx:成功–表示请求已被成功接收、理解、接受
- 3xx:重定向–要完成请求必须进行更进一步的操作
- 4xx:客户端错误–请求有语法错误或请求无法实现
- 5xx:服务器端错误–服务器未能实现合法的请求
- 响应状态码由三位数字组成,第一个数字定义了响应的类别,且有五种类型
-
常见的响应状态码
- 200 - 请求成功,已经正常处理完毕
- 301 - 请求永久重定向,转移到其它URL
- 302 - 请求临时重定向
- 304 - 请求被重定向到客户端本地缓存
- 400 - 客户端请求存在语法错误
- 401 - 客户端请求没有经过授权
- 403 - 客户端的请求被服务器拒绝,一般为客户端没有访问权限
- 404 - 客户端请求的URL在服务端不存在
- 500 - 服务端永久错误
- 503 - 服务端目前无法使用(由于超载或停机维护)。 通常,这只是暂时状态。
-
响应头
-
响应头用于描述服务器的基本信息,以及数据的描述,服务器通过这些数据的描述信息,可以通知客户端如何处理等一会儿它回送的数据。
-
常见的响应头:
-
Content-Length:表示内容长度
-
Content- Type:表示后面的文档属于什么MIME类型
-
Server:服务器通过这个头告诉浏览器服务器的类型
- 响应正文
-
-
响应正文就是响应的消息体,如果是纯数据就是返回纯数据,如果请求的是HTML页面,那么返回的就是HTML代码,如果是图片就是图片等。
-
二、搭建python自带静态web服务器
1 静态web服务器是什么
静态web服务器是指可以为出发请求的浏览器提供静态文档的程序。
平时我们浏览百度新闻数据的时候,每天的新闻数据都会发生变化,那访问的这个页面就是动态的。
而静态的Web服务器,页面的数据不会发生变化。
2 如何搭建python自带的静态web服务器
搭建python自带的静态