web基础介绍
web:就是我们所说的网页,打开网站展示的页面。(全球广域网,万维网)
world wide web (www)
分布式图形信息系统
分布式:计算机系统或者是应用程序分布在多台独立的计算机或者服务器上。通过计算机网络互相通信和协作。共同完成任务或者共同对外提供一致的服务。分布式设计的目标:把工作负载分散到多个节点上。
每个节点既是一个整体,也是一个独立运行体。这种设计提供了高可用的架构,允许分布式节点的服务器出现故障。
集群:建立在分布式的基础之上,把多台计算机或者服务器连接在一起,作为一个整体,形成一个单一的计算资源。
也是通过网络连接,共享任务和资源负载,实现高性能和高可用。这些计算机或者服务器他们的性能基本一致。
运行的服务或者应用程序都一致。
集群的目标:通过增加节点和减少节点实现弹性伸缩,提高处理能力和容量。
数据中心,web服务器都属于集群。大数据处理等等。
web的组成结构:
(核心)网页:纯文本格式的文件,HTML语言(超文本标记语言),是一种规范,也是一种标准。
通过标记符号来显示网页中的各个部分。
一般来说,我们访问的页面都是.html或者.htm (也是网站的首页)
浏览器把html语言进行翻译,形成用户看到的页面。
网站:由一个一个的页面组成,是一个网页的结合体。
域名:访问网站或者浏览页面时输入的地址(网址)
www.baidu.com----- 180.10.0.10
http\https:用来传输网页的通信协议。https就是加密的。是一种客户端和服务端之间通信,交互的标准和规范。
URL:万维网的寻址系统,是网站在互联网上的唯一标识。
UPI:域名后每一个为/划分的区域
超链接:超链接把网站中的不同网页连接起来。
发布:把制作好的网页部署到互联网上,可以分为内和外
内部访问:不提供互联网的对外访问,只能是内部的局域网访问
外部访问:互联网上公开的页面,所有人都可以访问的网页
web的版本
web1.0 :网页编辑好之后,用户直接阅读内容,用户无法对页面进行编辑、更改、创建其他内容。
web2.0:用户也是访问编辑好的页面,但是这个页面用户可以对其进行二次开发,分享、点赞、送礼,等等都是web2.0的新特征。
静态页面:
静态页面就是标准的HTML文件,文件的扩展名.html或者.htm。
纯文本,图像,声音,动画等等组成的一个页面。
网站建设的基础,早期的网站都是静态页面,没有后台数据库,没有其他的程序,也无法交互的页面。看
更新起来比较麻烦,展示型的网站,更新内容比较少的网站。
静态页面的URL的地址固定的,内容相对稳定,容易被搜索引擎解锁。
页面的浏览器速度比较快,没有后台程序,不需要连接数据库,页面打开的比较块。
动态页面:
网页的URL不固定,用户可以和后台进行交互(数据库)
在动态页面的URL里面有一个符号“ ?”
动态页面用的是PHP,JSP,python,ruby。
动态页面的特点:
1、交互性,用户可以对网站发布的页面进行二次创造
2、自动更新
3、页面的内容会实时的发生变化
区别:
1、静态页面 看
2、动态页面 交互
http协议和返回码:
http 0.9
http 1.0 基本淘汰
http 1.1 目前的主流
http 2.0 加密的协议,新一代的加密协议,htpp1.1的升级版
面试题:
http1.0和http1.1之间的区别:
1、缓存机制
缓存可以把用户的一些行为和操作,保存下来,下一次在访问,可以保留这些状态,不需要在和web服务器进行额外的通信,提高了访问的效率。
缓存有的是保存在本地,有的保存在web服务器。
缓存基本上都是保存在用户的本机(缓存由游览器保存)
缓存的保留时间,一般是30-180天
一般网站都是30天左右。
http1.0只有一种缓存策略。
http1.1引入了更多的缓存策略。
2、长连接
http1.1支持长连接,在一个tcp连接上可以传送多个http请求和相应。
一次性的获取页面所有的内容。
3、待宽的优化和网络连接的使用:
http1.0一次只能获取一个对象,其他对象还要继续的建立连接获取数据。
http1.1只要建立了连接,除非数据发送完毕,否则不需要为了其他的资源专门的再建立额外的连接。
http的工作方式
HTTP(超文本传输协议)的工作方式基于客户端-服务器模型,主要包括以下几个步骤:
-
客户端连接
- 客户端(通常是浏览器)通过指定的 URL 向服务器发起连接请求。
-
发送请求
- 客户端向服务器发送一个 HTTP 请求,请求包括请求方法(如 GET、POST、PUT、DELETE 等)、请求的 URL、HTTP 版本、以及一些请求头信息(如 User-Agent、Accept、Content-Type 等)。如果是 POST 或 PUT 等方法,还可能包含请求体数据。
-
服务器处理请求
- 服务器接收到请求后,根据请求的 URL 和方法进行处理。它可能会读取数据库、执行计算、获取文件等操作来生成响应。
-
服务器发送响应
- 服务器向客户端发送一个 HTTP 响应,响应包括 HTTP 版本、响应状态码(如 200 OK、404 Not Found、500 Internal Server Error 等)、响应头信息(如 Content-Type、Content-Length、Cache-Control 等)以及响应体(即请求的实际内容,如 HTML 页面、图片、JSON 数据等)。
-
客户端处理响应
- 客户端接收到响应后,根据响应头中的信息对响应体进行处理。例如,如果是 HTML 页面,浏览器会进行解析和渲染;如果是图片,会进行显示等。
-
断开连接
- 在完成一次请求-响应交互后,连接通常会关闭,但在支持持久连接(Keep-Alive)的情况下,连接可以保持一段时间以便后续的请求复用。
整个过程是基于文本的、无状态的,每次请求都是独立的,服务器不会主动记住之前客户端的请求信息,除非通过一些技术(如 Cookie、Session 等)来实现状态管理。
GET方式
客户端的请求的方式是get,那么status codes :请求收到之后,服务端对请求的响应的状态码。
1xx 100-101 信息提示
2xx 200-206 成功
3xx 300-305 重定向和缓存
4xx 400-415 客户端错误(客户端请求的内容或者页面不存在)
5xx 500-505 服务端错误 web 服务软件本身出了故障,无法响应。
http常见的状态码
200 ok 请求成功
301 永久重定向,请求的页面会永久到其他的页面
302 临时重定向 网站维护时使用
304 访问的时本地缓存
403 用户的请求禁止访问
404 用户请求的网页不存在
500 内部服务错误,一般是软件层面也可能是硬件故障,也可能是防火墙
502 Bad Gateway 无效网关(防火墙,限制了转发功能)
503 service unavailable 服务不可用
504 Gateway timeout 网关请求超时
POST方式
区别于get,get就是向服务发送请求,请求不带任何参数,由http协议自行约定的。
post也是发送数据,也是依照http协议,post会更改服务器的数据。post之后会在服务器上多一条数据,或者对原数据进行了修改。
get的请求可以被缓存的,post没有缓存
get的请求记录会保存再浏览记录(cooike),post不会被保存
get就是获取数据,post会修改数据
get的请求长度是有限制的,而且请求的字符串会显示再URL当中
post请求没有长度限制的,而且字符串也不在URL当中显示
动态页面.jsp.js,php为结尾的文件。
nginx---------web服务器
http就是apache ,在国内很少
nginx是开源的,是一款高性能,轻量级的web服务软件。
稳定性高,而且版本迭代比较快(修复bug速度比较快,安全性高)
消耗资源很低,http的请求并发连接,单台服务器可以支持30000-50000个并发请求。(系统资源全部分配给nginx使用)
单个节点的nginx一般支持20000个并发。
nginx的功能介绍:
1、静态文件服务:静态页面,可以直接提供静态文件服务,html css jsp。处理静态页面的响应速度很快,效率很高
2、代理:正向代理,反向代理。可以实现负载均衡,高可用和故障转移。
3、动态内容处理,nginx并不能直接处理动态请求,可以通过中间件把动态请求转发给后端服务器。
4、支持加密的http https
5、可以实现重定向。
6、虚拟主机,一个nginx可以配置多个域名和站点。
7、nginx自带缓存。
8、性能可扩展,处理能力可以随时调整。
nginx的应用场景:
静态页面
转发动态请求
反向代理,负载均衡
缓存服务
./configure --prefix=/usr/local/nginx \
--user=nginx \
--group=nginx \
--with-http_ssl_module \ 支持https的加密功能
ss/tls --with-http_v2_module \ 支持http2.0协议
--with-http_realip_module \ 支持nginx获取客户端的真实ip地址
--with-http_stub_status_module \ 支持nginx获取访问状态信息的功能
--with-http_gzip_static_module \ 支持页面压缩功能
--with-pcre \ 支持pcre库
--with-stream \ 支持四层代理的模块
--with-stream_ssl_module \ 支持对tcp连接的加密
--with-stream_realip_module 支持从代理协议中获取客户端的真实ip地址
drwxr-xr-x.2 nginx nginx 4096 7月 1 14:20 conf 配置文件目录 nginx的主配置目录
drwxr-xr-x.2 nginx nginx 407月 1 14:20 html 工作目录50x.htmI默认的访问操作打开的页面
drwxr-xr-x.2 nginxnginx 67月 114:20 10gS 日志目录 访问日志,报错日志
drwxr-xr-x.2 nginxnginx 19 7月 1 14:20 sbin nginx的二进制启动脚本
nginx的常用命令:
nginx-t :检査nginx.conf的配置文件当中的语法是否正确
nginx-v :显示nginx的版本
nginx-V :显示版本和配置项
nginx-s :信号 stop 关闭nginx
reload 重新加载nginx 如果更改了配置文件,nginx -s reload 无需重启服务