web基础与HTTP协议
- 一、域名概述
- 二、网页的概念
- 三、HTML
- 四、web概述
- 静态网页:
- 动态页面
- 动态页面与静态页面的区别
- 五、HTTP
一、域名概述
-
域名的概念:IP地址不易记忆
-
早期使用Hosts文件解析域名
– 主机名称重复
– 主机维护困难 -
DNS(域名系统)
– 分布式
– 层次性 -
域名空间结构
根域、顶级域、子域、二级域、主机名 -
域名注册
–域名注册是Internet中用于解决地址对应问题的一种方法
– 遵循先申请先注册原则
–域名注册步骤如下:
二、网页的概念
网页:
- 纯文本格式文件
- 编写语言为html
- 在用户的浏览器中被“翻译”称网页形式显示出来
网站:是由一个个网页面构成,是多个网页的结合体
主页:打开网站后出现的第一个网页成为网站主页(或首页)
域名:浏览网页时输入的网址
HTTP:用来传输网页的通信协议
URL:一种万维网寻址系统
HTML:用来编写网页的超文本标记语言
超链接:将网站中不同网页链接起来的功能
发布:将制作好的网页上传到服务器供用户访问的过程
三、HTML
HTML超文本标记语言,是网页的“源码”。
比如我们建立一个记事本,将格式改为.html,就会变成默认使用浏览器打开
HTML文档的结构
- HTML网页
- 头部部分
- 标题部分
- 主体部分
- 网页内容,包括文本、图形等
网页基本标签
- 标题标签
- 行控制标签
- 范围标签
- 图像标签
- 超链接标签
- 特殊符号
头标签中常用标签:
<title> :定义文档的标题
<base> :定义页面链接标签的默认链接地址
<link> :定义一个文档和外部资源之间的关系
<meta> :定义了HTML文档的元数据
<script> :定义了客户端的脚本文件
<style> :定义了HTML文档的样式文件
内容标签中常用的标签:
<table> :定义一个表格
<tr> :定义了表格中的一行
<td> :定义了表格中的某一行的某一列
<img> :定义了一个图像
<a> :定义了一个超链接
<p> :定义了一行
<br> :定义了换行
<font> :定义了字体
<h1> :定义字体大小,数字越大,字体越小
可以查看网页里的代码
四、web概述
web即全球广域网,也称为万维网,是一种分布式图形信息系统,建立在Internet上的一种网络服务。
web1.0:
以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读网站提供内容,这个过程是网站到用户的单向行为,属于静态网页
web2.0:
更注重用户的交互作用,用户既是网站的消费者(浏览者),也是网站内容的制造者,加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参与,属于动态用户
web2.0的特征:用户分享、以兴趣为聚合点的社群、开放的平台、活跃的用户
静态网页:
静态网页是标准的HTML文件,扩展名是.htm或者.html。是网站建设的基础,早期网站一般都由静态网页制作
没有后台数据库,不含程序和不可交互的网页
相对更新起来比较麻烦,适用于一般更新较少的展示型网站。
静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难,并且静态网页的交互性较差,在功能方面有较大的限制。但是页面浏览速度迅速,过程无需链接数据库,开启页面速度快于动态页面。
动态页面
动态网页的URL不固定,能通过后台与用户交互,在动态网页中有一个标志性的符号“?”,常用的编程语言有PHP、JSP、Python、Ruby等
动态网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面,这将是今后WEB发展的大势所趋,动态页面无需手动更新HTML文档,会自动生成新的页面,可以大大节省工作量,并且因时因人而变,不同的时间,不同的人访问同一网址时会产生不同的页面。
动态页面与静态页面的区别
动态页面:
有后台数据库支持,页面可交互,会自动更新,包含应用程序,扩展名通常以.php、.jsp、.py、.ruby等形式为后缀,页网址中有一个标志性的符号“?”
静态页面:
标准的HTML文件,扩展名是.htm、.html,没有后台数据库支持,不含应用程序和网页不可交互,不含有“?”
五、HTTP
HTTP协议是互联网上应用最为广泛的一种网络协议,设计这个协议的目的是为了发布和接收web服务器上的HTML页面
HTTP请求大概流程:客户端解析出服务端的域名→建立TCP链接→客户端发送数据请求→服务端响应客户端→服务端断开TCP链接。建立连接就是三次握手的过程,断开连接就是四次挥手的过程。
HTTP协议版本有:0.9、1.0、1.1、2.0、3.0
0.9:是最古老的版本
1.0:纯文本输出,http响应后会立即关闭TCP连接,支持http头部信息(比如http协议版本号,状态码等)
1.1:支持长链接(连接保持,持久连接)和管道机制(在TCP连接中实现多个http请求和响应)
2.0:二进制传输,支持长连接和完全多路复用(在一个TCP连接中同时发送多个请求,且不用按照顺序一一对应),支持网页头部压缩,支持服务端主动推送
3.0:基于UDP协议,但还未普及
HTTP方法:
HTTP支持几种不同的请求命令,这些命令被称为HTTP方法,每条HTTP请求报文都包含一个方法,告诉服务器要执行什么动作,比如获取一个web页面,运行一个网关程序,删除一个文件等。
HTTP方法 | 描述 |
---|---|
GET | 请求获取Request-URI所标识的资源 |
PUT | 请求服务器存储一个资源,并用Request-URI作为其标识 |
DELETE | 请求服务器删除Request-URI所标识的资源 |
POST | 在Request-URI所标识的资源后附加新的数据 |
HEAD | 请求获取由Request-URI所标识的资源的响应消息报头,查询元信息 |
CONNECT | 建立特殊的连接隧道 |
OPTIONS | 列出可对资源实行的方法 |
TRACE | 追踪请求-响应的传输路径 |
HTTP状态码:
HTTP状态码是用以表示网页服务器HTTP响应状态的3位数字代码,当浏览器请求某一URL时,服务器根据处理情况返回相应的处理状态。
状态码分类:
状态码首位 | 已定义范围 | 描述 |
---|---|---|
1XX | 100-101 | 信息提示 |
2XX | 200-206 | 成功 |
3XX | 300-305 | 重定向 |
4XX | 400-415 | 客户端错误 |
5XX | 500-505 | 服务器错误 |
HTTP常见状态码:
状态码 | 功能描述 |
---|---|
200 | 一切正常 |
301 | 永久重定向 |
302 | 临时重定向 |
401 | 用户或密码错误 |
403 | 禁止访问(客户端IP地址被拒绝) |
404 | 请求文件不存在 |
414 | 请求URI头部过长 |
500 | 服务器内部错误 |
502 | 无效网关 |
503 | 当前服务不可用 |
504 | 网关请求超时 |
HTTP请求流程分析:
用户在浏览器输入RUL访问时,发起HTTP请求,请求中包括请求行、请求头、请求体,服务器收到后返回响应报文,包括状态行、回应头、回应体。
- 请求报文
请求行:请求行由请求方法、URL以及协议三部分组成
请求头:请求头为请求报文添加了一些附加信息,由“名/值”对组成,每行一对,名和值之间使用冒号分隔。
空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少。
请求体:请求体是请求提交的参数,GET方法以及在URL中指明了参数,所以提交时没有数据。POST方法提交的参数在请求体中。
常用的请求头:
请求头 | 描述 |
---|---|
Host | 接受请求的服务器地址,可以是IP:端口号,也可以是域名 |
User-Agent | 发送请求的应用程序名称 |
Connectin | 指定与连接相关的属性,如Connection:Keep-Alive |
Accept-Charset | 通知服务端可以发送的编码格式 |
Accept-Encoding | 通知服务端可以发送的数据压缩格式 |
Accept-Lanuguage | 通知服务端可以发送的语言 |
- 响应报文
状态行:状态行由协议版本,状态码,状态码描述三部分组成
响应头:响应头与请求头部类似,为响应报文添加了一些附加信息
空行:响应头部的最后一个空行,表示响应头部结束
响应体:服务器返回的相应HTML数据,浏览器对其解析后显示页面
常见的响应头:
响应头 | 描述 |
---|---|
Server | 服务器应用程序软件的名称和版本 |
Content-Type | 响应正文的类型(图片还是二进制字符串) |
Cpntent-Length | 响应正文长度 |
Content-Charset | 响应正文使用的编码 |
Content-Encoding | 响应正文使用的数据压缩格式 |
Content-Language | 响应正文使用的语言 |