Linux网络-HttpServer的实现

文章目录

  • 前言
  • 一、请求报文的解析
    • URL的解析
  • 二、响应报文的发送
    • Content-Lenth
    • Conten-Type
    • Cookie和Set-Cookie
      • Cookie的风险
  • 三、尝试发送一个HTML网页
    • 404网页
    • Location 重定向
  • 四、浏览器的多次请求行为
  • 总结


前言

之前我们简单理解了一下Http协议,本章我们将在LInux下使用Socket编程自主完成一个HttpServer。 可以做到接收Http报文数据,加以解析再向远端发送Http报文数据。


之前写过很多遍的网络套接字编程代码就不再重复写了,这里直接写关于HttpServer的代码

一、请求报文的解析

上一章我们讲了,请求报文主要分为 请求行,请求报头,请求正文。
在这里插入图片描述
所以,我们就需要来解析我们收到的报文数据。

class HttpRequest
{
public:
    HttpRequest()
    {
    }

    bool Deserialize(std::string &request)
    {
        size_t pos = request.find(sep);
        if (pos == std::string::npos)
        {
            // 不完整报文
            lg(Warning, "Recv Incomplete Request...");
            return false;
        }
        _request_line = request.substr(0, pos);
        request.erase(0, pos + sep.size());

        std::string tmp;
        while (true)
        {
            pos = request.find(sep);
            if (pos == std::string::npos)
            {
                break;
            }
            tmp = request.substr(0, pos);
            if (tmp.empty())
            {
                // 说明已经截到空行
                break;
            }
            _request_header.push_back(tmp);
            request.erase(0, pos + sep.size());
        }
        request.erase(0, sep.size());
        _content = request;
        return true;
    }

    bool Parse()
    {
        std::string tmp = _request_line;
        int pos = tmp.find(blank);
        if (pos == std::string::npos)
        {
            // 解析的请求行存在问题
            return false;
        }
        _function = tmp.substr(0, pos);
        tmp.erase(0, pos + blank.size());

        pos = tmp.find(blank);
        if (pos == std::string::npos)
        {
            // 解析的请求行存在问题
            return false;
        }
        std::string url_tmp = tmp.substr(0, pos);
        if (url_tmp == "/")
        {
            _url = homepage;
        }
        else
        {
            _url = fileroot;
            _url += url_tmp;
        }

        tmp.erase(0, pos + blank.size());


        _http_version = tmp;
        return true;
    }


public:
    std::string _request_line;
    std::vector<std::string> _request_header;
    std::string _content;
    std::string _function;
    std::string _url;
    std::string _http_version;
	
	bool _isFound = true; //判断是否存在访问资源
};

上面通过的request成员函数,可以讲一份完整的报文全部解析下来。

URL的解析

上章我们讲过,URL的作用是为了找到该服务器上唯一的资源,那么我们就需要对URL再进行解释,才能正确找到想要请求的文件。

一般来讲我们的,我们在网址上的URL其实是在服务器的工作目录中的查找的,当然,如果你想访问其他目录的文件,只需要自己稍作解析即可,我们仅谈论大多数情况。
所以,为了可以更好的控制访问资源,我们就可以在服务器工作目录创建一个web根目录,将所有需要用到的其他资源分类放进去。
在这里插入图片描述
就比如说这里,我们创建了一个名为webroot的根目录。
在这里插入图片描述
再在服务器内部代码定义根目录路径,后续只需要直接在后面添加我们解析后的URL字符串就可以实现精准访问唯一一份资源了。

std::string ReadFileData(const std::string &filepath)
{
    std::ifstream in(filepath, std::ios::binary);
    if (!in.is_open())
    {
        // 文件打开失败,返回一个空串
        lg(Warning, "File Open Failed...");
        return "";
    }
    // 将文件流指针移动到文件结尾
    in.seekg(0, std::ios_base::end);
    auto len = in.tellg();
    // 重新将文件流指针移动到文件开头
    in.seekg(0, std::ios_base::beg);

    std::string content;
    content.resize(len);

    in.read((char *)content.c_str(), content.size());

    return content;
}

因为我们有时候会读取一个二进制文件,例如png,jpg格式的图片,所以我们这里采用二进制读取的方式打开文件。

最后返回的content就是文件的全部数据。

二、响应报文的发送

在上章我们也讲过相应报头是由 状态行,响应报头,正文组成。
在这里插入图片描述
所以,我们要遵循http协议,就必须要遵守http协议的响应报头发送格式来发送数据。

    std::string Encode(const std::string &content, const HttpRequest &hr)
    {
        std::string mes;
        if (hr._isFound)
        {
            mes += "HTTP/1.0 200 OK\r\n";
        }
        else
        {
            mes += "HTTP/1.0 404 NotFound\r\n";
        }
        mes += "Content-Lenth: ";
        mes += std::to_string(hr._content.size());
        mes += sep;

        mes += "Content-Type: ";
        mes += SuffixtoType(hr._suffix);
        mes += sep;

        mes += "Set-Cookie: ";
        mes += hr._content;
        mes += sep;

        mes += sep; // 空行

        mes += content;
        return mes;
    }

该Encode函数就帮我们格式化了一个还算完整的响应报文。

Content-Lenth

Content-Lenth 作为响应报头很重要的一部分,它标识了响应报文中正文的字符长度,浏览器也会去解析Content-Lenth来读取正文部分。

Conten-Type

Conten-Type 作为相应报头很重要的一部分,它标识了响应报文中正文数据是一个怎样的类型,是一个html格式的网页?是一个png格式的图片…

并且http协议对于不同后缀的文件都有一个标识字符串,如下例
在这里插入图片描述

Cookie和Set-Cookie

当我们的响应报头携带了Set-Cookie: xxxxxxxxxx 数据后,并被浏览器读取到了,浏览器就会生成一个Cookie文件,里面存放你的Cookie信息。以后你再去访问该域的网页,浏览器就会自动在请求报头携带上你的Cooke: xxxxxxxxxx。

这就是为什么我们在登录一些视频网站之后,只需要登陆一次,下次登录就不需要我再输入账号密码了。这就是因为浏览器保存了你的Cookie登录信息。

Cookie的风险

这种便利的功能也一般会带来风险,如果有黑客入侵你的计算机,获取了你的Cookie信息,将你的Cookie信息粘贴到黑客他自己的浏览器中,他就能以你的身份浏览网站。

为了降低风险,许多互联网公司采用的都是session ID的方式来作为Cookie内容保存,将你的私人信息保存到远端,这样即使黑客获取你的Cookie信息,也没办法获取到你的隐私信息。

虽然如今的互联网已经十分成熟,已经有了很多的安全策略,但是还是有可能通过非法获取你的Cookie信息来冒用你的身份。

降低此类情况的发生我们就需要做到:不随便点陌生网址并输入你的账号密码; 在不常用的计算机记得删除你的Cookie信息; 收到异常登录的邮件即使修改账号密码。

三、尝试发送一个HTML网页

通过URL,我们已经可以准确访问到服务器的一个资源,现在我们在这份资源上随便写一份简单的HTML代码

在这里插入图片描述
在这里,我们先打开我们的服务器,绑定好自己的端口号。
在这里插入图片描述
我上面那朵花的文件位于服务器的web根目录下的/html/first_page.html位置。
在这里插入图片描述
我们的浏览器是成功的获取到了/html/first_page.html的内容,也识别解析了html。


再从我们的抓包软件来看
在这里插入图片描述
我们可以看到浏览器收到的响应报文的正文正是我们的first_page.html原封不动的内容。

404网页

在这里插入图片描述
http的响应报文中的状态码是有规定的,像我们刚刚成功发送了一个完整的响应报文,我这里设置的状态码就是200 ,描述就是OK。

而对于我们经常看到的404,其实代表的就是没有找到你想要访问的那份资源,即你所访问的资源不存在。

这里我也是自己写一一个简单的404网页,大家可以来看看效果。
在这里插入图片描述
抓包到的响应报文
在这里插入图片描述

Location 重定向

Location在http协议当中是作为一个重定向的报头数据,后面携带上一个网址,即可直接重定向到另一个网址去。

不过需要注意的是,Location还必须配合状态码,需要状态码为3xx,我们这里采用临时重定向,所以就使用的302状态码。

在这里插入图片描述

那么我们是否会直接跳转到bilibili的主页去呢?
在这里插入图片描述
从结果来看我们是直接跳转到了b站的。

四、浏览器的多次请求行为

一般我们访问像百度,淘宝这些大网页,里面的内容是形形色色的,包含各种图片视频。 而对于现在的我们来看来,这些无非都是文件,是保存在服务器的web根目录下的文件。

那么,像这种大网站内容极其丰富,我们仅仅通过一次请求和响应可以将所有的资源全部获取吗?

答案肯定是不能的,因为图片是文件,视频是文件,html网页也是文件,而html语言作为前端网页开发语言,就可以与浏览器进行“联动”。

在这里插入图片描述
例如href标签可以让我们的网页进行跳转,跳转就需要再次对我们的服务器发起二次请求。

在这里插入图片描述
img标签可以添加图片,而浏览器识别到 src,也需要再次发起请求来获取图片。

在这里插入图片描述
在这里插入图片描述
最后对于favicon.ico的请求是网站图标的获取。
这里就可以看出,我访问一次带有图片的网页,它是给我们提交了不仅仅一次的请求的。


总结

本章学习了如何搭建一个建议的httpServer,并通过浏览器进行访问。

下一章我们将学习https协议。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/709951.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Unity OpenCVForUnity 安装和第一个案例详解 <一>

目录 一、资源简介 二、安装使用 1.下载案例Demo 2.移动StreamingAssets文件夹 3.添加场景 三、今日案例 1.案例Texture2DToMat Example 2.什么是Mat&#xff1f; 3.如何把Texture2D变成Mat &#xff08;1&#xff09;.初始化Mat &#xff08;2&#xff09;.Cv_…

OpenAI函数调用:使用Assistants API函数工具的一个示例

Are you looking to expand GPTs capabilities? Check out this tutorial for a complete example of an AI Assistant that can send emails whenever we ask it to. 您是否希望扩展GPT的功能&#xff1f;查看这个教程&#xff0c;它提供了一个完整的示例&#xff0c;展示了…

Docker中部署Jenkins+Pipline流水线基础语法入门

场景 DockerCompose中部署Jenkins&#xff08;Docker Desktop在windows上数据卷映射&#xff09;&#xff1a; DockerCompose中部署Jenkins&#xff08;Docker Desktop在windows上数据卷映射&#xff09;-CSDN博客 DockerComposeJenkinsPipeline流水线打包SpringBoot项目(解…

AlmaLinux 8.10 x86_64 OVF (sysin) - VMware 虚拟机模板

AlmaLinux 8.10 x86_64 OVF (sysin) - VMware 虚拟机模板 AlmaLinux release 8.10 请访问原文链接&#xff1a;https://sysin.org/blog/almalinux-8-ovf/&#xff0c;查看最新版。原创作品&#xff0c;转载请保留出处。 作者主页&#xff1a;sysin.org 2023.03.08 更新&…

EasyExcel:如何快速生成一个只含有表头的模板Excel

&#x1f341; 作者&#xff1a;知识浅谈&#xff0c;CSDN签约讲师&#xff0c;CSDN博客专家&#xff0c;华为云云享专家&#xff0c;阿里云专家博主 &#x1f4cc; 擅长领域&#xff1a;全栈工程师、爬虫、ACM算法&#xff0c;大数据&#xff0c;深度学习 &#x1f492; 公众号…

PAT B1016. 部分A+B

题目描述 正整数A的“D(为1位整数&#xff09;部分”定义为由A中所有DA组成的新整数Px。例如:给定A3862767,DA6&#xff0c;则A的“6部分”PA是66,因为A中有2个6。 现给定A、D、B、DB,请编写程序计算PAPB。 输入格式 在一行中依次输入A、DA、B、DB&#xff0c;中间以空格分隔,…

秋招突击——6/14——复习{(树形DP)树的最长路径}——新作{非递归求二叉树的深度、重复区间合并}

文章目录 引言复习树形DP——树的最长路径 新作使用dfs非递归计算二叉树的深度多个区间合并删除问题实现思路实现代码参考思路 总结 引言 这两天可能有点波动&#xff0c;但是算法题还是尽量保证复习和新作一块弄&#xff0c;数量上可能有所差别。 复习 树形DP——树的最长路…

弹幕逆向signature、a_bogus

声明 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01; 本文章未经许可禁止转载&a…

qmt量化交易策略小白学习笔记第32期【qmt编程之获取行业概念数据--如何获取迅投行业成分股数据】

qmt编程之获取迅投行业成分股数据 qmt更加详细的教程方法&#xff0c;会持续慢慢梳理。 也可找寻博主的历史文章&#xff0c;搜索关键词查看解决方案 &#xff01; 感谢关注&#xff0c;咨询免费开通量化回测与获取实盘权限&#xff0c;欢迎和博主联系&#xff01; 获取迅投…

LeetCode | 387.字符串中的第一个唯一字符

这道题可以用字典解决&#xff0c;只需要2次遍历字符串&#xff0c;第一次遍历字符串&#xff0c;记录每个字符出现的次数&#xff0c;第二次返回第一个出现次数为1的字符的下标&#xff0c;若找不到则返回-1 class Solution(object):def firstUniqChar(self, s):""…

[大模型]Qwen2-7B-Instruct 接入 LangChain 搭建知识库助手

环境准备 在 autodl 平台中租赁一个 3090 等 24G 显存的显卡机器&#xff0c;如下图所示镜像选择 PyTorch–>2.1.0–>3.10(ubuntu20.04)–>12.1 接下来打开刚刚租用服务器的 JupyterLab&#xff0c;并且打开其中的终端开始环境配置、模型下载和运行 demo。 pip 换源…

2024 年最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)

OpenAi 环境安装 首先确保您的计算机上已经安装了 Python。您可以从 Python 官方网站下载并安装最新版本 Python。安装时&#xff0c;请确保勾选 “Add Python to PATH” &#xff08;添加环境变量&#xff09;选项&#xff0c;以便在 cmd 命令行中直接使用 Python。 安装 Op…

window上搭建open DHCP server踩坑记录

参考类似的安装说明 window10上搭建open DHCP server_opendhcpserver-CSDN博客 到安装目录里面 OpenDHCPServer.ini 这个是配置文件。 http://127.0.0.1:6789/ 是访问地址&#xff0c;这个地址只是显示结果&#xff0c;不能配置。 需要注意的是&#xff1a;必须要有一个静…

DockerHub无法访问,国内镜像拉取迂回解决方案

无法访问后&#xff0c;主要存在以下几个问题&#xff1a; 无法进行镜像的搜索无法查看镜像相关的使用说明无法直接拉取镜像 对于第二点&#xff0c;目前没啥解决思路&#xff0c;主要针对第一点和第三点。 解决无法搜索镜像 目前仅可以解决部分问题&#xff0c;在知道镜像名…

读AI新生:破解人机共存密码笔记01以史为鉴

1. 科学突破是很难预测的 1.1. 20世纪初&#xff0c;也许没有哪位核物理学家比质子的发现者、“分裂原子的人”欧内斯特卢瑟福&#xff3b;Ernest Rutherford&#xff3d;更为杰出 1.1.1. 卢瑟福早就意识到原子核储存了巨大的能量&#xff0c;然而&#xff0c;主流观点认为开…

Redis和Docker

Redis 和 Docker 是两种不同的技术&#xff0c;它们各自解决不同的问题&#xff0c;但有时会一起使用以提供更高效和灵活的解决方案。 Redis 是一个开源的内存数据结构存储系统&#xff0c;可以用作数据库、缓存和消息代理。它设计为解决MySQL等关系型数据库在处理大量读写访问…

针对k8s集群已经加入集群的服务器进行驱逐

例如k8s 已经有很多服务器&#xff0c;现在由于服务器资源过剩&#xff0c;需要剥离一些服务器出来 查找节点名称&#xff1a; kubectl get nodes设置为不可调度&#xff1a; kubectl cordon k8s-node13恢复可调度 kubectl uncordon k8s-node13在驱逐之前先把需要剥离驱逐的节…

[Java基本语法] 数组及其应用

&#x1f338;个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 &#x1f3f5;️热门专栏:&#x1f355; Collection与数据结构 (92平均质量分)https://blog.csdn.net/2301_80050796/category_12621348.html?spm1001.2014.3001.5482 &#x1f9c0;线程与…

AI绘画入门教程(非常详细)从零基础入门到精通Midjourney提示词,咒语

Microorganisms infiltrating through brain-machine interfaces --v 6.0 Microorganisms infiltrating through brain-machine interfaces ,redpupil --v 6.0 Microorganisms infiltrating through brain-machine interfaces,billion girls dream --v 6.0 --niji 6 “动漫风”…

【Redis】String的常用命令及图解String使用场景

本文将详细介绍 Redis String 类型的常见命令及其使用场景&#xff0c;包括缓存、计数器、共享会话、手机验证码、分布式锁等场景&#xff0c;并且配图和伪代码进一步方便理解和使用。 命令执行效果时间复杂度set key value [key value…]设置key的值是valueO(k),k是键个数get…