http服务器的实现和性能测试

http服务器的实现

本文使用上一篇博文实现的epoll+reactor百万并发的服务器实现了一个使用http协议和WebSocket协议的WebServer。

完整代码请看我的github项目

1. 水平触发(Level Trigger)与边沿触发(Edge Trigger)

1.1 水平触发

水平触发是一种状态驱动机制。当文件描述符(如套接字)处于可读或可写状态时,内核会持续通知应用程序,直到应用程序处理完所有数据或资源。

优点

  • 容易编写,通常可以简单处理,因为内核会持续通知应用程序事件。

  • 不容易丢失事件通知。

缺点

  • 对于高并发场景,水平触发可能会造成不必要的系统调用。因为即使数据或资源已经读取过,内核还是会通知文件描述符仍然处于可读/可写状态。

使用场景

  • 典型的阻塞式 I/O 使用水平触发较为合适。
  • 适用于那些可以容忍一定的事件重复通知的应用程序。
1.2 边沿触发

边沿触发是一种状态变化驱动机制。只有当文件描述符的状态从不可读/不可写到可读/可写时,内核才会通知应用程序。ET 只在状态变化的那一刻通知,不会持续通知。

优点

  • 触发次数更少,减少了系统调用开销,适合高性能、高并发场景。

缺点

  • 容易出现遗漏事件的情况。应用程序需要一次性读取或写入尽可能多的数据,以确保没有遗漏。
  • 实现更为复杂。

使用场景

  • 非阻塞IO通常配合边沿触发使用,以避免阻塞和提高性能。
  • 边沿触发适用于高并发、追求性能的场景。
  • 如果数据包大小变化较大,适合使用边沿触发。

2. httpserver

2.1 调整内核tcp缓冲区大小

在这里插入图片描述

如果文件块太大,而用户层buffer太小或者内核tcp缓冲区太小,会导致需要多次发送,从而导致发送速度变慢。

可以尝试扩大TCP缓冲区,在/etc/sysctl.conf中设置

net.ipv4.tcp_wmem = 8192 8192 16384
net.ipv4.tcp_rmem = 8192 8192 16384
2.2 IO层和协议层

IO层包含负责管理IO事件的epoll和进行事件处理的reactor。

协议层就是实现http请求处理和发送http响应的函数。

2.3 使用状态机保存连接状态信息

可以在连接中保存一个status字段,表示当前连接的状态,当status为0,表示还没有发送任何信息,为1表示已经发送了头部,正在发送文件块,为2表示已经全部发送完毕。

显然我们需要在status为1时,将整个文件分块发送,因此就需要保存该文件描述符的上下文信息。

2.4 分块发送大文件,保存被发送文件的上下文信息

大文件传输中显然不能一次性把整个文件读出,然后写入用户缓冲区,再写入内核缓冲区。我们需要把文件分块,利用水平触发分多次写入,这样就绪要在connection中保存当前文件描述符,在status为0时打开文件,在status为2时关闭文件。

2.5 可选择使用sendfile函数减少内存复制

senfile函数可以在两个文件描述符之间直接传输数据,数据流不需要经过用户空间。它利用mmap指令直接将文件内容读取到系统缓冲区,因此性能更好。

缺点是,由于不经过用户空间,无法对文件分块发送,在阻塞IO模式下发送大文件可能长时间陷入阻塞。在非阻塞IO模式下,尽管不会陷入阻塞,但会可能导致其他连接饥饿。

2.6 性能测试qps

wrk是一款针对 Http 协议的基准测试工具,它能够在单机多核 CPU 的条件下,使用系统自带的高性能 I/O 机制,如 epoll,kqueue 等,通过多线程和事件模式,对目标机器产生大量的负载。

下载wrk。

这篇文章详细介绍了如何安装和使用wrk进行性能测试。

特点

  • 轻量级,简单易用
  • 只用于单机压测

测试结果:

  1. 对于每个http请求都返回一个738KB大小的图片,测试结果如下:
(base) fyli@a431:~/programs/sockets/course1 network_programs$ wrk -t12 -c400 -d30s http://localhost:2000
Running 30s test @ http://localhost:2000
  12 threads and 400 connections
  Thread Stats   Avg      Stdev     Max   +/- Stdev
    Latency    17.69ms   14.40ms   1.68s    99.92%
    Req/Sec   143.45    153.46   600.00     83.31%
  25494 requests in 30.10s, 17.80GB read
  Socket errors: connect 0, read 25499, write 0, timeout 1
Requests/sec:    847.08
Transfer/sec:    605.61MB

可以看到qps是847.08

  1. 对于每个http请求都返回一个600+字节的html文件,测试结果如下:
(base) fyli@a431:~/programs/sockets/course1 network_programs$ wrk -c400 -t12 -d30 http://localhost:2000
Running 30s test @ http://localhost:2000
  12 threads and 400 connections
  Thread Stats   Avg      Stdev     Max   +/- Stdev
    Latency     2.72ms   33.82ms   1.79s    99.38%
    Req/Sec     1.62k     1.02k    6.07k    72.66%
  461290 requests in 30.09s, 318.94MB read
  Socket errors: connect 0, read 461294, write 0, timeout 21
Requests/sec:  15327.85
Transfer/sec:     10.60MB

可以看到因为数据传输量变少,qps上升到了15327

2.7 代码实现

这里只展现了协议层和业务层的代码,IO层和事件回调的底层代码请看完整项目reactor.c。

webserver.h

#pragma once

#include <stdio.h>

#define BUFFER_LENGTH 819200
#define CONNECTION_LENGTH 256
#define READY_LENFTH 1024
#define PORT_NUM 2

typedef int (*RCallBack)(int fd);

struct Conn
{
    int fd;
    char rbuffer[BUFFER_LENGTH];
    char wbuffer[BUFFER_LENGTH];
    int rlength;
    int wlength;
    RCallBack send_callback;
    RCallBack recv_callback;
    int status;
    int file_fd;
};

int http_request(struct Conn *);
int http_response(struct Conn *);

int set_event(int fd, int event, int flag);

void error_handling(const char *message);

void log_error(const char *message);

webserver.c

#include <fcntl.h>
#include <unistd.h>
#include <sys/epoll.h>
#include <sys/stat.h>
#include <sys/types.h>

#include "webserver.h"

int http_request(struct Conn *conn)
{
    set_event(conn->fd, EPOLLOUT, EPOLL_CTL_MOD);
    conn->status = 0;
    conn->wlength = 0;
    return 0;
}

int http_response(struct Conn *conn)
{
    const char *file = "pic.png";
    int file_fd;
    if (conn->status == 0)
    {
        file_fd = open(file, O_RDONLY);
        if (file_fd == -1)
        {
            log_error("open() fails");
            return 1;
        }
        conn->file_fd = file_fd;
    }
    else
    {
        file_fd = conn->file_fd;
    }

    if (conn->status == 0)
    {
        struct stat filestat = {0};
        fstat(file_fd, &filestat);
        int sended = snprintf(conn->wbuffer, BUFFER_LENGTH,
            "HTTP/1.1 200 OK\r\n"
            "Content-Type: image/png\r\n"
            "Accept-Ranges: bytes\r\n"
            "Content-Length: %ld\r\n\r\n",
            filestat.st_size);
        conn->wlength = sended;
        conn->status = 1;
    }
    else if (conn->status == 1)
    {
        ssize_t recved = read(file_fd, conn->wbuffer, BUFFER_LENGTH);
        if (recved == 0)
        {
            close(file_fd);
            conn->status = 2;
        }
        if (recved < 0)
        {
            close(file_fd);
            log_error("read() fails");
            conn->status = 2;
        }
        conn->wlength = recved;
    }
    return 0;
}

3. 可能出现的问题及解决

  1. connection reset

    recv()函数可能由于对端reset连接而返回-1,这是正常现象,关闭对应的fd即可。

  2. 服务器程序在客户端关闭后直接退出

    可能是由于服务器程序向已经被关闭的socket写数据时会接收到一个SIGPIPE,默认情况下没有设置该信号的处理函数的话,就会导致该进程直接被kill。

    • 可以设置忽略该信号。
    signal(SIGPIPE, SIG_IGN);
    
    • 也可以自定义信号处理函数
    struct sigaction sa;
    sa.sa_handler = handle_sigpipe;
    sigemptyset(&sa.sa_mask);
    sa.sa_flags = 0;
    
    sigaction(SIGPIPE, &sa, NULL);  // 设置信号处理程序
    
    • 也可以在send函数参数中设置不发出信号
    send(fd, buffer, length, MSG_NOSIGNAL);
    

学习参考

学习更多请前往零声github。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/897492.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【学习AI-相关路程-mnist手写数字分类-python-硬件:jetson orin NX-自我学习AI-基础知识铺垫-遇到问题(1) 】

【学习AI-相关路程-mnist手写数字分类-python-硬件&#xff1a;jetson orin NX-自我学习AI-基础知识铺垫-遇到问题&#xff08;1&#xff09; 】 1、前言2、先行了解&#xff08;1&#xff09;学习基础知识-了解jetson orin nx 设备&#xff08;2&#xff09;学习python&AI…

AUTOSAR_EXP_ARAComAPI的6章笔记(2)

☞返回总目录 相关总结&#xff1a;AutoSar AP CM实例说明符的使用方法总结 6.2 实例说明符的使用方法 一、InstanceSpecifier 的概念 InstanceSpecifier 是在 [3] 中定义的一个核心概念&#xff0c;它由符合特定模型元素绝对路径的模型元素 shortName 组成&#xff0c;表现…

自定义中文排序在Java中的实现与注意事项

目录 前言1. 基本知识2. 实战 前言 #1024程序员节 | 征文# 对于Java的基本知识推荐阅读&#xff1a; java框架 零基础从入门到精通的学习路线 附开源项目面经等&#xff08;超全&#xff09;【Java项目】实战CRUD的功能整理&#xff08;持续更新&#xff09; 原先的Java中文…

Ubuntu(22.04)本地部署Appsmith

Ubuntu&#xff08;22.04&#xff09;安装Appsmith 简要介绍 Appsmith 是一个开源的低代码开发平台&#xff0c;旨在帮助开发者和非开发者快速构建定制化的内部应用程序和管理工具。通过直观的拖拽界面和丰富的预配置组件&#xff0c;Appsmith 让用户无需编写大量代码即可创建…

【C++】string类(2)

&#x1f973;个人主页: 起名字真南 &#x1f973;个人专栏:【数据结构初阶】 【C语言】 【C】 目录 引言1 模拟实现string类基本框架2 实现string类中的主要成员函数2.1 Push_Back 函数2.2 reserve 函数2.3 append 函数2.4 c_str 函数2.5 begin ,end 函数2.5 operator 函数2.6…

IDEA开发工具使用技巧积累

一、IDEA 工具设置默认使用maven的settings.xml文件 第一步&#xff1a;打开idea工具&#xff0c;选中 File ——> New Projects Setup ——> Settings for New Projects 第二步&#xff1a;先设置下自动构建项目这个选项 第三步&#xff1a;选中 Build Tools ——>…

word删除空白页 | 亲测有效

想要删掉word里面的末尾空白页&#xff0c;但是按了delete之后也没有用 找了很久找到了以下亲测有效的方法 1. 通过鼠标右键在要删除的空白页面处显示段落标记 2. 在字号输入01&#xff0c;按ENTER&#xff08;回车键&#xff09; 3.成功删除了&#xff01;&#xff01; PS…

Selenium爬虫技术:如何模拟鼠标悬停抓取动态内容

介绍 在当今数据驱动的世界中&#xff0c;抓取动态网页内容变得越来越重要&#xff0c;尤其是像抖音这样的社交平台&#xff0c;动态加载的评论等内容需要通过特定的方式来获取。传统的静态爬虫方法难以处理这些由JavaScript生成的动态内容&#xff0c;Selenium爬虫技术则是一…

基于SSM大学校医院信息管理系统的设计

管理员账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;校医管理&#xff0c;用户管理&#xff0c;在线问诊管理&#xff0c;线上挂号管理&#xff0c;病例记录管理&#xff0c;系统管理 校医账号功能包括&#xff1a;系统首页&#xff0c;个人中心&#xf…

用Java爬虫API,轻松获取taobao商品SKU信息

在电子商务的世界里&#xff0c;SKU&#xff08;Stock Keeping Unit&#xff0c;库存单位&#xff09;是商品管理的基础。对于商家来说&#xff0c;SKU的详细信息对于库存管理、价格策略制定、市场分析等都有着重要作用。taobao作为中国最大的电子商务平台之一&#xff0c;提供…

uniapp 微信小程序分包操作

1. 在项目根目录创建一个新的目录&#xff0c;名称为分包名称 2. 打开manifest.json&#xff0c;选择源码视图&#xff0c;加入以下代码 "optimization" : {"subPackages" : true } 3. 在pages.json中&#xff0c;pages后面添加分包代码 "subPackag…

Linux基础命令(入门)

linux 用户 root 用户 一个特殊的管理帐户 也被称为超级用户 root已接近完整的系统控制 对系统损害几乎有无限的能力 除非必要,不要登录为 root 普通&#xff08; 非特权 &#xff09; 用户权限有限 造成损害的能力比较有限 linux的哲学思想&#xff08;优点&#xf…

【Canvas与图标】制作电脑桌面图标

【成图】 制成的三种图标&#xff0c;都是120*120的。 制作时观察的大图 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>desk…

操作系统学习笔记2.1进程与线程

文章目录 概念 组成 特征状态与转换进程控制1. 进程的状态2. 进程控制块&#xff08;PCB&#xff09;3. 进程的创建与终止进程的创建进程的终止 4. 进程调度5. 进程间通信&#xff08;IPC&#xff09;6. 上下文切换 进程通信1. **管道&#xff08;Pipes&#xff09;**2. **信号…

C++ | Leetcode C++题解之第502题IPO

题目&#xff1a; 题解&#xff1a; typedef pair<int,int> pii;class Solution { public:int findMaximizedCapital(int k, int w, vector<int>& profits, vector<int>& capital) {int n profits.size();int curr 0;priority_queue<int, vect…

Prometheus 告警

github alertmanager 文档 Prometheus Alerting rules Prometheus alerting configuration 前几篇文章讲了Prometheus的监控&#xff0c;这一篇文章&#xff0c;讲通过监控指标触发告警 常用的告警方式有发邮件、调用指定接口(webhook) 等。本文讲解webhook方式&#xff0c;完…

ARL 灯塔 | ARL 灯塔 — 字典替换

关注这个工具的其它相关内容&#xff1a;自动化信息收集工具 —— ARL 灯塔使用手册 - CSDN 博客 0x01&#xff1a;ARL 字典替换 —— 理论篇 ARL&#xff08;Asset Reconnaissance Lighthouse&#xff09;在进行目标域名探测时&#xff0c;依赖的是其内置的默认字典集。然而在…

从零开始:Python与Jupyter Notebook中的数据可视化之旅

目录 **理解数据与数据可视化的基本流程****了解Python与其他可视化工具****掌握Anaconda、Jupyter Notebook的常用操作方法****原理** 环境配置1. **安装Anaconda软件&#xff0c;创建实验环境**2. **安装Jupyter Notebook**3. **创建第一个Jupyter Notebook文本**&#xff08…

nnUnet 大模型学习笔记(续):训练网络(3d_fullres)以及数据集标签的处理

目录 1. 数据集处理 1.1 实现脚本 1.2 json文件 2. 设置读取路径 2.1 设置路径 2.2 数据集转换 2.3 数据集预处理 2.4 训练&#xff08;3d_fullres) 3. 训练结果展示 关于nnUnet 数据集的处理和环境搭建&#xff0c;参考上文&#xff1a;第四章&#xff1a;nnUnet大模…

94、Python之异常:自定义异常以满足业务个性化需求

引言 前面介绍了Python中内置的异常类的继承体系&#xff0c;通常来说&#xff0c;这些异常类已经能够满足各种异常的场景需要。但是&#xff0c;有时还是需要自定义异常&#xff0c;来满足一些个性化的需求&#xff0c;以及更加可控、精细化的异常管理。 本文就来介绍一下如…