Benchmark学习笔记

小记一篇Benchmark的学习笔记

1.什么是benchmark

在维基百科中,是这样子讲的

“As computer architecture advanced, it became more difficult to compare the performance of various computer systems simply by looking at their specifications.Therefore, tests were developed that allowed comparison of different architectures.”

大致意思就是,随着计算机体系结构的进步,我们无法再简简单单的从他们的特性去比较计算机系统的性能,所以就诞生了我们今天的主角  `Benchmark` !!

  • Benchmark : "基准测试" 是一种用于衡量和评估系统性能的方法。在计算机领域,它通常指的是通过运行一系列标准化的测试来评估硬件或软件的性能。基准测试可以帮助人们比较不同系统、不同组件或不同配置之间的性能差异!!!

其实,用自己的话来说就是:

  • 通过相应的工具,手段,对硬件组件 ,软件应用程序如CPU性能、内存带宽、硬盘读写速度等单个组件或整个系统进行测试,并且将多次测量得到的结果用于性能的评估和比较,优化和调整,成为日后产品上市的决策支持等!!

下面,我们就来详细的讲解一下Benchmark的过程!!

2.确认测试的目标

对于每一次测试,我们都要选择对应的目标,这样才便于我们后续的数据分析和对比

如果目标是一个数据库,那么就可以从以下角度出发

  1. 查询性能:就拿mysql为例子,像这种查询遇到数据量大的,可以通过记录查询的执行时间或者查询的吞吐量来评估
  2. 并发连接数 :在现实生活中,我们可能会遇到大量用户同时对数据库进行查询,么我们通过增加并发的数据库连接数,并观察数据库的响应时间和系统资源利用率来评估
  3. 数据插入和更新性能:在sql注入中,有一些服务器会对User_Agent Cookie Refer头进行存储,那么就会用到mysql里面的 update 或者insert,那么,我们就可以观察插入和更新大量数据时的性能表现,包括单条数据的插入/更新性能和批量数据的插入/更新性能

如果他是一个网络服务系统,那么我们就可以从以下角度出发

  1. 响应时间 :用户在对服务其发送请求,然后经过服务器的处理,再返回给用户,这期间需要的时间就是响应时间我们通过记录这些时间,可以评估整个请求-响应周期的性能表现。
  2. 吞吐量:吞吐量可以表示为每秒处理的请求数量或每秒传输的数据量,它反映了系统的处理能力和性能瓶颈。
  3. 并发连接数:我们可以通过一些测试软件,如jmeter等工具,在一瞬间建立多并发连接数量,用来模拟在某一时刻的大量用户涌入的情景,然后通过观察系统的响应时间和资源利用率,可以评估系统的并发性能和资源消耗情况
  4. 稳定性和可靠性 ,在上面建立多并发的基础上我们还可以通过观察系统的稳定性和异常处理能力,可以评估系统在各种条件下的表现

3.选择合理的测试工具

还是拿上面的两个测试目标来举例子

网络服务系统

  1. Apache JMeter:Apache JMeter是一款功能强大的开源性能测试工具,主要用于测试各种类型的网络服务系统,包括Web应用程序、Web服务、数据库服务器等它支持多线程测试、分布式测试、图形化测试结果展示等功能,非常适合进行负载测试和压力测试
  2.   这个工具经常用来压力测试
  3. Gatling:Gatling是一款基于Scala语言开发的现代化性能测试工具,特别适用于高并发场景下的性能测试。它采用基于DSL(领域特定语言)的方式进行测试脚本编写,支持使用Scala语言进行自定义脚本开发,具有良好的可扩展性和灵活性。
  4. Wrk:Wrk是一款简单而强大的HTTP性能测试工具,适用于对HTTP服务进行高并发的压力测试。它采用多线程和非阻塞I/O的方式进行测试,并能够生成详细的测试报告和统计信息。

相信大家都发现了,只要是网络服务系统,压测它的工具一般都多并发,多线程的压力测试工具

                         

数据库

  1. SysBench:SysBench 是一个跨平台的基准测试工具,支持多种数据库系统,包MySQL、PostgreSQL、MariaDB 等。它可以用于测试数据库的性能、并发连接数、事务处理能力
  2. HammerDB:HammerDB 是一个开源的基准测试工具,主要用于测试关系型数据库系统,如 Oracle、SQL Server、DB2 等。它提供了丰富的基准测试场景和工具,可以模拟真实的数据库工作负载并评估数据库的性能表现
  3. Percona Toolkit:Percona Toolkit 是一个由 Percona 公司提供的一套 MySQL 和 MongoDB 管理工具,其中包括一些基准测试工具,如 pt-query-digest、pt-upgrade 等,可以用于评估和优化数据库的性能。

4.准备测试环境

这个也是非常重要的一步,我们需要保测试环境的稳定性和一致性,包括硬件配置、操作系统版本、驱动程序版本等。关闭不必要的后台任务和服务,以确保测试结果的准确性。

5.执行基准测试

当变量都设置好之后,现在开始进行测试。从基准线开始进行测试(已知的起点),并有系统地调整服务器设置。每个测试序列都会有一个结果,记录结果以便以后引用。在这种情况下,一个测试序列可看做是一次硬件设置更改。每应用一次新的设置,都必须重新进行测试并记录结果。一旦有足够的运行周期,工程师应该有一份完整的数据以完成他们的推论。

6.收集测试执行结果

其中包括各种性能指标的数据,如响应时间、吞吐量、并发连接数等。使用工具提供的报告功能或自定义脚本来自动化数据收集过程。

7.分析和比较结果

在这个步骤中,我们需要进行以下步骤

  1. 总体性能评估:首先,对系统的总体性能进行评估。这包括查看各项性能指标的平均值、中位数、标准差等统计数据,以了解系统的整体表现。

  2. 识别性能瓶颈:通过分析测试结果,识别系统性能的瓶颈所在。这可能包括响应时间较长的操作、吞吐量不足的任务、并发连接数过高导致的系统资源耗尽等。通过识别性能瓶颈,可以确定优化的重点和方向。

  3. 比较不同场景下的性能数据:如果进行了多个测试场景的基准测试,需要比较不同场景下的性能数据。这可以帮助确定系统在不同条件下的性能表现,并找出最佳的配置和参数组合。

  4. 对比不同系统或组件的性能:如果进行了多个系统或组件的基准测试,需要对比它们的性能数据。这可以帮助选择最适合自己需求的系统或组件,并确定哪些系统或组件需要进一步优化。

  5. 查找异常数据和趋势:检查测试结果中的异常数据和趋势。这可能包括某些测试任务的性能突然下降或波动、系统资源利用率异常高或异常低等。通过查找异常数据和趋势,可以发现系统中的问题并及时解决。

这个步骤就像计算机取证的分析的重要性一样

通过分析和比较基准测试结果意味着对测试数据进行详细的研究和比较,以便从中获取有用的见解和信息。这个过程的目的是为了理解系统的性能表现,识别潜在的问题或瓶颈,并确定优化的方向。

8.提出优化建议

Benchmark的一个最终的目的,就是提出优化建议

在测试中通常会选择一个或多个基准模型作为比较的标准。这些基准模型可以是已知的、在该任务上表现良好的模型,用来与新的方法进行比较 

当然了,除了需要从网上寻求相应的标准来进行对比以外,我们还需要根绝自身的特殊情况(如服务器的运存等条件)进行综合的测试


分析问题原因:针对性能瓶颈和问题,深入分析其根本原因。这可能涉及到系统的架构设计、代码实现、数据库优化、网络配置等方面的问题。通过分析问题原因,可以确定优化的方向和重点。


9.验证和重复测试 

 你以为做完上面的就完事了吗?? 肯定不是!!!

当我们得到了上面的测试和分析结果之后,我们还要去对这些结果进行进一步测试,因为我们不确定时候改进后的参数是否还会符合要求 理由如下:

  1. 确认优化效果:优化措施的实施并不总是能立即带来明显的改善。通过验证和重复测试,可以确认优化措施的实际效果是否与预期一致这有助于确定哪些优化是有效的,哪些需要进一步改进。

  2. 评估系统稳定性优化措施可能会对系统的稳定性产生影响。通过验证和重复测试,可以评估优化措施对系统稳定性的影响,并及时发现和解决潜在的问题,以确保系统的稳定运行。

  3. 排除误差和变化:基准测试结果可能受到各种因素的影响,如测试环境的变化、测试工具的误差等。通过重复测试,可以排除这些误差和变化的影响,确保测试结果的可靠性和一致性。

  4. 验证优化建议的可行性:重复测试可以验证提出的优化建议的可行性和有效性。如果优化建议在多次测试中都能得到相似的结果,那么说明该建议是可行的,并且对系统性能有实际的改进作用。

  5. 持续改进和优化:系统的性能优化是一个持续改进的过程。通过验证和重复测试,可以不断地评估系统的性能,并根据测试结果进行调整和优化,以满足不断变化的需求和挑战。

10.做出最终的建议

通过与第一次的结果进行对比,选出最优的结果,并且根据以下参考,做出建议

数据库优化

  • 索引优化:评估数据库的索引使用情况,根据查询模式和频率优化索引设计。
  • 查询优化:审查并优化复杂、低效的查询语句,确保查询执行效率高。
  • 表结构优化:评估数据库表结构,合理设计和规划表之间的关系,以及字段的数据类型和长度。
  • 缓存策略优化:考虑使用缓存技术来减轻数据库压力,提高数据访问速度。

网络服务优化

  • 响应时间优化:优化网络服务的响应时间,包括优化代码、减少网络延迟、使用高效的数据传输协议等。
  • 并发处理优化:评估系统的并发处理能力,优化并发处理策略和线程池配置,提高系统的并发处理能力。
  • 负载均衡优化:考虑使用负载均衡技术来平衡服务器负载,确保系统的稳定性和可靠性。

应用程序优化

  • 代码优化:审查并优化应用程序的代码,提高代码的执行效率和性能。
  • 内存管理优化:优化内存使用,包括减少内存泄漏、优化内存分配和释放策略等。
  • 异步处理优化:考虑使用异步处理技术来提高系统的并发处理能力和响应速度。

等等.........

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/425896.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

项目设计:基于Qt和百度AI的车牌识别系统(嵌入式ARM)

基于Qt和百度AI智能云实现的智能车牌识别系统,具体可实现为停车场管理系统、智能计费停车系统…等。 1.系统实现思路及框架 1.1实现思路 要实现一个车牌识别系统,有多种方法,例如用opencv图像算法实现,或用第三方算法接口&#x…

02-设计概述

上一篇:01-导言 本章重点讨论 JNI 中的主要设计问题。本节中的大多数设计问题都与本地方法有关。调用 API 的设计将在第 5 章:调用 API 中介绍。 2.1 JNI 接口函数和指针 本地代码通过调用 JNI 函数来访问 Java 虚拟机功能。JNI 函数可通过接口指针使用…

设计模式(九)模版方法模式

请直接看原文:设计模式(九)模版方法模式_模板方法模式的优缺点-CSDN博客 -------------------------------------------------------------------------------------------------------------------------------- 1.模版方法模式简介 模版方法模式介…

无人机巡检技术方案,无人机智能化巡检在火电厂的应用场景分析

无人机智能化巡检是一种将先进的无人机技术与人工智能、大数据分析等现代信息技术相结合的新型巡检方式,主要用于替代或辅助传统的人工巡检,在多个领域实现高效、精准和安全的巡查工作。 无人机技术在火电厂巡检中的应用: 无人机电力巡航&a…

中科大计网学习记录笔记(十七):拥塞控制原理 | TCP 拥塞控制

前言: 学习视频:中科大郑烇、杨坚全套《计算机网络(自顶向下方法 第7版,James F.Kurose,Keith W.Ross)》课程 该视频是B站非常著名的计网学习视频,但相信很多朋友和我一样在听完前面的部分发现信…

(每日持续更新)jdk api之PipedReader基础、应用、实战

博主18年的互联网软件开发经验,从一名程序员小白逐步成为了一名架构师,我想通过平台将经验分享给大家,因此博主每天会在各个大牛网站点赞量超高的博客等寻找该技术栈的资料结合自己的经验,晚上进行用心精简、整理、总结、定稿&…

多路转接之epoll

常用的三个API: epoll_create(); //例如 int epfd epoll(10);创建一棵有10个结点的红黑树,注意:这个数只是对内核建议的数值,内核参照这个参数去构建epoll_ctrl();//参数2 op可以取值 EPOLL_CTL_ADD/MOD/DELevents:EPOLLIN/…

C++进阶(二) 多态

一、多态的概念 多态的概念:通俗来说,就是多种形态, 具体点就是去完成某个行为,当不同的对象去完成时会 产生出不同的状态。举个栗子:比如买票这个行为,当普通人买票时,是全价买票;学…

Sora:探索大型视觉模型的前世今生、技术内核及未来趋势

Sora,一款由OpenAI在2024年2月推出的创新性文生视频的生成式AI模型,能够依据文字说明,创作出既真实又富有想象力的场景视频,展现了其在模拟现实世界方面的巨大潜能。本文基于公开技术文档和逆向工程分析,全面审视了Sor…

java八股文复习-----2024/03/03

1.接口和抽象类的区别 相似点: (1)接口和抽象类都不能被实例化 (2)实现接口或继承抽象类的普通子类都必须实现这些抽象方法 不同点: (1)抽象类可以包含普通方法和代码块&#x…

work 3/1

1>机械臂 #include <head.h> #define SER_POTR 8899 #define SER_IP "192.168.125.223" int main(int argc, const char *argv[]) {//创建套接字int cfdsocket(AF_INET,SOCK_STREAM,0);if(cfd-1){perror("");return -1;}//链接struct sockaddr_i…

腾讯云4核8G服务器申请费用多少?性能如何?支持几个人?

腾讯云4核8G服务器支持多少人在线访问&#xff1f;支持25人同时访问。实际上程序效率不同支持人数在线人数不同&#xff0c;公网带宽也是影响4核8G服务器并发数的一大因素&#xff0c;假设公网带宽太小&#xff0c;流量直接卡在入口&#xff0c;4核8G配置的CPU内存也会造成计算…

【详识JAVA语言】面向对象程序三大特性之三:多态

多态 多态的概念 多态的概念&#xff1a;通俗来说&#xff0c;就是多种形态&#xff0c;具体点就是去完成某个行为&#xff0c;当不同的对象去完成时会产生出不同的状态。 多态实现条件 在java中要实现多态&#xff0c;必须要满足如下几个条件&#xff0c;缺一不可&#xf…

Sqli-labs靶场第20关详解[Sqli-labs-less-20]自动化注入-SQLmap工具注入

Sqli-labs-Less-20 通过测试发现&#xff0c;在登录界面没有注入点&#xff0c;通过已知账号密码admin&#xff0c;admin进行登录发现&#xff1a; 登录后会有记录 Cookie 值 设想如果在Cookie尝试加上注入语句&#xff08;报错注入&#xff09;&#xff0c;测试是否会执行…

Hololens2开发环境配置及项目生成部署

Hololens2开发环境配置及项目生成部署 Hololens2开发环境配置及项目生成部署一、官方文档及推荐配置说明1.官方文档介绍2.推荐配置及配置说明 二、安装步骤0.现有Visual Stuido和Unity卸载1.Windows SDK安装2.Visual Studio安装3.Unity安装4.MRTK配置 三、初次环境配置1.新建Un…

C++进阶(三) 二叉搜索树

一、二叉搜索树 1.1 二叉搜索树概念 二叉搜索树又称二叉排序树&#xff0c;它或者是一棵空树&#xff0c;或者是具有以下性质的二叉树: 若它的左子树不为空&#xff0c;则左子树上所有节点的值都小于根节点的值若它的右子树不为空&#xff0c;则右子树上所有节点的值都大于根节…

Postman上传文件的操作方法

前言 调用某个接口&#xff0c;测试上传文件功能。一时间不知如何上传文件&#xff0c;本文做个操作记录&#xff0c;期望与你有益。 步骤一、设置Headers key:Content-Type value:multipart/form-data 步骤二、设置Body 选择form-data key:file下拉框选择file类型value&…

2024年【道路运输企业主要负责人】考试报名及道路运输企业主要负责人模拟考试

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 道路运输企业主要负责人考试报名根据新道路运输企业主要负责人考试大纲要求&#xff0c;安全生产模拟考试一点通将道路运输企业主要负责人模拟考试试题进行汇编&#xff0c;组成一套道路运输企业主要负责人全真模拟考…

Mysql学习之各种锁

锁 事务的隔离性由锁来实现 MySQL并发事务访问相同记录 并发事务访问相同记录的情况大致可以分为3种&#xff1a; 读-读的情况 读-读情况&#xff0c;即并发事务相继读取相同的记录。读取操作本身不会对记录由有任何的影响&#xff0c;并不会引起什么问题&#xff0c;所以允许…

【SQL注入】宽字节注入原理讲解

一、addslasehes()转义函数 addslashes() 是 PHP 中用于转义字符串中的特殊字符的函数之一。它会在指定的预定义字符&#xff08;单引号、双引号、反斜线和 NUL 字符&#xff09;前面添加反斜杠&#xff0c;以防止这些字符被误解为代码注入或其他意外操作。 1. 用法 string …