大数据性能测试怎么做?看完这篇终于懂了!

 

大数据性能测试的目的

1.大数据组件的性能回归,在版本升级的时候,进行新旧版本的性能比对。

2.在新版本/新的生产环境发布之后获取性能基线,建立可度量的参考标准,为其他测试场景或者调优过程提供对比参考。

3.在众多的发行版本中进行测试比对,为PoC测试提供参考数据。

4.支持POC测试,得出结论,到时候可以根据业务模型和需求,或者根据客户需求选择不同的方案。

5.在客户方进行性能测试,达到客户要求的性能标准满足客户使用的需求。

性能测试的时机

  • 上线新版本

  • 上线新的环境/新的主机

  • 开辟了新的区域

  • PoC 测试

  • 性能专项测试

性能测试的步骤

明确测试的目标

确定性能测试场景,集群规模和规格,数据量,数据格式,压缩算法等。

比如:

  • 版本迭代测试,需要和历史版本集群规格和参数对齐,以便比较版本性能是否劣化;

  • Poc测试需要明确客户场景;

  • 软件发行商测试,需要与发行商集群规模保持一致。

申请主机环境和测试周期

搭建运行环境和监控

获取的性能指标,部分包含:性能数据,比如带宽、磁盘IO、CPU、内存等指标。

开展测试

测试过程中使用nmon或者其他系统监控的工具记录系统指标变化,以供发现系统瓶颈,利于后续调优。

针对性能结果进行调整优化

进行迭代性能测试。

出具性能测试报告

大数据组件测试工具和方法

图片

除了上述主流的大数据主键外还有Hbase等,除了主流的测试工具Hibench之外还有雅虎的大数据测试套件。

大数据性能调优

在大数据领域普遍存在数据倾斜的问题,需要参考对应组件的官方文档以及参考业界的案例介绍。

大数据相关的测试

基准测试

单一用户单个事务的测试,目的是在对选择的用户在无压力的情况下获取系统处理单个请求的情况。

负载测试

通过逐步增加系统的负载,测试系统性能的变化。

稳定性测试

通过给系统加载一定的业务压力,运行7*24 小时,以此检测系统是否稳定运行。

功能测试

特别是在OLAP引擎选择的时候,需要测试其对标准SQL支持的情况,如部门不支持update和delete操作、不支持with语句、不支持except和intersection操作等。

性能需求

CPU、内存、磁盘IO、网络负载使用率不超过80%,响应时间90%的读取、写入、导出、导入不超过3s,有不到10%的响应时间不超过5s。

测试案例

1.在不同数据量(100G、500G 、1T)分别对Hadoop和spark进行读取、数据写入、数据导出 数据导入基准测试。

2.在不同数据量下进行并行和读写混合测试。

3.在不同数据量下进行7*24小时的数据稳定性测试。

测试观察指标

  • CPU 使用率

  • 内存使用率

  • IO

  • 网络

  • 响应时间

  • 其他指标

 

总结:

感谢每一个认真阅读我文章的人!!!

作为一位过来人也是希望大家少走一些弯路,如果你不想再体验一次学习时找不到资料,没人解答问题,坚持几天便放弃的感受的话,在这里我给大家分享一些自动化测试的学习资源,希望能给你前进的路上带来帮助。

软件测试面试文档

我们学习必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有字节大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

 

          视频文档获取方式:
这份文档和视频资料,对于想从事【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴我走过了最艰难的路程,希望也能帮助到你!以上均可以分享,点下方小卡片即可自行领取。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/632668.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【好书推荐-第十六期】《 LangChain技术解密:构建大模型应用的全景指南》(Github 6800+示例!)

😎 作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公众号:洲与AI。 🎈 本文专栏:本文收录…

【Flask 系统教程 6】进阶操作

Flask操作cookie 在 Flask 中操作 Cookie 是相对简单的。Cookie 是一种存储在用户计算机上的小型数据片段,由服务器发送到用户浏览器,然后在每次请求时由浏览器发送回服务器。在 Flask 中,你可以使用 request 对象来读取 cookie,…

【Maven】简介_下载安装

1.maven简介 项目管理工具项目对象模型 project object model (POM) 一个项目:清理、编译、测试、打包、发布、部署 1.1 为什么需要使用maven 组装机和品牌机的概念IDE (集成开发环境)不是万能的依赖大量的手工操作,编译、测试、…

npm install [Error]

npm install 依赖的时候报错 依赖版本问题的冲突,忽视即可 使用 npm install --legacy-peer-deps

个人写表格辅助软件

该软件作用 Excel 的辅助,可以执行excel不方便的操作,从excel复制数据到软件进行操作又复制回Excel。 下载软件地址 ,大小:65kb 点击下载 完整UI 列操作 右键单击列名弹出菜单 单元格操作 右键单击单元格弹出菜单 导航模式 每个操作都可以…

如何给实拍添加旋转模糊效果?视频模糊特效PR模板剪辑素材

PR特效模板,高级旋转模糊效果视频模板剪辑素材。 特征: After Effects 2019及以上兼容项目。 Premiere Pro 2021及以上兼容项目。 可用分辨率(4K–HD–方形–移动)。 不需要插件。 包括教程。 免费下载:https://prmu…

什么是电表智能抄表?

1.什么叫电表智能抄表 电表智能抄表,又被称为全自动读表系统,是一种利用通信网技术,如wifi网络、物联网技术或通信网络,全自动收集解决电能消耗数据信息的软件。与传统手动式抄水表方式相比,它大大提高了高效率&#…

Hadoop大数据应用技术复习题分析

文章目录 复习一一. 单选题二. 多选题三. 填空题 复习三一. 单选题 复习一 一. 单选题 (单选题)压缩速度由大到小snappy、LZO、gzip、bzip2,压缩比最大的是 A. snappy B. LZO C. gzip D. zip2 正确答案: D:zip2; 答案解析: 压缩率:zip2>…

Jenkins使用目录挂载实现自定义node版本

场景:研发同事需要一个指定版本的npm环境,但是现在使用的是docker部署的jenkins,在不新构建jenkins镜像的前提下,选择挂载方式解决。 1.下载nodejs 16版本的nodesource-nodejs.repo仓库脚本 cd /etc/yum.repos.d/ curl -sL http…

【Linux】Udp_Tcp协议

欢迎来到Cefler的博客😁 🕌博客主页:折纸花满衣 🏠个人专栏:Linux 目录 👉🏻再谈端口号pidof命令 👉🏻UDP协议报文的管理基于UDP协议的应用层协议 👉&#x1…

mysql 多表关联执行计划 mysql 多表关联优化

desc SELECT * FROM expense_application a left join expense_application_detail b on a.order_no b.order_no LIMIT 10; 和 explain SELECT * FROM expense_application a left join expense_application_detail b on a.order_no b.order_no LIMIT 10; 这两种写法是一样…

持续拥抱鲲鹏生态 星辰天合深化信创存储能力

近日,鲲鹏昇腾开发者大会与广电五舟“2024 智算中国行”北京站陆续召开,星辰天合持续拥抱鲲鹏生态,以重要的合作伙伴身份受邀参加,并在鲲鹏昇腾开发者大会上荣获“甄选解决方案最佳应用软件奖”,在广电五舟“2024 智算…

C++学习~~string类

1.STL简单介绍 (1)标准模版库,是C里面的标准库的一部分,C标准库里面还有其他的东西,但是我们不经常使用,我们经常使用的还是STL这个标准库部分。 (2)六大件:仿函数&…

Microsoft Threat Modeling Tool 使用(三)

Boundary(边界) 本文介绍信任边界,基于 SDL TM Knowledge Base (Core) 模版,这是一个通用的威胁建模模板,非常适合初学者和大多数威胁建模需求。 这些边界(Boundary)在微软威胁建模工具中用于表…

如何重启Windows系统上的Mysql服务

很久很久之前,我想把我的一台windows笔记本当比服务使用,当时还没有搞wsl, 试了vmware在局域网内总是断连。然后就直接在 windows系统上装了一个 windows版本的Mysql81。 有一天需要修改最大连接数, 费了挺大的劲终于找到了配置文件 my.ini…

在云服务器上运行StyleGAN3生成伪样本

首先是传入数据,这里我们不做赘述。 对于数据格式的裁剪,可以通过以下代码进行: from glob import glob from PIL import Image import os from tqdm import tqdm from tqdm.std import trangeimg_path glob(r"C:\Users\Administrato…

Windows Docker安装运行Nacos

#下载Nacos docker pull nacos/nacos-server #可以创建docker中nacos网络,如果以后要使用docker中的mysql存储nacos配置的话,本文使用本地机器mysql,暂用不到 docker network create nacos_network #暂时先运行docker docker run --nam…

python手写数字识别(PaddlePaddle框架、MNIST数据集)

python手写数字识别(PaddlePaddle框架、MNIST数据集) import paddle import paddle.nn.functional as F from paddle.vision.transforms import Compose, Normalizetransform Compose([Normalize(mean[127.5],std[127.5],data_formatCHW)]) # 使用tran…

农业四情监测站在农业生产中有哪些作用

TH-Q3农业四情监测站是一种先进的农业监测设备,可以对土壤、虫情、气象、苗情、孢子等生产环境状况进行实时动态监控,为农业生产提供全面的数据支持和决策依据。 该监测站通常包括土壤温度、湿度、PH值、电导率等土壤参数传感器,虫情监测仪、…

AI绘图Stable Diffusion,如何无损高清放大图片,保姆级教程建议收藏!

前言 我们在用 stable diffusion 制作AI图片时,默认生成图片的尺寸为512*512,即使是竖图一般也就是512*768,如果再把尺寸设置大一些,就会因为硬件算力不够而造成系统崩溃,今天就来跟大家聊一聊,如何将制作…