超融合承载 PostgreSQL 数据库和 AI 系统的性能评测|金融行业实践

随着人工智能技术的日渐成熟,不少金融用户也开发了自己的 AI 应用系统,协助实际业务中诸如文字识别、图像转换、信息录入等工作,提升业务效率。不过,AI 应用系统普遍依赖 GPU 提供强大算力,对底层存储的性能也有较高的要求,“选择什么样的 IT 基础设施支持 AI 应用场景”也成为很多用户关心的问题。

近期,某头部资产管理机构计划升级 IT 基础架构,为生产环境投资分析系统数据库(PostgreSQL)和自研人工智能分析系统(以下简称“AI 系统”)提供高性能、高可靠支持,因此测试了 SmartX 超融合对以上两个应用场景的支持能力。

测试结果
  • 投资分析系统 PostgreSQL 数据库场景:3 节点 SmartX 超融合运行投资分析系统,用时相比生产环境物理服务器增加 1 分钟(18.8%),符合用户预期,可满足业务使用需求。

  • AI 系统:通过 GPU 直通功能在 SmartX 超融合中运行 AI 系统,性能明显优于生产环境某公有云平台,多种模型下文件分析用时降低 15%-27%

更多金融行业场景探索与性能评测,欢迎点击下载《金融核心生产业务场景探索》系列电子书。

《金融核心生产业务场景探索》icon-default.png?t=O83Ahttps://mobile.smartx.com/p/756e0

测试背景

该资管用户生产环境投资分析系统以 PostgreSQL 提供数据库服务,运行在单机物理服务器中,由本地磁盘提供存储能力。同时,用户还自行搭建了人工智能分析系统,运行在某公有云环境的云服务器中(每年公有云的投入高达数十万,成本较高)。AI 系统使用的模型包括 whisper(large-v2) 和 cogvlm2(int4),主要用于对音频、PDF 和图片等业务材料进行文字识别和转换,以及后续的数据分析和存档备份,以减少手工录入、提升工作效率。

为了进一步开展 IT 基础设施现代化建设并实现降本增效,以更低的成本投入为以上两个应用场景提供高性能、高可靠、易运维的 IT 基础架构支持,用户测试了 SmartX 超融合对两个应用场景的支持能力,并与生产环境性能表现进行了对比。

环境与配置

投资分析系统 PostgreSQL 数据库场景

为了确保测试虚拟机系统环境与物理服务器系统环境相同,本次测试使用 SmartX 自研 P2V 迁移工具 SMTX CloudMove,将当前运行在物理服务器上的投资分析系统 PostgreSQL 数据库在线迁移至 SmartX 超融合平台的虚拟机中。

硬件配置

软件配置
  • 生产环境物理机操作系统:CentOS 7.9

  • 测试环境超融合软件:SMTX OS 6.0

AI 系统

生产环境中,AI 系统部署在某公有云云主机中。测试环境中,在 SmartX 超融合平台创建一个配置规格相同的虚拟机,通过 GPU 直通功能将 NVIDIA L20 GPU 卡挂载至虚拟机中,部署应用模型后进行测试。欲深入了解 SmartX 超融合 GPU 直通与 vGPU 支持功能,请阅读:GPU 直通 & vGPU:超融合为 GPU 应用场景提供高性能支持。

系统环境

GPU 卡信息 
* 在进行 AI 模型推理如 whisper 和 cogvlm 时,使用更多的是 GPU 内的 Tensor Core 进行 Transformer (whisper)与卷积网络矩阵运算(cogvlm),并非单纯依靠 CUDA Core。因此生产环境与测试环境使用的 GPU 在此次测试项目中综合表现基本持平,测试结果差异主要反映了两个平台虚拟机性能和存储性能的差异。

测试项目 

  • 投资分析系统数据库性能测试:通过测试脚本发起对不同资产产品进行分析的任务,获取每项产品的分析耗时,并与生产环境任务用时进行对比。

  • AI 系统性能测试:分别测试 whisper 模型和 cogvlm 模型下多种文件的分析用时(包含图像、音频和视频),并与生产环境分析用时进行对比。

测试结果

投资分析系统 PostgreSQL 数据库性能测试

测试时,SMTX OS 开启 RDMA,经过多次优化,将虚拟机配置调整为 8vCPU 和 256GB 内存,保持服务器超线程关闭和虚拟机处理器物理透传,并对虚拟机 vCPU 做物理核绑定。测试结果如下图所示。

可以看到, 在 SmartX 超融合中运行投资分析系统 PostgreSQL 数据库,测试总用时比裸金属环境慢 1 分钟左右(18.8%),用户表示结果符合预期,可满足用户的业务使用需求。更重要的是,这一测试结果是基于 8 个虚拟核(vCPU)对比生产环境的 32 个物理核得出的,在硬件资源仅有原环境约 1/8 的情况下(测试环境与原生产环境都使用二代 XEON,CPU 主频相差也仅为 0.1 GHz),实际性能差异只有不到 19%,超融合环境能更好地满足用户更为看重的整体拥有成本(TCO)以及运行效率方面的需求。

另外,我们在测试过程中通过 iostat / top 等工具对超融合节点性能进行持续监控,观察到存储间歇性压力为 30-50MB/s,iowait 持续为 0,内存用量约为 20G 左右,而 CPU 单核负载保持在 99%,因此性能方面的压力主要集中在 CPU 上。

AI 系统性能测试 

whisper 模型测试

cogvlm 模型测试 

可以看到,在两个模型测试中,SmartX 超融合支持 AI 系统进行多种文件分析任务(包括图像、音频、视频),相较生产环境公有云用时缩短了 15%-27%,用户对此性能表现十分满意。

总结

整体而言,SmartX 超融合平台能够为金融用户投资分析系统数据库(PostgreSQL)和人工智能分析系统提供高性能、高可靠的基础架构支持,尤其是在 AI 场景中,SmartX 超融合性能明显优于公有云环境,能更好地满足业务需求。此外,超融合架构简洁、灵活的特点,能够为用户带来更多收益:

  • 灵活扩展:支持最少 3 节点部署,按需扩展,带来媲美公有云的灵活性。

  • 简化运维:超融合架构简单,具备多种运维支持功能,降低运维难度。SMTX CloudMoveSMTX CloudMoveSMTX CloudMove 自研迁移工具支持用户高效、便捷地从物理机、公有云、虚拟化平台迁移至 SMTX OS 集群。

  • 多种 GPU 支持特性:支持 GPU 直通、vGPU 功能,以及 MIG、MPS 等技术,允许用户对 GPU 进行灵活切分。

  • 降本增效:避免高昂的公有云投入,以性价比更高的超融合平台提供更强大的性能支持。SmartX 超融合也支持 CPU、GPU 资源的灵活分配,提升资源利用率,且支持用户利旧既有服务器利旧既有服务器利旧既有服务器,进一步降低硬件成本。

欲深入了解 SmartX 超融合对 AI 应用场景的支持能力,请阅读:

  • 支持企业级 AI 应用,IT 基础架构应具备哪些能力?有哪些解决方案?

  • GPU 直通 & vGPU:超融合为 GPU 应用场景提供高性能支持

您还可下载《SmartX 产品在数据库场景下的测试与实践合集》,了解更多行业用户使用 SmartX 超融合和分布式存储支撑 Oracle、MySQL 和信创数据库的评测与实践。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/930200.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数据结构代码归纳

线性表 线性表的顺序表示 定义与初始化 typedef struct SqList{ElemType data[MaxSize];//ElemType *data 开动态数组 int length; }Sqlist; void InitList(SqList &L){L.length0;//若静态数组//若动态数组 //L.data(ElemType*)malloc(sizeof(ElemType)*MaxSize); } …

华为的USG6000为什么不能ping通

前言: 防火墙usg6000v的镜像 链接: https://pan.baidu.com/s/1uLRk0-hnHRTLYLx1Pnplow?pwdtymp 提取码: tymp 看了好多毒文章,感觉写作业更有意思,可以了解新的知识 内容: 首先看毒文章是这样说的,华为的防火墙是…

“量子跃迁与数据织网:深入探索K最近邻算法在高维空间中的优化路径、神经网络融合技术及未来机器学习生态系统的构建“

🎼个人主页:【Y小夜】 😎作者简介:一位双非学校的大二学生,编程爱好者, 专注于基础和实战分享,欢迎私信咨询! 🎆入门专栏:🎇【MySQL&#xff0…

VTK编程指南<三>:基于VTK入门程序解析来理解VTK基础知识

1、VTK入门程序 下面是一个完整的Vtk入门程序&#xff0c;我们基于这个程序来对VTK的基本知识进行一个初步了解。 #include <iostream>#include <vtkAutoInit.h> VTK_MODULE_INIT(vtkRenderingOpenGL2);// VTK was built with vtkRenderingOpenGL2 VTK_MODULE_INI…

汽车免拆案例 | 2007款宝马650i车发动机偶尔无法起动

故障现象 一辆2007款宝马650i车&#xff0c;搭载N62B48B发动机&#xff0c;累计行驶里程约为26万km。车主反映&#xff0c;发动机偶尔无法起动&#xff0c;故障频率较低&#xff0c;十几天出现1 次&#xff0c;且故障出现时起动机不工作。 故障诊断  接车后试车&#xff0c;…

Kafka单机及集群部署及基础命令

目录 一、 Kafka介绍1、kafka定义2、传统消息队列应用场景3、kafka特点和优势4、kafka角色介绍5、分区和副本的优势6、kafka 写入消息的流程 二、Kafka单机部署1、基础环境2、iptables -L -n配置3、下载并解压kafka部署包至/usr/local/目录4、修改server.properties5、修改/etc…

python中的列表、元组、字典的介绍与使用

目录 一、区别介绍 1.使用场景以及区别图 2.详细介绍 列表 元组 字典 二、例子操作 (一)列表list 1.定义和初始化 2.访问元素&#xff08;下标&#xff09; 3.修改元素&#xff08;下标&#xff09; 4.添加元素&#xff08;append、下标insert&#xff09; 5.删除…

WiFi受限不再愁,电脑无网络快速修复指南

有时在试图连接WiFi时&#xff0c;会发现网络连接受限&#xff0c;或无法正常访问互联网。这种情况不仅影响了工作效率&#xff0c;还可能错过重要的信息。那么&#xff0c;究竟是什么原因导致了电脑WiFi连接受限呢&#xff1f;又该如何解决这一问题呢&#xff1f;小A今天就来教…

【技巧】Mac上如何显示键盘和鼠标操作

在制作视频教程时&#xff0c;将键盘和鼠标的操作在屏幕上显示出来&#xff0c;会帮助观众更容易地理解。 推荐Mac上两款开源的小软件。 1. KeyCastr 这款工具从2009年至今一直在更新中。 https://github.com/keycastr/keycastr 安装的话&#xff0c;可以从Github上下载最…

c++ map对其值排序

无法直接排序,转换成vector<std::pair<string,int>> #include <iostream> #include <map> #include <vector> #include <algorithm>// 用于排序的比较函数 bool compareByValue(const std::pair<std::string, int>& a, const …

调度器、闲逛进程

调度器、闲逛进程 一、调度器/调度程序二、闲逛进程 一、调度器/调度程序 ②、③由调度程序引起&#xff0c;调度程序决定&#xff1a; 让谁运行&#xff1f;-- 调度算法 运行多长时间&#xff1f;-- 时间片大小 调度时机 – 什么事件会触发“调度程序”&#xff1f; ∙ \bull…

第七节(1)、T型加减速转动【51单片机-TB6600驱动器-步进电机教程】

摘要&#xff1a;本节介绍步进电机T型加减速的控制方法&#xff0c;分2个小节&#xff0c;本小节主要内容为该控制方法的推导与计算&#xff0c;第二节对T型加减速进行了简化计算 一.加速阶段计算 1.1 计算时间与步数关系 根据位移公式可得&#xff1a; a n g l e 0 n ∗ s…

利用 360 安全卫士极速版关闭电脑开机自启动软件教程

在使用电脑的过程中&#xff0c;过多的开机自启动软件会严重拖慢电脑的开机速度&#xff0c;影响我们的使用体验。本教程中简鹿办公将详细介绍如何使用 360 安全卫士极速版关闭电脑开机自启动软件&#xff0c;让您的电脑开机更加迅速流畅。 一、打开 360 安全卫士极速版 在电…

车联网安全学习之TBOX

Telematics BOX&#xff0c;简称 T-BOX&#xff0c;也称远程信息处理控制单元&#xff08;Telematics Control Unit, TCU&#xff09;&#xff0c;集成GPS、外部通信接口、电子处理单元、微控制器、移动通信单元和存储器等功能模块。 TBOX 提供的功能有网络接入、OTA、远程控制…

神经网络入门实战:(六)PyTorch 中的实用工具 SummaryWriter 和 TensorBoard 的说明

(一) SummaryWriter 这里先讲解 SummaryWriter &#xff0c;TensorBoard 会在第二大点进行说明。 SummaryWriter 是 PyTorch 中的一个非常实用的工具&#xff0c;它主要用于将深度学习模型训练过程中的各种日志和统计数据记录下来&#xff0c;并可以与 TensorBoard 配合使用&am…

C#实现一个HttpClient集成通义千问-开发前准备

集成一个在线大模型&#xff08;如通义千问&#xff09;&#xff0c;来开发一个chat对话类型的ai应用&#xff0c;我需要先了解OpenAI的API文档&#xff0c;请求和返回的参数都是以相关接口文档的标准进行的 相关文档 OpenAI API文档 https://platform.openai.com/docs/api-…

开发知识点-uniCloud

开发知识点-uniCloud 服务空间云函数 cloudfunctions云对象importObjectJSON 格式的文档型数据库Collection unicloud数据的指定表集合 DB SchemaJQL 语法参考资料 服务空间 项目关联空间 云函数 cloudfunctions 云对象importObject JSON 格式的文档型数据库 nosql 非关系…

Vue Web开发(二)

1. 项目搭建 1.1. 首页架子搭建 使用Element ui中的Container布局容器&#xff0c;选择倒数第二个样式&#xff0c;将代码复制到Home.vue。 1.1.1.下载less &#xff08;1&#xff09;下载less样式 npm i less   &#xff08;2&#xff09;下载less编辑解析器 npm i less…

GWAS分析先做后学

大家好&#xff0c;我是邓飞。 GWAS分析是生物信息和统计学的交叉学科&#xff0c;上可以学习编程&#xff0c;下可以学习统计。对于Linux系统&#xff0c;R语言&#xff0c;作图&#xff0c;统计学&#xff0c;机器学习等方向&#xff0c;都是一个极好的入门项目。生物信息如…

Go学习:变量

目录 1. 变量的命名 2. 变量的声明 3. 变量声明时注意事项 4. 变量的初始化 5. 简单例子 变量主要用来存储数据信息&#xff0c;变量的值可以通过变量名进行访问。 1. 变量的命名 在Go语言中&#xff0c;变量名的命名规则 与其他编程语言一样&#xff0c;都是由字母、数…