一张图看懂大模型性价比:能力、价格、并发量全面PK

图片

最近,国内云厂商的大模型掀起一场降价风暴。火山引擎、阿里云、百度云等纷纷宣布降价,部分模型价格降幅据称高达99%,甚至还有些模型直接免费。

五花八门的降价话术,一眼望去遍地黄金。但事实真的如此吗?今天我们就拨开迷雾,深挖下大模型降价背后那些事。

1

选大模型

要最强版还是轻量级?

企业选用大模型,首先要明确模型的使用需求:

如果需要语言理解、生成、逻辑等综合能力强,能解决复杂业务场景问题的大模型,那么必须使用各大头部厂商的最强模型,包括豆包Pro系列、通义千问Qwen-Max系列和文心ERNIE 4.0。这些模型均已超越GPT3.5,但距离GPT-4略有差距。

如果对模型能力要求不高,比如简单的对话问答,但是需要响应速度快、便宜的大模型,那么可以使用各家大模型的轻量化版本。包括豆包Lite系列、通义千问Qwen-Long/Plus/Turbo系列、文心ERNIE-3.5/Speed/Lite系列。

选模型就像选车一样,高端商务和家用买菜,肯定不是一个价。入门级的车就算给你倒贴钱,你敢开去跑极限越野吗?所以还是要关注模型能力,不能光看最低价。

2

比价格,还要比并发

选好适配业务的模型之后,就要算算使用成本了。

各家大模型公布的x元/千tokens,都是指“后付费”的刊例价。也就是按照实际使用的tokens算账。

乍看很简单——谁的单价低,谁就更便宜呗。但真要用起来,这里面门道就多了。

和“后付费”价格绑定在一起的,有两个关键指标,一个叫TPM(每分钟token数),一个叫RPM(每分钟请求数)。

TPM,代表着一家企业客户在单位时间内能够使用的token限额;RPM,代表着一家企业客户在单位时间内最多能用多少次大模型。两个指标中有一个达到限额,模型就拒绝提供服务了。

打个比方:大模型API调用就像一个大水池,TPM是限定了每分钟可以打一杯水还是一桶水,RPM是限定了同时可以来10个人还是来100个人打水。无论水价多便宜,哪怕是免费的,如果一分钟只能接一杯水,那也没太大用处。

3

大模型降价“御三家”最详细对比

搞清楚大模型价格那些事儿,接下来看看这波降价潮里最风口浪尖的三家云厂商:首先掀桌的火山引擎和豆包大模型,火上浇油的阿里云和通义千问大模型,摔杯免费的百度智能云和文心大模型。

在这里插入图片描述

以上数据均来自于各厂商官网及产品控制台,数据采集时间为5月22日。如有变动,以厂商最新公告为准。

为了更直观地表现以上大模型的综合性价比,我们按照模型能力分级,计算一元钱能购买的tokens数量,以及不同模型支持的并发能力,分别做成图表。

图片

备注:在典型流量场景中,推理输入远大于推理输出,一般为5比1到10比1之间。在长文本对话的PDF总结摘要等场景,输出相比输入更是可以忽略。因此本文以推理输入价格为准,计算一元钱能买到的tokens数量。

4

简单总结

百度最强模型的价格不变,但轻量模型把“厘时代”直接打到免费。不过需要注意的是,根据文心一言官网介绍,ERNIE Speed模型适用于精调,而精调还是要收费的。

阿里云的模型全线降价,最强模型降幅低,轻量模型降幅高。所有价格应该都是经过了精密的测算,不会是随意拍的数。从价格来看还是颇有诚意,但初始支持的TPM/RPM稍显不足,企业在实际使用中需要对相关权益做好沟通。

字节,火山引擎。当我们说起价格那些事儿,不由想起《明朝那些事儿》的经典台词:要么不做,要么做绝。豆包大模型闷声发育一年,无论是最强模型还是轻量模型,TPM还是RPM,用九个字可以形容:不留空档,竞争力拉满。

如何学习AI大模型?

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

在这里插入图片描述

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/637027.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

太阳诱电:顺应时代需求的新型电容器为何能在全球得到广泛应用(下)

随着汽车电动化和电子控制化的进展,车载计算机和电气部件也在逐渐向大功率化的方向发展。而构成这些车载设备电源电路的电子元器件也必须随之进行技术革新。太阳诱电集团携手全资子公司ELNA,开发并供应新型电容器“导电性高分子混合铝电解电容器”&#…

热爱无解 少年万丈光芒!首席艺人【彭禹锦】登陆第八季完美童模全球赛

2024年7月,一档由IPA模特委员会创办于2017年的王牌少儿模特大赛即将拉开全球总决赛的帷幕!作为家喻户晓的国民赛事——完美童模曾6季荣获CCTV央视新闻报道,以创意引领、美学引领、和兼具文化底蕴的赛事特色,收获了全球百万亲子家庭的喜爱。20…

工业镜头的参数、选型步骤

目录 一、如何选择合适的工业镜头 1. 工业镜头的基本参数 2. 选择工业镜头的步骤 3. 案例分析:如何选择合适的镜头 4. 远心镜头的设计目的 二、 介绍远心镜头 2.1 远心镜头的主要特性 2.2 远心镜头的类型 2.3 远心镜头的应用 2.4 远心镜头的工作原理 2.5 …

SOA半导体光放大器及其应用

---翻译自Michael Connelly于2015年发表的文章 1.简介 在过去的二十五年里,光纤通信网络的部署和容量迅速增长。这种增长得益于新光电技术的发展,这些技术可用于利用光纤的巨大带宽。如今,运行的系统比特率已超过 100 Gb/s。光技术是全球信…

Kubernetes的灵魂核心:kube-scheduler

Kubernetes(简称K8s)是一个开源的容器编排系统,用于自动化容器化应用程序的部署、扩展和管理。在Kubernetes集群中,kube-scheduler是一个至关重要的组件,它负责将Pod(Kubernetes中的最小部署单元&#xff0…

谷歌推出TransformerFAM架构,以更低的消耗处理长序列文本

Transformer对大模型界的影响力不言而喻,ChatGPT、Sora、Stable Difusion等知名模型皆使用了该架构。 但有一个很明显的缺点,其注意力复杂度的二次方增长在处理书籍、PDF等超长文档时会显著增加算力负担。 虽然会通过滑动窗口注意力和稀疏注意力等技术…

win11安装docker运行Open-Webui 界面化展示 ollama大模型

1.OpenWeb UI运行需要docker 环境下载docker Get Started | Docker 2.需要命令提示符docker -v 查询是否安装成功; 查询docker详情docker version 3.github拉取open-webUi镜像Package open-webui GitHub 复制命令运行在命令提示符; 等待下载完成 4.到…

打造一个增强版Kimi:可以生成图片、PPT、PDF文档、数据分析等

Kimi虽然在国内AI大模型中表现不错,但是和ChatGPT还是差不少功能。现在有一个很简单的方法,把kimi功能增强,使用效果大大改善,比如生成图片: 具体方法如下: 打开coze网站:https://www.coze.cn/…

AI大模型探索之路-实战篇4:DB-GPT数据应用开发框架调研实践

目录 前言一、DB-GPT总体概述二、DB-GPT关键特性1、私域问答&数据处理&RAG2、多数据源&GBI3、多模型管理4、自动化微调5、Data-Driven Multi-Agents&Plugins6、隐私安全 三、服务器资源准备1、创建实例2、打开jupyterLab 四、DB-GPT启动1、激活 conda 环境2、切…

使用VUE3+TS+elementplus创建一个增加按钮

一、前言 在上一篇文章中分享了创建table的过程&#xff0c;详见&#xff08;VUE3TSelementplus创建table&#xff0c;纯前端的table&#xff09;&#xff0c;本文在创建好的table的基础上&#xff0c;再创建一个增加按钮。 二、程序展示 1、前面创建table的程序 <templ…

Springboot+Vue项目-基于Java+MySQL的游戏交易系统(附源码+演示视频+LW)

大家好&#xff01;我是程序猿老A&#xff0c;感谢您阅读本文&#xff0c;欢迎一键三连哦。 &#x1f49e;当前专栏&#xff1a;Java毕业设计 精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; &#x1f380; Python毕业设计 &…

关于智慧校园安全用电监测系统的设计

人生人身安全是大家关注的话题&#xff0c;2019年12月中国消防统计近五年发生在全国学生宿舍的火灾2314起&#xff08;中国消防2019.12.应急管理部消防救援局官方微博&#xff09;&#xff0c;违规电器是引发火灾的主因。如果在各寝室安装智能用电监测器实时监督线路参数&#…

足球走地数据分析之大小球策略及工具介绍

在足球走地数据分析中&#xff0c;大小球策略是一种非常实用的投注方式。以下是一些关于大小球策略的分析和建议&#xff1a; 理解大小球概念&#xff1a;大小球是足球走地投注中的一种玩法&#xff0c;主要预测的是一场比赛中的总进球数是否超过或低于一个预设的数值。例如&a…

浏览器API与协议

现代浏览器是一个囊括了数百个组件的操作系统&#xff0c;包括进程管理、安全沙箱、分层的优化缓存、JavaScript虚拟机、图形渲染和GPU管道、存储系统、传感器、音频和视频&#xff0c;网络机制等等。 在浏览器上运行的应用的性能。&#xff0c;取决于多个组件&#xff1a;解析…

C#利用WinForm实现可以查看指定目录文件下所有图片

目录 一、关于Winform 二、创建应用 三、功能实现 四、代码部分 一、关于Winform Windows 窗体是用于生成 Windows 桌面应用的 UI 框架。 它提供了一种基于 Visual Studio 中提供的可视化设计器创建桌面应用的高效方法。 利用视觉对象控件的拖放放置等功能&#xff0c;可…

适用于 Windows 7/8/10/11 的 6 款最佳免费分区软件

分区软件程序旨在帮助您创建、缩小、删除、扩展、合并或拆分硬盘和其他存储设备的分区。虽然可以在 Windows 中对硬盘进行分区而无需使用其他软件&#xff0c;但您可以执行的活动范围有限。例如&#xff0c;如果没有外部工具&#xff0c;您无法调整分区大小或合并分区。在这篇文…

Stable Diffusion|黑白老照片修复

在这个时代&#xff0c;我们习惯于拥有高清、色彩丰富的照片&#xff0c;然而&#xff0c;那些古老的黑白色老照片由于年代的久远&#xff0c;往往会出现模糊、破损等现象。 关于AI绘画技术储备 学好 AI绘画 不论是就业还是做副业赚钱都不错&#xff0c;但要学会 AI绘画 还是要…

解决 fatal: Not a git repository (or any of the parent directories): .git 问题

解决方法&#xff1a;在命令行 输入 git init 然后回车就好了

一些常见的程序设计问题

秒杀 redis缓存库存 1.判断库存名额是否充足&#xff0c;2.进行扣减 为了防止超卖&#xff0c;必须保证这两部的原子性 库存扣减后发送mq消息&#xff0c;去异步执行创建订单流程&#xff0c;创建订单失败会造成少卖。可加重试机制&#xff0c;对多次重试依旧失败的&#xff…

史上最全PMP学习资料、项目管理资料、备考经验包,3A一次通过

你是否也有过类似的经历&#xff1f; 为了获取备考资料&#xff0c;有的同学在论坛、知乎或者相关垂直类网站下载了很多的资料&#xff0c;这些资料大部分是机构进行获客引流的资料&#xff0c;没有真正的干货。 经常会看到10G、20G的资料包&#xff0c;感觉内容很丰富&#xf…