MaaS玩家:希望AI大模型价格战再狠一点


明知产能严重过剩的新能源企业却还在重金扩产,多半因为他们花的不是自己的钱;明知极度烧钱的AI大模型却开始打价格战,多半因为他们并不靠这东西挣钱。

所有投资人必备的一项技能,就是中观行业景气度及商业模式对比。很明显,AI有很多的商业逻辑与其他行业非常相似。就比如:有实力的才能卷、免费的往往才是最贵的。

打响这场AI大模型价格战第一枪的,是2020年便投资上亿元筹建AI超算机、拥有1万张英伟达A100 GPU的幻方,旗下深度求索DeepSeek-V2(32k)利用KV cache和batch size权重配比把价格压到了GPT-4o的1/35。第二枪跟随的,是字节的豆包,AI大模型看上去直接进入了以厘计价的时代。最终,百度的两款轻量化AI模型直接宣布免费,价格战直接开到了竞速终点。

但这几个名字放到一起,似乎有些别扭:幻方作为管理600亿资金规模的顶级量化私募,他们好像不是靠AI大模型挣钱;字节左手抖音右手今日头条,AI大模型难道是为了做营销号吗?百度直接宣布免费,难不成中国用户不用浏览器、不看广告、不用百度云了吗?

同样的,@百融云-W(6608.HK)这种MaaS厂商也是同样思路,难不成企业用户不使用AI模型库了吗?

投资人能听到的故事,都是资本家愿意讲出来让你听的;商战到底是怎么打的,得听资本家们没说什么。

所谓的AI大模型降价,指的是“输入”价格,而不是“输出”价格。也就是用户输入给AI大模型的问题,比如《红楼梦》完整版共96万字,大概是160万tokens,这部分按token量计价的输入端确实在打价格战,但AI大模型反馈的回答属于输出价格,这部分并没有降价。比如字节的“0.8元/百万tokens,比行业价格低99.3%”,指的就是输入价格,但是豆包通用模型Pro-32k的输出价格仍是2元/百万tokens。

那AI企业如果不靠大模型挣钱,他们的利润来自哪里?答案有两个:一是模型微调,也就是根据企业用户的需求定制开发,这个模式按照微调的计算资源耗费与开发周期来计费;二是模型部署,就是一家企业客户独占一台服务器的AI计算资源,将AI模型私有化,这样就不会有其他客户分流属于你的AI资源和算力。

AI大模型,本质上只是一个集合了监督学习、算法、强化学习的基础设施,而已。那企业究竟想用AI做到的是什么?换句话说,AI公司到底要赚的是哪份钱呢?

答:基于客户最离不开的AI功能,开发基于大模型的商业模式。最典型的就是百融云的MaaS(模型即服务)模式。

当初互联网刚普及的时候,用户吐槽流量费太高只是表象,本质上是因为父老乡亲们想打游戏、刷短视频。换到AI时代,之前客户吐槽大模型太贵用不起,本质上是因为他们不需要一个模型放在那儿,而是帮他们快速地做各种冗余数据的智能解析。

所以,AI大模型价格战对用户有利不假,但看清本质,选出能借此趋势把MaaS业务推向市场的公司,才是有大智慧的投资人。股市中7亏2平1赚,必须看到与绝大部分人认知不一样的逻辑,才有赚钱的机会。

衍生自AI大模型的MaaS业务究竟是哪方面让客户必须使用?举一个非常现实的行业例子,想一个问题:这个年代,有谁不借银行的钱?

近期,国有大行参股国家大基金三期、截至2024年一季度中国住户部门贷款余额81.45万亿元的两条新闻引发了深度思考。为什么经济思维印象流中,地产萎靡则信贷乏力的逻辑失效了?为什么国有大行也在参与半导体这种资本回报率已经很低的产业?

原因在于中国金融系统的特征:中国的企业债券市场规模虽然持续扩容,但相对海外市场而言仍然偏低,且其中大部分是金融债和城投债。为什么这样?因为贷款只要经过一家银行里的几个部门就可以操作了。

企业的业务、生产规模、用电量,以及纳入征信系统内的个人用户信息,对于银行的尽调成本是极低的,这是银行信贷的天然优势。但是债券发行方却必须面向整个市场宣传自己,没有背书的信用,就必须要用更高的利率做风险补偿。

那既然基础的企业及用户信息,银行本身就拥有,那他们需要AI大模型和百融云的MaaS业务做什么呢?

答案是:AI智能分析、决策、自动建模。

MaaS的本质,就是一个AI模型库,有海量的AI模型可供调用,比如资产分析、消费评分、估值建模、产品分类推荐、智能营销响应等等。对于银行等金融机构而言,如何把信贷业务中最新的贷款申请者行为信息、财富管理潜在客户最新的收入及资产情况、资本市场各类产品(股票、债券、基金)的实时报价与净值,用AI能力结合起来做综合评估,且需要数据不出本地同时能保障隐私安全,最终完成信贷投放审批和业务全流程,这才是他们始终离不开百融云这种MaaS厂商的根本原因。

再举一个财富管理领域的具体例子,一位客户提出了“有5万元可供投资”的需求,百融云的MaaS服务就会调用所有的AI模型库,最终形成的模型调用结果就会是:“您的投资风格是稳健型,您是我行尊贵的铂金客户,我行目前有平均年化收益3%的理财产品,起投金额正是5万……”。

所以当AI大模型开始打价格战之后,更低的“输入”价格会让客户更多地运用AI服务,同时随之而来的是单价没变、但使用频次海量增长的“输出”价格。同时对于资金实力不像金融业一样雄厚的其他行业客户来讲,AI大模型的价格战会让他们真正开始拥抱AI,反而促进了MaaS企业客户量广度和深度的爆发式增长。

没错,广大用户希望AI大模型价格战打的更狠一些,这样就越便宜;这也是百融云这种MaaS厂商的夙愿,因为他们终于等到了AI渗透率爆发的时点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/678838.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

大模型时代的具身智能系列专题(八)

standford Chelsea Finn团队 Chelsea Finn是Stanford计算机科学与电气工程系的助理教授。她的实验室IRIS通过大规模的机器人互动研究智能,并与SAIL(斯坦福人工智能实验室)和ML Group(机器学习团队)有合作关系。他还在…

Java邮件发送的基本流程是什么?如何实现?

Java邮件发送的SMTP服务器如何配置?怎么配置发信? Java邮件发送是在Java应用程序中通过邮件协议(如SMTP)发送电子邮件的过程。它是许多企业级应用程序中常见的功能,用于向用户发送通知、确认邮件等。AokSend将介绍Jav…

浅谈配置元件之随机变量

浅谈配置元件之随机变量 1.概述 为了增强测试的真实性和多样性,JMeter 提供了多种配置元件来生成动态数据,其中“随机变量”(Random Variable) 就是一种常用的配置元件,用于生成随机数值、字符串等,以模拟不同用户请求中的变化参…

【Mac】Downie 4 for Mac(视频download工具)兼容14系统软件介绍及安装教程

前言 Downie 每周都会更新一个版本适配视频网站,如果遇到视频download不了的情况,请搜索最新版本https://mac.shuiche.cc/search/downie。 注意:Downie Mac特别版不能升级,在设置中找到更新一列,把自动更新和自动downl…

蓝牙网关和WiFi网关的对比

蓝牙网关和WiFi网关都是无线通信技术中的重要组件,它们各自具有不同的特点和应用场景。以下是蓝牙网关和WiFi网关的一些对比: 蓝牙网关 作用: - 蓝牙网关可以无线连接各种设备,如门锁、灯、电视等,并能与购物者、旅…

java海滨学院班级回忆录源码(springboot)

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的海滨学院班级回忆录。项目源码以及部署相关请联系风歌,文末附上联系信息 。 项目简介: 海滨学院班级回忆录的…

Struts2 系列漏洞 - S2-001

一、前言 Struts2 是较早出现实现 MVC 思想的 java 框架。struts2 在 jsp 文件中使用 ognl 表达式来取出值栈中的数据。 struts 标签与 ognl 表达式的关系类似于 jstl 标签与 el 表达式的关系。[故在 jsp 文件中需引入 struts 标签库] # 二、概述 S2-001 漏洞由于在其解析 j…

Arduino ESP8266模块TFT液晶屏

ESP8266模块 模块实物图: 模块引脚定义: 工作模式选择: FlashBoot启动模式: GPIO15接GND UART固件下载模式: GPIO15接GND, GPIO0接GND 调试串口: URXD/UTXD 可用来下载固件和调试信息输出 模块使能&…

安装源码moveit遇到的问题

文章目录 问题1、 在操作 rosdep update 时报超时错误问题2、E: 仓库 “http://mirrors.ustc.edu.cn/ros/ubuntu focal Release” 没有 Release 文件问题3、卸载ompl问题4、安装moveit 问题1、 在操作 rosdep update 时报超时错误 出现 访问 https://raw.githubusercontent.com…

【官方文档解读】torch.jit.script 的使用,并附上官方文档中的示例代码

由 OpenMMLab 的部署教程 所述,对于模型中存在有控制条件的(如 if,for 等),需要用 torch.jit.script 而非采样默认的 torch.jit.trace 方法。本文则详细介绍了下官方文档中对 torch.jit.script 的解释和示例代码。 to…

SemiDrive X9H 平台 QT 静态编译

一、 前言 芯驰 X9H 芯片,搭载多个操作系统协同运行,系统实现了仪表、空调、中控、副驾多媒体的四屏驱动控制,在人车智能交互上可以通过显示屏、屏幕触摸控制、语音控制、物理按键控制、车身协议的完美融合,使汽车更智能。让车主…

“论软件系统建模方法”必过范文,突击2024软考高项论文

论文部分 摘要 2023年03月,我参与了某艺术品公司线上拍卖管理平台的研发。该项目的目标是建立一个互联网在线拍卖平台,用户可以通过手机或PC浏览器进入拍卖平台,对喜欢的拍品进行参拍出价。平台提供了在线支付、在线出价、保证金管理、拍品…

通信技术信号源硬件实验

定义 1.RZ码(归零码) RZ编码也成为归零码,归零码的特性就是在一个周期内,用二进制传输数据位,在数据位脉冲结束后,需要维持一段时间的低电平。 2.NRZ码(不归零编码) NRZ编码也成为…

AVL树的介绍与实现

前言 我们上一期介绍了二叉搜索树并做了实现,本期我们来继续学习另一个更优的树即AVL树! 本期内容介绍 什么是AVL树? AVL树的实现 AVL树的性能分析 在正式的介绍AVL树之前,我们先来回忆一下二叉搜索树的特点:左子树的…

nnUNet保姆级使用教程!从环境配置到训练与推理(新手必看)

文章目录 写在前面nnUNet是什么?一、配置虚拟环境二、安装nnUNet框架1.安装nnUNet这一步我遇到的两个问题: 2.安装隐藏层hiddenlayer(可选) 三、数据集准备nnUNet对于你要训练的数据是有严格要求的,这第一点就体现在我…

pushowl | 运用分销裂变模式实现业绩快速增长

一、公司简介 PushOwl公司是一家专注于为电子商务商店提供在线营销工具的印度初创企业。以下是对PushOwl公司的详细介绍: 基本信息: 所属公司:Creatorbox Softwares Private Limited 成立日期:2018年 所属地:印度 …

103.网络游戏逆向分析与漏洞攻防-ui界面的设计-加速功能的开关设计

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 如果看不懂、不知道现在做的什么,那就跟着做完看效果,代码看不懂是正常的,只要会抄就行,抄着抄着就能懂了 内容…

RDMA (1)

RDMA是什么 Remote Direct Memory Access(RDMA)是用来给有高速需求的应用释放网络消耗的。 RDMA在网络的两个应用之间进行低延迟,高吞吐的内存对内存的直接数据通信。 InfiniBand需要部署独立的协议。 RoCE(RDMA over Converged Ethernet),也是由InfiniBand Trade Associat…

【吊打面试官系列】Java高并发篇 - Java 线程数过多会造成什么异常?

大家好,我是锋哥。今天分享关于 【Java 线程数过多会造成什么异常?】面试题,希望对大家有帮助; Java 线程数过多会造成什么异常? 1、线程的生命周期开销非常高 1000道 互联网大厂Java工程师 精选面试题-Java资源分享…

postman教程-12-保存请求至Collections

领取资料,咨询答疑,请➕wei: June__Go 上一小节我们学习了Postman管理环境的方法,本小节我们讲解一下Postman保存请求至Collections集合的方法。 1、创建Collection 在保存Request请求之前,先创建一个Collection(集合)&#…