在豆包这事上,字节看得很明白

8914ebeffde530bf6bf518667dc30e47.png

4b2da8b05fcaa591a822be14914d1cfe.png

6125b8d46599e35e2dfb23957d525f08.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


导语:

1.基于豆包的话炉/猫箱APP市场反响一般

2.价格战对于豆包来说是副产物

3.价格战对大模型市场是良性的

4.豆包接下来会推广至国际社会

因为宣称价格比行业便宜99.3%,豆包成功出圈了。根据火山引擎公布的价格计算,一元钱就能买到豆包主力模型的125万Tokens,大约是200万个汉字,相当于三本《三国演义》。

豆包的出现,给人一种突如其来的感觉,这是因为豆包起初并不叫豆包,而是叫做云雀。

在火山方舟大模型服务平台的模型调用API界面可以看到这么一句话“字节自研大模型于2024年5月正式命名为豆包大模型,不再使用Skylark名称,您可以逐步迁移使用豆包系列模型。”

说起云雀,那就不得不提起字节的另一个产品——话炉。

2024年3月的时候,字节推出了一款APP叫做“话炉”。这是一款基于云雀大模型的AI聊天APP,产品的特点在于里面包含了多种智能体。话炉的开发者们为这些智能体赋予了不同的性格、背景,让智能体在对话的过程中看起来就像真人一样。

56fd77e5145c7033c80a0e87cc2d9306.png

图:名为“自讨苦吃”的虚拟角色

2024年开春,正是国产大模型的爆发期,如百度文心、阿里通义千问,都是在该时期发布。相较于市面上强调功能的大模型,话炉用这些虚拟角色铸成了自己的核心生产力,从而实现了差异化。

2024年4月11日,“话炉”更名为了“猫箱”。虽然早在2023年12月,字节就申请了话炉的商标,可是上线才1个月就更名,字节的这番操作确实有些让人摸不着头脑。

话说回来,“猫箱”听起来确实比“话炉”更年轻,也更好记一些。考虑到“猫箱”所搭载的大量虚拟角色,更名为“猫箱”后,对年轻用户的吸引力会更强一些。

猫箱所对标的产品叫做星野,于2023年9月发布。从下载量上看,猫箱的市场反馈要低于星野。

fc3b66c2e043df8365207ee852bdff28.png

图:华为应用市场中不同APP的安装量

可惜的是,字节的光环并没有带动猫箱的下载量。

字节清楚豆包该如何运营

在猫箱之后,字节便直接把幕后的豆包推到了前面,准备让市场来考验考验它。

豆包来自于字节跳动在2023年11月末新成立的Flow部门,由字节跳动技术副总裁洪定坤亲自带队。这是一个专门生产AI产品的部门,仅仅是2023年一年,就发布了7款自研AI产品,如小悟空、扣子(Coze)等等。

Flow部门在企业内对标的是抖音,换句话说,Flow发布的产品,不仅要达到日活数亿级别,还要推动产品部门旗下产品的国际化。比如Flow在2023年发布的Cici,相当于国际版的豆包,在发布仅180天的时候,累计下载量就达到了1522万次。

虽然Cici自2024年2月开始,下载量出现了比较明显的下滑,但对国际聊天大模型市场的冲击,还是能体现出Flow部门的实力。

也正是由于Cici为Flow积攒的经验,让豆包大模型及相关产品的整个部署策略,才会那么独树一帜。

虽然豆包不少第一个打价格战的大模型,但是在2024年5月15日的在火山引擎原动力大会上,火山引擎的谭待确实是第一个高调宣布的。

不过字节所谓的”低价格卖token“并不少那种”咬紧牙关“式地宣扬自己家产品,相反,即便是没有推广需求,豆包依然会想方设法地降低成本。原因不难理解,豆包可以很好地赋能于字节的整个产品线,包括抖音、今日头条。

比如在豆包的页面中可以看到,豆包在发布的收就已经适配和了浏览器插件版本和客户端版本,再加上发布即宣布产品定价策略。说明豆包一开始就考虑好了后续如何运营产品,而不单单只是怎么提高产品性能。

da6df3d2cf3ae114b43783675d1f331e.png

其实不管是云雀还是豆包,它都不是字节为了迎合大模型时代而刻意推出的产品,而是公司发展受到了大模型技术的辐射,才开发出了技术,这就是为什么字节会考虑豆包后续的运营,本质上来讲,其中受惠和得利者都是字节。因此,价格战对于豆包来说,其实是一个有正面积极作用的“副产物”。

价格战只为获客?

说到价格战,大多数人会认为大模型的价格战和2010年打车市场价格战、2015年共享单车市场价格战的逻辑是类似的,通过不断烧钱来获得客户,直至对手的资金跟不上补贴。实际情况则与之截然不同。

打车市场与共享单车市场的价格战,是近年来中国共享经济领域中最为引人注目的现象之一。这两个市场的发展轨迹,从初生的繁荣到激烈的竞争,再到逐步走向规范化管理,不仅深刻改变了人们的出行方式,也成为了观察中国互联网行业竞争态势与监管政策演进的窗口。

打车的费用来自于道路养护、汽油消耗以及出租车司机的工时,它与国际原油价格直接挂钩,所以很难降低。补贴的出现,就是一种“赔本赚吆喝”。在那段时间里,滴滴与快的两家企业不惜重金投入,一度成为中国互联网史上最为惨烈的补贴战争。

共享单车的故事同样跌宕起伏。2015年前后,摩拜、ofo等共享单车品牌如雨后春笋般涌现,凭借“随借随还”的便捷模式,迅速风靡各大城市,解决了人们“最后一公里”的出行难题。各家企业为了争夺用户,纷纷推出免费骑行、低价月卡等优惠政策,再次引发了价格战。

比起打车,共享单车的费用产生就更难改变了,主要来自于单车的磨损、折旧,以及调配多地共享单车数量所产生的人工费用。

打车市场与共享单车市场的价格战,是市场初期快速扩张不可避免的现象,它们在推动行业快速发展的同时,也暴露了诸多问题。而且,无论是打车市场也好,还是共享单车也好,他们的价格战,就是实打实地从企业的腰包里掏钱来补贴市场。

对于大模型来说,一切就都不一样了。大模型所产生的费用主要来自于研发人员的工资、能源消耗和计算资源消耗。不过有意思的是,一旦这三者之间存在比较强的联动关系。

比如通过MoE架构赋能Transformer模型,就会让模型的计算复杂度大幅降低,进而减少对能源以及计算资源的消耗。这也就意味着,技术力与大模型成本之间的关系非常直接。

如果企业需要降低大模型成本,就只有三种方法:1.自己建个发电厂;2.自己生产GPU;3.通过技术研发降低大模型计算成本。显然,只有第三条比较合当下企业发展的逻辑。

同时也要警惕,模型计算复杂度降低也有可能会导致生成的结果不尽人意。这个情况叫做精度-效率权衡(Precision-Efficiency Trade-off),指的是通过简化模型结构、减少参数数量、或者使用更高效的算法来加速推理过程,这往往会直接影响到模型的性能,包括但不限于准确性、生成质量或鲁棒性。

因此,尽管这样的改动可能会提升处理速度或减少资源消耗,但它也可能导致生成的结果不如原来那样精确或满意,这就是在模型效率提升与保持高精度之间的典型权衡。

用户心中有杆秤,会评估模型生成的结果。如果在降低模型性能和获取用户之间进行选择,无论是哪个大模型都只会选择后者,毕竟只有拥有用户,才能获得收入。

字节需要新的收入来源

从今日头条,再到抖音,字节跳动一直在创造互联网的神话。但是在国际市场受挫的字节,显然需要新的增长方式,这就是为什么他们成立了与国际市场接壤的Flow部门。

事实上,真正让字节跳动大模型脱颖而出的,从来不是低廉的价格,而是豆包的国际化能力。甚至可以这么说,豆包的国际化能力比每年研发投入和抖音在一个量级的飞书都要高上不少。

2023年,字节收缩了游戏业务,2024年又精简了飞书团队。字节跳动明白Flow团队,以及豆包、Cici这些产品的投入产出比。

根据Pragma的市场调查,2023年北美语言大模型的市场规模为8.49亿美元,约合60多亿人民币。该市场的复合增长率是72.17%,到了2030年,市场规模将会达到1055亿美元,约合7637亿人民币。

欧洲也毫不逊色,2023年欧洲语言大模型的市场规模是2.71亿美元,约合19.6亿人民币。市场复合增长率为83.3%,2030年市场规模为500亿美元,约合3618亿人民币。

豆包大模型的性能在国际市场中处于非常靠前的位置,具有一定的市场竞争力。那么换言之,字节越早步入国际化,收入就越高。

不过在国际市场中,大模型不少按token来收费的,而是按月。比如ChatGPT的Plus版本,每月的订阅费用为20美元。谷歌AI Premium的订阅费用也是每月20美元。所以字节需要重新考虑定价策略,才能让豆包在国际化的道路上走得比较顺畅。

文:火焰翼人 / 数据猿
责编:凝视深空 / 数据猿

ac5a43c1cb59d7ac80a5db787702eb78.jpeg

2784e0a46ceffcc5d8f5e19c6410bf98.png

3cfa78a2b601ae36af94a2453868560f.png

c59c369272ac7ccd75125b7124a6c93c.jpeg

9863db63654bd817d86a3c44c43882dd.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/657283.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

通过安全的云开发环境重新发现 DevOps 的心跳

云开发平台如何“提升” DevOps 首先,我来简单介绍一下什么是云开发环境:它通常运行带有应用程序的 Linux 操作系统,提供预配置的环境,允许进行编码、编译和其他类似于本地环境的操作。从实现的角度来看,这样的环境类…

猫耳 WebSocket 跨端优化实践

前言 在现代的移动应用程序中,长连接是一种不可或缺的能力,包括但不限于推送、实时通信、信令控制等常见场景。在猫耳FM的直播业务中,我们同样使用了 WebSocket 长连接作为我们实时通信的基础。 在我们推进用户体验优化的工作中,…

如何将音频中的人声分离出来?

想要把一段视频中的人声跟背景音乐分离开来,找个好一点的音频处理软件就能把声音分离了,常见的有以下方法,一起来看看吧。 pr 打开软件,然后将电脑上的音频文件,上传到软件中,然后按住[ctrla]选择所有音频…

6-继承

6-继承 1、基本语法和方式2、继承的基本特点2.1 三种继承方式相同的基本点2.2 三种继承方式的差别2.3 公有继承的独有特点 3、子类的构造、析构3.1 子类的构造3.2 子类的析构3.3 子类的拷贝构造函数3.4 子类的拷贝赋值 4、多重继承4.1 内存布局4.2 类型转换4.3 名字冲突问题 5、…

C语言 | Leetcode C语言题解之第117题填充每个节点的下一个右侧节点指针II

题目: 题解: void handle(struct Node **last, struct Node **p, struct Node **nextStart) {if (*last) {(*last)->next *p;}if (!(*nextStart)) {*nextStart *p;}*last *p; }struct Node *connect(struct Node *root) {if (!root) {return NULL…

【小呆的力学笔记】连续介质力学的知识点回顾一:运动和变形

文章目录 1. 运动的描述2. 拉格朗日描述下的变形2.1 线元的变化2.2 体元的变化2.3 面元的变化 1. 运动的描述 在连续介质力学中,存在着两种对运动的描述,一种为拉格朗日描述,即通过描述每个物质点的运动来描述整个变形体的运动,也…

解决IDEA菜单栏找不到VCS的问题,且使用IDEA推送新项目到托管仓库

问题描述: 在idea软件中使用git推送项目,idea页面顶部菜单栏无VCS 解决方案: 一:File->Settings->Version Control-> 点击 ->选择项目->VCS:->点击ok: 二:托管平台创建一个Git仓库来保…

基于遗传优化的货柜货物摆放优化问题求解matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 5.完整程序 1.程序功能描述 基于遗传优化的货柜货物摆放优化问题求解matlab仿真。在一个货架上,初始状态下,随机将货物放在货柜上,优化之后,整…

openresty(Nginx) 隐藏 软包名称及版本号 升级版本

1 访问错误或者异常的URL 2 修改配置,重新编译,升级 #修改版本等 vim ./bundle/nginx-1.13.6/src/core/nginx.h #define nginx_version 1013006 #define NGINX_VERSION "1.13.6" #define NGINX_VER "openresty/&q…

玩转STM32-直接存储器DMA(详细-慢工出细活)

文章目录 一、DMA介绍1.1 DMA简介1.2 DMA结构 二、DMA相关寄存器(了解)三、DMA的工作过程(掌握)四、DMA应用实例4.1 DMA常用库函数4.2 实例程序 一、DMA介绍 1.1 DMA简介 DMA用来提供外设与外设之间、外设与存储器之间、存储器与…

中国企业出海,哪些业务需要负载均衡?

国内企业出海的进程正在加速。中国的出海企业剑指跨境电商、社交、游戏、短剧等市场,其中尤其以跨境电商的数据最为突出。据官方数据,2023年我国跨境电商进出口总额达到2.38万亿元,比2016年增长近50倍,占货物贸易总规模的5.7%。 …

【Mybatis】映射文件中获取单个参数和多个参数的写法

xml的映射文件中获取接口方法中传来的参数是直接用#{}的方式来获取的 那么接下来,我们就具体来说一下获取参数里边的各种规则和用法 1.单个参数,比如上面的getOneUser,只有一个id值作为参数 Mybatis对于只有一个参数的情况下,不…

机器学习-5-如何进行交叉验证

参考一文带您了解交叉验证(Cross-Validation):数据科学家必须掌握的7种交叉验证技术 参考如何在机器学习中使用交叉验证(实例) 1 交叉验证 1.1 交叉验证的本质 针对中小型数据集常用的一种用于观察模型稳定性的方法——交叉验证。 交叉验证是用来观察模型的稳定性的一种方…

计算机毕业设计hadoop+spark+hive物流大数据分析平台 物流预测系统 物流信息爬虫 物流大数据 机器学习 深度学习

流程: 1.Python爬虫采集物流数据等存入mysql和.csv文件; 2.使用pandasnumpy或者MapReduce对上面的数据集进行数据清洗生成最终上传到hdfs; 3.使用hive数据仓库完成建库建表导入.csv数据集; 4.使用hive之hive_sql进行离线计算&…

基于NAMUR开放式架构(NOA)的工业设备数据采集方案

一 NAMUR开放式架构 传统自动化金字塔结构的优越性在过去许多年里已被证明。然而,传统的自动化金字塔在获取和利用对物联网和工业4.0有价值的数据方面却存在一定挑战。这是因为传统系统通常是封闭的,数据访问受到限制,难以集成到新的数字化解…

eclipse启动时间过长的问题

项目场景: 由于我用eclipse比较习惯,虽然IDEA很好,但是因为收费,所以在个人开发学习过程中一直还是使用eclipse,本文不讨论eclipse与IDEA孰优孰劣问题。 开发环境: 操作系统:Windows 11 22631…

HCIP-Datacom-ARST自选题库__BGP/MPLS IP VPN简答【3道题】

1.在BGP/MPLSIPVPN场景中,如果PE设备收到到达同一目的网络的多条路由时,将按照定的顺序选择最优路由。请将以下内容按照比较顺序进行排序。 2.在如图所示的BGP/MPLSIP VPN网络中,管理员准备通过Hub-Spoke组网实现H站点对VPM流量的集中管控&am…

数字化校园的特征

"数字化校园"是校园信息化进入高级阶段的表现形式,信息技术与教育教育的交融应该更深化。因而,数字化校园应该具以下特征: 1.互联网络高速发展 网络是信息时代的根基,没有网络就无法完成教育信息化的绝大部分作业。数字…

启智CV机器人,ROS

资料: https://wiki.ros.org/kinetic/Installation/Ubuntu https://blog.csdn.net/qq_44339029/article/details/120579608 装VM。 装ubuntu20.04 desktop.iso系统。 装vm工具: sudo apt update sudo dpkg --configure -a sudo apt-get autoremove o…

MagicPose4D:解锁AI驱动的3D模型动作新纪元

在当今快速发展的数字内容创作领域,MagicPose4D正以其革命性的技术颠覆传统动画制作流程,成为创作者手中的魔法棒。这款先进的框架不仅仅是一款工具,更是通往无限创意的一扇门,它使得为3D模型赋予生动、自然的动作变得前所未有的简单和高效。下面,让我们深入探索MagicPose…