大模型618提前开战,永久免费意味着什么?

万万没想到,当我们在说经过上一年的百模大战,2024 年将成为大模型应用落地的关键一年,不承想,AI 大模型价格战疯狂席卷而来。

这场战役始于巨头。字节、阿里、百度、科大讯飞、腾讯先后官宣降价或免费,价格战所带来的是对于所有行业用户、开发者用户而言,究竟谁家的模型 API 才是物美价廉的优选,AI 赛道真正的产品力竞争由此拉开了序幕。

在这之中,科大讯飞的动作颇引开发者注目。其官宣讯飞星火 API 能力正式免费开放,Lite 版本 API 永久免费开放,Pro/Max 版 API 大幅降价,低至 0.21 元/万 tokens。

图片

消息一出,无疑加剧价格战的火药味,也直接推进大模型市场的竞争进入新阶段。对开发者而言,大模型打响价格战之时,究竟该选哪家 API 大展身手?如何更丝滑地深入应用场景创新、探索大模型在不同领域的应用潜力?讯飞星火又有着怎样的优势,为开发者们带来了哪些利好?

图片

基础版本永久免费、顶配版低至 0.21 元/万 Tokens

话不多说,先来看科大讯飞对讯飞星火大模型的具体定价调整情况:

亮点一:讯飞星火 Lite API“永久免费”

这也是业界首个宣布大模型基础版本「永久免费」的公司。从功能上来看,讯飞星火 Lite API 支持在线联网搜索,适用于需要在较低计算能力环境下进行模型推理和精调的定制化场景,旨在为开发者提供一个易于接入且成本效益高的轻量级大语言模型。讯飞星火已经学习了包括金融、能源、工业等 12 个行业的知识,这使得 Lite API 在这些领域内提供更加精准的服务。

图片

它的永久性免费,不仅降低了开发者的使用门槛,还通过不断学习和更新,提供了更加丰富和高效的服务。

亮点二:顶配版迎来史上最低价,输入输出同为 0.21-0.3 元/万tokens

本次科大讯飞也在顶配的 Spark3.5 Max/Spark Pro 版本上实现了更低的价格。

以输出价格为例,支持联网搜索与天气等内置插件、System 角色人设与 Function Calling 函数调用的 Spark3.5 Max API 价格低至 0.21元/万Tokens。在讯飞星火,1 token 相当于 1.5 个中文汉字,因此 2.1 元就足够调用“讯飞星火3.5 Max”生成一部余华《活着》的内容量。

这一点,和近期同样宣布降价的百度文心一言 ERNIE-4.0 和阿里通义千问 Qwen-Max 1.2元/万tokens 的价格相比,讯飞星火定价为百度、阿里的五分之一,更具性价比。

图片

对此,科大讯飞在投资者关系活动上表示,讯飞星火 API(应用接口)免费的相关商业逻辑在讯飞人工智能开放平台已经有成功实践和验证:讯飞开放平台面向全行业提供人工智能能力和整体解决方案,以免费+扶持的策略为主,基本能力免费,对于其他企业做不了的、性能更高的、个性化的定制服务收费。

图片

讯飞星火降价的背后——全国产算力

回看科大讯飞、百度、阿里等国产大模型厂商相继大幅降价的举措,这也不禁让人好奇的是,曾几何时,都说大模型是一场“钞能力”的战争,就连外媒也曾多次报道,走在 AI 大模型前沿的 OpenAI 主要通过三种方式来就生存问题“自救”。

其一是向消费者提供会员订阅服务,即每月收取 20 美元 ChatGPT Plus 订阅服务费,从而提供更快的响应服务,并带来优先使用功能更强大的 GPT-4 等模型策略;二是提供面向开发者的 API 接口调用收费模式;三是借助微软等投资者的投资来加大研发。在过去一年,据 The Information 透露,OpenAI 获得了 16 亿美元的收入,然而这与外媒报道的为运营 ChatGPT 每天要消耗 70 万美金相比,这笔买卖还是亏了很多。

在这种趋势下,科大讯飞为何加入了“降价”这波浪潮,也更加引人关注。

事实上,在过去一年的时间里,国内的大模型制造商在算力、推理和算法等多个方面取得了显著的突破,从而实现了技术层面的成本降低,同时,「基于国产自主可控大模型工程化优势」也是科大讯飞如此做的底气所在。

在算力层面,由于国际竞争环境日趋复杂,为了抢抓通用人工智能时代的发展主动权,有「居安思危」意识的科大讯飞多年前起就加大国产算力的投入,构建一套自主创新的体系,并投入大量的精力展开国产化移植优化的工作。

此前,科大讯飞公布与华为联合打造的“飞星一号”平台,集算、存、运、管四位一体,是首个能够支持万亿参数大模型训练的大规模算力平台。

2023 年 10 月,科大讯飞宣布“飞星一号”万卡国产算力平台正式启用。如今这一平台实现了全国产化,采用昇腾 AI 硬件训练服务器和先进的网络技术,单机算效提升 50%,通信带宽利用率提升 40%,并行训练算法优化 10%,其国产芯片的训练效率已经与英伟达 A100相当,为 AI 提供强大的算力支撑,使得处理复杂任务的大模型训练成为可能,同时极大地降低了算力成本。

借助“飞星一号”,科大讯飞于今年 1 月推出的讯飞星火 V3.5 模型在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了升级。其中语言理解、数学能力超过 GPT-4 Turbo,代码达到 GPT-4 Turbo 96%,多模态理解达到 GPT-4V 91%,推动了数智化生产力的进一步发展。

图片

与此同时,在技术实现上,讯飞星火大模型融合了深度学习和自然语言处理等尖端技术,使其能够高效地处理包括文本、图像在内的多种类型的信息,从而实现全面且深入的认知能力。这种多模态的信息处理机制为模型提供了丰富的知识来源和强大的环境适应能力。

图片

大模型狂卷价格战,对开发者意味着什么?

对于这波降价,CSDN 和多位 AI 资深开发者讨论,有人认为这是大模型厂商的一种营销手段,一方面,厂商通过提供免费或低价服务吸引用户,积累数据来优化自家的模型;另一方面,他们也期待用户在体验基础版本后,转向更高阶的付费服务;还有人认为,这反映了大模型行业内现有性能评测标准的缺乏,既然没有统一的标准,通过直白的比拼价格可以让用户更容易理解和选择。

实际上,许多大模型 C 端产品如 ChatGPT、讯飞星火自发布之日起,便采用了免费的政策。如今 API 的免费与降价,某种程度上表明大模型本身不再稀缺,真正稀缺的是开发者资源,让更多的开发者能够用得起或才是此轮降价的本质,所谓得开发者得大模型的天下,只有用了,才有更多应用、落地场景、数据随之而来。

正因此,科大讯飞表示,焕新的价格体系将帮助开发者降低调用成本,驱动产品创新验证,解决真实世界的刚需。

价格战的开启,就一线开发者而言,如何选用也成为当前亟需解决的难题?

面对不同版本,明确需要完成的任务和处理的数据量,预计产品的用户数量和使用频率,都是选择合适 API 的重要考虑因素。

首先,开发者可利用免费的大模型调用额度进行初步测试和开发,如科大讯飞此次免费提供的 Lite API 已经足够用于小规模应用,虽然这一版本的 QPS 低,但它的 tokens 总量是无限的,较适合个人开发者使用。你可以使用 Lite API 来完成语言理解、内容创作、知识问答、逻辑推理、数学能力这些任务。在不增加预算的情况下,调用 API 为应用添加基本的 AI 功能。

而更高阶的星火 Pro/Max API 则能提供更高级的 AI 服务,适用于代码理解与编写、多模态交互等复杂任务。结合不同 API,开发者可以创造出新的复合服务,如结合语音识别和自然语言处理,开发更智能的语音助手等。

大模型发展至今,除了价格之外,开发者还普遍关注以下几个方面:

  • 生态系统的支持,对于许多垂直行业的应用,使用微调模型和专用部署模式能够更好地体现效果,这超出了 API 服务的范畴。

  • 技术支持,现在很多人并不清楚如何将业务接入 AI 能力,或者只是一知半解。对于相对复杂的任务,如果不能合理拆解步骤,大模型将难以实现相应功能,进而被认为“模型不行”。如果大模型平台能够提供一些典型案例,帮助用户理解复杂任务的拆解过程,明确哪些部分可以通过工程化方式解决,哪些部分推荐接入 AI,将会极大地帮助开发者。

  • 好用性,业务接入 AI 时,最大的挑战在于模型能力。如果模型能力能够满足业务需求且价格合理,开发者会乐于接受;但如果模型能力不足,即使免费也不会使用。

在生态系统维度,科大讯飞也在很早之前便做了战略布局,其采用“1+N认知大模型”实现模型赋能,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。

图片

以教育为例,基于讯飞星火大模型的智能编程助手iFlyCode已成为教师和学生的得力助手。办公场景中,讯飞听见、智能办公本等产品大幅提升了工作效率。智慧城市中,利川的县域智算中心推动了城市公共基础资源的发展。讯飞星火大模型还渗透到了科研、金融、汽车等多个行业。

其次在技术支持上,科大讯飞近日宣布,面向大模型开发者,讯飞星火开通了专属服务通道,聚焦零故障运行的 SRE 体系、1+X+N 的模型能力矩阵、技术专家 1V1 在线支持、全年近百场交流活动四大核心维度,全面升级服务体系。

图片

最后,相对于免费和降价的策略,大模型厂商也需要进一步的打磨自己的高精尖能力,怎么实现低价、高速、好用才是硬道理,这其间又将涉及到诸多的 PK。有专家向 CSDN 预测,大模型的价格之战,最后必然只存活两三个通用模型,其竞争激烈程度可见一斑。

面向未来,科大讯飞加快了脚步,即将于 6 月发布直接对标 GPT-4-Turbo 的讯飞星火大模型 4.0 版本。科大讯飞董事长刘庆峰于近日 BEYOND 国际科技创新博览会上对即将发布的新一版本表示,「我们与 GPT-4 的差距在半年之内,今年 6、7 月前后就能赶上 GPT-4 目前水平。一旦 GPT-5 发布后,差距可能会被拉到约一年,但我们会再次赶上。」

我们也将共同见证讯飞星火大模型 4.0 版本的到来,期待更多开发者利用大模型 API 大展身手,加速更多应用落地,助力 AI 普惠。

来源:CSDN微信公众号

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/635922.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

风控指南:国内车险欺诈呈现四大趋势

目录 车险欺诈呈现内外勾结的团伙化 防范车险欺诈需要多重合作 保险企业需要提升反欺诈能力 监管部门需要加强协同合作 2024年4月11日,国家金融监督管理总局官网发布国家金融监督管理总局关于《反保险欺诈工作办法(征求意见稿)》公开征求意见…

正点原子[第二期]Linux之ARM(MX6U)裸机篇学习笔记-16讲 EPIT定时器

前言: 本文是根据哔哩哔哩网站上“正点原子[第二期]Linux之ARM(MX6U)裸机篇”视频的学习笔记,在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了正点原子教学视频和链接中的内容。…

Lumines推出RGBL彩色混合LED

Luminus Devices倾心打造了一款崭新的4合1 RGBL(红绿蓝绿石灰)LED系列,专为舞台与建筑照明领域量身打造,满足对高显色指数(CRI)与高输出颜色混合的苛刻需求。这一创新之举,无疑是照明技术的一次…

【OpenGL实践10】关于几何着色器

目录 一、说明 二、几何着色器 2.1 设置 2.2 基本几何着色器 2.2.1 输入类型 2.2.2 输出类型 2.2.3 顶点输入 2.2.4 顶点输出 2.3 创建几何着色器 2.4 几何着色器和顶点属性 三、动态生成几何体 四、结论 练习 一、说明 几何着色器的应用比较高级,关于…

Postman使用技巧

Postman是一款广泛使用的API开发和测试工具,专为简化Web服务API的开发、测试、文档编制和协作过程而设计。它支持各种HTTP请求方法,包括GET、POST、PUT、DELETE等,允许用户轻松地构建和发送请求,以及检查响应。 本文介绍几个提升效…

Linux信号:信号的概念及意义

目录 一、什么是信号 kill-l查看信号 二、信号的产生 2.1系统调用 kill raise abort 2.2软件条件 13)SIGPIPE pipe信号 14)SIGAKARM alarm信号 2.2硬件中断 2.3异常 8)SIGFPE 除0异常 11)SIGSEGV 野指针 2.4信号处理的常见方式 三、Core Dump和term…

docker如何拉取redis最新镜像并运行

要拉取Docker Hub上最新版本的Redis镜像,您可以使用以下命令: docker pull redis:latest 这里的latest标签会自动获取Redis镜像的最新版本。如果您希望指定一个确切的版本号,可以直接使用该版本号替换latest。例如,要拉取Redis版…

Python | Leetcode Python题解之第108题将有序数组转换为二叉搜索树

题目: 题解: class Solution:def sortedArrayToBST(self, nums: List[int]) -> TreeNode:def helper(left, right):if left > right:return None# 选择任意一个中间位置数字作为根节点mid (left right randint(0, 1)) // 2root TreeNode(nums…

计算机网络数据链路层知识点总结

3.1 数据链路层功能概述 (1)知识总览 (2)数据链路层的研究思想 (3)数据链路层基本概念 (4)数据链路层基本功能 3.1 封装成帧和透明传输 (1)数据链路层功能…

上海亚商投顾:三大指数均跌超1.3%,全市场下跌个股超4600只

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 一.市场情绪 市场全天震荡调整,三大股指均跌超1.3%。PEEK概念股逆势大涨,肯特股份、沃特股份涨停&a…

[STM32-HAL库]AS608-指纹识别模块-STM32CUBEMX开发-HAL库开发系列-主控STM32F103C8T6

目录 一、前言 二、详细步骤 1.光学指纹模块 2.配置STM32CUBEMX 3.程序设计 3.1 输出重定向 3.2 导入AS608库 3.3 更改端口宏定义 3.4 添加中断处理部分 3.5 初始化AS608 3.6 函数总览 3.7 录入指纹 3.8 验证指纹 3.9 删除指纹 3.10 清空指纹库 三、总结及资源 一、前言 …

AI赋能 企业智能化应用实践

前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家:https://www.captainbed.cn/z ChatGPT体验地址 文章目录 前言云定价优化语音助手与聊天机器人预测性维护客服运营自动化低功耗微处理器神…

无线网络安全技术基础

无线网络安全技术基础 无线网络安全风险和隐患 随着无线网络技术广泛应用,其安全性越来越引起关注.无线网络的安全主要有访问控制和数据加密,访问控制保证机密数据只能由授权用户访问,而数据加密则要求发送的数据只能被授权用户所接受和使用。 无线网络在数据传输时以微波进…

微软MSBuild大会发布Copilot+PC:技术革新还是隐私噩梦?

微软在最近的MSBuild 2024大会上发布了全新的CopilotPC概念,这一技术结合了高通骁龙X Elite芯片,将人工智能与PC紧密结合。此次发布引起了广泛关注,不仅是因为其技术创新,还因为潜在的隐私问题。甚至连Elon Musk也对此表示担忧&am…

Nginx企业级负载均衡:技术详解系列(11)—— 实战一机多站部署技巧

你好,我是赵兴晨,97年文科程序员。 工作中你是否遇到过这种情况:公司业务拓展,新增一个域名,但服务器资源有限,只能跟原有的网站共用同一台Nginx服务器。 也就是说两个网站的域名都指向同一台Nginx服务器…

WPF中DataGrid实现多选框功能

1. 效果图 2. Model建立 public class RstModelCheck : ObservableObject {//为了显示Head1和Head2.而且View中绑定属性而非字段,否则不能显示。public string? Name { get; set; } public bool PlatenAll {get > _platenAll;set{SetProperty(ref _platenAl…

MoonDream2微调指南【最小VLM】

在本指南中,我们将探讨如何使用计算机视觉数据集对完全开源的小型视觉语言模型 Moondream2 进行微调,以计数项目(这是 GPT-4V 一直表现不一致的任务),并以一种可以依赖输出用于生产应用程序的方式进行微调。 视觉语言…

电力巡检穿戴式智能手环:让巡检不孤立无援

电力巡检穿戴式智能手环:让巡检不孤立无援 在电力巡检的广袤天地里中,电力工作人员他们身着工装,头戴安全帽,手持仪器,穿梭在高压线路与铁塔之间。他们的健康状态,直接关系到电力作业的安全与效率。如今,电…

先进电气技术 —— 控制理论中的“观测器”概述

一、背景 观测器在现代控制理论中的地位十分重要,它是实现系统状态估计的关键工具。观测器的发展历程可以从以下几个方面概述: 1. 起源与发展背景: 观测器的概念源于对系统状态信息的需求,特别是在只能获取部分或间接输出信息…

免费分享一套微信小程序旅游推荐(智慧旅游)系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】,帅呆了~~

大家好,我是java1234_小锋老师,看到一个不错的微信小程序旅游推荐(智慧旅游)系统(SpringBoot后端Vue管理端)【论文源码SQL脚本】,分享下哈。 项目视频演示 【免费】微信小程序旅游推荐(智慧旅游)系统(SpringBoot后端Vue管理端) Java毕业设计…