真要这么卷?某国产大模型定价下调90%,百万 tokens 只需 1 元!

就在刚刚,国内明星AI公司——智谱AI官宣重磅炸弹:

将能力对标GPT3.5-Turbo的GLM-3的大模型API调用价格最高下调90%,价格仅为原来的十分之一!

废话不多说,直接上图:

图片

官网地址:https://open.bigmodel.cn/

一句话解释:在不使用Batch API的情况下,GLM-3 Turbo的模型定价降80%;在使用Batch API的情况下,价格再额外减半,达90%降幅!

即将推出的GLM-3 Turbo Batch 批处理 API(异步任务处理),适用于无需实时响应场景,包括效果评估、数据批处理等任务。

与GLM-3能力接近的主流国产大模型还有百度文心一言ERNIE-3.5、阿里通义千问Qwen-Turbo,这几个都是能力对标GPT3.5的国产大模型。

 GPT-3.5研究测试:

yeschat

GPT-4研究测试:

Hello, LLMs

Claude-3研究测试(全面吊打GPT-4):

AskManyAI

很多人可能对GLM-3 Turbo降价后的1元=200万tokens没什么概念,笔者给大家上了个直观的大模型价格对比图:

图片

可以看到,智谱GLM-3 Turbo的新定价相比其他几家能力相近的模型,简直是低到冷人发指,就差把免费二字贴到脑门上了。

如果你是个小红书博主,平均每篇小红书笔记360字,那么你给GLM-3 Turbo充值 1块钱,你可以写 10000篇 小红书推文...

你能坚持日更的话,得发27年才能把这一块钱花完

图片

ps:对于小红书推文来说,亲测GLM-3 Turbo能力够用了

今天这一刻让笔者恍惚间回到了若干年前的滴滴Uber补贴大战,亦或是更早的外卖补贴大战,面临今天这似曾相识的一幕,笔者心里只有一个声音:

打起来!打起来!

好了,严肃,聊点认真的。

作为AI从业者,笔者深知大模型价格大幅下降所带来的意义有多恐怖。而智谱作为国产大模型技术的领军厂商,率先打响第一枪,放在若干年后回头看,这很可能成为一个里程碑事件。

Sam Altman在一次采访中提到:

“高质量的人工智能的成本会越来越便宜,将持续降低到接近于0”

夕小瑶科技说

,赞31

大模型技术,若要深刻的改变世界,意味着它具备影响全球十亿人的影响力。而要影响全球十亿人,意味着大模型技术的访问成本要足够低,才能支撑起来繁荣、强网络效应的上层应用。

智谱AI的这一枪,让国内的AI产业链比国外更早的迈入“超低成本构建上层AI应用”的时代。尽管国内的大模型基础技术没有国外成熟,但价格却率先卷了下来,这意味着国内在AI应用生态上,有望比国外更早的出现免费的现象级AI应用。

接下来,就得看智谱的友商的表现了。

看到这,你可能会问,为什么是智谱AI打响了价格战第一枪?

这还得从夕小瑶科技说前阵子发表的这篇文章《网传Llama 3比肩GPT-4?别闹了》 说起。

智谱AI此次降价,既不是有钱任性、也不是拼命,而是因为——

技术实力够强所带来的“任性”

笔者通过调研发现,智谱AI研发了一系列的模型推理算子优化、模型压缩及硬件高效适配、高性能系统实现以及精细化集群调度等技术,全链路技术优化下,大幅压缩了GLM-3 Turbo的推理成本。

提一个比较恐怖的数字。

自大模型开放平台上线以来,在模型效果和推理性能不断提升的情况下,据粗略估算,模型的调用价格已累计降价超过100倍

图片

智谱AI大模型开放平台是智谱GLM系列大模型的体验与接入平台,智谱大模型全家桶包括GLM-3-Turbo、GLM-4、视觉理解大模型GLM-4V、文生图模型CogView-3、代码模型 CodeGeeX 、超拟人角色定制模型CharacterGLM,擅长中文的向量模型Embedding-2等,几乎涵盖大模型应用开发的所有场景。

平台传送门:https://open.bigmodel.cn/

在这个恐怖的数字背后,是智谱AI持续的技术创新和积累,从底层算法、预训练框架、到国产硬件适配,GLM系列模型全链路技术不仅安全可控,且已比肩世界先进水平。

笔者深入研究了智谱AI大模型开放平台后发现,bigmodel.cn 上已经聚集了超过数十万的企业和开发者,并且在持续快速增长,过去的半年每日tokens消耗增长超过一百倍

它不仅拥有完整的商业化套件,甚至还提供开箱即用的AI应用开发资源和官方的调用工具,比如:

  • 网页检索web search

  • 函数调用function call

  • 知识库检索retrival

这些工具自1月份上线以来已被累计调用超 3亿次

目前,智谱AI大模型开放平台形成了强大的大模型技术与应用共济生态。

最后,不得不再提一嘴智谱AI领跑业界的技术实力。

在刚刚结束的ICLR2024顶级会议上,智谱AI成为了唯一一家受邀演讲的中国AI厂商,分享了GLM大模型面向AGI的三大技术趋势:

  1. 基于超级认知SuperIntelligence和超级对齐SuperAlignment技术的GLM-4升级版本,在多模态和AI安全方面有很大提升;

  2. 提出以大模型为中心的通用计算系统GLM-OS,目的是解决复杂任务;

  3. 公开了正在探索中的GLM-Zero技术项目,模仿人类的无意识的学习机制,这将是通过AGI必经之路。

在这次演讲中,智谱还透露了一个重要信息:

接下来GLM-4.5会迎来文本能力和多模态能力的升级!

又是卷起价格战,又是在AI顶级会议上受邀演讲,甚至还有这即将到来的GLM“旗舰模型”的重磅升级。智谱AI的这一系列操作已经把国内广大AI开发者的期待值拉满了!

话不多说,flag当立。

等出来后,小编我第一时间给大家测评!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/618555.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【SRC实战】前端脱敏信息泄露

挖个洞先 https://mp.weixin.qq.com/s/xnCQQCAneT21vYH8Q3OCpw “ 以下漏洞均为实验靶场,如有雷同,纯属巧合 ” 01 — 漏洞证明 一、前端脱敏,请求包泄露明文 “ 前端脱敏处理,请求包是否存在泄露? ” 1、获取验…

公有云Linux模拟UDP端口并抓包

目录 写在前面操作步骤服务端开启UDP端口并监听客户端连接Wireshark抓包查看 写在前面 关于具体的操作,请参考我的上一篇文章 公有云Linux模拟TCP三次挥手与四次握手(Wireshark抓包验证版) 在本文,仅介绍与上一篇不同的地方。 操…

STL中的优先级队列

目录 1.引言 2.简介 3.基本操作 4.实现原理 5.自定义优先级比较 6.相关题目 7.能特点 8.总结 1.引言 在C标准库中,优先级队列是一种非常有用的数据结构,它允许我们根据元素的优先级来对其进行排序和访问。这种数据结构在多种应用场景中都发挥着重…

Linux提权--第三方软件MYSQL数据库提权(WEB+本地)

免责声明:本文仅做技术交流与学习,非法搞事后果自负... 目录 靶场镜像: 过程: 手工: 下载mysql udf poc 进行编译. 进入数据库进行UDF导出 下载(上传) 创建do_system函数调用 探针(./LinEnum.sh),查找suid权限. 配合使用find调用执行 工具: 过程: 外连不上? 隧道出…

云器Lakehouse:Multi-Cluster弹性架构如何实现湖上高并发低延迟分析

导读 在当今快速发展的大数据时代,数据平台的性能和效率对于企业来说至关重要。云器Lakehouse的Multi-Cluster弹性架构为我们提供了一种全新的视角,以应对数据湖上高并发和低延迟分析的挑战。本文将深入探讨云器Lakehouse如何通过其独特的技术理念和架构…

B端弹窗设计指南,3000字讲清楚,内附大量案例。

B端系统弹窗是指在企业级(Business to Business)系统中,弹出的窗口或对话框,用于向用户展示信息、提供操作选项或者收集用户输入。 一、B端系统弹窗的作用 作用如下: 提示和通知:弹窗可以用于向用户展示重…

Maven多环境与SpringBoot多环境配置

1. Maven多环境配置与应用 1.1 多环境开发 我们平常都是在自己的开发环境进行开发, 当开发完成后,需要把开发的功能部署到测试环境供测试人员进行测试使用, 等测试人员测试通过后,我们会将项目部署到生成环境上线使用。 这个时…

RisingWave基本操作

什么是RisingWave RisingWave 是一款基于 Apache 2.0 协议开源的分布式流数据库。RisingWave 让用户使用操作传统数据库的方式来处理流数据。通过创建实时物化视图,RisingWave 可以让用户轻松编写流计算逻辑,并通过访问物化视图来对流计算结果进行及时、…

Mobilenet四代网络模型架构

一、Mobilenet v1 MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 论文地址:https://arxiv.org/abs/1704.04861https://arxiv.org/abs/1704.04861 1.概述 Mobilenet是一个用于移动端和嵌入式的神经网络,其核心思想是采用深度可分离…

六西格玛遇上AI:质量提升进入“快车道”

人工智能(AI)与六西格玛管理方法——正在慢慢接近我们的视野中,预示着在质量管理中一场改革重大改革将要到来。 AI,作为科技的前沿,正以其强大的数据处理能力和机器学习能力,为质量管理提供全新的视角。它…

四十九坊股权设计,白酒新零售分红制度,新零售策划机构

肆拾玖坊商业模式 | 白酒新零售体系 | 新零售系统开发 坐标:厦门,我是易创客肖琳 深耕社交新零售行业10年,主要提供新零售系统工具及顶层商业模式设计、全案策划运营陪跑等。 不花钱开3000多家门店,只靠49个男人用一套方法卖白酒…

docker-compose集成elk(基于logstash+filebeat)采集java和nginx日志

1.准备compose.yml编排式文件 services: #日志信息同步logstash:container_name: logstashimage: docker.elastic.co/logstash/logstash:7.17.14 #logstash:command: logstash -f /usr/share/logstash/pipeline/logstash.confdepends_on:- elasticsearchrestart: on-failurepo…

基于yolov5+gradio目标检测演示系统设计

YOLOv5与Gradio:目标检测可视化展示的新篇章 随着人工智能技术的深入发展,目标检测已成为现代智能应用中的一项关键技术。YOLOv5,作为目标检测领域的杰出代表,凭借其出色的实时性和准确性,赢得了广泛的认可和应用。而…

wordpress增加谷歌分析

wordpress增加谷歌分析 为了更好的浏览体验,欢迎光顾勤奋的凯尔森同学个人博客 http://www.huerpu.cc:7000 一、创建谷歌分析账号与媒体应用 谷歌分析地址:https://analytics.google.com/analytics 创建一个账号,如果你没有的话。 在该账…

Java8 ConcurrentHashMap 存储、扩容源码阅读

文章目录 1. 概述2. 入门实例3. 属性4. 核心方法4.1 put4.2 initTable4.3 transfer4.4 sizeCtl4.5 sizeCtl bug 1. 概述 ConcurrentHashMap 是线程安全且高效的 HashMap。 HashMap 可以看下我这篇 传送门 。 2. 入门实例 public class MyStudy {public static void main(St…

Express框架下搭建GraphQL API

需要先下载apollo-server-express,apollo-server-express是Express框架下,用于构建GraphQL服务的中间件,属于Apollo Server的一部分: npm install apollo-server-express 随后在index.js添加 apollo-server-express包&#xff1…

gin自定义验证器+中文翻译

gin自定义验证器中文翻译 1、说明2、global.go3、validator.go4、eg:main.go5、调用接口测试 1、说明 gin官网自定义验证器给的例子相对比较简单,主要是语法级别,便于入门学习,并且没有给出翻译相关的处理,因此在这里记…

鸿蒙开发接口Ability框架:【 (Context模块)】

Context模块 Context模块提供了ability或application的上下文的能力,包括允许访问特定于应用程序的资源、请求和验证权限等。 说明: 本模块首批接口从API version 6开始支持。后续版本的新增接口,采用上角标单独标记接口的起始版本。 本模块…

什么是数据平台——企业构建Data+AI的基础数据底座需要的决策参考

什么是数据平台 标准的解释是这样的 Wikipedia A data platform usually refers to a software platform used for collecting and managing data, and acting as a data delivery point for application and reporting software. 数据平台是指将各类数据进行整合、存储、处…

【C++】继承(菱形继承的深入理解)

在本篇博客中,作者将会带领你深入的理解C中的继承。 注意!!!本篇博客是在32位机器下进行讲解的,64位下会有所不同,但大同小异。 一. 继承的概念及定义 继承的概念 什么是继承?为什么要有继承&…