OpenAI封锁中国?国产大模型开启价格战?收好这份LLM选购指南,带你搞定极致性价比 | ShowMeAI

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!



1. Cloud LLM capability, cost, performance | 一份开发者最实用的大模型「性价比」计算手册

这是 Harlan Lewis 整理的大语言模型 (LLM) 对比清单,从capability 能力cost 成本throughput 吞吐量 三个指标,对国外最新主流大模型进行了打分,并绘制了可视化图。


完整版本如下所示 👇

模型数量:27 (国外为主)

更新频率:非常及时

推荐指数:⭐⭐⭐⭐⭐


开发者最常使用 & 近期推出的领先大模型,都被加入了这份表单。比如,Claude 3.5、GPT-4o、Gemini 1.5、Llama 3、Groq、Phi、Command R+ 等大模型系列,以及来自中国的 DeepSeek-V2。

评价指标包含两部分。上半部分 (黄色背景) 是各大模型在 MMLU、MATH、GPQA、HumanEval、MT Bench 等基准测试中的得分;下半部分 (白色背景) 是各大模型在各项测评指标中的得分,包括上下文窗口、最大输出 token 数、吞吐量、速率限制、1M token 的输入成本 & 输出成本……


根据作者设定的评价指标,有几个关键结论值得注意:

  • 👍 GPT-4o 功能一骑绝尘,吞吐量仅仅次于最快的模型,成本也控制得非常好。
  • 👍 Gemini 1.5 Flash 吞吐量遥遥领先 (不包括 Groq) ,在基准测试中表现不错,每个 token 的成本也控制到较低。
  • Gemini 1.5 Flash 和 GPT-4o 这两个模型一起,几乎覆盖了各种功能/速度/成本需求的任务,完全取代了5月份之前的开发方案
  • 👎 Claude 3 Opus 功能靠前,但吞吐量低,且每个token的成本很高。它与初始版本的 GPT-4 相比还算有优势,但与最新的前沿大模型 (GPT-4o、GPT-4 Turbo、Gemini 1.5 Pro、Llama 3 70B) 相比,Claude 3 Opus 在成本方面完全没有竞争力。
  • Groq 系列大模型有多种版本,且吞吐量和成本都有巨大的领先优势。但因为它的云API服务还不成熟,所以没有在表单中呈现出来。

原始的 Google 在线表单,作者维护和更新都非常及时。你可以访问 👇 下方链接获取最新版

官网 → https://docs.google.com/spreadsheets/d/1foc98Jtbi0-GUsNySddvL0b2a7EuVQw8MoaQlWaDT-w



2. Artificial Analysis | 一份更完备、更客观的 AI大模型 (LLM) 购物指南

Artificial Analysis 是目前看到最完备的大模型性能对比网站啦!

不仅基于数据进行了大量分析和可视化,还给出了 质量、价格、性能、速度、上下文窗口等关键指标的 详细排名,帮你选择最合适的大模型和API提供商。


感受下网站风格和主要内容 👇

模型数量:38 (国外为主)

更新频率:非常及时

推荐指数:⭐⭐⭐⭐⭐


网站对比维度非常丰富,可视化图 & 结论也很清晰,而且支持自定义交互,非常实用!

  • 各能力维度的比较 (Quality Comparison by Ability)
  • 质量 vs. 吞吐量 (Quality vs. Throughput)
  • 质量 vs. 价格 (Quality vs. Price)
  • 吞吐量 (Throughput)
  • 定价:输入和输出价格 (Pricing: Input and Output prices)
  • ……

整体来看,各关键指标中得分高的大模型有 👇

  • 质量 (Quality):GPT-4o、GPT-4 Turbo、Claude 3 Opus、Llama 3 (70B)
  • 吞吐量 (Throughput):Gemma 7B、Gemini 1.5 Flash、Llama 3 (8B)、GPT-3.5 Turbo Instruct
  • 延迟 (Latency):Mistral 7B、Mistral Medium、Mixtral 8x7B、Mixtral 8x22B
  • 价格 (Price):Gemma 7B、OpenChat 3.5、DeepSeek-V2、Llama 3 (8B)
  • 上下文窗口 (Context Window):Gemini 1.5 Flash、Gemini 1.5 Pro、Claude 3 Opus、Claude 3 Sonnet

单拿出价格一栏,可以看到大模型输入/输出价格的明显变化。右侧交互框支持勾选自己想添加参与比价的其他大模型

整个网站收录了国外主流前沿大模型,国内的依旧只有 DeepSeek-V2-Chat 大模型入选。网站底部有这些大模型清单,点击还可以跳转到每个大模型的专属介绍页面。

官网 → https://artificialanalysis.ai



3. LLM API Pricing Calculator | 大模型 API 价格计算器,一步到位的价格计算助手

这个网站非常有意思!

手动设定大模型的输入& 输出值,网站下方可以直接显示各个大模型的费用额度。而且!网站还支持 tokens、Words、Characters 这三种不同的计算类型 👏 再也不用自己苦哈哈地换算了~


网站截图如下 👇 赶紧加入收藏夹~

模型数量:25 (国外)

更新频率:比较及时

推荐指数:⭐⭐⭐⭐⭐


唯一比较可惜的点在于,网站收录的大模型数量比较少 (当然主流的也都包括啦),而且木有国产大模型~

官网 → https://docsbot.ai/tools/gpt-openai-api-pricing-calculator



4. The Fastest AI | 各大模型 token 生成速度对比网站,三个指标综合测评

这是一个专门对比各大模型 token 生成速度的网站,并且非常科学地设定和计算了3个指标的得分。而且表单顶部还支持交互筛选。

  • TTFT:到首个 token 的时间 (Time To First Token)
  • TPS:每秒 token 数量 (Tokens Per Second)
  • Total Time:从请求发出到最终 token 生成的总时间 (From request to final token)

绿色背景表示生成速度快,红色背景表示慢 👇

模型数量:56 (国外)

更新频率:非常及时

推荐指数:⭐⭐⭐⭐⭐


原网站底部,对指标的定义和计算方式,有非常清晰的解释说明。感兴趣可以访问下方链接 👇

官网 → https://thefastest.ai



5. LLM Pricing | 包含最多大模型&供应商的比价网站,简明清晰

LLM Pricing 应该是传播度最广泛的比价网站之一

网站整合了大模型官网、云服务供应商等多种渠道的价格信息,并对输入&输出价格进行了比较。


以下是网页截图 👇 更新还算及时,可以收藏当作比价小助手!

模型数量:63 (国外)

更新频率:非常及时

推荐指数:⭐⭐⭐⭐


网站收录了 60+ 主流厂商和前沿大模型,挺全面的!唯一可惜的就是,木有国内的大模型~ 所以还是要自己比较价格和性能了~

官网 → https://llm-price.com



6. AIGCRank | 国内外AI大语言模型API价格对比

终于!有一个中文的大模型的对比网站了

AIGCRank 是一个专门汇总和比较全球主要AI模型提供商的价格信息的工具,提供最新的大语言模型价格数据,以及一些免费的AI大模型API。

模型数量:138 (国内外主流大模型)

更新频率:比较及时

推荐指数:⭐⭐⭐⭐

官网 → https://aigcrank.cn/llmprice/



7. 大模型性能全景图 | 一份文档追全球 400 家大模型进展

这是国内开发者维护的一份大模型全景图,整理了近 400 个国内外大模型&性能参数,并据此整理了学霸榜、全球开源榜、国内开源榜、多模态榜、贵榜 、宜榜等多个实用榜单,还把参数进行了可视化供直观判断。

模型数量:376 (国内外几乎所有重要大模型)

更新频率:比较及时

推荐指数:⭐⭐⭐⭐

链接 → https://langgptai.feishu.cn/wiki/HteYwsIMpimxO8kFqJ8cylqEnoe?table=tbl2mBh6CE5ezghR&view=vewbhF3k1V

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ > 前往 🎡ShowMeAI,获取结构化成长路径和全套资料库,用知识加速每一次技术进步!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/749366.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深入浅出:npm常用命令详解与实战

theme: smartblue npm是什么 npm(Node Package Manager)是Node.js平台的默认包管理器,它让JavaScript开发者能够轻松地共享、管理和使用彼此编写的代码模块。npm不仅仅是一个安装工具,它还是一个全面的生态系统,用于发…

为什么要本地化您的多媒体内容?

当我们访问网站、应用程序和社交媒体时,体验不再局限于陈旧的文本和静态图像。现代处理能力和连接速度提高了快速加载视频、音频和动画的可能性。 这一切都提供了更具沉浸感和互动性的用户体验。多媒体是数字营销中最有效的内容之一,因为它对用户更具吸…

笔记本电脑录屏,教你3个方法,简单录屏

随着科技的飞速发展,笔记本电脑录屏功能已经不再局限于传统的录制需求,而是成为了探索屏幕动态的新方式。无论是创意工作者、游戏爱好者还是日常办公者,都可以借助这一功能,将屏幕上的精彩瞬间、重要信息或创新思路记录下来&#…

记录跨度3年的SqlServer数据同步项目分析

目录 技术选型决策阶段 发布订阅 自定义开发 Datax Datax废除主外键关系和自增ID ER模型分组 废掉库表主外键 维度划分Datax任务 基于ID同步 基于TIME时间同步 基于全表ALL同步 废掉自增ID DataX废除主外键关系手动拷贝 手动拷贝 Datax任务分组触发器 Datax全表…

基于Java微信小程序自驾游拼团设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟感兴趣的可以先收藏起来,还…

深度学习11-20

1.神经元的个数对结果的影响: (http://cs.stanford.edu/people/karpathy/convnetjs/demo/classify2d.html) (1)神经元3个的时候 (2)神经元是10个的时候 神经元个数越多,可能会产生…

Django安装与启动

1、Django是什么? 基于python的Web开发框架,支持用户快速开发安全、可维护的网站 2、怎么安装? pip install Django4.2 3、如何启动? 不写ip和端口时候,默认启动http://127.0.0.1:8000/ python .\manage.py runse…

STM32HAL库 -- RS485 开发板通信(速记版)

在本章中, 我们将使用 STM32F429的串口 2 来实现两块开发板之间的 485 通信(半双工)。 RS485 简介 485(一般称作 RS485/EIA-485)隶属于 OSI 模型物理层,是串行通讯的一种。电气特性规定为 2 线,半双工,多…

基于Java的家教信息管理平台

作者介绍:计算机专业研究生,现企业打工人,从事Java全栈开发 主要内容:技术学习笔记、Java实战项目、项目问题解决记录、AI、简历模板、简历指导、技术交流、论文交流(SCI论文两篇) 上点关注下点赞 生活越过…

入门篇:创建和运行Hello World

DevEco Studio安装完成后,可以通过运行Hello World工程来验证环境设置是否正确。接下来以创建一个支持Phone设备的工程为例进行介绍。 创建一个新工程 打开DevEco Studio,在欢迎页单击Create Project,创建一个新工程。根据工程创建向导&…

手持小风扇哪个品牌好耐用?手持小风扇品牌排行榜揭晓分享

炎炎夏日,手持小风扇、USB小风扇,成为人手一台的“网红”。这些小风扇造型小巧,可以装进包里,夏日出街或者挤公交地铁都可以拿出来吹一吹。那么这些小风扇性价比高不高呢?真的好用吗?耐用吗?根据…

小程序开发平台源码系统——内容付费(知识付费)小程序功能 带完整的安装代码包以及搭建部署教程

系统概述 随着互联网的发展,人们对于知识和信息的获取需求日益增长。内容付费小程序应运而生,为用户提供了一个便捷、高效的知识交易平台。小程序开发平台源码系统则为开发者提供了构建内容付费小程序的基础和工具,使其能够快速打造具有个性化…

svn明明都在环境变量中添加了,但还是无法在cmd中生效

svn明明都在环境变量中添加了,但还是无法在cmd中生效 cmd显示原因问题解决 cmd显示 svn不是内部或外部命令,也不是可运行的程序或批处理文件 原因 安装svn一直点下一步下一步…,没有勾选command line client。 问题解决 1.按下winx&…

Win10环境下chromadb安装报错的解决方案

ChromaDB(也称为Chroma)是一个开源的向量数据库,主要用于AI和机器学习场景。本文记录安装过程中遇到的问题及解决方式。 执行pip安装命令 pip install chromadb0.4.15 -i https://pypi.tuna.tsinghua.edu.cn/simple问题一 报错信息 error…

艺术与科技的精湛融合:探讨AI绘画与AI动画的交汇点

前言 艺术与科技的精湛融合:探讨AI绘画与AI动画的交汇点 在当代社会中,艺术和科技的结合呈现出了从来灭有的创新和可能性。随着人工智能技术的不断发展,AI绘画与AI动画的融合愈发引人瞩目。这一融合不仅给艺术家们带来了更多创作的可能&…

C语言实现KMP算法

#include<stdio.h> #include<string.h> #include<stdlib.h>void getNextArray(char * sub_str, int sub_str_length, int * next_array); int kmpSearch(char * sub_str, char * main_str);int main(void) {// 1 声明用于算法处理的字符串char origin_str[] …

量化交易策略:定义及其重要性

量化交易是华尔街和硅谷的秘密结合点&#xff0c;在这里数学和算法与金钱和市场相遇。虽然它曾经是金融巨头的专属领域&#xff0c;但现在它比以往任何时候都更易于接触。 但不要被愚弄&#xff0c;量化交易仍然是一种高速、高压的游戏&#xff0c;在毫秒间可以赚到或失去财富…

ManageEngine连续荣登Gartner 2024年安全信息和事件管理魔力象限

我们很高兴地宣布&#xff0c;ManageEngine再次在Gartner的安全信息和事件管理&#xff08;SIEM&#xff09;魔力象限中榜上有名&#xff0c;这是我们连续第七年获得这一认可。 Gartner ManageEngine Log360是一款全面的SIEM解决方案&#xff0c;旨在帮助组织有效处理日志数据…

Quads,一个无敌的 Python 库!

更多资料获取 &#x1f4da; 个人网站&#xff1a;ipengtao.com 大家好&#xff0c;今天为大家分享一个无敌的 Python 库 - Quads。 Github地址&#xff1a;https://github.com/fogleman/Quads 在科学计算和工程应用中&#xff0c;数值积分是一个常见的问题。Python的Quads库…

Java基础知识整理笔记

目录 1.关于Java概念 1.1 谈谈对Java的理解&#xff1f; 1.2 Java的基础数据类型&#xff1f; 1.3 关于面向对象的设计理解 1.3.1 面向对象的特性有哪些&#xff1f; 1.3.2 重写和重载的区别&#xff1f; 1.3.3 面向对象的设计原则是什么&#xff1f; 1.4 关于变量与方…