开源大模型和闭源大模型,打法有何区别?

现阶段,各个公司都有自己的大模型产品,有的甚至不止一个。除了小部分开源外,大部分都选择了闭源。那么,头部开源模型厂商选择开源是出于怎样的初衷和考虑?未来大模型将如何发展?我们来看看本文的分享。

img

在对人工智能发展史的观察中,我们发现了AIGC以及它背后的大语言模型在近年高速发展的诸多偶然与必然(可回顾历史文章《关于AIGC崛起与行业发展,我有几点小观察…》

但近两年,大批大语言模型应用的涌现以及“百模大战”的兴起,却与“模型开源”这个动作密不可分。

除了开放性,现阶段的开源和闭源大模型在盈利模式、商业打法、发展策略等方面有何区别?头部开源模型厂商选择开源又是出于怎样的初衷和考虑?未来开源和闭源大模型将如何发展?下文揭晓。

一、开源和闭源大模型的差异化打法

在大众的认知中,开源软件往往指向完整共享源代码,任何人都能使用、检查、修改和分发其源代码的产品。

在计算机科学与技术发展进程中,Linux(操作系统)、Python、JavaScript(编程语言和框架)、MySQL(数据库)、Transformer(深度学习框架)等产品的开源都显得意义非凡。

开源大模型虽属开源阵营中的一员,但现阶段大多数开源的大模型并不像开源软件那样共享完整的源代码、数据集、训练过程等细节,更多属于权重方面的有限开源。

这里面有大模型开发的数据量级、训练复杂度等方面的原因。因为这层缘故,大多数开源模型更多依靠开源方来推动产品研发和迭代,社区贡献度有限。

img产品经理如何做好B端数字化?各行各业都搭上了数字化转型的顺风车,实现了行业的迅速发展。由于B端产品是为企业所提供服务的产品,那么,企业应该如何乘上数字化的顺风车呢?查看详情 >

但即便如此,它让大批开发者能在较低使用成本的基础上,根据自身实际需求进行灵活调整,并解锁更多商业场景和收益,也足以极大刺激整个产业的发展与繁荣。

闭源大模型和大多数闭源软件差异不大,通常指不对外分享源代码,仅所有者能合法访问、修改和分发,经封装后对外进行商业化变现的大模型产品。用户一般只能在付费后按既定方式使用。

区别于开源产品经常采用的“开源方主导+社区共建”的开发模式,闭源大模型高度依赖开发方的自主研发和长线运营,主要通过知识产权的价值货币化快速获取收益。

因为闭源大模型较之开源大模型存在更高的使用门槛,开发方会倾向于将大模型封装成各种标准化的产品,方便各类开发商在此基础上创建应用,并按实际消耗的tokens量、专有许可费等收费。

为了丰富业务线,目前主流的闭源大模型厂商也有基于底层模型推出AI应用,收取相应的产品订阅、调用、定制化等费用,以扩大整体营收。

两者迥异的开发形态和商业模式,决定了开源大模型前期更多通过免费/低价获客和生态合作,壮大基本盘,实现对关联业务的加持或业务场景及客源的拓展,服务于未来的财务增长。

而闭源大模型则更多采用“模型即服务”和应用拓展,直接进行商业变现,服务于当下的业绩增长。

当两者结合,共同推动了大语言模型的发展,加速着通用人工智能时代的来临。

img

二、主流玩家开源大模型的几点思考

就在最近,业内对开源和闭源大模型的讨论声不绝于耳。

孰是孰非这里不论,不过个人比较认同“我们都是受益于开源成长起来的个人和公司”这句话(摘自360创始人周鸿祎的公开发言)。

而且,在整理媒体对当下主流开源大模型掌舵人的采访时,我们发现:各家选择开源自家大模型产品,背后的商业考虑与决策依据其实挺耐人寻味。总结起来,主要包含以下几点:

1)保障技术安全与良性发展。

比如包括Meta CEO扎克伯格、Mistral创始人Arthur Mensch等在内的头部开源大模型厂商leader都有提到:模型的开源会是保障大模型技术安全,解决安全漏洞的有效措施。

而且伴随用户使用的增加,能更好地集思广益,改善模型适用性与标准性,实现良性发展。这点与以往的开源软件宗旨算是一脉相承。

2)实现产业赋能。

鉴于当前基于全栈国产化基础软硬件的平台不多,已开源的多模态本土大模型产品也少,以中国科学院自动化研究所为代表的“国家队”选择开源自研的紫东太初大模型,则更多是想通过“大模型+小数据”的形式,推动大模型对产业带来的赋能。

3)促成生态合作共赢。

作为开源大模型赛道的代表性厂商,Meta坚持开源Llama系列大模型,则很大程度上源于对未来发展的考虑。

在公开采访中,Meta CEO扎克伯格曾表示:开源对Meta AI的未来发展有利。对于整个科技领域来说,大模型的开源也显得意义深刻,能创造更多赢家。

国内方面,以智谱为代表的本土大模型厂商,通过开源ChatGLM-6B,在加速全球下载量的同时,催生了600+优秀大模型应用开源项目,此举进一步推动了产业融合和AI生态建设。

4)为商业化做准备。

虽然开源意味着很难直接大规模商业变现,但作为获客或打开知名度的手段,却效果斐然。

比如2023年成立的Mistral AI ,因发布Mistral 7B、Mistral 8X7B两大开源模型一举成名,之后再推商业化模型,已能在业内快速打开局面,近期官宣获得6.4亿美元B轮融资。

而Llama系列的开源让Meta保持在AI领域的独特优势,反哺社交、广告等业务的同时,也打开了和云服务商、AI硬件平台等合作的另一种可能。

除此之外,出于提升行业地位、扩大商业机会等考虑,也推动着不少大模型开发商选择了开源,以争取在商业生态中的竞争优势或长远发展。

三、未来开源和闭源大模型将如何共处?

目前,有人认为开源大模型和闭源大模型处在对立面,未来必将像零和博弈一般,你输我赢,此消彼长。

不过在个人看来,两者的关系未来很可能像开源软件与闭源软件一样,长期共存,各自发展。

在这其中,开源产品能达到闭源产品很难企及的用户覆盖面与创新自由度,而闭源产品能更快、直接转化为商业利益,进一步提升产品迭代速度和服务质量。

两者就像Linux与Windows,Android与iOS,虽然有竞争,但互为补充,各自在擅长的领域开疆拓土。

只是在入局者越来越多、产品越来越卷的当下,未来市场难免会经历洗牌,只保留少数头部、更具有竞争优势的选手。

这也是眼下国内外大模型厂商热心于竞争生态位或出于商业化考虑,反复切换开源和闭源赛道,或丰富业务线以保持自身优势的一大原因。

比如谷歌在推出闭源大模型Gemini Ultra的同时,发布了Gemma 2B 和7B两款开源模型产品。Mistral在推出Mistral 7B、Mistral 8X7B两大开源模型后一炮而红,新推出的旗舰版大模型Large 则为闭源产品。

出于成本压力和商业化考虑,目前开源大模型厂商和闭源大模型厂商的界限正逐渐模糊。

不过抛开这些,就整个行业来说,开源和闭源大模型的百花齐放,推动了AI上层应用生态乃至整个行业的繁荣,也为人们以较低门槛使用人工智能产品带来了便利。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

资源分享

图片

大模型AGI学习包

图片

图片

资料目录

  1. 成长路线图&学习规划
  2. 配套视频教程
  3. 实战LLM
  4. 人工智能比赛资料
  5. AI人工智能必读书单
  6. 面试题合集

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

1.成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

图片

2.视频教程

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,其中一共有21个章节,每个章节都是当前板块的精华浓缩

图片

3.LLM

大家最喜欢也是最关心的LLM(大语言模型)

图片

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/773466.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

多态的优点

多态的优点 1、多态的优点1.1 可替换性(Substitutability)2、可扩充性(Extensibility) 2、总结 💖The Begin💖点点关注,收藏不迷路💖 1、多态的优点 在面向对象编程(OOP…

滤波算法学习笔记

目录 引言 一、定义 二、分类 三、常见滤波算法 四、应用与优势 五、发展趋势 例程 1. 均值滤波(Moving Average Filter) 2. 中值滤波(Median Filter) 3. 高斯滤波(Gaussian Filter) 4.指数移动…

【Python画图-seaborn驯化】一文学会seaborn画散点图scatterplot、swarmplot技巧

【Python画图-seaborn驯化】一文学会seaborn画散点图scatterplot、swarmplot 本次修炼方法请往下查看 🌈 欢迎莅临我的个人主页 👈这里是我工作、学习、实践 IT领域、真诚分享 踩坑集合,智慧小天地! 🎇 免费获取相关内…

【uni-app】基础

一、官网 网址:https://zh.uniapp.dcloud.io/tutorial/其他辅助网页讲解:https://www.wenjiangs.com/doc/7y94pldun2插件下载free:https://ext.dcloud.net.cn/ 二、提示框 用uni.showToast提醒的次数超过7个字的时候就会导致文字显示不全&…

【Arduino】XIAOFEIYU实验ESP32使用温湿度传感器测量温度(图文)

温度传感器在我们的日常生活中应用还是很普遍的,使用ESP32可以方便的使用温度传感器对文档进行测量,今天XIAOFEIYU就来实验一下DHT11温湿度传感器。 需要安装DHT温度传感器的库,可以先进行下载:GitHub - adidax/dht11: DHT11 lib…

ChatMoney:AI看病,私人医生不是梦想!

本文由 ChatMoney团队出品 在当今这个科技飞速发展的时代,人工智能技术正在以惊人的速度改变着我们的生活,人工智能已经深入到各个领域,医疗行业也不例外。 而今天我要和大家聊一聊利用ChatMoney全能知识库AI系统在求医问诊领域所发挥的巨大…

Cesium与Three相机同步(3)

Cesium与Three融合的案例demo <!DOCTYPE html> <html lang"en" class"dark"><head><meta charset"UTF-8"><link rel"icon" href"/favicon.ico"><meta name"viewport" content&q…

接口签名、日志、token校验优化

文章目录 引言I 整合接口签名校验、接口信息日志处理、token校验功能为一个注解1.1 获取注解信息,判断API校验功能配置II 签名优化2.1 签名随机数统一放在请求头2.2 校验签名接口的请求参数类型为自定义对象2.3 获取请求数据,并校验签名数据2.4 Knife4j全局添加鉴权参数III 签…

thinkadmin 新增和编辑页面多选关联表人员信息,并可按名称搜索查询

假如现在有一个窗口表和人员表,窗口表中的user_ids字段存储多个工作人员,人员表的id在窗口表的user_ids字段中存储为 “1,2,3”,代表3个工作人员,通过以下代码实现 form.html <div class="layui-col-xs12"><span class="help-label

自动驾驶理论新突破登Nature子刊!清华、密歇根联合提出三条技术路线,剑指「稀疏度灾难」

自动驾驶理论新突破登Nature子刊&#xff01;清华、密歇根联合提出三条技术路线&#xff0c;剑指「稀疏度灾难」 近日&#xff0c;清华大学与密歇根大学联合提出的自动驾驶汽车安全性「稀疏度灾难」问题&#xff0c;发表在了顶刊《Nature Communications》上。研究指出&#…

【12321骚扰电话举报受理中心-短信验证安全分析报告】

前言 由于网站注册入口容易被黑客攻击&#xff0c;存在如下安全问题&#xff1a; 暴力破解密码&#xff0c;造成用户信息泄露短信盗刷的安全问题&#xff0c;影响业务及导致用户投诉带来经济损失&#xff0c;尤其是后付费客户&#xff0c;风险巨大&#xff0c;造成亏损无底洞…

揭秘:华火电焰灶可不可信,安不安全?

随着科技的不断进步&#xff0c;传统厨房灶具也在经历着前所未有的变革。在这个追求环保、节能和智能化的时代&#xff0c;最近发布的一款名为华火电燃喷焰式组合灶厨吸引了众多消费者的目光。今天&#xff0c;我们就来对这款华火HH-SZQP60电燃喷焰式组合灶进行一次深入评测&am…

谷粒商城学习-06-使用vagrant快速创建linux虚拟机

这一节的内容是在Windows上安装虚拟机。 为什么要按照虚拟机呢&#xff1f; 原因是很多软件只能在Linux下运行&#xff0c;有的虽然也可以在Windows上运行&#xff0c;但从安装到运行会遇到很多问题&#xff0c;为这些解决这些问题花时间对于大多数人特别是初学者是没有什么价…

Qt中udp指令,大小端,帧头帧尾实际示例

前言 虽然QT中&#xff0c;udp发送和接收&#xff0c;其实非常简单&#xff0c;但是实际工作中&#xff0c;其实涉及到帧头帧尾&#xff0c;字节对齐&#xff0c;以及大小端序的问题。比如网络中&#xff0c;正规的一般都是大端序&#xff0c;而不是小端序&#xff0c;大多数的…

Arthas实战(3)- CPU使用率高问题排查

一、 准备测试应用 新建一个 SpringBoot应用&#xff0c;写一段 CPU 使用率高的代码&#xff1a; GetMapping("/cpuUsageRate") public String cpuUsageRate() {while (true) {// 这个循环没有实际意义&#xff0c;只是为了占用CPUfor (int i 0; i < 1_000_000…

(三)共享模型之管程

线程安全问题 案例 两个线程对初始值为 0 的静态变量一个做自增&#xff0c;一个做自减&#xff0c;各做 5000 次&#xff0c;结果是 0 吗&#xff1f; Slf4j(topic "c.ThreadSafe") public class ThreadSafe {public static int counter 0;public static void …

南京,协同开展“人工智能+”行动

南京&#xff0c;作为江苏省的省会城市&#xff0c;一直以来都是科技创新和产业发展的高地。近日&#xff0c;南京市政府正式印发了《南京市进一步促进人工智能创新发展行动计划&#xff08;2024—2026 年&#xff09;》和《南京市促进人工智能创新发展若干政策措施》的“11”文…

Linux Static Keys和jump label机制

文章目录 前言一、asm goto二、API使用2.1 低版本API2.2 高版本API 三、jump label四、源码分析4.1 数据结构4.2 static_key_false4.3 jump_label_init4.4 __jump_label_transform4.5 static_key_slow_inc/dec 五、__jump_table节5.1 内核5.2 内核模块 六、修改内存代码6.1 x86…

vue配置sql规则

vue配置sql规则 实现效果组件完整代码父组件 前端页面实现动态配置sql条件&#xff0c;将JSON结构给到后端&#xff0c;后端进行sql组装。 这里涉及的分组后端在组装时用括号将这块规则括起来就行&#xff0c;分组的sql连接符&#xff08;并且/或者&#xff09;取组里的第一个。…

论文配色:跟着顶刊学配色(Nature篇)

写在前面&#xff1a; 截至目前&#xff0c;nature共发表Article 572篇&#xff0c;本文挑选了部分最新的文献&#xff0c;进行配色总结&#xff0c;每种颜色分别提供十六进制、RGB、HSB、CMYK和LAB5种描述模型&#xff0c;方便后期配色使用。 三色&#xff1a; 四色&#xff…