开源大模型LLaMA 2会扮演类似Android的角色么?

图片

在AI大模型没有商业模式?等文章中,我多次表达过这样一个观点:不要把大模型的未来应用方式比喻成公有云,大模型最终会是云端操作系统的核心(新通用计算平台),而它的落地形式会很像过去的沃森,以系统型超级应用的形态落地。假如真的这样,那无疑的就需要一个开源的、便宜的“安卓”来真正启动这种落地。没想到的是这还没过去一个月,LLaMA 2出现了,并且表现优异。那LLaMA 2会在AI行业里扮演移动互联网中安卓的角色么?(其它如chatGPT 和AlphaGo下围棋,谁赢?垂域大模型有戏么?等一系列与此有关的大模型文章参见个人公号:琢磨事

安卓与历史性时刻

整个移动互联网有两个至关重要的历史性时刻:一个是iPhone的发布,这伴随着乔布斯而载入史册;一个则是同年Android的发布,相比之下这个则有点默默无闻。但实际上对于移动互联网而言,后者的实际影响大于前者。每年全球手机销量里面15%左右为苹果手机,其它基本是安卓手机。

换句话说,没有安卓就没有移动互联网。

那安卓这类操作系统到底是什么?为什么这么关键?我们来简单科普下操作系统的概念。

图片

(操作系统最简示意图)

这个图不十分精确,Kernel(内核)那个位置通常还有非常复杂的各种模块,但好在它能清楚说明操作系统是什么。安卓就处于中间的Kernel那个位置,对上面的各种应用比如微信、抖音来讲,他们其实根本接触不到麦克风、摄像头、内存、网络等,所有对具体物理设备的使用都要通过安卓这样的系统。

这样的分工好处是什么呢?

降低开发和应用成本。在IT行业的早期没有上面的分工,通常都是一个公司(比如IBM)把所有事都干了。这就导致对人员要求非常高。纯粹从技术复杂度角度看开发一般终端应用的难度如果是1,那很多操作系统里模块的开发难度估计是10,并且两者的难度不在一个维度上。同时操作系统只有1个,但应用会有无数个(安卓--应用商店)。所以就需要一种更为高效的分工方式,于是行业再分工,操作系统出现了。

高效的分工体系才能导致整个生态的大发展,对于移动互联网安卓就是生态大发展的最关键支点。如果微信团队需要自己做安卓,那很可能我们就看不见微信了。

如果说技术意义上的操作系统是上面那张简图,那商业意义上的操作系统则是一个引擎,为所有应用提供动力,缩减它们的开发成本、缩短周期。

大模型扮演的就是这个角色,但如果它只有一个(chatGPT),并且只是OpenAI自己用,那就像只有iOS一样,根本就造不出来五花八门的手机,也就不会有移动互联网的真正启动。

过去基于chatGPT根本没法打造沃森这样的系统,各种数据风险的考量根本不是一个技术进步就能对冲掉的,谁愿意把数据都上传到OpenAI呢,谁愿意依赖一个完全不知道的黑盒呢!

但在过去别的大模型又太差了,LLaMA 2在改变这种局面,从评测看它基本赶上GPT3.5,,也就是说在创造价值的维度它变的能用了,在落地的维度又因为开源而能对冲风险上的顾虑。再发展下去就真的会变成一个新智能生态的引擎,类似安卓的角色。

在前面系列文章里面也曾经多次提到我们普遍的看待大模型的方式是有问题的。如果就看到技术和能力,而看不到它的落地需要一套复杂系统做支撑,那就搞不清它的真正价值创造方式,就会争论是屁胡还是什么,但其实并不对。

人工智能应用会大爆发么?

如果评测结果无误,那现在就需要开始在不同的领域打造一个个类似沃森的系统。否则可能就晚了。

大模型很关键,提供了打造智能型应用的机会,但就像移动互联网上真正有价值的是微信而不是一个裸的安卓一样,大模型也需要在它上面长出自己的应用。用系统的思维模式很容易看到这类系统型超级应用的关键点。我们换一张图来对此进行说明。

图片

(Alexa基础架构,本质和安卓一样)

上图是亚马逊Alexa的基础架构图,为什么用它呢,因为Alexa是现在为止最像云端操作系统的一个产品。

实际上OpenAI的插件骨子里也是这模式。可以这么讲从大模型的角度看OpenAI的远胜,这种智能的进步大幅缩减应用(上图中的Alexa Skills Kit)的开发成本,但从系统完备性的角度看OpenAI还有很长一段路要走,比如对大规模设备的介入和管控等。

基于这种架构图很容易看出基于大模型的超级应用的关键点:

大模型:会处于中间的部分,负责提供通用智能的能力。也要与其它各类算法相配合,比如感知类算法、推荐类算法等。上图中针对交互做了一点分解,分成:语音识别(ASR)和自然语言理解,后者会完全被大模型取代,但不会改变架构。

AIoT基础设施:为了支撑大模型跑好并且和另外几部分连接起来,AIoT用的东西一个也缺不了,包括大规模设备管理通讯等。这些部分加起来才是过去系统的Kernel,也就是安卓所扮演的角色(上图中间的部分)。

用户侧(上图右侧):要提供充分感知,这种感知要有时间维度和空间维度,要有现场和历史数据。我们和智能音箱进行交互的时候,先要喊一嗓子,比如小爱同学等,它要听不到不管后面大模型多厉害也是不行。然后交互的时候肯定需要这个人的建模数据(历史)以及位置等,然后才能做好内容输出。不同场景下这部分会有比较大差别,比如沃森的场景可能就需要个人的24小时心电图、病史以及基因数据。这些部分非常关键,需要综合应用IoT和各种算法才能达成目标。大模型在这个环节扮演的角色没那么关键。

应用侧(上图左侧):智能音箱的场景就需要对接各种数据源(chatGPT的插件就干这事的),总不能天气也靠大模型来生成吧。对于沃森类系统这里就需要行业数据和法规等。

相比于过去应用侧在变薄,但问题是三个部分整个加一起才是智能云系统下的应用,非要类比的话这种新应用的创建有点像需要打造一个个属于特殊领域的手机。

有无数个领域需要这种系统型超级应用,医疗、教育、税务、企业、零售、军事、家居等,很久以前DeepMind甚至还尝试过给Google数据中心做个这样的应用来管空调。

人工智能应用确实会大爆发,在过去大模型是起点和障碍,而不是应用本身。LLaMA 2提供了跨越低成本跨越这种障碍的可能性。

普遍盈利(break-even)会来么?

在此前的系列文章中我多次总结:从商业角度看,人工智能过去10年的创业其实集体性失败了,因为没跑通任何一个像样的商业模式。而真自己做大模型的企业短期亏损会加剧,因为投入增加并且经常会被归零,而议价权并不会增加。

那现在看这会有什么变化么?

有点变化,但不是对做大模型的公司,而是对应用大模型的公司。

可以更低成本创造一种效力巨大的系统型超级应用,甚至可以简单用等于多少人来衡量其效果和商业价值。如果LLaMA 2继续再进展下去,那相当于这个超级应用总是可以用便宜却更强劲的引擎。

这时候整体成本可控了,周边的部分也需要投入,但不会像大模型研发那样导致投入产出高度失衡。

这时候效果明显了,过去的AI算法其实解决了一些不痛不痒的问题,不创造商业上的核心价值,做闸机和智能音箱能创造什么核心价值?但现在不一样,大模型在技术上的进展保证了,在用和不用上会导致大刀对坦克的差异。比如对企业而言谁能想象电脑、互联网全部都不用的企业?

更关键在于数据飞轮的Key看着是在做出系统型超级应用的企业手里,这导致上限会比较高。

琢磨事上马斯克首先是个商人,从xAI发布说起里我画了一张这样的图:

图片

(数据飞轮的三个阶段)

每一个大模型每个领域中最终追求的一定是把这个数据飞轮跑起来,但很遗憾的是到目前为止好像除了AlphaGo别的就没跑起来过。

可这不意味着未来也这样,谁在未来能把它先跑起来,谁就是那个领域的冠军,也就赢了。

现在产业链条上谁最可能把这个飞轮跑起来?

显然是成功落地系统型超级应用的人,他们才是拥有场景和用户的人。

若干年后,回看我们可能会认为LLaMA 2是一个类似2007年安卓发布的时刻。

小结

我个人前十年主要做系统,中间做了阵战略投资,后十年主要就做人工智能的产研,可能是这种背景的原因导致我越看大模型商业化的路径越觉得是系统型超级应用。希望对此感兴趣的同学和我联系,共同探讨如何在新技术要素下确立新的商业模式。确实,像DeepMind那哥们说的:不要扯图灵测试了,现在核心是看看能不能终结人工智能行业的十年亏损,这更关键些!

其它大模型相关文章,涉及团队组织等其它方面,标题有点热闹,内容不是:

chatGPT 和AlphaGo下围棋,谁赢?垂域大模型有戏么?

AI大模型没有商业模式?

从教育到就业,AI大模型到真产生影响还有多远

是时候摒弃黑暗森林式思维了,从瓦格纳反叛开始说

马斯克首先是个商人,从xAI发布说起

碳基中心 VS 硅基中心:把Vision Pro和便利蜂放一起比比

AI带来了巨大的机遇,未能善用AI的企业将面临衰退

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/49867.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

linux 指令最后一期

bc ---- linux下的计算器 bc 是一个计算器 我们输入:quit 来退出这个计算器 我们可以这样来用: uname -r uname –r指令: 语法:uname [选项] 功能: uname用来获取电脑和操作系统的相关信息。 补充说明&#xff1a…

数据库应用:Redis安装部署

目录 一、理论 1.缓存 2.关系型数据库与非关系型数据库 3.Redis 4.Redis安装部署 5.Redis命令工具 6.Redis数据库常用命令 7.Redis多数据库操作 二、实验 1.Redis安装部署 2.Redis命令工具 3.Redis数据库命令 4.Redis多数据库操作 三、问题 1.RESP连接CentOS 7 R…

2.playbook剧本

文章目录 playbook剧本创建剧本运行剧本定义和引用变量指定远程主机sudo切换用户when条件判断剧本格式迭代with_itemswith_listwith_flattenedwith_togetherwith_cartesianwith_nested Templates模块tags模块 playbook剧本 playbooks 本身由以下各部分组成 Tasks:任…

操作系统启动相关概念(BIOS、MBR、GPT、BRUB)

不管是 Windows 还是 Linux 操作系统,底层设备一般均为物理硬件,操作系统启动之前会对硬件进行检测,然后硬盘引导启动操作系统,如下为操作系统启动相关的各个概念。 一、BIOS 基本输入输出系统(Basic Input Output Sy…

【Java】Spring——创建Spring + 对Spring的存储 /读取对象操作

文章目录 前言一、创建Spring项目二、向Spring容器中存储 Bean 对象三、从Spring容器中读取 Bean 对象得到Spring上下文对象得到 Bean 对象 总结 前言 本人是一个普通程序猿!分享一点自己的见解,如果有错误的地方欢迎各位大佬莅临指导,如果你也对编程感兴趣的话,互…

决策树学习

决策树学习 决策树决策树基础适用决策树学习的经典目标问题样本的表示训练样本决策树的概念发展历史 经典决策树算法ID3算法属性选择和节点混杂度(Impurity)ID3 Q1: 哪个属性是最佳属性?当前最佳属性节点选择熵(Entropy&#xff0…

JSP 中的隐式对象预定义变量详解

JSP隐式对象是JSP容器为每个页面提供的Java对象,开发者可以直接使用它们而不用显式声明。JSP隐式对象也被称为预定义变量。 JSP所支持的九大隐式对象: request对象 request对象是javax.servlet.http.HttpServletRequest 类的示例。每当客户端请求一个J…

揭秘UniApp跨平台魔力:6道面试题带你探索!

文章目录 1. UniApp是什么?它有什么特点和优势?2. 介绍一下UniApp的跨平台原理。1. 基于WebView的渲染2. 统一封装API3. 平台特性适配4. 虚拟DOM Diff算法 3. 如何在UniApp中实现页面路由跳转?4. 如何在UniApp中发送网络请求?5. 详…

ELK 使用kibana查询和分析nginx日志

背景:使用kibana查询和分析nginx请求日志,方便开发人员查询系统日志和分析系统问题。 setp 1、定义Index patterns 2、定义Discover(Search 查询数据) 3、定义Visualizations 3.1 定义Vertical Bar 3.2 、Choose a source 3.3、定义图表 4、定义…

WPS本地镜像化在线文档操作以及样例

一个客户项目有引进在线文档操作需求,让我这边做一个demo调研下,给我的对接文档里有相关方法的说明,照着对接即可。但在真正对接过程中还是踩过不少坑,这儿对之前的对接工作做个记录。 按照习惯先来一个效果: Demo下载…

K8S系统监控:使用Metrics Server和Prometheus

Kubernetes 也提供了类似的linux top的命令,就是 kubectl top,不过默认情况下这个命令不会生效,必须要安装一个插件 Metrics Server 才可以。 Metrics Server 是一个专门用来收集 Kubernetes 核心资源指标(metrics)的…

qt服务器 网络聊天室

widget.cpp #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);//给服务器指针实例化空间server new QTcpServer(this); }Widget::~Widget() {delete ui; }//启动…

使用Gradio构建生成式AI应用程序; Stability AI推出Stable Diffusion XL 1.0

🦉 AI新闻 🚀 Stability AI推出最先进的AI工具Stable Diffusion XL 1.0 摘要:Stability AI宣布推出Stable Diffusion XL 1.0,该版本是其迄今为止最先进的AI工具。Stable Diffusion XL 1.0提供更鲜艳、更准确的图片生成&#xff…

【AI之路】使用huggingface_hub优雅解决huggingface大模型下载问题

文章目录 前言一、Hugging face是什么?二、准备工作三、下载整个仓库或单个大模型文件1. 下载整个仓库2. 下载单个大模型文件 总结附录 前言 Hugging face 资源很不错,可是国内下载速度很慢,动则GB的大模型,下载很容易超时&#…

【QT 网络云盘客户端】——主窗口界面的设计

目录 1.设计主窗口界面 2.设置窗口的背景图片 3. 自定义标题栏 3.1 设置toolbutton按钮的图片 3.2 设置按钮的大小 3.3 将自定义标题栏添加设置到主页面中 3.4 去除窗口的原标题栏 3.5 设置按钮颜色 3.6 切换页面功能实现 4.我的文件页面的设计 4.1 菜单栏的设计 4…

分冶算法 剑指 07 重建二叉树 排序算法:剑指45 把数组排成最小的数 10-I 斐波那契数列

来记录几个注意事项 1.vector容器里利用find&#xff08;&#xff09;函数 不同于map&#xff08;map有find方法&#xff09;&#xff0c;vector本身是没有find这一方法&#xff0c;其find是依靠algorithm来实现的。 所以要包含头文件 #include <iostream> #include <…

物联网阀控水表计量准确度如何?

物联网阀控水表是一种新型的智能水表&#xff0c;它采用了先进的物联网技术&#xff0c;可以通过远程控制和监测水表的运行情况&#xff0c;实现更加精准的水量计量和费用结算。那么&#xff0c;物联网阀控水表的计量准确度如何呢&#xff1f;下面我们将从以下几个方面进行详细…

sql中with as用法/with-as 性能调优/with用法

文章目录 一、概述二、基本语法三、使用场景3.1、定义CTE,并为每列重命名3.2、多次引用/多次定义3.3、with与union all联合使用3.4、with返回多种结果的值3.5、with与insert使用 四、递归查询4.1、语法4.2、使用场景4.2.1、用with递归构造1-10的数据4.2.2、with与insert递归造数…

flink to starrocks 问题集锦....

[问题排查]导入失败相关 - 问题排查 - StarRocks中文社区论坛 starrocks官网如下&#xff1a; Search StarRocks Docs starrocks内存配置项&#xff1a; 管理内存 Memory_management StarRocks Docs 问题1&#xff1a;实时写入starrocks &#xff0c;配置参数设置如下&a…

微信小程序,商城底部工具栏的实现

效果演示&#xff1a; 前提条件&#xff1a; 去阿里云矢量图标&#xff0c;下载8个图标&#xff0c;四个黑&#xff0c;四个红&#xff0c;如图&#xff1a; 新建文件夹icons&#xff0c;把图标放到该文件夹&#xff0c;然后把该文件夹移动到该项目的文件夹里面。如图所示 app…