AI 应用之路:质疑汤姆猫,成为汤姆猫,超越汤姆猫

过去一年,我对 AI 应用的看法经历了这样一个过程:质疑汤姆猫,理解汤姆猫,成为汤姆猫,超越汤姆猫。

什么是汤姆猫?汤姆猫是 2010 年移动互联网早期的一款应用,迅速走红,又淡出视野。这是一个比喻,指代那些很好玩,一度成为现象级,但没有长期留存的产品。拍出海马体的妙鸭相机,让郭德纲说英文相声的 Heygen,都有点 AI 时代汤姆猫的意思。

坦率讲,最开始我是质疑汤姆猫的,这类产品一度热闹,但玩法单一,没有长期留存率,很难持续。在写的《今天的AI创业,与移动互联网时代的区别在哪里?》中,有一段对汤姆猫的讨论:

一个平台从 1 岁走到黄金年龄,会经历很多真伪机会。回头看移动互联网的早期,有四类机会都曾霸榜。

……

第二类机会叫「汤姆猫」,是小机会。汤姆猫很巧妙的用到了手机的麦克风,你说什么话,它就会用猫的语气来复述。当时日下载量到了百万级别,但没有长期留存率,因为玩法单一,和猫对话几天后就没有新鲜感了。后来汤姆猫被中国的一家上市公司收购了,作价 70 亿人民币。

今天在 AI 的早期阶段,摆在我们眼前的依然是这四类机会,我们需要想清楚,谁是 AI 时代的手电筒,谁是 AI 时代的抖音快手。基于大模型的套壳应用是新时代的手电筒,很短的时间就会被大模型的能力击穿;基于 AI 做出的一些原生小爆款应用,如果玩法过于单一,无法形成自己的资产,很可能成为新时代的汤姆猫;

后来为什么理解汤姆猫了?因为更理解大模型的能力边界,和当下所处的阶段了。

01

理解汤姆猫,

是因为理解了当下大模型的能力边界

图片

大模型的发展规律和互联网有很大差异,更应该参照芯片行业的发展规律。

50 年代,仙童发明了半导体后,随着芯片能力的提升,先后出现了计算器、PC、游戏机、移动手机、MP3、智能手机这些国民级的电子产品,这背后是摩尔定律的推动,「处理器的性能每两年翻一倍,价格下降为之前的一半」。

这些电子产品横跨几十年,依次解锁,半导体刚出来的时候,它的能力只能用来做计算器,随着计算能力的提升,才能造出 PC。

OpenAI 推出 ChatGPT 只有一年多时间,基于大模型的应用的出现也是有先后顺序的,在要出计算器、随身听的时候,不要硬造 PC;在要出汤姆猫的时候,不要硬造抖音,造不出来。历史无法跳跃,只能经历。

Scaling Law 会成为 AI 时代的摩尔定律,堆算力,堆参数。随着模型能力的提升,基于大模型不是造应用,而是造虚拟人,起初是本科生,之后是白领,之后是某些领域的专家比如医生、律师,后面会造出科学家,最终极的形态是 AGI,随着模型智能程度的提升,这些虚拟人会依次解锁。

以造人的标准来看待当下大模型的能力,就知道需要多少智能,和中间的差距了。

而现在我们常说的「AIGC 应用」,可能只是 AI 发展史上的过渡阶段,是因为当下的模型还造不出虚拟人,所以先造辅助软件。

02

成为前千分之一的汤姆猫,

完成能力蜕变

理解汤姆猫后,我认为应该尽快「成为汤姆猫」,且做前千分之一的汤姆猫。

这缘于我的一个观察。

和很多投过的早期项目相处后,我发现创始人的能力不是线性增长,而是跳变的,忽然之间上了很大一个台阶,可能就一个月时间,隔壁老王已经不是我认识的老王,我得管他叫王哥了。

发生跳变的时间点往往和 PMF 跑通有关系,跑通后,整个人的思考水平、决策的犀利程度、心态的平稳度都有一个质变,再之后,就和业务量爬到几层楼相关了,月收入 1000 万、月收入 1 亿、月收入 10 亿是完全不同的思考水平,爬楼的中间,会有很多正负反馈,往往深刻又惨痛,反馈越大,能力跳变越明显。这才有了士别三日当刮目相看的感觉。

这让我明白了一个朴素的道理,产品是创始人的实验室,首先要跑通 PMF,让自己有个实验室,哪怕这个实验室小了点

然后要寻找更大的实验室,基于 10 万日活和 1 亿日活能做的实验是不一样的,一个人天天基于几亿日活做商业实验,他的水平能不高吗?为什么一些平台级产品的大佬思考水平极高,像开了天眼一样,因为他有几个亿的用户啊。

人人都想做有终局的产品,做下一个微信和抖音,但别忘了,张小龙是做 Foxmail 被腾讯收购的,Foxmail 是个邮件客户端,是那个年代最知名的套壳应用了。

基于这一观察,和 AI 现在所处的极早期阶段,在寻找 PMF 的时候,先不要嫌弃它是汤姆猫,找个具体且收敛的切入点,跑通它,让自己有个实验室,先完成能力跳变。

AI 和移动互联网的差异,远大于移动互联网和互联网的差异,先跳下来,刷一遍自己的 ROM 很重要。在 AI 这个全新的世界中,大多数人是从头学,今年完成能力跳变,还是明年完成能力跳变,会遇到截然不同的机遇。

但即便以汤姆猫的标准看 AI 应用,只求爆款,不苛求留存率,也只有前千分之一的产品能成汤姆猫。

03

超越汤姆猫,

才有机会成为 Super App

前千分之一的选手成为汤姆猫后,会面临两个选择:

一是基于汤姆猫继续绣花,迭代产品,希望做出长期留存,这很难,因为这个产品的地基很薄,就是绣花绣上天,也是个绣花版汤姆猫,基于汤姆猫建成一个迪斯尼娱乐王国是不现实的

二是通过做汤姆猫实现了团队能力升级,走出汤姆猫,去做新的事情。人站在一层楼和一百层楼看到的机会是不一样的,做过十亿的业务,自然会发现百亿业务的机会,这或许会找到更厚的地基,做出 super App。这是所谓的「超越汤姆猫」。

选一还是选二,是一道分水岭。很多耳熟能详的平台级产品,初创时都有过类似汤姆猫的阶段,又推出新产品超越了汤姆猫

2012 年 3 月,字节跳动成立,先推出的是内涵段子,同年 8 月推出了今日头条,2016 年 9 月,抖音上线。

2015 年 4 月,拼好货上线,做的是拼团买水果,同年 9 月,拼多多上线,切到了电商的主战场,2022 年 9 月,Temu 上线,开始海外的征程。

2010 年 3 月,美团团购上线,2013 年 11 月,美团外卖上线,2015 年 10 月,美团合并大众点评,从交易平台延伸到了信息平台。

好了,即便我们懂了「超越汤姆猫」这个道理,依然难过好这一生。

绝大多数情况下,人们很难大大方方承认自己是个汤姆猫,面对低留存率、低商业价值的时候,会做很多设想,是不是自己功能不够完善?是不是用户数量不够多?是不是应该把汤姆猫升级成社交产品,就有网络效应了?这种事情在移动互联网发生过很多了,做日历的、做滤镜的、做小游戏的,都有过平台梦。

「成为汤姆猫」是块石头,用好了可以踩着石头过河,实现「超越汤姆猫」;用不好是阻拦前行的巨石,做一辈子的汤姆猫。

04

Scaling Law 会成为 AI 时代的摩尔定律

上面是从质疑到成为的心路历程,也是感受当下,认清当下,抓住当下的过程。

那么更具体的聊聊当下,现在处于什么 timing,会推演出哪些信号?

最关键的信号,Scaling Law 会成为AI时代的摩尔定律,模型的智能程度每年增长百分之 X,价格降为之前的 1/N,现在还只有一个定性的描述,当 X 和 N 都成为一个定量数字的时候,这个规律就开始正式运转了。

Scaling Law 会把模型送上一个个新高度,从而会依次解锁上层应用,也就是造人。这些虚拟人需要替代真人,端到端的完成任务,做到「L4 级别」。在真实工作环境中,我们 90% 的时间是在解决那 10% 的难题,大模型能否解决好那 10% 的难题是一道及格线,过不了这个及格线,大模型只能做副驾 copilot,充其量是一个好用的软件;过了这个及格线,大模型就是主驾,我们开始为主驾付工资。

基于造人的标准,需要有一套图灵测试 2.0。在 ChatGPT 出来后,模型已经通过图灵测试 1.0,接近人的回答水平,以假乱真了。图灵测试 2.0 是一套基于工种的测试,比如文案策划、剧本杀小姐姐、程序员、医生,如果这个虚拟程序员能听懂你的需求、写出完整代码、修正 bug,那他就通过程序员图灵测试了。当下的大模型基本通过剧本杀小姐姐的图灵测试了,大家在 Character.ai、星野这些应用上和 AI 聊的很欢。

如果以图灵测试 2.0 来衡量当下的 AI Agent,真正的 Agent 尚未出现,真正意义上的 Agent 是可以自己规划任务,端到端的完成任务的。

如果第一个 Agent 出现,大概率是出在 OpenAI,因为他有最领先的模型,Agent 的出现主要和模型的智能程度相关,OpenAI 什么时候出 Agent 的 demo 产品,会是应用层百花齐放的关键信号

基于上面的这些推演,AI 还在很早期的阶段,如果硬要类比互联网的话,此时此刻对应 Yahoo 出现的门户时代。

做 AI 应用的创业者经常半夜问自己,我这应用有网络效应吗?放心,没有。

即便是 ChatGPT 也没有网络效应,只有品牌效应。互联网早期,门户网站也没有网络效应,只有品牌效应,Google 出来后才有了规模效应,Facebook 出来后才有了网络效应。

AI 行业什么时候会有网络效应这种城河?可能是 AI Agent 横行天下的时候,比如我们有个秘书 Agent,帮我们和生意上的伙伴约时间排会,双方的 Agent 一通交流,一握手,约好了!对方的 Agent 也必须是同一厂牌的 Agent,才能最大限度的交流,这就是 AI 时代的网络效应。

多久会发展到这个阶段?很难量化,但不要小看 AI 的进化速度。Sora 出来后,带给我最大的触动是,他比想象中来的快,行业里的人认为 2024 年年底或 2025 年才会出高质量的视频模型,OpenAI 直接在今年 2 月就拿出来了。

对 Sora 的热议,又一次体现了我们总是「高估当下,低估未来」,Sora 还没有公测,大家看到的是精选出来的 demo,在公测后,我估计大概率达不到大家的预期,这时又会出现「不过尔尔」的声音。又过一段时间,Sora 又进化的让人惊讶。

这种冷热交替,去年年初的时候已经在 ChatGPT 上上演过了,先是热议,认为要革命了,然后大家用了一段时间后,觉得还是有局限性,智慧程度不够,上层的杀手级应用也没出现,热议之后是冷静。然后 Sora 横空出世,又带来一波热议,如此往复。

别忘了,不管冷热,Scaling Law 永远在那里,在推动着模型成长。

万物自有其规律,没人能越过 1 到 17 岁,一步到位长到 18 岁。我们都知道 AI 带来的机会大,这是共识了。对当下 timing 的研判、对模型能力边界的理解,还处于非共识,这是真正考验创业者的地方

人人都想做有终局的产品,望着终局,恨不能省略中间的过程,跳跃中间的历史,直接做最有价值的事情,这是一种我执,忽略了真实世界运转的规律。

而理解汤姆猫、成为汤姆猫、超越汤姆猫,才是真实世界运转的规律,这是一种去执。

去执后,更容易看清当下,抓住当下。浪潮来的时候,关键是要站在海里,且早早学会游泳,早早习惯海水的味道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/440491.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C++ · 代码笔记5 · 探索多态与虚函数

目录 前言011虚函数_使用基类指针实现覆盖特性012虚函数_使用引用实现覆盖特性013使用多态场景小例程020构成多态的条件030虚析构函数040纯虚函数051typeinfo运算符_获取类型信息052typeinfo_根据不同类型进行不同操作 前言 本笔记所涉及到的编程环境与 《C 代码笔记1 从C到C…

7款前端实战型项目特效分享(附在线预览)

分享7款实用性的前端动画特效 其中有canvas特效、css动画、svg动画等等 下方效果图可能不是特别的生动 那么你可以点击在线预览进行查看相应的动画特效 同时也是可以下载该资源的 CSS春节灯笼特效 基于CSS实现的灯笼特效 灯笼会朝左右两个方向来回的摆动着 以下效果图只能体现…

knife4j生产环境禁止打开页面

Knife4j是一个集Swagger2 和 OpenAPI3为一体的增强解决方案,官网地址:Knife4j 集Swagger2及OpenAPI3为一体的增强解决方案. | Knife4j 考虑到安全性问题,在实际服务部署到生产环境后就需要禁用到swagger页面的展示,这个时候只需…

Jmeter查看结果树之查看响应的13种详解方法

Jmeter查看结果树查看响应有哪几种方法,可通过左侧面板底部的下拉框选择: 01 Text 查看结果树中请求的默认格式为Text,显示取样器结果、请求、响应数据3个部分内容。 取样器结果: 默认Raw展示,可以切换为Parsed视图&#xff0c…

Selenium常见元素操作,学完就能上手

web端自动化测试在回归测试、兼容测试扮演着举足轻重的角色,作为web自动化测试工程师,日常工作主要的部分就是编写自动化测试用例代码,借助的开源框架来说,目前市场占有率较高的仍然是selenium。 如何使用selenium完成web页面元素…

算法---双指针练习-5(有效三角形的个数)

有效三角形的个数 1. 题目解析2. 讲解算法原理3. 编写代码 1. 题目解析 题目地址:有效三角形的个数 2. 讲解算法原理 算法的基本思想是首先对数组进行排序,然后使用三个指针left、right和cur,分别表示三个元素的索引。其中,left指…

PCIE UVM SVT

PCIE中存在UI概念,unit interval 定义为每个bit 传输需要的时间。 Introduction VC UVM VIP for PCIE 是一个兼容UVM验证方法学的高级验证组合以及数据类型的套件。 VC UVM VIP是基于uvm_agen 的架构图如下所示: svt_pcie_device_agent:它包含Driver,Target,Requeseter,I…

CDR(CorelDRAW)2024最新汉化注册补丁包下载

CorelDRAW 2024是一款功能强大的平面设计软件,广泛应用于图形设计、编辑照片以及创建网站等领域。凭借对高级操作系统的支持、多监视器查看和4K显示屏的兼容性,它让初始用户、图形专家、小型企业主和设计爱好者都能自信快速地交付专业级结果。 CorelDRA…

解决方案|珈和科技推出农业特色产业数字化服务平台

今年中央一号文件提出,鼓励各地因地制宜大力发展特色产业,支持打造乡土特色品牌。 然而,农业特色产业的生产、加工和销售仍然面临诸多挑战。产品优质不能优价,优质不能优用的现象屡见不鲜,产业化程度低、生产附加值不…

套接字编程 --- 一

目录 1. 预备知识 1.1. 端口号 1.2. 认识TCP协议 1.3. 认识UDP协议 1.4. 网络字节序 2. socket 2.1. socket 常见系统调用 2.1.1. socket 系统调用 2.1.2. bind 系统调用 2.1.3. recvfrom 系统调用 2.1.4. sendto系统调用 2.3. 其他相关接口 2.3.1. bzero 2.3.2…

智慧公厕的三大特点:信息化、数字化、智慧化

智慧公厕是以物联网、互联网、大数据、云计算等先进技术为支撑,对公共厕所的使用、运营、管理、养护进行全方位高效应用的创新型公厕。它具有三大显著特点:(ZonTree中期)信息化、数字化和智慧化。本文以智慧公厕源头实力厂家广州中…

【鸿蒙 HarmonyOS 4.0】常用组件:List/Grid/Tabs

一、背景 列表页面:List组件和Grid组件; 页签切换:Tabs组件; 二、列表页面 在我们常用的手机应用中,经常会见到一些数据列表,如设置页面、通讯录、商品列表等。下图中两个页面都包含列表,“…

【PCIe 链路训练】之均衡(equalization)

1、概述 这篇文章简单介绍一下PCIE phy的均衡原理和过程,USB phy,ethernet phy这些高速的串行serdes也有相同或者相似的结构。可以不用太关注其中的细节,等到debug的时候可以查询协议,但是需要了解这个故事讲的大概内容。整个equalization过程是controller和phy一起配合完成…

什么是智慧公厕?智慧公厕设备有哪些

在现代社会,公共厕所作为城市基础设施的重要一环,承载着城市卫生、居民生活品质的重要责任。然而,传统公厕存在的问题仍然不可忽视:脏乱差、资源浪费、安全隐患等等。 为了解决这些问题,针对公共厕所日常使用、运营管…

go语言-k8s宿主信息采集运维脚本

背景 由于工作需要,需要采集k8s集群中的宿主相关信息,包括cpu,memory,lvm,标签等信息。通常作为SRE会主选shell或python脚本来实现。但最近我们团队主流开发语言已经切换到golang.所以本次尝试用go语言来写写运维脚本。 实现流程图 代码实现 package m…

[笔记]Crash Course Computer Science

二进制 byte 在电脑中的单位换算: kilobyte 千字节 megabyte 兆字节 gigabyte 千兆字节 1kb210bit 1024byte 1000b 1Mb 220bit 1024kb 1Gb 230bit 1TB1000GB 1GB十亿字节1000MB10^6KB Gb 和 GB 一般而言GB用于文件,Gb用于通信。B代表Byte&…

类与对象(三)--static成员、友元

文章目录 1.static成员1.1概念🎧面试题✒️1.2static的特性🎧1.3思考🎧 2.友元2.1什么是友元?🎧2.2两种友元关系:🎧 1.static成员 1.1概念🎧 🔎 static关键字用于声明类…

SpringCloudAlibaba微服务之Nacos架构及基础概念梳理

SpringCloudAlibaba微服务之Nacos架构及基础概念梳理 文章目录 SpringCloudAlibaba微服务之Nacos架构及基础概念梳理1. 官网介绍1. 简介2. Naocs是什么3. Nacos 地图4. Nacos 生态图 2. Nacos 架构1. 基本架构及概念1. 服务 (Service)2. 服务注册中心 (Service Registry)3. 服务…

第四届信息通信与软件工程国际会议(ICICSE 2024)即将召开!

2024年第四届信息通信与软件工程国际会议(ICICSE 2024)将于2024年5月10-12日在中国北京举办。本次会议由北京工业大学、IEEE以及Comsoc 联合主办。随着当今社会信息化的高速发展,电子信息技术的应用更是随处可见。其中,信息通信与…

K倍区间(蓝桥杯)

文章目录 K倍区间题目描述前缀和数学优化代码部分解释 K倍区间 题目描述 给定一个长度为 N的数列,A1,A2,…AN,如果其中一段连续的子序列 Ai,Ai1,…Aj 之和是 K的倍数,我们就称这个区间 [i,j]是 K倍区间。 你能求出数列中总共有多少个 K倍区…