Sora给中国AI带来的真实变化

47a37f5b45765af3e0a2d11e4d2a3579.jpeg

OpenAI的最新技术成果——文生视频模型Sora,在春节假期炸裂登场,令海内外的AI从业者、投资人彻夜难眠。

如果你还没有关注到这个新闻,简单介绍一下:Sora是OpenAI使用超大规模视频数据,训练出的一个通用视觉模型,可以理解和模拟运动中的物理世界,生成不同时间、纵横比和分辨率的视频,最大版本的Sora能够生成长达一分钟的高保真视频。

47d74c9f57894bc146c6b5b394a33102.png

Sora发布之前,也有许多采用各种方法的视频生成模型,但都使用较少的视觉数据,只能生成较短(4秒)或固定大小的视频。所以,Sora逼真的视觉效果、碾压级的性能提升,在震撼整个科技圈之余,也导致了“中国AI焦虑症”的人传人现象。

广大网友们再一次痛心疾首,对中国A发出质问:

为什么又一个AI元创新没能发生在中国?我们点错了科技树,好难过;

中国跟美国的AI差距越来越大,Sora这波国内慢了十年吧?这下真跟不上了;

复制Sora算力是最大阻碍,从芯片禁运开始咱们就完败了,没戏了。

当然也不乏阴阳怪气的,“等国外的类Sora模型开源,国內AI公司就又能创新啦”。

36667c6ac69e75fa661897a73e204572.png

在中美对弈的时代背景下,上述焦虑情绪,每一次在海外科技取得重大突破的时候,都会蔓延开来。但时间证明,作为全球唯二的AI大国之一,中国发展了多年AI技术,就算美国真有什么新AI成果是其他国家做不了、赶不上的,那也绝对不是中国。

拿并不遥远的ChatGPT来说,经过一年狂奔,“中国有没有自己的ChatGPT”已经不再成为问题。2023年很多国产“类ChatGPT”大语言模型已经向公众开放使用,走进行业场景,有数亿用户检测过中国AI的真实水平,或许与OpenAI还存在差距,但肯定不是一些人担忧的那样,认为“中国做不到”“技术有代差”。

这就像我们经常会看到一类“震惊体”新闻,一种新药问世,就说人类离永生不远了;一个AI突破,就说AGI要实现了,人类要被毁灭了。读者在这些奇谈怪论中“死去活来”,对AI的认知也在“成神”和“骗子”之间反复横跳。而真正懂药的人,肯定不会相信一种药能包治百病,而是搞清楚疗效和副作用,在对应的症状上使用。

同理,真正了解AI产业的人,也能正视中国AI的长处,承认现实差距,不卑不亢,积极应对。

尤其是经过了ChatGPT的“练兵”之后,这一次我们应该更有底气,客观看待Sora对中国AI带来的真实变化,准备迎接又一个“AI之春”。

变化一:拉近差距

096bf3de022ac32e69e4b02b632bbbe3.png

在“ChatGPT为什么没有诞生在中国?”之后,龙年版本已经成了“Sora为什么没有诞生在中国?”接连两次错失“元创新”,让期待中国AI“弯道超车”“后来居上”的急性子读者,大感失望。

科技发展从来不是一步登天,现实并没有爽文小说中逆袭打脸的“金手指”,只能是一步一个脚印迈进。不能否认,大语言模型、文生视频模型的颠覆性产品,没有首发在中国,但也必须看到,中国AI一直都在正确的道路上,并且脚步在加速。

de1bb1202530705f1cfad3c8a08b0129.png

Sora的发布,反而会让中美AI的距离进一步拉近,原因有三:

首先,方向一致。

错过一场技术革命,最可怕的不是来得晚,而是点错技能树,比如历史上日本大力发展的“五代机”,选错方向就错过了一个时代。OpenAI的ChatGPT、Sora都是在大规模预训练模型的技术路径上,进行大量的工程实践创新。由此可见,一项新突破,技术积累、技术选型是十分重要的,而这条以Transformer架构为主的“大模型之路”,中国AI一直在持续跟进,基础设施和算法层面的坚实程度是肉眼可见的。

其次,目标明确。

OpenAI的元创新让人应接不暇,处于全球AI领先地位,中国AI企业确实与其存在差距,始终在追赶。但这并不是讽刺中国AI的理由。“没有从头发明xx技术”,并不代表不优秀,OpenAI也不是Transformer发明者。而且,OpenAI本身就是一家集合了全球顶尖人才、力量与资本的特殊AI公司,就连谷歌都跟在后面屡败屡战,用OpenAI的标准去要求各方面资源受限的中国AI产学研机构,其实是不公平的。

Sora明确了,“视频生成模型是一条构建物理世界通用模拟器的有效路径”,印证了暴力计算的又一次胜利,“Scaling Law”大力出奇迹的涌现效果,相当于为中国AI领域完成了“探路”。有了清晰的追赶目标,中国AI各界反而能快速整合资源、投入研发,从而进一步拉近中美在文生视频上的距离。和ChatGPT一样,中国AI做出“类Sora”也是必然的,绝不可能错过这一波或者彻底跟不上。

89539fbee82eb3d08bc27f9022419d66.png

最后,能力具备。

或早或晚,中国一定会做出“类Sora”,但到底是三年后、五年后,还是十年后?我们认为,2024年应该就会看到国产Sora问世。无论是Sora所用到的基础模型LLM、文生图模型DALL·E 3、大规模视频数据集、AI算力体系、大模型开发工具栈等核心基础设施,中国都已经具备。比如原创的基础大语言模型文心一言、讯飞星火、BAICHUAN等,以及文生图模型文心一格、腾讯混元等,加上过去一年大模型存算传基础设施的突飞猛进,有能力和条件支持中国AI修成正果,在视频生成赛道再现 类ChatGPT 式的成功。

面对Sora,中国AI努力追赶是必须的,但数一数行囊中的工具和果实,不必妄自菲薄,更不用乱了阵脚。沿着正确且清晰的道路,加速向前跑,中美AI的差距才能缩小。

598302c138138f72fd01f2440d5ef7d5.png

变化二:

国产大模型格局再优化

和LLM一样,不会出现Sora在全球一枝独秀,而国内却无视频生成模型可用的情况。衷心希望,我们在不久的未来,不会像LLM百模大战一样,从担忧“中国没有Sora”,转而担忧“中国要那么多Sora怎么用”。

从这个角度看,OpenAI从ChatGPT到Sora的持续输出,会让国内AI大模型市场少一点虚火,多一分理性。

少一点虚火,是指底层模型的重要性,被Sora再一次“划重点”,避免国产大模型低水平的重复建设。

2023年一个又一个大语言模型被训练出来,推向市场,其中原创性的基础模型占比最小,更多是行业大模型,以及很多私有化部署的大模型,在数据规模、参数规模上无法与基座模型相提并论,生成效果也会差很多。这种低水平的重复建设,也会造成AI算力、投资的浪费。

而Sora在视频领域的惊艳表现,再次证明了暴力美学的有效性,将曾经大火的AI视频创业公司的模型直接碾压。正如OpenAI CEO奥特曼在YC W24 启动会上的演讲中所说:最正确的做法是设想一个“上帝般的”模型正在运作,然后基于这种设想来构建最好的产品。

bc43f226d562151d05e98737f98993c3.png

对中国AI来说,将为数不多具有底层原创能力的基座模型,如文心、星火等,作为大模型基础设施与支柱,支持初创企业和千行百业做好精调、优化,避免“重复造轮子”,是非常重要的。

多一分理性,是在被Sora惊艳的同时,也要想到应用和商业化的渐进性,以更合理的方案来进行国产类Sora的开发。

类ChatGPT的大语言模型在狂奔一年之后,在与各个行业结合的过程中,已经暴露出实际应用场景局限、商业价值虽有但不多、大模型投入产出比较低的挑战。如何用好大模型,已经成为中国AI的关键考验。

相比“人人皆可上手”的大语言模型,视频生成模型的应用门槛更高,受众群体更小,目前OpenAI仅开放给创作者使用,而非像ChatGPT那样开放给大众。不难看到,视频生成模型从研发到落地,整个过程会更加缓慢,应用潜力与商业出口还有待探索。

这一方面留给中国AI产学各界了较长的追赶窗口期,同时,由于Sora能够激活多大的商业价值尚不明确,除了字节跳动、流媒体平台等要全力投入,其他科技企业和初创公司都要考虑到商业化的问题,为创作、商用场景打磨好工具,做好视频生成模型的提示词工程,以便非专业背景的广大行业用户们上手使用。

大模型的价值需要商业化来证明,Sora也不例外。视频生成模型走向行业的长跑,才刚刚开始。在更广袤的产业空间里,如何让类Sora产品带来真实价值,这个答案OpenAI没有给,美国AI不会给,只能由中国AI自己来书写,而这也是国內更胜一筹的地方。

911b8f9cb3c91285c4efb76bc67f8649.png

变化三:

长期动能的查漏补缺

不必焦虑Sora,并不意味着中国AI就能躺平“坐看云卷云舒”了。必须承认,国产大模型还有很多瓶颈尚待解决。

Sora模拟物理世界的通用能力,不仅可以用于影视制作等内容创意行业,还可以为游戏、自动驾驶、工业数字孪生、电商、文旅等各行各业,提供一个构建虚实融合世界的技术支柱。

a95286bed03b8b32cd577dc40a44677a.png

那么问题来了,国产Sora一定会出现,但我们做好各行业规模应用Sora的准备了吗?恐怕今天的答案还是,没有。

前面提到,Sora的“暴力美学”再次证明了Scale的价值。而要达到涌现效果,基座模型仍然高度依赖于大量高质量数据集,超大规模算力,大量工程化调优人才,以及由此带来的巨大开发及运行成本。

即使背靠微软云的OpenAI,也没有面向公众开放使用Sora,也没有向开发者开放API接入,就连正式开放使用的时间表都欠奉。国产AI本就存在的专项算力紧缺问题,在Sora问世之后变得更加紧迫。

同时不难预料,为了进一步阻截中国AI的发展,围绕AI算力的新一轮限制一定会来。完善和发展AI基础设施,构建自主可控的产业链,让大语言模型、视频生成模型等新AI技术都不缺席中国式现代化的进程,让算力成为中国数字经济长期发展的动能,中国计算行业依旧重任在肩。

此外,在中美AI差距中,数据的规模与质量成为越不过的门槛。2023年5月英国《经济学人》提出,中国在建立基础模型方面比美国落后两到三年,造成这一差距的首要原因就是数据,AI模型在训练时难以充分利用互联网内容。

针对这一现状,2023年12月15日,国家数据局同中央网信办、科技部、工业和信息化部等17个部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,目标是到2026年底,数据要素应用场景广度和深度大幅扩展。2024年,我们一定会见证该行动的推进与落地,见证数据要素成为国产AI的养料。

1ff0b359ecf8a9d7336397fc6276b5a8.jpeg

由此可见,中国AI的查漏补缺,不是一朝一夕的事,也不是某一家AI企业、某一个模型厂商的事,面对已经在行动的中国产业各界,何妨多一些耐心。

智者不惑,仁者不忧,勇者不惧。正视Sora给中国AI带来的变化与挑战,不为一时的缺席而焦虑,是相信我们有能力登场,也终将登场。

3e47d4cfc7f2345b30135854a0352ea9.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/398654.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

以程序员的视角,看前后端分离的是否必要?

Hello,我是贝格前端工场,本篇分享一个老生常谈的话题,前后端分离是必然趋势,但也是要区分具体的场景,欢迎探讨,关注,有前端开发需求可以私信我,上车了。 一、什么是前后端分离和不分…

消息队列-RabbitMQ:workQueues—工作队列、消息应答机制、RabbitMQ 持久化、不公平分发(能者多劳)

4、Work Queues Work Queues— 工作队列 (又称任务队列) 的主要思想是避免立即执行资源密集型任务,而不得不等待它完成。我们把任务封装为消息并将其发送到队列,在后台运行的工作进程将弹出任务并最终执行作业。当有多个工作线程时,这些工作…

【ArcGIS微课1000例】0105:三维模型转体模型(导入sketchup转多面体为例)

文章目录 一、实验概述二、三维模型转多面体三、加载多面体数据四、注意事项一、实验概述 ArcGIS可以借助【导入3D文件】工具支持主流的三维模型导入。支持 3D Studio Max (.3ds)、VRML and GeoVRML 2.0 (.wrl)、SketchUp 6.0 (.skp)、OpenFlight 15.8 (.flt)、Collaborative …

docker (八)-dockerfile制作镜像

一 dockerfile dockerfile通常包含以下几个常用命令: FROM ubuntu:18.04 WORKDIR /app COPY . . RUN make . CMD python app.py EXPOSE 80 FROM 打包使用的基础镜像WORKDIR 相当于cd命令,进入工作目录COPY 将宿主机的文件复制到容器内RUN 打包时执…

挑战杯 基于LSTM的天气预测 - 时间序列预测

0 前言 🔥 优质竞赛项目系列,今天要分享的是 机器学习大数据分析项目 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/po…

【LeetCode】递归精选8题——基础递归、链表递归

目录 基础递归问题: 1. 斐波那契数(简单) 1.1 递归求解 1.2 迭代求解 2. 爬楼梯(简单) 2.1 递归求解 2.2 迭代求解 3. 汉诺塔问题(简单) 3.1 递归求解 4. Pow(x, n)(中等&…

【linux】查看openssl程序的安装情况

【linux】查看openssl程序的安装情况 1、查看安装包信息 $ rpm -qa |grep openssl 2、安装路径 $ rpm -ql openssl $ rpm -ql openssl-libs $ rpm -ql openssl-devel 3、相关文件和目录 /usr/bin/openssl /usr/include/openssl /usr/lib64/libssl.so.* /usr/lib64/libcrypto…

直接查看电脑几核芯几线程的方法

之前查看电脑几核芯几线程时都是点击 此电脑->属性->设备管理器->处理器 但是这样并不能判断是否有多线程 譬如这里,是2核芯2线程还是4核芯? 实际上,打开任务管理器后点击性能查看核芯线程数即可 所以示例这台电脑是4核芯而不是2…

视频生成模型:构建虚拟世界的模拟器 [译]

原文:Video generation models as world simulators 我们致力于在视频数据上开展生成模型的大规模训练。具体来说,我们针对不同时长、分辨率和宽高比的视频及图像,联合训练了基于文本条件的扩散模型。我们采用了一种 Transformer 架构&#…

多维时序 | Matlab实现BiLSTM-MATT双向长短期记忆神经网络融合多头注意力多变量时间序列预测模型

多维时序 | Matlab实现BiLSTM-MATT双向长短期记忆神经网络融合多头注意力多变量时间序列预测模型 目录 多维时序 | Matlab实现BiLSTM-MATT双向长短期记忆神经网络融合多头注意力多变量时间序列预测模型预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.多维时序 | Matlab…

回显服务器

. 写一个应用程序,让这个程序可以使用网络通信,这里就需要调用传输层提供的api,传输层提供协议,主要是两个: UDP,TCP,它们分别提供了一套不同的api,socket api. UDP和TCP UDP:无连接,不可靠传输,面向数据报,全双工 TCP:有连接,可靠传输,面向字节流,全双工 一个客户端可以连接…

仪表板展示|DataEase看中国:历年研究生报考数据分析

背景介绍 在信息时代的浪潮中,研究生教育作为培养高层次专业人才的重要通道,不断吸引着广大毕业生和在职人士的关注。今天我们结合2018年~2024年的研究生报考数据,以数字为镜,深入了解近年来研究生培养态势。 本文将…

Redis篇----第七篇

系列文章目录 文章目录 系列文章目录前言一、Redis 的回收策略(淘汰策略)?二、为什么 edis 需要把所有数据放到内存中?三、Redis 的同步机制了解么?四、Pipeline 有什么好处,为什么要用 pipeline?前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍…

机器学习:逻辑回归原理

逻辑回归模型是一种广泛应用于分类问题的统计方法。尽管名为“回归”,但它实际上是一种分类算法,主要用于预测观察对象属于某个类别的概率。逻辑回归模型特别适用于二分类问题,但也可以通过一些策略扩展到多分类问题。 逻辑回归的应用与优化…

gazebo 中使用gmaping 建图

一、使用gmapping 建图 启动roscoreroslaunch wpr_simulation wpb_stage_robocup.launchsudo apt install ros-noetic-gmappingrosrun gmapping slam_gmapping启动rviz (rosrun rviz rviz)。添加RobotModel、LaserScan、Map后 显示如下: 6.rosrun wpr_simulation k…

网络爬虫基础(上)

1. 爬虫的基本原理 爬虫就是在网页上爬行的蜘蛛,每爬到一个节点就能够访问该网页的信息,所以又称为网络蜘蛛; 网络爬虫就是自动化从网页上获取信息、提取信息和保存信息的过程; 2. URL的组成部分 URL全称为Uniform Resource L…

UG NX二次开发(C#)-PMI-获取PMI尺寸数据

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 1、前言2、在UG NX的三维模型中添加PMI尺寸信息3、采用二次开发获取尺寸数据4、测试结果1、前言 PMI(Product and Manufacturing Information)是产品和制造信息的简称,主要用于将产品部件设计的…

python 与 neo4j 交互(py2neo 使用)

参考自:neo4j的python.py2neo操作入门 官方文档:The Py2neo Handbook — py2neo 2021.1 安装:pip install py2neo -i https://pypi.tuna.tsinghua.edu.cn/simple 1 节点 / 关系 / 属性 / 路径 节点(Node)和关系(relationship)是构成图的基础…

代码随想录算法训练营第二十三天 | 669. 修剪二叉搜索树,108.将有序数组转换为二叉搜索树,538.把二叉搜索树转换为累加树 [二叉树篇]

代码随想录算法训练营第二十三天 LeetCode 669. 修剪二叉搜索树题目描述思路递归参考代码 LeetCode 108.将有序数组转换为二叉搜索树题目描述思路参考代码 LeetCode 538.把二叉搜索树转换为累加树题目描述思路参考代码 LeetCode 669. 修剪二叉搜索树 题目链接:669. …

《Solidity 简易速速上手小册》第9章:DApp 开发与 Solidity 集成(2024 最新版)

文章目录 9.1 DApp 的架构和设计9.1.1 基础知识解析更深入的理解实际操作技巧 9.1.2 重点案例:去中心化社交媒体平台案例 Demo:创建去中心化社交媒体平台案例代码SocialMedia.sol - 智能合约前端界面 测试和验证拓展功能 9.1.3 拓展案例 1:去…