李飞飞空间智能来了:AI生成可探索交互的3D世界,颠覆游戏电影VR行业

目录

  • 前言
  • 图生世界
  • 摄影效果
    • 景深效果
    • 滑动变焦
  • 3D效果
    • 交互效果
    • 动画效果
  • 走进大师的艺术
  • 工作流
  • 总结

前言

12月3日,有AI“教母”之称的李飞飞发布了空间智能的一个项目,一经发布就立刻引爆了外网。这个项目是仅仅通过一张图片,AI就可以快速的构建一个3D世界,而且这个世界是可以探索和交互的,先来看一看效果:

空间智能:AI生成的3D世界

是不是非常酷炫,实际上空间智能还有更多的能力,下面详细来看一下

图生世界

当今AI发展非常迅速,用图来生成视频已经很逼真了,但是这次的空间智能更是超乎想象。

只需要将一张图片交给空间智能,空间智能就能够在短时间生成一个3D世界。可以在浏览器里进行实时绘制,实际上就是通过Three.js来实现的。这样我们就可以在这个世界里进行探索了,如下

图生世界,颠覆行业的产品

可以看到,除了正前方原图中的元素,AI还会自动生成补全其他方向上的元素。

目前这个项目的功能还没有对外开放,我们无法自己来生成世界。但是在空间智能官网(https://www.worldlabs.ai/blog)上提供了很多已经生成的世界,我们可以自己去探索
在这里插入图片描述

就跟我们玩的3D游戏一样,可以通过awsd这四个键来前后左右移动,通过鼠标拖动来调整视角。

看看我们在其中一个世界里的探索

一起来探索AI生成的世界吧

可以看到AI生成的这个世界确实让人惊艳,整体非常平滑,确实有真实世界的感受,尤其它的探索能力是其他AI无法比拟的。

但是在视频中也可以看到,虽然声称的是3D世界,但是其实只是一个小场景,而且我们在其中的行动也不是完全自由的,只能在一个很小的范围内进行移动。

不过这只是一个开始,相信随着空间智能的不断进化,后续会生成更宏大、更自由的世界。

在这些世界里探索的时候,其实也可以发现AI的痕迹,比如很多小细节上处理的还不够。比如下面这个凭空出现的小楼:
在这里插入图片描述

摄影效果

你以为这就是空间智能的全部么?当然不是,空间智能生成的世界还支持很多功能,比如一些摄影效果。

景深效果

空间智能可以模拟景深效果,对焦距离相机一定距离物体,这样这部分会清晰的显示,而其他部分则会变得模糊,如下:

空间智能的景深效果

滑动变焦

滑动变焦(Dolly Zoom)就是希区柯克变焦,是电影拍摄中一种很常见的镜头技法。希区柯克变焦的特点是:镜头中的主体大小不变,而背景大小改变。

空间智能支持滑动变焦这一效果,如下:

空间智能的滑动变焦效果

3D效果

相较于其他生成模型,空间智能生成的世界有很多优点:

  • 永恒性:一旦这个世界生成了,它就固定下来了,无论如何转变视角或移动后再返回,这个场景都不会改变了。

  • 实时性:这个场景生成后,你可以实时在这其中进行探索。

  • 正确性:生成的世界遵循3D几何的基本物理规律,有立体感和深度。其他AI模型生成的视频虽然很梦幻,但是缺乏这种效果。

空间智能通过深度图这种简单的方式来实现,简单来说就是每个像素的颜色是由它与摄像头的距离决定的。这部分大家有兴趣去官网看一下吧,这里就不展示效果了。

抬头仰望,那轮皎洁的明月,如同镶嵌在深蓝天幕上的明珠,静静地洒下银辉,照亮了每一个归家人的路。无论身在何方,心中那份对家的眷恋,都随着这轮满月,变得更加浓烈。

交互效果

空间智能生成的世界另外一个特点就是交互性,用户可以在这个场景中放置物体,也可以实现交互,如下:

与AI生成的3D世界交互吧

官网实现了三种效果,声纳、聚光灯和波纹效果。

部分用户提前获得了工具,已经进行了部分创作,他们利用这些生成的世界做了更多复杂的交互,实现了更多的效果。

动画效果

除了交互效果,还可以实现动画效果,如下:

让AI生成的世界动起来

这里就简单展示一下,大家有兴趣自行去官网体验。

走进大师的艺术

有了空间智能这个能力,我们就可以将那些大师的画作构建出来,比如漫游在梵高的《夜晚露天咖啡座》中:

一起漫游在大师的名画中

感觉就像是走进了一个抽象的世界中一样。

工作流

空间智能会保持原图的风格,这就使得它可以与其他AI生成工具结合使用。比如文生图,同一个prompt在不同的模型下生成的图片风格是不一样的,空间智能以这些图片为基准生成的世界风格一样会保持不变。

这里就不展示了,可以去官网体验。

总结

空间智能的发布结结实实的秀了一把,其强大的生成能力确实将AI带进了新的领域。虽然其中有一些瑕疵,而且目前局限于一个小小的场景,但是对于电影、游戏、VR等领域会产生一些颠覆性的改变。

最后的这个视频,是向大家分享空间智能如何在现有工作流中发挥强大的作用,甚至改变整个工作流的。

空间智能如何颠覆现有工作流

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/930652.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

网络安全防护指南:筑牢网络安全防线(5/10)

一、网络安全的基本概念 (一)网络的定义 网络是指由计算机或者其他信息终端及相关设备组成的按照一定的规则和程序对信息收集、存储、传输、交换、处理的系统。在当今数字化时代,网络已经成为人们生活和工作中不可或缺的一部分。它连接了世…

方案拆解 | 打击矩阵新规频出!2025矩阵营销该怎么玩?

社媒平台的矩阵营销又要“变天”了?! 11月18日,小红书官方发表了被安全薯 称为“小红书史上最严打击黑灰产专项”新规,其中就包括黑灰产矩阵号的公告。 ▲ 图源:小红书 实际上,不包括这次,今年…

XGBoost算法原理

XGBoost(eXtreme Gradient Boosting)是一种基于梯度提升决策树的机器学习算法,它通过优化损失函数来构建模型。XGBoost在许多数据科学竞赛中取得了成功,并且由于其高效性和准确性而广受好评。 1. 梯度提升框架 在开始讨论XGBoost…

【uni-app 微信小程序】新版本发布提示用户进行更新

知识准备 uni.getUpdateManager文档介绍 不支持APP与H5,所以在使用的时候要做好平台类型的判断,如何判断,参考条件编译处理多端差异 代码参考 export const updateApp () > {const updateManager uni.getUpdateManager()updateManag…

【C++算法】31.前缀和_连续数组

文章目录 题目链接:题目描述:解法C 算法代码:图解 题目链接: 525. 连续数组 题目描述: 解法 前缀和思想: 如果把0变成-1,那么就是在区间内找一个最长的子数组,使得子数组中所有元素…

前端知识1html

VScode一些快捷键 Ctrl/——注释 !——生成html框架元素 *n——生成n个标签 直接书写html的名字回车生成对应的标签 常见标签 span&#xff1a; <span style"color: red;">hello</span> <span>demo</span> span实现&#xff1a; 标题…

Android 实现中英文切换

在开发海外项目的时候&#xff0c;需要实现app内部的中英文切换功能&#xff0c;所有的英文都是内置的&#xff0c;整体思路为&#xff1a; 创建一个sp对象&#xff0c;存储当前系统的语言类型&#xff0c;然后在BaseActivity中对语言进行判断&#xff1b; //公共Activitypubl…

信息系统安全防护攻防对抗式实验教学解决方案

一、引言 在网络和信息技术迅猛发展的今天&#xff0c;信息系统已成为社会各领域的关键基础设施&#xff0c;它支撑着电子政务、电子商务、科学研究、能源、交通和社会保障等多个方面。然而&#xff0c;信息系统也面临着日益严峻的网络安全威胁&#xff0c;网络攻击手段层出不…

5.11【机器学习】

先是对图像进行划分 划分完后&#xff0c; 顺序读取文件夹&#xff0c;在文件夹里顺序读取图片&#xff0c; 卷积层又称为滤波器&#xff0c;通道是说滤波器的个数&#xff0c;黑白通道数为1&#xff0c;RGB通道个数为3 在输入层&#xff0c;对于输入层而言&#xff0c;滤波…

word poi-tl 图表功能增强,插入图表折线图、柱状图、饼状图

目录 问题解决问题poi-tl介绍 功能实现引入依赖功能介绍 功能实例饼图模版代码效果图 雷达图&#xff08;模版同饼图&#xff09;代码效果图 柱状图&#xff08;模版同饼图&#xff09;代码效果图 附加CustomCharts 工具类CustomChartSingleSeriesRenderData 数据对象CustomCha…

MongoDB分片集群搭建及扩容

分片集群搭建及扩容 整体架构 环境准备 3台Linux虚拟机&#xff0c;准备MongoDB环境&#xff0c;配置环境变量。一定要版本一致&#xff08;重点&#xff09;&#xff0c;当前使用 version4.4.9 配置域名解析 在3台虚拟机上执行以下命令&#xff0c;注意替换实际 IP 地址 e…

docker desktop打包配置国内镜像地址

打包遇到无法访问外网资源&#xff0c;直接配置国内镜像地址 直接加入如下代码就行&#xff1a; {"builder": {"gc": {"defaultKeepStorage": "20GB","enabled": true}},"experimental": false,"registry-m…

嵌入式Linux,标准I/O探究,I/O缓冲,以及函数讲解

出于速度和效率的考虑&#xff0c;系统 I/O 调用&#xff08;即文件 I/O &#xff0c; open 、 read 、 write 等&#xff09;和标准 C 语言库 I/O 函数&#xff08;即标准 I/O 函数&#xff09;在操作磁盘文件时会对数据进行缓冲。 1. 文件 I/O 的内核缓冲 read() 和…

【人工智能】大数据平台技术及应用

文章目录 前言一、大数据平台基本概念及发展趋势1、数据量爆发式增长&#xff0c;发数据蓬勃发展2、大数据到底是什么&#xff1f;3、大数据处理与传统数据处理的差异4、为什么要建立大数据平台&#xff1f;5、大数据平台开源架构-Hadoop6、华为云大数据平台架构 二、大数据技术…

Word中的公式域

在WORD操作中&#xff0c;遇到数学公式时&#xff0c;我们往往都要通过公式编辑器来录入&#xff0c;其实&#xff0c;除了公式编辑器以外&#xff0c;在Word中还有一个编辑公式的利器&#xff1a;域。有了这个工具&#xff0c;应付一般的数学公式编辑还是绰绰有余的。 公式域的…

2.STM32通信接口之SPI通信---SPI实战《精讲》

SPI仅支持一主多从&#xff08;无应答机制&#xff09; 参照&#xff1a;《第十一部分》1.STM32通信接口之SPI通信---SPI介绍《精讲》-CSDN博客 在采用一主多从的模式下。从机未被选中&#xff0c;SN1时&#xff0c;从机的MISO会处于高阻态状态&#xff0c;SN0时&#xff0c;M…

电子电气架构 --- E/E(电子电气架构)的重新定义

我是穿拖鞋的汉子&#xff0c;魔都中坚持长期主义的汽车电子工程师。 老规矩&#xff0c;分享一段喜欢的文字&#xff0c;避免自己成为高知识低文化的工程师&#xff1a; 所谓鸡汤&#xff0c;要么蛊惑你认命&#xff0c;要么怂恿你拼命&#xff0c;但都是回避问题的根源&…

小身躯大能量-供热系统通过EtherCAT转Profinet网关进行升级

在现代工业自动化领域&#xff0c;通信技术的进步对于提高系统效率、稳定性和可靠性起着至关重要的作用。EtherCAT&#xff08;Ethernet for Control Automation Technology&#xff09;作为一种实时以太网解决方案&#xff0c;因其高性能及成本效益高等特点&#xff0c;在众多…

buuctf:镜子里面的世界

查看图片属性以及010没有发现任何有用的信息 图片名字是steg.png,用stegsolve试试 flag{st3g0_saurus_wr3cks}

brpc的接口使用和封装

brpc 是用 c语言编写的工业级 RPC 框架&#xff0c;常用于搜索、存储、机器学习、广告、推荐等高性能系统。 brpc的远程调用思想&#xff1b;将数据处理的过程不在放在本地进行&#xff0c;而是放在服务器中去 接口使用 客户端和服务端的使用 服务端&#xff1a; 1.继承Echo…