3D生成式AI模型与工具

当谈到技术炒作时,人工智能正在超越虚拟世界,吸引世界各地企业和消费者的注意力。

但人工智能可以进一步增强虚拟世界,至少在某种意义上:资产创造。 AI 有潜力扩大用于虚拟环境的 3D 资产的创建。

AI 3D生成使用人工智能生成3D模型或物体。有几种技术:文本转 3D 模型、图像转 3D 模型、视频转 3D 模型。

每种技术都可以帮助创作者快速定制和生成虚拟资产和环境,特别是帮助那些没有 3D 建模专业知识的人。

AI 3D 生成的潜在应用是在视频游戏和元宇宙环境中创建资产,以及商业产品的设计概念。 它甚至可以用于创建工厂车间的虚拟表示,生成工业工厂的潜在模型。

1、DreamFusion

  • 创作者:谷歌、加州大学伯克利分校
  • 首次发布:2022 年 9 月

 Dream Fields 可以根据文本输入生成 3D 模型。 它本质上是 Dream Fields 的扩展版本,Dream Fields 是 Google 于 2021 年推出的生成 3D 系统。

DreamFusion 几乎不需要事先训练,这意味着它可以在没有 3D 数据的情况下生成对象的 3D 表示。 它使用由 Imagen 文本到图像扩散模型生成的对象的 2D 图像来理解它尝试生成的模型的不同视角。

2、Point-E

  • 创建者:OpenAI
  • 首次发布:2022 年 12 月

Point-E 的工作原理与 OpenAI 的图像生成工具 DALL-E 相同 - 只需输入“戴着圣诞老人帽子的柯基犬”之类的内容,系统就会生成 3D 模型。

Point-E 可以在单个 GPU 上仅用一到两分钟生成 3D 模型。 它还拥有图像转 3D 功能,这意味着图像可以与文本一起用于输入。

3、GAUDI

  • 创作者:苹果
  • 首次发布:2022 年 8 月

GAUDI以著名西班牙建筑师的名字命名,由 Apple 的研究人员创建,用于根据文本提示生成 3D 场景。 用户可以使用自然语言从任何角度重新绘制场景,从而创建建筑物的内部扫描。

GAUDI 还可以通过文本在 3D 室内场景中生成新的摄像机运动,例如用户输入“穿过走廊”。

4、MVDream

  • 创建者:TikTok 母公司字节跳动、加州大学圣地亚哥分校
  • 首次发布:2023 年 8 月 31 日

MVDream是该列表中的最新模型之一。 字节跳动和加州大学圣地亚哥分校的研究人员开发了一种扩散模型,可以根据文本输入生成高质量的 3D 渲染。

MVDream 可以生成模型的多个视图,这些视图是几何一致的多视图图像。

可以使用 DreamBooth3D 等工具对该模型进行微调,以实现个性化 3D 生成。

5、Magic3D

  • 创建者:英伟达
  • 首次发布:2023 年 3 月

Magic3D是一种预先训练的文本到图像扩散模型。 它可以根据文本提示创建高质量的 3D 网格模型。

Magic3D 采用两阶段过程:它使用低分辨率扩散创建粗略模型,然后,系统使用稀疏 3D 哈希网格结构,并通过高效的可微渲染器进一步优化,以创建最终输出。

Magic3D 可以在 40 分钟内创建高质量的 3D 网格模型。

6、COLMAP

  • 创建者:Johannes L. Schönberger,微软混合现实和人工智能实验室首席科学家
  • 首次发布:2021 年 10 月

COLMAP是一个开源 3D 重建管道,具有图形和命令行界面。 它可用于从少量图像生成详细的 3D 环境。

COLMAP 用户可以导出 3D 网格 - 尽管要对其进行细化,需要使用 MeshLab 等程序。

7、PointLLM

  • 创作者:香港中文大学、上海人工智能实验室、浙江大学
  • 首次发布:2023 年 8 月

PointLLM旨在帮助 3D 生成。 这种方法可以帮助 PaLM 和 Llama 等大型语言模型理解 3D 数据。

使用 PointLLM,人工智能研究人员可以在其数据集中充分利用点云(代表 3D 形状或对象的数据点)。

8、Gliastar

Gliastar 是AI驱动的视频创建工具,可以通过文本输入为品牌角色制作动画。

只需向 Gliastar 提供角色的 2D 或粗略 3D 表示,将模型集成到 GliaStar AI 动画系统中,系统就会在几分钟内自动生成所需吉祥物的 3D 动画。

9、3DFY.ai

3DFY.ai可以根据文本提示或单个图像创建高质量的 3D 模型。

3DFY.ai 3D 生成管道可以快速自动生成 3D 输出 - 用户能够测试文本到 3D Web 服务以尝试自己的提示。

10、Fotor

Fotor可让你根据文本描述生成 3D 模型。 用户可以为各种应用创建详细的 3D 模型。

Fotor还拥有AI 3D角色生成器,用户可以在几分钟内创建独特且详细的角色。

11、Spline

借助 Spline,用户可以使用自然语言输入实时生成 3D 模型和表示。

样条曲线不仅可用于制作 3D 模型,还可用于制作动画和纹理。

12、Meshcapade

Meshcapade构建虚拟化身——使用生成式 AI 为电子商务设置等业务应用程序创建准确的数字人类。

Meshcapade 的 SMPL 系统使用机器学习来捕获个人 3D 体型的统计数据。

13、Masterpiece Studio

借助Masterpiece Studio  ,你可以使用 AI 生成 3D 资产。

Masterpiece Studio 构建了 3D 创作软件,非技术背景的用户可以使用该软件来创建从概念到动画的 3D 内容。

Masterpiece 团队与 Meta 合作构建了 Masterpiece X,它允许创作者重新混合现有的 3D 资产。 你也可以在 Meta Quest 商店中访问它。

14、Luma AI

借助 Luma,用户可以在几分钟内生成逼真的 3D 资源和环境。

Luma 可通过移动设备使用,因此 iOS 用户可以通过手机使用其 3D 生成工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/412026.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

能碳双控| AIRIOT智慧能碳管理解决方案

在当前全球气候变化和可持续发展的背景下,建设能碳管理平台成为组织迎接挑战、提升可持续性的重要一环,有助于组织实现可持续发展目标,提高社会责任形象,同时适应未来碳排放管理的挑战。能碳管理是一个涉及跟踪、报告和减少组织碳…

C++面试宝典第32题:零钱兑换

题目 给定不同面额的硬币coins和一个总金额amount,编写一个函数来计算可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额,则返回-1。说明:你可以认为每种硬币的数量是无限的。 示例1: 输入:coins = [1, 2, 5], amount = 11 输出:3 解释:11 = …

ETL是什么

一、ETL概念 ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库&#xff…

光谱数据处理:1.特征波长优选的不同方法与Python实现

首先,我们要理解为什么要对“光谱数据进行特征波长优选”以及这是在干嘛,光谱数据可以想象成一长串的彩色条纹,每种颜色对应一个波长,就像彩虹一样。这些颜色的条纹代表了从某种物质(比如植物、矿石或是食品&#xff0…

计网自顶向下:网络应用层【Web应用与HTTP协议】

目录 Web应用Web页URLWorld Wide Web 超文本传输协议——HTTP超文本C/S结构报文请求报文响应报文HTTP响应状态码try:在命令行里手工给web服务器发送请求 http连接的两种类型非持久(http1.0)持久(http1.1)▷ 流水线▷ 非…

【自然语言处理三-自注意self attention】

自然语言处理三-自注意力 self attention 自注意力是什么?自注意力模型出现的原因是什么?词性标注问题解决方法1-扩展window,引用上下文解决方法2-运用seq2seq架构新问题来了:参数量增加、无法并行的顽疾 自注意力self attention模…

C++ list详解以及模拟实现

目录 1.list的使用 1.1list的定义 1.2list的使用 1.3list iterator使用 1.4list capacity 1.5list element access 1.6list增删查改 2.list迭代器失效问题 3.list的模拟实现 1.list的使用 1.1list的定义 1. list是可以在常数范围内在任意位置进行插入和删除的序列式容…

水印相机小程序源码

水印相机前端源码,本程序无需后端,前端直接导入即可,没有添加流量主功能,大家开通后自行添加 源码搜索:源码软件库 注意小程序后台的隐私权限设置,前端需要授权才可使用 真实时间地址拍照记录&#xff0c…

alembic

alembic是sqlalchemy的作者开发的。 用来做OMR模型与数据库的迁移与映射。 第一个,alembic的所有命令都是以alembic开头 第二,alembic的迁移文件也是通过版本进行控制的。首先,通过pip install alembic进行安装。以下将解释alembic的用法 方…

从管易云·奇门到金蝶云星空通过接口配置打通数据

从管易云奇门到金蝶云星空通过接口配置打通数据 对接源平台:管易云奇门 管易云是金蝶旗下专注提供电商企业管理软件服务的子品牌,先后开发了C-ERP、EC-OMS、EC-WMS、E店管家、BBC、B2B、B2C商城网站建设等产品和服务,涵盖电商业务全流程。 目标系统:金蝶…

ZYNQ:串口-CAN协议转换

前言 目前已经实现zynq的PS-CAN和PL-CAN功能。串口-CAN协议转换是实现以太网-CAN功能的过渡,通过这个流程能够减少后期以太网工程出现问题的频率。阶段性功能目标如下: 实现数据在CAN调试助手和串口调试助手之间的来回转换,从而了解中断机制…

Vue前端对请假模块——请假开始时间和请假结束时间的校验处理

开发背景:Vueelement组件开发 业务需求:用户提交请假申请单,请假申请的业务逻辑处理 实现:用户选择开始时间需要大于本地时间,不得大于请假结束时间,请假时长根据每日工作时间实现累加计算 页面布局 在前…

【Excel PDF 系列】EasyExcel + iText 库

你知道的越多,你不知道的越多 点赞再看,养成习惯 如果您有疑问或者见解,欢迎指教: 企鹅:869192208 文章目录 前言转换前后效果引入 pom 配置代码实现定义 ExcelDataVo 对象主方法EasyExcel 监听器 前言 最近遇到生成 …

SQL进阶(三):Join 小技巧:提升数据的处理速度

复杂数据结构处理:Join 小技巧:提升数据的处理速度 本文是在原本sql闯关的基础上总结得来,加入了自己的理解以及疑问解答(by GPT4) 原活动链接 用到的数据:链接 提取码:l03e 目录 1. 课前小问…

动态规划之第 N 个泰波那契数/三步问题【leetCode】【算法】

动态规划动态规划之第 N 个泰波那契数/三步问题 动态规划LeetCode题目第 N 个泰波那契数求解1求解2(滚动数组) 三步问题求解1求解2(滚动数组) 动态规划 如果问题是由重叠的子问题构成的,那就可以用动态规划&#xff08…

JSON简介以及如何在Python中使用JSON

什么是JSON? JSON是"JavaScript Object Notation"的简称,是一种数据交换格式 JSON格式 假设我们有一个对象,这个对象有两个属性:“name”跟“age”。 在JSON中是这样表达的: { "name":"男孩…

【 C++ 】闭散列哈希表的模拟实现

哈希节点状态 我们都很清楚数组里的每一个值无非三种状态: 如果某下标没有值,则代表空EMPTY。如果有值在代表存在EXIST。如果此位置的值被删掉了,则表示为DELETE。 而这三种状态我们可以借助enum枚举来帮助我们表示数组里每个位置的状态。…

RK3568平台开发系列讲解(基础篇)如何快速学习一套 Linux开发板源码

🚀返回专栏总目录 文章目录 一、基础代码二、驱动代码沉淀、分享、成长,让自己和他人都能有所收获!😄 拿到一份源码和一块评估板,如何快速找到与这块板相关的源码,是很多研发人员都曾遇到过的问题。如果对内核源码结构有大概了解,要完成这些事情也不难,通常可按照基础…

ASLR 和 PIE

前言 ASLR(Address Space Layout Randomization,地址空间随机化)是一种内存攻击缓解技术,是一种操作系统用来抵御缓冲区溢出攻击的内存保护机制。这种技术使得系统上运行的进程的内存地址无法被预测,使得与这些进程有…

高性能 Kafka 及常见面试题

Kafka 是一种分布式的,基于发布/订阅的消息系统,原本开发自 LinkedIn,用作 LinkedIn 的事件流(Event Stream)和运营数据处理管道(Pipeline)的基础。 基础原理详解可见 Kafka 基本架构及原理 基础…