微软与腾讯技术交锋,TRELLIS引领3D生成领域多格式支持新方向

去年 11 月,腾讯推出 Hunyuan3D 生成模型,是业界首个同时支持文字和图像生成 3D 的开源大模型。紧接着不到一个月,微软便发布了全新框架 TRELLIS,加入 3D 资产生成领域的竞争中。TRELLIS 支持多格式输出,包括辐射场、3D 高斯和网格,为不同需求提供最大灵活性。

两个模型现均已上线 hyper.ai 超神经官网,快来试试哪个更胜一筹吧~

在线使用 Hunyuan3D:https://go.hyper.ai/Rsrno

在线使用 TRELLIS:https://go.hyper.ai/JE5s5

1 月 6 日-1 月 11 日,hyper.ai 官网更新速览:

  • 优质公共数据集:10 个

  • 优质教程精选:6 个

  • 社区文章精选:8 篇

  • 热门百科词条:5 条

  • 1 月截稿顶会:7 个

访问官网:hyper.ai

公共数据集精选

1. VSI-Bench 视觉空间智能基准测试集

该数据集包含超过 5k 个问题-答案对,覆盖近 290 个真实室内场景视频,涉及住宅、办公室和工厂等多种环境,涵盖了物体识别、位置关系、动作预测等多个方面的问题。

直接使用:https://go.hyper.ai/q0DYA

在这里插入图片描述

VSI-Bench 的任务演示

2. Facial Feature Extraction Dataset 面部特征提取数据集

该数据集是一个包含 750 张图像的标记数据集,用于检测脸部的眉毛、眼睛、鼻子、嘴唇、胡须区域。数据标记过程在 Roboflow 中执行,以 YOLOv8 格式从导出。

直接使用:https://go.hyper.ai/O3kER

在这里插入图片描述

数据集示例

3. Sentiment and Emotion Analysis Dataset 情感情绪分析数据集

该数据集包含 422,000 个情绪分析句子,和 3,309 个情感分析句子作为补充。情绪分析标记有 6 种不同情绪:喜悦、悲伤、愤怒、恐惧、喜爱和惊讶。

直接使用:https://go.hyper.ai/wFNO6

4. Eurus-2-RL-Data 数学编程问题训练数据集

该数据集是一个专门用于强化学习训练的高质量数据集,主要应用于数学和编程问题的解决,包含了约 455k 个数学问题和 27k 个编程问题。

直接使用:https://go.hyper.ai/Wdo1k

5. Medical o1 Reasoning SFT 医学推理数据集

该数据集专为微调 HuatuoGPT-o1 这一医学大语言模型而设计,旨在提升其在复杂医学推理任务中的表现。数据集的构建依赖于 GPT-4o,通过搜索可验证的医学问题并利用医学验证器进行答案验证,确保了数据的准确性和可靠性。

直接使用:https://go.hyper.ai/XMtXp

6. MCTS 中文文本简化数据集

该数据集包含 723 条基于 Penn Chinese Treebank (CTB) 的标准、选自新闻语料的复杂结构句子,并且每一句都配有多个人工简化的版本,从而成为中文文本简化任务上规模最大、参考最多的评估数据集。

直接使用:https://go.hyper.ai/UR3CN

7. educhat-sft-002-data-osm 教育领域对话数据集

该数据集包含了 400 万个数据点,包含了多样化的教育垂直领域数据,如开放问答、作文批改、启发式教学、情感支持和课程辅导等。

直接使用:https://go.hyper.ai/nQw0K

8. GOAT 算数任务微调数据集

此数据集有 dataset.json 和 dataset.ipynb 两个文件。dataset.json 文件包含约 170 万个由 dataset.ipynb 生成的、用于算术任务的合成数据。

直接使用:https://go.hyper.ai/8ZAvG

9. NaturalProofs 数学推理数据集

该数据集是一个用于研究自然语言中数学推理的多领域语料库,它包含了大约 30k 个定理陈述和证明、15k 个定义以及 2k 个额外页面(例如公理、推论),这些内容都是用自然数学语言编写的。

直接使用:https://go.hyper.ai/Bk4WE

10. TransGPT-pt&sft 交通对话预训练数据集

该数据集为国内首款综合交通大模型 TransGPT 的一部分,包含约 34.6 万条交通领域文本数据,这些数据用于领域内预训练,以及约 5.8 万条交通领域对话数据,用于微调。

直接使用:https://go.hyper.ai/vuDHa

公共教程精选

1. Hunyuan3D:仅需 10 秒生成 3D 资产

Hunyuan3D 是 3D 生成扩散模型模型,包括一个轻量版和一个标准版,均支持从文本和图像输入生成高质量的 3D 资产。经过定性和定量的多维度评估,Hunyuan3D-1.0 在几何细节、纹理细节、纹理-几何一致性、 3D 合理性、指令遵循等方面的表现都非常出色。

本教程是 Hunyuan3D 轻量版,点击下方链接,按照教程指引即可体验 3D 模型生成。

在线运行:https://go.hyper.ai/Rsrno

在这里插入图片描述

效果示例

2. TRELLIS:微软开源的 3D 资产生成模型 Demo

TRELLIS 是微软 (Microsoft) 团队于 2024 年开发的一个基于图神经网络的可解释性框架,旨在通过学习图结构数据的特征,提供高效的模型可解释性。

该模型与环境已经部署完毕,根据教程指引即可使用大模型进行图像转 3D 影像。

在线运行:https://go.hyper.ai/JE5s5

在这里插入图片描述

效果示例

3.快速部署 ChatGLM2-6b-32k

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于通用语言模型 (GLM) 架构,拥有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地(INT4 量化)等级下最低只需 6 GB 显存)。

按照教程步骤操作,直接复制生成的 API 地址,即可使用 ChatGLM-6B。

在线运行:https://go.hyper.ai/B0b7V

在这里插入图片描述

模型 web 界面

4. 使用 NLTK 进行自然语言处理

NLTK 是使用自然语言数据创建 Python 程序的最流行的平台之一。除了用于分类、标记化、词干、标记、解析和语义推理的文本处理库以外,它还为 50 多个大型结构化文本数据集(语料库)和词汇资源提供了简单的接口。

本教程将介绍如何使用 NLTK 在文本处理阶段进行各种 NLP 操作,并借助一些用于情感分析文本分类的 NLTK 工具创建 Keras 模型。

在线运行:https://go.hyper.ai/BFZ10

在这里插入图片描述

词频分布示例

5. Audio LDM 音频编辑教程

AudioLDM 是一种潜在的文本到音频扩散模型,能够在给定任何文本输入的情况下生成真实的音频样本。AudioLDM 将文本提示作为输入并预测相应的音频。它可以生成文本条件音效、人类语音和音乐。

该项目通过 Gradio 接口可以生成前端交互界面,相关模型和依赖已经部署完毕,点击下方链接即可编辑音频。

在线运行:https://go.hyper.ai/BCOWL

6. ShowUI:专注 GUI 自动化的视觉-语言-动作模型

ShowUI 模型通过理解屏幕界面的内容,并执行如点击、输入、滚动等交互动作,支持网页和手机应用场景,能够自动完成复杂的用户界面任务。ShowUI 能够解析屏幕截图和用户指令,进而预测出界面上的交互动作。

该教程为模型一键部署 Demo,只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行体验。

在线运行:https://go.hyper.ai/reHs7

在这里插入图片描述

模型 web 界面

💡我们还建立了 Stable Diffusion 教程交流群,欢迎小伙伴们添加神经星星微信(微信号:Hyperai01)备注【SD教程】,入群探讨各类技术问题、分享应用效果~

社区文章精选

1. 10大圣诞数据集汇总:热门歌曲/礼物愿望清单/菜谱/10年间圣诞推特文案……

圣诞节期间,HyperAI超神经为大家准备了 10 个圣诞节相关的数据集,支持在线使用与加速下载,快来体验吧。

查看数据集汇总:https://go.hyper.ai/if7Lc

2. 成本下降 100 倍!非营利组织 E11 Bio 新成果,绘制大脑数百万细胞连接关系

生物科技公司 E11 Bio 推出 PRISM 技术,能够以极低成本绘制整个大脑中数百万个细胞的连接关系,这一系列创新使得全脑连接组学的整体成本预计下降至少 100 倍,为未来探索人类大脑提供了可能。本文是对该企业的详细报道,点击速看。

查看完整报道:https://go.hyper.ai/ISc4j

3. 多国政策/科研突破/先锋人物/企业布局……一文看尽 2024 年 AI4S 行业大事

HyperAI超神经为大家梳理盘点了 2024 年 AI for Science 领域的高影响力事件。点击查看详细报道。

查看完整报道:https://go.hyper.ai/d2Dlv

4. 全球变暖难逆转,斯坦福团队用 AI 预测最高温变化,破纪录可能性达 90%

在全球持续变暖等大背景下,罕见的极端气候事件开始频发。斯坦福大学、科罗拉多州立大学与苏黎世联邦理工学院的研究团队,通过将人工智能卷积神经网络系统用于全球变暖预测,发现即便我们能够实现快速减排,全球气温仍有 90% 的可能性持续升高。本文是对论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/vDt3e

5. 模拟人类反应式抓取过程,普渡大学团队实现机器人学习的数据高效触觉表征

普渡大学三年级博士生徐政通以「面向机器人学习的数据高效触觉表征」为题,向大家分享了反应式抓取控制器 LeTac-MPC 和用于机器人统一触觉表示的 UniT 两大科研成果。本文是对分享内容的整理汇总,点击速看。

查看完整报道:https://go.hyper.ai/IPIjj

6. 五战蛋白质结构预测风向标 CASP,南开大学郑伟:竞争性与难度提升,关注实际生物问题

CASP 一直以来被行业看作是蛋白质结构预测的风向标。 在此背景下,HyperAI超神经有幸与郑伟教授进行了一次深度访谈,透过具有行业风向标意义的国际大赛 CASP,他为我们剖析了当下蛋白质结构预测领域的发展趋势。干货满满,点击速看。

查看完整报道:https://go.hyper.ai/Y83iz

7. 坚守 30 年,麻省理工学院瞄定下一代锂电池,用生成式 AI 实现固态电解质重大突破

麻省理工学院和丰田研究所的研究团队在一项最新研究中深入研究了不同先进生成式模型在聚合物生成中的复杂性,并提出了一种可以持续生成和评估新的基于 GPT 和扩散模型的聚合物电解质的从头设计方法,为实验检验提供了新的候选物。本文是对论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/PDc8J

8. 刚刚!世界最快GPU RTX 5090官宣售价超1.4万元,国行阉割版5090 D定价超1.6万元

在 CES 2025 大会上,英伟达 RTX 5090 正式官宣,是迄今为止速度最快的 GeForce RTX GPU,首发价 1.4 万元,国行版 5090 D 售价 1.6 万元。RTX 5090 还增加了 FP4 支持,与上一代产品相比,内存占用空间更小,运行生成式 AI 模型的速度提高了 2 倍。本文是对该产品的详细介绍,点击速看。

查看完整报道:https://go.hyper.ai/dyyZS

热门百科词条精选

  1. 核范数 Nuclear Norm

  2. 配对 t 检验 Paired t-Test

  3. 大规模多任务语言理解 MMLU

  4. Sigmoid 函数 Sigmoid function

  5. 最小二乘法 The least square method

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

1 月截稿顶会

在这里插入图片描述

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1700+ 公开数据集提供国内加速下载节点

  • 收录 500+ 经典及流行在线教程

  • 解读 200+ AI4Science 论文案例

  • 支持 600+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/953744.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【C++】类与对象(中上)(难点部分)

目录 💕1.类的默认成员函数 💕2.构造函数 💕3.析构函数 💕4.缺省值 💕5.拷贝构造函数 (最新更新时间——2025.1.14) 这世间没有绝境 只有对处境绝望的人 💕1.类的默认成员函数 默…

Apache Hop从入门到精通 第三课 Apache Hop下载安装

1、下载 官方下载地址:https://hop.apache.org/download/,本教程是基于apache-hop-client-2.11.0.zip进行解压,需要jdk17,小伙伴们可以根据自己的需求下载相应的版本。如下图所示 2、下载jdk17(https://www.microsoft…

springboot房屋租赁管理系统

Spring Boot房屋租赁管理系统是一种基于Spring Boot框架构建的,旨在解决传统租房市场中房源信息更新不及时、虚假信息泛滥、交易流程繁琐等问题的信息化解决方案。 一、系统背景与目的 随着城市化进程的加快和人口流动性的增强,租房市场需求急剧增长。…

计算机网络 (35)TCP报文段的首部格式

前言 计算机网络中的TCP(传输控制协议)报文段的首部格式是TCP协议的核心组成部分,它包含了控制TCP连接的各种信息和参数。 一、TCP报文段的结构 TCP报文段由首部和数据两部分组成。其中,首部包含了控制TCP连接的各种字段&#xff…

鸿蒙-页面和自定义组件生命周期

页面生命周期,即被Entry装饰的组件生命周期,提供以下生命周期接口: onPageShow:页面每次显示时触发一次,包括路由过程、应用进入前台等场景。onPageHide:页面每次隐藏时触发一次,包括路由过程、…

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

作者:寒空、横槊、娜米、公仪 道旅科技:科技驱动,引领全球旅游分销服务 道旅科技 (https://www.didatravel.com/home) 成立于 2012 年,总部位于中国深圳,是一家以科技驱动的全球酒店资源批发商…

【HarmonyOS NEXT】鸿蒙跳转华为应用市场目标APP下载页

【HarmonyOS NEXT】鸿蒙跳转华为应用市场目标APP下载页 一、问题背景: 如今,大家都离不开各种手机应用。随着鸿蒙系统用户越来越多,大家都希望能在鸿蒙设备上快速找到想用的 APP。华为应用市场里有海量的 APP,但之前从鸿蒙设备进…

JavaScript动态渲染页面爬取之Splash

Splash是一个 JavaScript渲染服务,是一个含有 HTTP API的轻量级浏览器,它还对接了 Python 中的 Twisted 库和 OT库。利用它,同样可以爬取动态渲染的页面。 功能介绍 利用 Splash,可以实现如下功能: 异步处理多个网页的渲染过程:获取渲染后…

Thrustmaster Hotas Warthog飞行操作杆开发

目录 0 摘 要 :简单说一下这篇文章在搞啥 1 背 景 :什么需求以及对开发的背景调查 2 环境配置 :具体需要什么环境,对软件层面的需求 3 硬件测试 :测试遥感器…

算法-查找数组对角线上最大的质数

力扣题目:2614. 对角线上的质数 - 力扣(LeetCode) 给你一个下标从 0 开始的二维整数数组 nums 。 返回位于 nums 至少一条 对角线 上的最大 质数 。如果任一对角线上均不存在质数,返回 0 。 注意: 如果某个整数大于…

电梯系统的UML文档02

现在我们来回答用UML 设计电梯系统的实践中遇到的问题:“UML 是一种适合于实时系统的建模语言吗?”我们发现基于上段提到的特征,UML 是适合的但有不足。用UML 设计实时系统有以下问题: •特定硬件及它们特征的定义。 •在对象、任务和硬件层…

mysql set age=‘0‘ 和 set age=0的区别?

select case when(t1.business_transfer‘source’)then 0 else t1.settlement_tyy_cash_amount end as tyy from t_settlement_waybill t1 where waybill_sn in (‘2025010700001’); select case when(t1.business_transfer‘source’)then (t1.settlement_tyy_cash_amount‘…

利用Java爬虫按图搜索1688商品(拍立淘)的实践指南

在当今数字化时代,网购已成为人们生活中不可或缺的一部分。而1688作为国内领先的B2B电商平台,汇聚了海量的商品资源。然而,在面对众多商品时,传统的文字搜索方式有时难以满足我们的需求。比如,当我们看到一件心仪的商品…

达梦8-DMSQL程序设计学习笔记1-DMSQL程序简介

1、DMSQL程序简介 DMSQL程序是达梦数据库对标准SQL语言的扩展,是一种过程化SQL语言。在DMSQL程序中,包括一整套数据类型、条件结构、循环结构和异常处理结构等,DMSQL程序中可以执行SQL语句,SQL语句中也可以使用DMSQL函数。 DMSQ…

使用 WPF 和 C# 将纹理应用于三角形

此示例展示了如何将纹理应用于三角形,以使场景比覆盖纯色的场景更逼真。以下是为三角形添加纹理的基本步骤。 创建一个MeshGeometry3D对象。像往常一样定义三角形的点和法线。通过向网格的TextureCoordinates集合添加值来设置三角形的纹理坐标。创建一个使用想要显示的纹理的 …

Git版本控制 - 创建使用Repository

Git版本控制 – 创建使用Repository Version Control with Git - Create and Use Repository By JacksonML 上文提到,Git是一种分布式版本控制系统。作为全球范围内广泛使用的工具,如何将项目分步骤运用到其中呢? 本文简要介绍如何用Git工…

WINFORM - DevExpress -> devexpress版--报表(report)

devexpress report模板 1.安装devexpress(DevExpress 总结【安装、案例】_caoyanchao1的博客-CSDN博客_devexpress) 2.新建vs项目且添加standarReportDesigner控件 涛神设计器注意 3.运行后步骤 点击New Report DetailReport 涛神设计器checkbox(3.复选框只认boolean类型的 b…

【Redis】初识Redis

目录 Redis简介 Redis在内存中存储数据 Redis数据库中的应用 Redis缓存中的应用 Redis消息中间件 尾言 Redis简介 如下是Redis官网中,对Redis的一段描述 在这段描述中,我们提取如下关键要点: Redis主要用于在内存中存储数据Redis可…

YOLOv9改进,YOLOv9自研检测头融合HAttention用于图像修复的混合注意力检测头

参考文章 完成本篇内容,首先完成这篇文章,并把代码添加到 YOLOv9 中: YOLOv9改进,YOLOv9引入HAttention注意机制用于图像修复的混合注意力转换器,CVPR2023,超分辨率重建 下文都是手把手教程,跟着操作即可添加成功 目录 参考文章🎓一、YOLOv9原始版本代码下载🍀🍀…

[读书日志]8051软核处理器设计实战(基于FPGA)第七篇:8051软核处理器的测试(verilog+C)

6. 8051软核处理器的验证和使用 为了充分测试8051的性能,我们需要测试每一条指令。在HELLO文件夹中存放了整个测试的C语言工程文件。主函数存放在指令被分为五大类,和上面一样。 打开后是这样的文件结构。HELLO.c是主文件,这是里面的代码&am…