CV论文--2024.2.29

1、ShapeLLM: Universal 3D Object Understanding for Embodied Interaction

中文标题:ShapeLLM: 用于具身交互的通用三维物体理解

简介:这篇论文介绍了ShapeLLM,它是专为具体交互设计的首个三维多模态大语言模型(LLM)。ShapeLLM利用三维点云和语言探索通用的三维物体理解。基于改进的3D编码器,ShapeLLM通过将ReCon扩展为ReCon ++,从多视角图像中提取几何信息,以实现更好的几何理解。通过将ReCon ++ 作为LLM的3D点云输入编码器进行训练,ShapeLLM 在构建的指令跟随数据上进行训练,并在新的人工策划的评估基准3D MM-Vet 上进行测试。ReCon ++ 和 ShapeLLM 在三维几何理解和语言统一的三维交互任务方面表现出最先进的性能,如具体的视觉基础。

原文地址:https://arxiv.org/abs/2402.17766v1

2、VRP-SAM: SAM with Visual Reference Prompt

中文标题:VRP-SAM: 带有视觉参考提示的 SAM

简介:这篇文章介绍了一种创新的视觉参考提示(VRP)编码器,它使得分割任何物体模型(SAM)能够利用注释的参考图像来作为分割的指导,从而形成了VRP-SAM模型。简而言之,VRP-SAM利用注释的参考图像来识别特定对象,并对目标图像中的这些特定对象进行分割。值得注意的是,VRP编码器支持各种参考图像的注释格式,包括点、框、涂鸦和掩模。通过扩展其通用性和适用性,同时保留SAM的优势,VRP-SAM提高了用户友好性。为了增强VRP-SAM的泛化能力,VRP编码器采用了元学习策略。为验证VRP-SAM的有效性,我们在Pascal和COCO数据集上进行了广泛的实证研究。值得一提的是,在可学习参数最少的情况下,VRP-SAM在视觉参考分割方面取得了最先进的性能。此外,VRP-SAM展现出强大的泛化能力,使其能够对未见过的对象进行分割,并实现跨领域分割。

原文地址:https://arxiv.org/abs/2402.17726v1

3、CAD-SIGNet: CAD Language Inference from Point Clouds using Layer-wise Sketch Instance Guided Attention

中文标题:CAD-SIGNet:使用逐层草图实例引导注意力从点云进行CAD语言推断

简介:这篇文章介绍了计算机辅助设计(CAD)领域中的逆向工程,虽然该领域尚未完全实现。其主要目标是在给定物理对象的3D扫描情况下,揭示CAD过程背后的设计细节。作者提出了CAD-SIGNet,这是一种端到端可训练的自回归架构,用于从输入点云中还原CAD模型的设计历史,包括一系列草图和挤出操作。该模型通过逐层交叉注意点云和CAD语言嵌入之间的视觉语言表示来学习。特别是,作者提出了一种新的草图实例引导注意(SGA)模块,以便更好地重建草图的细节。由于其自回归属性,CAD-SIGNet不仅能够在给定输入点云的情况下还原相应CAD模型的完整设计历史,还能提供多个可信的设计选择。这使得设计师可以在设计过程中提供多个下一步选择,从而实现交互式逆向工程场景。作者在公开可用的CAD数据集上进行了广泛实验,展示了他们的方法在两个设置中的有效性:完整设计历史还原和基于点云的条件自动完成。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/416045.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Galaxy基础教程:从列表集合中提取元素标识符

如何从一个列表集合中提取元素标识符? 解决方案 网站:UseGalaxy.CN 工具: Extract element identifiers of a list collection (Galaxy Version 0.0.2) Dataset collection *: 列表集合 讨论 该工具接受一个列表类型的集合作为输入&#xff0…

11.以太网交换机工作原理

目录 一、以太网协议二、以太网交换机原理三、交换机常见问题思考四、同网段数据通信全过程五、跨网段数据通信全过程六、关键知识七、调试命令 前言:在网络中传输数据时需要遵循一些标准,以太网协议定义了数据帧在以太网上的传输标准,了解以…

猜猜心里数字(个人学习笔记黑马学习)

1.定义一个变量,数字类型,内容随意 2.基于input语句输入猜想的数字,通过if和多次elif的组合,判断猜想数字是否和心里数字一致 num5if int(input("请输入第一次猜想的数字:"))5:print("猜对了&#xff0…

JavaEE:多线程(3):案例代码

目录 案例一:单例模式 饿汉模式 懒汉模式 思考:懒汉模式是否线程安全? 案例二:阻塞队列 可以实现生产者消费者模型 削峰填谷 接下来我们自己实现一个阻塞队列 1.先实现一个循环队列 2. 引入锁,实现线程安全 …

mysql修改字段的长度锁表问题

mysql修改字段的长度锁表问题 背景 MySQL(这里指5.6及其后续版本)修改字段的长度锁表会锁表吗?答案是可能会但不一定会 具体原理 MySQL 5.6 及以后版本扩大字段长度 支持 online ddl in-place 模式,而这将不会锁表。varchar 表示…

SpringBoot神来一言管理系统

介绍 神来一言管理系统是一款汇总和记录生活中自己无意间说出的一句有意思的话或他人说出的一句有意思的话。 使用技术 SpringBootMyBatisPlusThymeleafMySQL 项目结构 功能介绍 登录 首页 一言管理 详情 分类管理 源码下载 链接: https://pan.baidu.com/s/14FkhiJJlXM4N…

江苏专转本复习几轮比较好?

大一、大二 江苏专转本备考复习 到现在你复习了几轮? 复习几轮最靠谱呢? 据调查统计:专转本17%的考生复习三轮及以上,23%的考生复习了两轮。这两类的考生录取率高至85%。 可见复习轮数多,专转本上岸的概率也大。综…

人工智能水印技术入门:工具与技巧

近几个月来,我们看到了多起关于“深度伪造 (deepfakes)”或人工智能生成内容的新闻报道:从 泰勒斯威夫特的图片、汤姆汉克斯的视频 到 美国总统乔拜登的录音。这些深度伪造内容被用于各种目的,如销售产品、未经授权操纵人物形象、钓鱼获取私人…

SpringCloud微服务-Nacos配置管理

Nacos配置管理 文章目录 Nacos配置管理1、统一配置管理具体步骤 2、配置自动刷新(热更新)3、多环境配置共享3.1、添加一个环境共享配置3.2、在user-service中读取共享配置3.3、编写接口测试3.4、运行两个User Application ,使用不同的profile…

FPGA-学会使用vivado中的存储器资源RAM(IP核)

问题 信号源(例如ADC)以1us一个的速率产生12位的数据现要求获得连续1ms内的数据,通过串口以115200的波特率发到电脑。 分析 数据量是1000个 数据速率不匹配 数据内容未知 数据总数据量有限 数据的使用速度低于数据的产生速度 数据生产和消耗的位宽 数据量相对较…

一个实时波形图的封装demo(QT)(qcustomplot)

前言: 封装的一个实时波形图的类,可以直接提升使用。 提供了接口,可以更改颜色,样式,等等 参考: Qt Plotting Widget QCustomPlot - Introduction 另外参考了一个大神的作品,链接没找到。 项目…

JS画摆线

最近看到一个很漂亮的曲线&#xff0c;研究了一下。 从圆心画一条线匀速转动&#xff0c;终点再画一条线转动&#xff0c;2条线转速不同&#xff0c;会画出很漂亮的花纹。 一个周期 完整周期 <html> <style> body { background:black; } p { text-align:center; c…

python脚本实现全景站点欧拉角转矩阵

效果 脚本 import numpy as np import math import csv import os from settings import *def euler_to_rotation_matrix(roll, pitch, yaw):# 计算旋转矩阵# Z-Y-X转换顺序Rz

v-rep--websocket接口

websocket是什么 V-REP 中的 Web Socket 是一种用于在 V-REP 和外部应用程序之间进行通信的协议和技术。Web Socket 基于 TCP 连接&#xff0c;可以提供双向、实时的数据传输&#xff0c;适用于互动性或实时交互性应用。 (比如v-rep在云服务器上运行&#xff0c;通过websocke…

Groovy(第五节) Groovy 之集合

Groovy 可以直接在语言内使用集合。在 Groovy 中,不需要导入专门的类,也不需要初始化对象。集合是语言本身的本地成员。Groovy 也使集合(或者列表)的操作变得非常容易,为增加和删除项提供了直观的帮助。 可以将范围当作集合 在前一节学习了如何用 Groovy 的范围将循环变得…

vue - - - - - vue3使用draggable拖拽组件

vue3使用draggable拖拽组件 一、组件安装二、插件使用三、遇到的问题1. missing required prop&#xff1a; “itemKey” 一、组件安装 yarn add vuedraggablenext // or npm i -S vuedraggablenext二、插件使用 <template><draggableitem-key"id"class&q…

【HDFS】Decommision(退役) EC数据节点剩最后几个块卡住的问题

一、背景 近期操作退役EC集群的节点。在退役的过程中,遇到了一些问题。特此总结一下。 本文描述的问题现象是: 每一批次退役10个节点,完全退役成功后开始操作下一批。 但是,中间有一批次有2台节点的Under Replicated Blocks一直是1,不往下降。 处于Decommissioning状态卡…

三款热门超声波清洗机对比测评:希亦、固特、大宇多维度实测!

如果你非常在意物品的健康卫生&#xff0c;并且希望能够摆脱手动清洗一些物品而彻底解放双手&#xff01;在家备一款超声波清洗机还是非常有必要的&#xff01;无论是珠宝、眼镜还是日常小物&#xff0c;都希望能够保持如新的光泽和卫生状态。那么超声波清洗机是最合适不过的&a…

【Leetcode每日一题】二分查找 - 有效的完全平方数(难度⭐)(19)

1. 题目解析 Leetcode链接&#xff1a;367. 有效的完全平方数 这个问题的理解其实相当简单&#xff0c;只需看一下示例&#xff0c;基本就能明白其含义了。 核心在于判断给定的整数是否可以开方成两个整数相乘&#xff0c;可以就返回false&#xff0c;反之返回true。 2. 算法…

es安装中文分词器 IK

1.下载 https://github.com/medcl/elasticsearch-analysis-ik 这个是官方的下载地址&#xff0c;下载跟自己es版本对应的即可 那么需要下载 7.12.0版本的分词器 2.安装 1.在es的 plugins 的文件夹下先创建一个ik目录 bash cd /home/apps/elasticsearch/plugins/ mkdir ik …