【计算机图形学】AO-Grasp: Articulated Object Grasp Generation

对AO-Grasp: Articulated Object Grasp Generation的简单理解

文章目录

  • 1. 做的事情
  • 2. AO-Grasp数据集
    • 2.1 抓取参数化和label标准
    • 2.2 语义和几何感知的抓取采样
  • 3. AO-Grasp抓取预测
    • 3.1 预测抓取点
    • 3.2 抓取方向预测
  • 4. 总结

1. 做的事情

引入AO-Grasp,grasp proposal generation method,生成稳定和可操纵的6DoF铰接物体抓取策略,可以完成打开/关闭橱柜的任务。给定单个铰接物体的部分点云,AO-Grasp使用最新的运动性抓取点预测模型来预测物体上的最佳抓取点,并利用最先进的刚性物体抓取方法来找到对应逐点的抓取方向。

在这里插入图片描述

2. AO-Grasp数据集

AO-Grasp数据集是一组模拟数据集,有在铰接物体上的运动抓取。由5个常用家庭家具/应用类别(箱子、洗碗机、烤箱、垃圾桶、保险柜)的61个实例上的48K个6DoF的grasp组成。

对于每个实例,在闭关状态和9个随机采样的打开状态下生成抓取动作,并为每个状态随机蔡阿姨给你20个相机视点。

2.1 抓取参数化和label标准

AO-Grasp数据集使用二指gripper。抓取被表示为 g = ( t , R ) ∈ S E ( 3 ) g=(t,R)∈SE(3) g=(t,R)SE(3) t t t是抓取位置, R R R是抓取方向。

与刚性物体抓取相反,抓取的稳定性通常通过摇动物体或施加干扰力验证,我们要求与铰接物体进行语义上有意义的交互,如打开微波炉的门。因此设计了抓取评估过程,不仅衡量抓取稳定性,还衡量可操纵性。

首先在g处生成完全打开的gripper,若没有探测到碰撞,则关闭gripper完成抓取。接着使gripper朝最佳方向运动以驱动物体部件,以执行动作,这个方向是通过物体GT的关节状态和axis获得的。在固定数量的步骤后,终止运动,若满足两个条件则抓取成功:

  1. gripper仍然与物体交互,表示grasp是稳定的;

  2. 被抓取的部件移动了一定的距离,则表示是可运动的。

2.2 语义和几何感知的抓取采样

给定物体实例,目标是采样一组打好标签的抓取。在物体表面均匀采样抓取位置对刚性物体来说是很方便的,但运动性抓取通常集中在很小的范围内(如关闭微波炉的把手),使得均匀采样不够高效。为战胜这个挑战,利用物体语义和几何的先验引导采样。

抓取可运动性与语义强相关。因此,使用部件网格的语义标签来识别可运动比肩,如门,可操纵的零件如旋钮和把手。应用语义感知的采样,更偏向采样可运动部件上的抓取点。

抓取质量同样受物体几何影响。因此偏置采样朝向高曲率变化区域和远离joint axis的点:

在这里插入图片描述

应用几何感知的采样。Following [32], we sample the gripper forward axis within a cone aligned with the surface normal, then uniformly sample the wrist rotation.

3. AO-Grasp抓取预测

在这里插入图片描述

输入是铰接物体部分点云,输出是一组6DoF的抓取姿态。

首先,AO-Grasp预测机器人应该抓取物体的哪个位置,这是通过Grasp Point Predictor进行预测的,在AO-Grasp数据集上训练。通过损失设计和训练策略选定来泛化到新的视点和新的物体下。

接着,生成抓取方向,抓取由Grasp Point Predictor预测的抓取点,AO-Grasp由Contact-GraspNet(最先进的刚性物体抓取方法)生成旋转。

最后,从逐点抓取分数和抓取方向,通过选择具有高抓取概率的点来组成抓取建议的最终集合。

3.1 预测抓取点

PointNet++提取特征,MLP预测这个点的抓取概率。使用一下两个策略来获得跨视角、跨物体实例和类别的泛化:

1. 学习视角独立的点对应关系: Actionable Grasp Point Predictor必须理解抓取概率分数是视角独立的,一个好的抓取点在视角改变的情况下应当没有影响。
在这里插入图片描述

使用Siamese网络结构来学习视角独立的逐点特征,如图2(a)所示。训练损失为:

在这里插入图片描述

2. 计算密集的“pseudo ground truth”热图: 直接用AO-Grasp数据集中的二进制抓取标签训练会导致在测试类别上较差的泛化性,因为模型会容易过拟合稀疏的数据,为缓和这种过拟合,通过给点云的每个点 p ( i ) p^{(i)} p(i)分配pseudo ground truth标签 h p g t ( i ) h^{(i)}_{pgt} hpgt(i)来增强数据:

在这里插入图片描述

总损失:

在这里插入图片描述

3.2 抓取方向预测

用了Contact GraspNet来预测的。没有做创新。

4. 总结

感觉通篇看下来,前面看起来很精彩的样子,但是关于摘取方向的预测好像有点点子烂尾,因为没什么很大的技术创新。。。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/490134.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【MySQL】聊聊自增id用完怎么办?

在实际的开发中,一般都会将数据存储到数据库中,在设计表的时候,其实id如果达到最大值的话,会出现什么问题。其实主要分两种情况,一种是设置了主键id,另一种没有设置主键id。 表定义自增值id create table…

如何利用FLUENT计算流体力学方法解决大气与环境领域流动问题

ANSYS FLUENT是目前全球领先的商用CFD 软件,市场占有率达70%左右,是工程师和研究者不可多得的有力工具。由于采用了多种求解方法和多重网格加速收敛技术,因而FLUENT能达到最佳的收敛速度和求解精度。灵活的非结构化网格和基于解的自适应网格技…

SOC子模块---RTC and watchdog

RTC RTC大致执行过程: 对SOC 中的锁相环或者外部晶振的时钟进行计数;产生时,分,秒的中断;送给中断控制器;中断控制器进行优先权选择后送给cpu;Cpu执行中断服务程序;在中断服务程序…

OpenGL学习笔记【4】——创建窗口,给窗口添加渲染颜色

一、前三章节的前情回顾 章节一:上下文(Context) OpenGL学习笔记【1】——简介-CSDN博客 章节一讲述了OpenGL在渲染的时候需要一个Context来记录了OpenGL渲染需要的所有信息和状态,可以把上下文理解成一个大的结构体,它里面记录了当前绘制使…

JavaSE系统性总结全集(精华版)

目录 1. 面向对象(封装,继承,多态)详解 1.1 面向过程和面向对象的区别 1.2面向对象的三大特性 1.2.1 封装 1.2.2 继承 1.2.3 多态 1.2.4 方法重写和方法重载的区别(面试题) 1.2.5 访问权限修饰符分…

动听的洗牌游戏(Java篇ArrayList实操)

本篇会加入个人的所谓‘鱼式疯言’ ❤️❤️❤️鱼式疯言:❤️❤️❤️此疯言非彼疯言 而是理解过并总结出来通俗易懂的大白话, 小编会尽可能的在每个概念后插入鱼式疯言,帮助大家理解的. 🤭🤭🤭可能说的不是那么严谨.但小编初心是能让更多人…

【数仓】DataX软件安装及配置,从mysql同步到hdfs

相关文章 【数仓】基本概念、知识普及、核心技术【数仓】数据分层概念以及相关逻辑【数仓】Hadoop软件安装及使用(集群配置)【数仓】Hadoop集群配置常用参数说明【数仓】zookeeper软件安装及集群配置【数仓】kafka软件安装及集群配置【数仓】flume软件安…

PyTorch----torch.nn.Linear()函数

torch.nn.Linear是PyTorch中的一个模块,用于在神经网络中实现完全连接层。它表示输入张量的一个线性变换通过将它与一个权矩阵相乘并加上一个偏置项。 下面是torch.nn.Linear的语法: torch.nn.Linear(in_features, out_features, biasTrue)参数: in_f…

干货分享之反射笔记

入门级笔记-反射 一、利用反射破泛型集合二、Student类三、获取构造器的演示和使用1.getConstructors只能获取当前运行时类的被public修饰的构造器2.getDeclaredConstructors:获取运行时类的全部修饰符的构造器3.获取指定的构造器3.1得到空构造器3.2得到两个参数的有参构造器&a…

【项目技术介绍篇】如何从码云gitee下载项目代码

作者介绍:本人笔名姑苏老陈,从事JAVA开发工作十多年了,带过大学刚毕业的实习生,也带过技术团队。最近有个朋友的表弟,马上要大学毕业了,想从事JAVA开发工作,但不知道从何处入手。于是&#xff0…

用 C++ 编码架构图的最佳用例

统一建模语言(UML),作为一种实际应用的语言标准,借助一系列架构图呈现建模软件系统。UML 的出现鼓励了自动化软件工具的开发,有助于自动代码生成。UML 图面向对象系统和软件工具,将静态结构和动态行为以可视…

python---协程与任务详解

文章目录 前言一. 基本概念了解与学习1.1 阻塞1.2 非阻塞1.3 同步1.4 异步1.5 多进程1.6 协程 二. 示例操作对比2.1 同步调用2.2 多进程2.3 异步IO 三. 异步协程3.1 定义协程3.2 多任务协程3.3 协程实现3.4 使用 aiohttp3.5 与多进程结合 总结 前言 之前爬虫使用的是requests多…

Docker 【安装MongoDB】

文章目录 前言一、安装二、使用1. 通过权限认证的方式登入2. 基础操作 前言 MongoDB是一个非关系型数据库,它主要的应用场景有这些 相比mysql,MongoDB没有事务,索引之类的东西。最小单位是文档。 可能有人说,为什么这个场景我要…

latex在写算法`\For` 和 `\EndFor` 以及 `FOR` 和 `\ENDFOR` ,报错Undefined control sequence.

这里写目录标题 1. 错误原因2. 进行改正3. 爱思唯尔期刊与施普林格期刊对于算法的格式不太一样,不能直接套用总结 1. 错误原因 我在算法中使用\For,\EndFor 2. 进行改正 换成FOR,\ENDFOR 3. 爱思唯尔期刊与施普林格期刊对于算法的格式不太…

CopyOnWriteArrayList原理

CopyOnWriteArrayList原理 1. 简介 在 ArrayList 的类注释上,JDK 就提醒了我们,如果要把 ArrayList 作为共享变量的话,是线程不安全的,推荐我们自己加锁或者使用 Collections.synchronizedList 方法,其实 JDK 还提供…

【解决】E: 无法获取 dpkg 前端锁 (/var/lib/dpkg/lock-frontend)

常用两个方法 1 杀死之前的相关进程 在提示信息里面有进程号 $ sudo kill 2158 2 强制解锁 sudo rm /var/cache/apt/archives/lock sudo rm /var/lib/dpkg/lock 以上不行时候,更新软件库 sudo apt-get update

锁车锁电曝视频+画像车主:车企的「科技与狠活」

作者 | 辰纹 来源 | 洞见新研社 近日,不少车企远程锁车锁电再度引热议。但车企的“科技狠活”没有最狠只有更狠,仅去年就发生数宗车企泄露车主视频等隐私数据的案例,不仅令当事车主“社死”,甚至成千上万网友发问“自己的车&…

2024中国闪存市场观察:AI助推闪存全面起势?

过去两年,闪存市场一直处于低迷状态,但去年第四季度闪存颗粒资源的上涨,导致闪存产品价格一路上扬,市场遂发生反转。 2024年,中国闪存市场会彻底走向复苏,还是急转直下?中国AI热潮,…

如何撰写高质量渗透测试报告

渗透测试作为信息安全领域的重要环节,其成果的体现形式往往凝聚在最终的渗透测试报告之中。一份优秀的渗透测试报告不仅记录了测试过程的每一个细节,更是指导客户改进安全状况、防范潜在风险的重要依据。下面,我们将深入探讨如何撰写一份详尽…

【最新!红外小目标检测算法HCFNet】

文章目录 摘要1 引言2 相关工作2.1 传统方法2.2 深度学习方法 3 方法3.1 PPA3.2 维度感知选择性整合模块3.3 多稀释通道细化器模块3.4 损失函数设计 4 实验4.1 数据集与评估指标4.2 实现细节4.3 消融和对比 5 结论 论文:HCF-Net: Hierarchical Context Fusion Netwo…