GPD<论文精简版>

问题陈述

给定点云数据、机械手的几何参数,抓取位姿检测问题( grasp pose detection problem)表示为,在抓手闭合情况下,识别抓手的配置的问题。

:机器人工作空间

:三维点云中的一组点,由一个或多个传感器感知的

我们假设云中每个点都与该点的一个视点配对,由,其中代表一组视点

我们将作为视点点云(ps.拥有某个视点观察角度的点云)

定义1

1、二指手:双指手可以由两个接触面来模拟,这两个接触面沿着一维流形相互靠近和远离。

因为只允许二指手,由于我们只允许使用两只手指的手,因此手相对于物体的 6-DOF 姿势足以计算出手指接触的位置,而手指接触的位置则是手相对于物体以给定姿势闭合时的位置。因此,只需给出 6-DOF 手部姿态,就能评估是否存在抓握动作。

问题陈述

输入视点云、ROI、二指抓手。目的是找到一组或更多6自由度抓手,其中抓手在闭合时满足力闭合。

任何减少点云噪声和错误的操作都是step1中进行。

Step2找到ROI,不用把物体从背景中分割出来,ROI应该包括一组或更多物体

Sampling

Step3.找到满足一定数量的六自由度候选抓取。这一步我们希望抓手尽可能均匀分布在物体表面的可抓取部分。

我们将表示为一个抓手,表示手完全张开始占用的体积。

定义为闭合区域,即手闭合时扫过的体积

根据上面定义,我们对抓取候选进行一定限制:

采样过程为:

首先,从中机采样N个点,即抓手与ROI区域相交的那部分点云(就是夹爪内部点云)

然后,对于每个采样的点云。我们计算p出局部参考框架的矩阵的特征向量(we calculate a local reference frame at p by evaluating the Eigenvectors of the matrix),即。其中表示 p 处向外指向的单位表面法线,表示关于点p的r-ball(step4)。

表示 p 处的正交参考框架(称为达尔布框架),其中 v1(p)对应于 M(p)的最大特征值,v3(p)对应于最小特征值。向量 v3(p) 是 p 处表面法线的平滑估计值,v1(p) 是小主曲率轴的平滑估计值,v2(p) 是大主曲率轴的平滑估计值。F(p)根据需要旋转 180 度,使 v3(p) 指向物体表面的外侧。图 2 显示了这一坐标系,并在原点叠加了抓手。

下一步。对于每个采样的参考框架p ∈C ∩ R, 我们对满足条件 1 和 2 的手进行局部网格搜索(step5-10)。我们搜索一个二维网格,其中e Y and Φ表示是 F(p)参照系中沿 Y 轴和围绕 Z 轴的离散值集(在我们的实验中,|Y| = 10,|Φ| = 8)。对于每个,我们应用相对于 F(p)坐标系的相应平移和旋转。

然后,然后,我们将手沿负 x 轴向前 "推",直到其中一个手指或手掌接触到点云。

R4×4表示表示同质变换(Homogeneous transform),它描述了 x、y 平面上 x、y 的平移和 φ 绕 z 轴的旋转。相对于 F(p),手在 x、y、φ 偏移处的参照系为

对于每个 (y,φ)∈G,让 F(hy,φ) 表示在网格单元 y, φ 处被向前推直到与云接触的手: F(hy,φ)=F(p)Tx∗,y,φ,其中 x∗ = minx∈R,使得 B(hx,y,φ(p))∩C=∅(步骤 6)。

如果闭合区域 C(hy,φ) 至少包含云中的一个点,则将一只手 hy,φ 添加到候选抓握集合 H 中(步骤 7-9)。

图三展示 点云被部分遮挡情况下的候选抓取

抓取方法比较(上一节Ours和其他人的方法)

大多数使用滑动窗口生成抓取建议:(Saxena et al. 2008; Jiang et al. 2011; Fischinger and Vincze 2012; Fischinger et al. 2013). Pinto and Gupta (2015) cluster foreground pixels using background subtraction on the RGBD image。

和我们最像的:Herzog et al. (2012) (later adopted by Kappler et al. (2015)). That method works by segmenting the object to be grasped from the rest of the point cloud and calculating the convex hull. For each face in the convex hull, a coordinate frame is created at the center of each face and oriented such that the x axis points outward (similar to F(p) in our method as shown in Figure 2). A one-dimensional grid search is performed over a set of angular displacements about the x axis and the hand is “pushed” toward the object (similar to what we do in Step 6 of Algorithm 2)

然而我们的又有不同之处:First, whereas Herzog et al. (2012) segment the object, cast a convex hull around it, and only sample grasps at the center of each face in the hull, we sample grasps on all visible surfaces. This makes our sampling method more practical in cluttered scenarios where object segmentation can be challenging.(大概意思是Herzog对物体进行了分割,在物体表面生成凸壳,对凸壳的中心进行抓取采样。但是我们对所有可见的表面都进行了抓取采样,我们的方法有利于杂乱场景)

Second, whereas Herzog et al. (2012) and Kappler et al. (2015) perform a one-dimensional grid search over hand orientations about the x axis in the F(p) coordinate frame, we perform a twodimensional grid search over positions along the y axis and orientations about the z axis in F(p).(大概意思是Herzog和Kappler在F(p)坐标系的x轴上进行一维网格搜索,但是我们对 F(p)中沿 Y 轴的位置和 Z 轴的方向进行二维网格搜索)

【又讨论了,研究z轴方向找好还是x轴方向找好,又做了比较。比较证明我们的方法候选抓取更多,效果更好。图四展示效果】

候选抓取分类

CNN输入的是深度传感器观察到的物体表面,输出的是抓取预测

候选抓取表示

使用多视图作为分类器的输入。

为训练CNN使用的抓取数据集

上面的方法证明了,抓取表示与抓取表面的几何形状还有角度有关,因此数据集应该跨越这两个变量。因此采用BigBird数据集。

While we use BigBird in this paper, any object dataset that pairs RGBD images with mesh models of the object geometry will work.

Labeling候选抓取

我们把抓手限制在定义1的描述中,因此,评估6自由度手部姿势是否闭合是否形成力闭合,就可以将抓取分为好的和不好的。但是有人(Roa and Suarez 2015; Kappler ´ et al. 2015)指出,力闭合不一定能很好的预测一个给定抓取在现实操作中是否会成功。

因为我们用二指夹爪,因此我们选择特殊的力闭合,称为无摩擦antipodal grasp。

当施加的无摩擦接触扳手在各自施加单位力的情况下相互平衡时,一组接触就是无摩擦反向抓取(Platt 等人,2010 年;Murray 等人,1994 年)。这是一个比力闭合更保守的条件,因为对于任何非零库仑摩擦系数(假设为软接触)而言,任何无摩擦反脚抓取也是力闭合抓取。此外,它对微小的接触扰动具有鲁棒性。对于任何正摩擦系数和任何具有 Lipschitz 连续表面的物体,都存在一个围绕无摩擦反向抓取的接触配置邻域,该邻域也是力闭合的(大概意思是,无摩擦antipodal grasp是力闭合抓取的一种,但是这个条件更能成功抓取)

Improving Classification Accuracy

.。。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/462377.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

宠物疾病 与 光线疗法

人类与动物以及大自然是相辅相成的。人离开动物将无法生存,对于动物我们尽力去保护,与大自然和谐稳定生存发展。 生息在地球上的所有动物、在自然太阳光奇妙的作用下、生长发育。太阳光的能量使它们不断进化、繁衍种族。现在、生物能够生存、全仰仗于太…

windbg调试协议wireshark抓包解析插件

把目录下文件复制到如下位置,Wireshark支持版本4.0以上 C:\Program Files\Wireshark\plugins\4.0\kdnet.lua C:\Program Files\Wireshark\gcrypt.dll C:\Program Files\Wireshark\luagcrypt.dll 启动 “C:\Program Files (x86)\Windows Kits\10\Debuggers\x64\windbg.exe” -k …

如何检测无源晶振过驱?晶振过驱怎么办?

无源晶振(Passive Crystal Oscillator)是一种使用晶体元件来生成稳定频率的振荡器,它不像有源振荡器(如时钟芯片)那样需要外部电源。检测无源晶振是否过驱通常需要通过测量其输出波形和频率,与期望的规格进行比较。 如何检测无源晶振过驱: …

Java高级互联网架构师之路:排查当前JVM错误的步骤

程序 这个程序是有问题的,我们通过一些命令来分析这个程序究竟是哪里出了问题。首先把当前的程序通过SSH工具传输到centos系统中,之后我们就可以在linux环境下编译和执行。 注意一点:上面类的名字是Z,但是在linux环境下,我们将其改为了AA,并且文件名改为了AA,所以文章下…

5 分钟小工具:使用 dive 分析 docker 镜像

需求 拿到一个镜像之后,我想知道: 分层查看镜像里都有哪些文件各层使用了什么命令构建的这个镜像镜像里比较大的文件有哪些(可能需要优化) dive 工具介绍 dive 工具可以做这些分析。dive 的 github 地址是 wagoodman/dive&…

2024年【电工(初级)】考试资料及电工(初级)实操考试视频

题库来源:安全生产模拟考试一点通公众号小程序 电工(初级)考试资料根据新电工(初级)考试大纲要求,安全生产模拟考试一点通将电工(初级)模拟考试试题进行汇编,组成一套电…

HarmonyOS NEXT应用开发—自定义视图实现Tab效果

介绍 本示例介绍使用Text、List等组件,添加点击事件onclick,动画,animationTo实现自定义Tab效果。 效果预览图 使用说明 点击页签进行切换,选中态页签字体放大加粗,颜色由灰变黑,起到强调作用,同时&…

7. 字符串和集合(重点)

常见API API (全称 Application Programming Interface:应用程序编程接口)就是别人写好的一些程序,给咱们程序员直接拿去调用即可解决问题的。 1 包 1.1 什么是包? 包是用来分门别类的管理各种不同程序的&#xff…

通用大模型研究重点之三:Model APPs

Embedding背景 Embedding 起源于 Word Embedding,经过多年的发展,已取得长足进步。从横向发展来看,由原来单纯的 Word Embedding,发展成现在的Item Embedding、Entity Embedding、Graph Embedding、Position Embedding、Segment …

业务服务:任务调度中心

文章目录 前言一、Scheduled的使用1. 快速使用2. 参数分析 二、xxl-job的使用1. 创建数据库2. 搭建任务调度应用3. 服务注册到xxl-job4. 快速入门5. 任务参数6. 命令行任务7. 跨平台远程调用8. 初始化与销毁9. 邮件报警 前言 任务调度中心,常被用于发送任务&#x…

StarRocks面试题及答案整理,最新面试题

StarRocks 的 MV(物化视图)机制是如何工作的? StarRocks 的物化视图(MV)机制通过预先计算和存储数据的聚合结果或者转换结果来提高查询性能。其工作原理如下: 1、数据预处理: 在创建物化视图时…

微信小程序调试、断点调试

1、wxml 查看对应的页面组件 2、console面板可以用来打印信息 3、sources 用来断点调试 4、network面板用来调试接口 5、storage面板 可以查看每个key对应的value内容,这些数据在用户使用小程序时被持久化保存在本地。

【AIGC】重磅消息,GPT-4.5 Turbo将在6月发布?

2024 年 AI 辅助研发趋势 文章目录 强烈推荐GPT-4.5 Turbo竞争对手Anthropic的Claude 3谷歌的Gemini 1.5 Pro 总结强烈推荐专栏集锦写在最后 强烈推荐 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击…

仿牛客项目Day8:社区核心功能2

显示评论 数据库 entity_type代表评论的目标类型,评论帖子和评论评论 entity_id代表评论的目标id,具体是哪个帖子/评论 targer_id代表评论指向哪个人 entity public class Comment {private int id;private int userId;private int entityType;priv…

Linux 进程控制进程终止

目录 一、fork函数 1、概念 2、父子进程的共享 3、 为什么父子进程会从fork()调用之后的位置继续执行代码 4、写时拷贝 5、为什么需要写时拷贝 6、写时拷贝的好处 7、fork常规用法 8、fork调用失败的原因 9、查看系统最大进程数 二、进程终止 1、进程退出场景 2、…

鲸鱼优化算法双馈风电机组一次调频三机九节点虚拟惯量下垂控制DFIG matlab/simulink

以频率偏差变化最小为优化目标,采用鲸鱼算法优化风电机组一次调频控制系数。 采用matlab.m文件与simulink.slx文件联合。 系统频率优化结果 鲸鱼算法 时域模型

Learn OpenGL 14 混合

混合 OpenGL中,混合(Blending)通常是实现物体透明度(Transparency)的一种技术。透明就是说一个物体(或者其中的一部分)不是纯色(Solid Color)的,它的颜色是物体本身的颜色和它背后其它物体的颜色的不同强度结合。一个有色玻璃窗是…

SwiftUI的毛玻璃效果

SwiftUI的毛玻璃效果 记录一下 SwiftUI的毛玻璃效果 import SwiftUI /*extension ShapeStyle where Self Material {/// A material thats somewhat translucent.public static var regularMaterial: Material { get }/// A material thats more opaque than translucent.pub…

生命周期、wxs

1. 什么是生命周期 生命周期( Life Cycle )是指一个对象从创建 -> 运行 -> 销毁的整个阶段,强调的是一个时间段。例如:  张三出生,表示这个人生命周期的开始  张三离世,表示这个人生命周期的结束…

接口测试之文件下载

在工作中对于下载接口,经常会有这样的疑问:这类接口一般功能比较稳定,但是又比较重要,需要占用回归测试时间,有没有可替代的方式? 答案肯定是有的,可以从接口测试/UI自动化测试介入&#xff0c…