CoRL 2023 获奖论文公布,manipulation、强化学习等主题成热门

今年大模型及具身智能领域有了非常多的突破性进展,作为机器人学与机器学习交叉领域的全球顶级学术会议之一,CoRL也得到了更多的关注。

CoRL 是面向机器人学习的顶会,涵盖机器人学、机器学习和控制等多个主题,包括理论与应用。今年的CoRL 2023共有199 篇论文入选,热门主题包括控制、强化学习等。大会已经于上周11 月 6 日- 9 日在美国亚特兰大举行,在本次大会上,公布了最佳论文奖、最佳学生论文奖、最佳系统论文奖等奖项。

下面我们一起起来看看CoRL 2023的获奖论文详情:

PS:除了今年的获奖论文,我也整理了去年CoRL 2022的获奖论文,有想法发顶会的同学建议都看看哦。

需要的全部论文及源码同学看文末

CoRL 2023

最佳论文奖

Distilled Feature Fields Enable Few-Shot Language-Guided Manipulation

标题:蒸馏特征场实现少样本语言引导操作

作者:William Shen, Ge Yang, Alan Yu, Jensen Wong, Leslie Pack Kaelbling, Phillip Isola

内容:本研究通过利用蒸馏特征场,将准确的3D几何与2D基础模型中的丰富语义相结合,填补了机器人操作中2D到3D的空白。作者提出了一种用于6自由度抓取和放置的少样本学习方法,利用这些强大的空间和语义先验知识实现对未见过物体的野外泛化。通过从视觉语言模型CLIP中提取的特征,作者展示了一种通过自由文本自然语言指定新对象进行操作的方法,并证明了其能够泛化到未见过的表达和新类别的物体上。

最佳学生论文奖

Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners

标题:大型语言模型规划器的不确定性对齐

作者:Allen Z. Ren, Anushri Dixit, Alexandra Bodrova, Sumeet Singh, Stephen Tu, Noah Brown, Peng Xu, Leila Takayama, Fei Xia, Jake Varley, Zhenjia Xu, Dorsa Sadigh, Andy Zeng, Anirudha Majumdar

内容:本研究提出了一种名为KNOWNO的框架,用于测量和对齐基于大型语言模型(LLM)的规划器的不确定性。该框架可以帮助规划器在不知道时知道并请求帮助。KNOWNO建立在共形预测理论的基础上,提供任务完成的统计保证,同时最小化复杂多步规划设置中需要人类帮助的情况。实验结果表明,在涉及不同模态的模糊性的任务中,KNOWNO在提高效率和自主性方面优于现代基线方法(可能涉及集成或广泛的提示调整),并提供正式保证。

Predicting Object Interactions with Behavior Primitives: An Application in Stowing Tasks

标题:使用行为原语预测物体交互

作者:Haonan Chen, Yilong Niu, Kaiwen Hong, Shuijing Liu, Yixuan Wang, Yunzhu Li, Katherine Rose Driggs-Campbell

内容:本研究提出了一种使用行为原语从预测物体交互的预测模型和单个演示中学习泛化机器人装载策略的方法。作者提出了一种新的框架,利用图神经网络在行为原语参数空间内预测物体交互。进一步地,作者使用增强的原语轨迹优化来搜索预定义的异构行为原语库的参数以实例化控制动作。该框架使机器人能够通过几个关键帧(3-4)从单个演示中熟练地执行长期装载任务。

Language Embedded Radiance Fields for Zero-Shot Task-Oriented Grasping

标题:用于零样本面向任务抓取的语言嵌入辐射场

作者:Satvik Sharma, Adam Rashid, Chung Min Kim, Justin Kerr, Lawrence Yunliang Chen, Angjoo Kanazawa, Ken Goldberg

内容:本研究提出了一种新的语言嵌入辐射场用于面向任务的物体抓取的方法LERF-TOGO。该方法使用视觉语言模型,在给定自然语言查询的情况下,零样本输出一个物体的抓取分布。为了实现这一点,作者首先构建了一个场景的LERF,将CLIP嵌入到多尺度3D语言字段中,可使用文本进行查询。然而,LERF没有物体边界的感觉,因此其相关性输出通常返回对象上的不完整激活,这对于抓取是不够的。LERF-TOGO通过提取DINO特征的3D物体掩码来弥补这种缺乏空间分组的问题,然后在此掩码上条件性地查询LERF以获得物体上的一个语义分布,从而从现成的抓取规划器中对抓取进行排序。

最佳系统论文奖

RoboCook: Long-Horizon Elasto-Plastic Object Manipulation with Diverse Tools

标题:使用多种工具进行长期弹性-塑性物体操纵

作者:Haochen Shi, Huazhe Xu, Samuel Clarke, Yunzhu Li, Jiajun Wu

内容:本研究开发了一种名为RoboCook的智能机器人系统,能够感知、建模和操纵各种工具的弹塑性物体。RoboCook使用点云场景表示法,利用图神经网络(GNN)对工具-物体交互进行建模,并将工具分类与自监督策略学习相结合,制定操纵计划。作者展示了一个通用的机器人手臂可以从每个工具仅需20分钟的实际交互数据中学习复杂的长期软体物体操纵任务,如制作饺子和字母饼干。

MimicPlay: Long-Horizon Imitation Learning by Watching Human Play

标题:通过观察人类玩耍进行长期模仿学习

作者:Chen Wang, Linxi Fan, Jiankai Sun, Ruohan Zhang, Li Fei-Fei, Danfei Xu, Yuke Zhu, Anima Anandkumar

内容:本研究提出了一种分层学习框架MimicPlay,通过观察人类玩耍的视频序列来学习机器人的长期模仿技能。作者认为,即使形态不同,人类玩耍数据仍然包含丰富的物理交互信息,可以促进机器人策略学习。受此启发,MimicPlay从人类玩耍数据中学习潜在计划,以指导在少量远程操作演示上训练的低层次视觉运动控制。通过对14个现实世界中的长期操纵任务进行系统评估,作者发现MimicPlay在任务成功率、泛化能力和对干扰的鲁棒性方面优于最先进的模仿学习方法。

Robot Parkour Learning

标题:机器人跑酷学习

作者:Ziwen Zhuang, Zipeng Fu, Jianren Wang, Christopher G Atkeson, Sören Schwertfeger, Chelsea Finn, Hang Zhao

内容:本研究提出了一种用于学习多样化跑酷技能的端到端视觉跑酷策略的系统,该系统使用简单的奖励,而无需任何参考运动数据。作者开发了一种受直接定位启发的强化学习方法来生成跑酷技能,包括攀爬高障碍物、跃过大间隙、爬行低障碍物、挤过窄缝和奔跑等。作者将这些技能提炼为单一的视觉跑酷策略,并使用其自我中心的深度相机将其转移到四足机器人上。

CoRL 2022

最佳论文奖

Training Robots to Evaluate Robots: Example-Based Interactive Reward Functions for Policy Learning

用于策略学习的基于示例的交互式奖励函数

简述:本研究提出了一种名为“交互式奖励函数”(IRFs)的方法,用于训练机器人自动获取物理互动行为,以评估尝试执行的机器人技能的结果,从而提高任务执行的性能。

最佳论文入围名单

Learning Agile Skills via Adversarial Imitation of Rough Partial Demonstrations

通过对手的粗略部分演示进行对抗性模仿来学习敏捷技能

简述:本研究提出了一种生成对抗网络方法,用于从部分和可能物理不兼容的演示中推断奖励函数,以成功获取技能。

Supercharging Imitation with Regularized Optimal Transport

用正则化最优传输加强模仿

简述:本研究提出了一种新的模仿学习算法——正则化最优传输(ROT),该算法结合了轨迹匹配奖励和行为克隆,可以显著加速模仿学习,并在多个视觉控制任务上表现出色。

最佳系统论文奖

Legged Locomotion in Challenging Terrains using Egocentric Vision

基于自我中心视觉的挑战性地形中的腿部运动

简述:本研究提出了一种全新的端到端移动系统,能够跨越多种地形,并在小型四足机器人上实现实时运行。该系统使用单个前置深度相机进行自我中心视觉,并通过强化学习和有监督学习训练了策略。

特别创新奖

Do As I Can, Not As I Say: Grounding Language in Robotic Affordances

基于机器人可供性的语言

简述:本研究提出了一种通过预训练技能提供真实世界基础的方法,以约束语言模型提出既可行又适合上下文的自然语言行动。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“CoRL”领取获奖论文+代码合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/139042.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

小米路由器4A千兆版刷入OpenWRT并远程访问

小米路由器4A千兆版刷入OpenWRT并远程访问 文章目录 小米路由器4A千兆版刷入OpenWRT并远程访问前言1. 安装Python和需要的库2. 使用 OpenWRTInvasion 破解路由器3. 备份当前分区并刷入新的Breed4. 安装cpolar内网穿透4.1 注册账号4.2 下载cpolar客户端4.3 登录cpolar web ui管理…

2012年7月11日 Go生态洞察:Gccgo在GCC 4.7.1中的集成

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

设计模式之解释器模式

阅读建议 嗨,伙计!刷到这篇文章咱们就是有缘人,在阅读这篇文章前我有一些建议: 本篇文章大概5000多字,预计阅读时间长需要5分钟。本篇文章的实战性、理论性较强,是一篇质量分数较高的技术干货文章&#x…

GEE20:获取地面站点的遥感图层的采样值

获取采样点值 1. 介绍2. GEE实现2.1 数据介绍2.2 GEE code 3.参考 1. 介绍 去年由于实验需要,想通过GEE获取遥感图层的采样值,但是多次尝试后任无法实现。最近通过查询,终于找到的获取采样点的方法,现在将其记录在此,并…

《视觉SLAM十四讲》-- 视觉里程计2

文章目录 07 视觉里程计 27.1 直接法的引出7.2 2D 光流7.2.1 Lucas-Kanade 光流7.2.1 实践:LK 光流 7.3 直接法7.3.1 推导过程7.3.2 直接法的优缺点 07 视觉里程计 2 7.1 直接法的引出 特征点的缺点: 关键点的提取与描述子的计算非常耗时,实…

辐射骚扰整改思路及方法:对差模电流的影响?|深圳比创达电子EMC

同样的分析可以应用在差模电流的情况,唯一不同的是,两根导线的磁场分布是相反的,磁场互相抵消,由于导线中的电流大小相等,产生的磁场H大小相同,在互相靠近的情况下,在磁环内的两个感应磁场大小相…

C盘可以格式化吗?正确答案在这里!

“我一直有个比较好奇的问题,我的电脑中病毒了,我想将c盘进行格式化操作,但是c盘中是有比较多重要文件的,在这种情况下,c盘可以格式化吗?怎么格式化c盘呢?” 面对各种电脑情况,可能不…

Python实现cpu密集型多线程

问题: 想通过以下代码实现多线程 class ThreadTest(threading.Thread):def __init__(self, num, *args, **kwargs):super(ThreadTest, self).__init__(*args, **kwargs)self.num numprint(num)def run(self):print(self.num)print(time.time())if __name__ &quo…

postman连接数据库

参考:https://blog.csdn.net/qq_45572452/article/details/126620210 1、安装node.js 2、配置环境变量 3、安装xmysql连接数据库cmd窗口输入"npm install -g xmysql"后回车cmd窗口输入"xmysql"后回车,验证xmysql是否安装成功(下图代表安装成功)…

编程最佳外挂:批量数据分析与可视化,CodeGeeX工具箱一键完成

ChatGLM3代模型的Code Interpreter能力,本周已经在VSCode里的CodeGeeX插件产品中,以开发者工具箱的产品形态上线。 下图以VSCode插件为例:在CodeGeeX的侧边栏,和智能问答AskCodeGeeX并列出现的工具箱标签,用户登录后就…

区块链拆分

随着区块链技术的发展和普及,去中心化钱包逐渐成为数字货币领域的重要工具。去中心化钱包不仅具有高度安全性和隐私保护能力,还可以通过智能合约和开源技术实现定制化功能。本文将探讨去中心化钱包定制开发的基本概念、优势、流程和前景。 一、去中心化钱…

YOLOv8 营业执照提取 统一社会信用代码、企业名称

目录 背景 尝试一:整图OCR识别,然后正则匹配 尝试二:利用显著特征,直接传统方法定位,切出来识别 尝试三:yolov8训练一个统一社会信用代码、企业名称位置检测 ​编辑 效果 模型信息 项目 ​编辑 代…

(六)Spring源码解析:Spring AOP源码解析

一、AOP概念 Aspect:切面 给业务方法增加到功能,切面泛指交叉业务逻辑。上例中的事务处理、日志处理就可以理解为切面。常用的切面是通知(Advice)。实际就是对主业务逻辑的一种增强。 Pointcut:切入点 切入点指声明的…

springcloudalibaba入门详细使用教程

目录标题 一、简介二、SpringCloud Alibaba核心组件2-1、Nacos (配置中心与服务注册与发现)2-2、Sentinel (分布式流控)2-3、RocketMQ (消息队列)/RabbitMq/kafka2-4、Seata (分布式事务)2-5、Dubbo (RPC) 三、为什么大家看好 Spring Cloud Alibaba3-1、阿里巴巴强大的技术输出…

【每日一题】307. 区域和检索 - 数组可修改-2023.11.13

题目: 307. 区域和检索 - 数组可修改 给你一个数组 nums ,请你完成两类查询。 其中一类查询要求 更新 数组 nums 下标对应的值另一类查询要求返回数组 nums 中索引 left 和索引 right 之间( 包含 )的nums元素的 和 &#xff0c…

智能井盖传感器具有什么效果?

智能井盖传感器与智慧城市之间有着密切的关联,两者之间属于相辅相成的状态,对于城市的现代化和城市生命线建设有助力作用。智能井盖传感器是其中一个重要的组成环节,它们帮助城市改变原有的生活和生态环境,为政府部门完善城市基础…

【机器学习】 朴素贝叶斯算法:原理、实例应用(文档分类预测)

1. 算法原理 1.1 朴素贝叶斯方法 朴素贝叶斯方法涉及一些概率论知识,我们先来复习一下。 联合概率:包含多个条件,并且所有的条件同时成立的概率,公式为: 条件概率:事件A在另一个事件B已经发生的前提下发…

工作十年+的测试应该具备什么能力?

大概是2014年的时候,我开始接触面试工作,就是从应聘者转为面试官,记得印象深刻的是面试了一位做了8年的测试。对方气场很足,嗯,毕竟那时的我还只是一个3、4年经验的小测试,相反,印象深刻的并不是…

Mysql基本知识

1.SQL分类 DDL【data definition language】 数据定义语言,用来维护存储数据的结构 代表指令: create, drop, alter DML【data manipulation language】 数据操纵语言,用来对数据进行操作 代表指令: insert,delete,up…

十四、W5100S/W5500+RP2040树莓派Pico<NetBIOS>

文章目录 1 前言2 简介2 .1 什么是NetBIOS?2.2 NetBIOS的优点2.3 NetBIOS工作原理2.4 NetBIOS应用场景 3 WIZnet以太网芯片4 NetBIOS网络设置示例概述以及使用4.1 流程图4.2 准备工作核心4.3 连接方式4.4 主要代码概述4.5 结果演示 5 注意事项6 相关链接 1 前言 随着…