【具身智能评估1】具身视觉语言规划(EVLP)仿真环境汇总

参考论文:Core Challenges in Embodied Vision-Language Planning
论文作者:Jonathan Francis, Nariaki Kitamura, Felix Labelle, Xiaopeng Lu, Ingrid Navarro, Jean Oh
论文原文:https://arxiv.org/abs/2106.13948
论文出处:Journal of Artificial Intelligence Research 74 (2022) 459-515
论文被引:27(11/18/2023)

论文中的工作截止到2021年,在此基础上补充了近几年具身智能领域相关的仿真环境。
在这里插入图片描述

术语对齐

Embodied Vision Language Planning (EVLP):具身视觉语言规划
在这里插入图片描述

具身智能仿真环境

解决 EVLP 任务通常需要使用仿真环境和数据集。仿真平台和数据集有助于复现和评估具身智能系统。模拟器旨在复制现实世界的方方面面,并模拟能够解决复杂任务的智能体(agent),同时抽象出设计和监督现实世界智能体的所面临的挑战。相比之下,数据集在阐明每项任务的框架方面起着至关重要的作用。数据集提供了智能体在应对特定多模态刺激时的行为示例。

早期的具身研究模拟平台通常利用视频游戏环境来创建和训练神经控制器。由于简化的环境通常缺乏真实世界环境的多样性和复杂性,人类的表现很快就在其中一些平台上实现了。最近的研究通过使用逼真的照片和使用交互式情境(智能体能够修改环境中物体的状态)来解决这种缺乏真实感的问题。为此,人们也在开发从模拟到现实的迁移和评估为重点的框架,以便研究真实环境与模拟环境之间的差异。
在这里插入图片描述
在这里插入图片描述

VLN Simulators

Matterport3DSim

Matterport3D Dataset:

论文标题:Matterport3D: Learning from RGB-D Data in Indoor Environments
论文作者:Angel Chang, Angela Dai, Thomas Funkhouser, Maciej Halber, Matthias Nießner, Manolis Savva, Shuran Song, Andy Zeng, Yinda Zhang
论文原文:https://arxiv.org/abs/1709.06158
论文出处:3DV 2017
论文被引:1449(11/18/2023)
论文代码:https://github.com/niessner/Matterport,834 star
项目主页:https://niessner.github.io/Matterport/

Matterport3D Simulator:

论文标题:Vision-and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments
论文作者:Peter Anderson, Qi Wu, Damien Teney, Jake Bruce, Mark Johnson, Niko Sünderhauf, Ian Reid, Stephen Gould, Anton van den Hengel
论文原文:https://arxiv.org/abs/1711.07280
论文出处:CVPR 2018
论文被引:1089(11/18/2023)
论文代码:https://github.com/peteanderson80/Matterport3DSimulator
项目主页:–

Habitat

Habitat 1.0

论文标题:Habitat: A Platform for Embodied AI Research
论文作者:Manolis Savva, Abhishek Kadian, Oleksandr Maksymets, Yili Zhao, Erik Wijmans, Bhavana Jain, Julian Straub, Jia Liu, Vladlen Koltun, Jitendra Malik, Devi Parikh, Dhruv Batra
论文原文:https://arxiv.org/abs/1904.01201
论文出处:ICCV 2019
论文被引:1043(11/18/2023)
论文代码:https://github.com/facebookresearch/habitat-sim,2k star
项目主页:https://aihabitat.org/

Habitat 2.0

论文标题:Habitat 2.0: Training Home Assistants to Rearrange their Habitat
论文作者:Andrew Szot, Alex Clegg, Eric Undersander, Erik Wijmans, Yili Zhao, John Turner, Noah Maestre, Mustafa Mukadam, Devendra Chaplot, Oleksandr Maksymets, Aaron Gokaslan, Vladimir Vondrus, Sameer Dharur, Franziska Meier, Wojciech Galuba, Angel Chang, Zsolt Kira, Vladlen Koltun, Jitendra Malik, Manolis Savva, Dhruv Batra
论文原文:https://arxiv.org/abs/2106.14405
论文出处:NeurIPS 2021 Spotlight
论文被引:279(11/18/2023)
论文代码:https://github.com/facebookresearch/habitat-lab,1.5k star
项目主页:https://aihabitat.org/

Habitat 3.0

论文标题:Habitat 3.0: A Co-Habitat for Humans, Avatars and Robots
论文作者:Xavier Puig, Eric Undersander, Andrew Szot, Mikael Dallaire Cote, Tsung-Yen Yang, Ruslan Partsey, Ruta Desai, Alexander William Clegg, Michal Hlavac, So Yeon Min, Vladimír Vondruš, Theophile Gervet, Vincent-Pierre Berges, John M. Turner, Oleksandr Maksymets, Zsolt Kira, Mrinal Kalakrishnan, Jitendra Malik, Devendra Singh Chaplot, Unnat Jain, Dhruv Batra, Akshara Rai, Roozbeh Mottaghi
论文原文:https://arxiv.org/abs/2310.13724
论文出处:arXiv
论文被引:2(11/18/2023)
论文代码:https://github.com/facebookresearch/habitat-lab/tree/v0.3.0,1.5 k
项目主页:https://aihabitat.org/habitat3/

StreetLearn

论文标题:Learning to Navigate in Cities Without a Map
论文作者:Piotr Mirowski, Matthew Koichi Grimes, Mateusz Malinowski, Karl Moritz Hermann, Keith Anderson, Denis Teplyashin, Karen Simonyan, Koray Kavukcuoglu, Andrew Zisserman, Raia Hadsell
论文原文:https://arxiv.org/abs/1804.00168
论文出处:NeurIPS 2018
论文被引:293(11/18/2023)
论文代码:https://github.com/google-deepmind/streetlearn,271 star
项目主页:https://sites.google.com/view/streetlearn/

VDN Simulator

Matterport3DSim

EQA Simulators

House3D

论文标题:Building Generalizable Agents with a Realistic and Rich 3D Environment
论文作者:Yi Wu, Yuxin Wu, Georgia Gkioxari, Yuandong Tian
论文原文:https://arxiv.org/abs/1801.02209
论文出处:ICLR 2018
论文被引:232(11/18/2023)
论文代码:https://github.com/facebookresearch/House3D
项目主页:–

AI2-THOR

论文标题:AI2-THOR: An Interactive 3D Environment for Visual AI
论文作者:Eric Kolve, Roozbeh Mottaghi, Winson Han, Eli VanderBilt, Luca Weihs, Alvaro Herrasti, Matt Deitke, Kiana Ehsani, Daniel Gordon, Yuke Zhu, Aniruddha Kembhavi, Abhinav Gupta, Ali Farhadi
论文原文:https://arxiv.org/abs/1712.05474
论文出处:arXiv 1712
论文被引:662(11/18/2023)
论文代码:https://github.com/allenai/ai2thor,914 star
项目主页:https://ai2thor.allenai.org/

MINOS

论文标题:MINOS: Multimodal Indoor Simulator for Navigation in Complex Environments
论文作者:Manolis Savva, Angel X. Chang, Alexey Dosovitskiy, Thomas Funkhouser, Vladlen Koltun
论文原文:https://arxiv.org/abs/1712.03931
论文出处:arXiv 1712
论文被引:128(11/18/2023)
论文代码:https://github.com/minosworld/minos,199 star
项目主页:https://minosworld.github.io/

EOR Simulators

REVERIE

论文标题:REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments
论文作者:Yuankai Qi, Qi Wu, Peter Anderson, Xin Wang, William Yang Wang, Chunhua Shen, Anton van den Hengel
论文原文:https://arxiv.org/abs/1904.10151
论文出处:CVPR 2020
论文被引:204(11/18/2023)
论文代码:https://github.com/YuankaiQi/REVERIE,94 star
项目主页:–

EGM Simulators

ALFRED

论文标题:ALFRED: A Benchmark for Interpreting Grounded Instructions for Everyday Tasks
论文作者:Mohit Shridhar, Jesse Thomason, Daniel Gordon, Yonatan Bisk, Winson Han, Roozbeh Mottaghi, Luke Zettlemoyer, Dieter Fox
论文原文:https://arxiv.org/abs/1912.01734
论文出处:CVPR 2020
论文被引:489(11/18/2023)
论文代码:https://github.com/askforalfred/alfred,288 star
项目主页:https://askforalfred.com/

ArraMon

论文标题:ArraMon: A Joint Navigation-Assembly Instruction Interpretation Task in Dynamic Environments
论文作者:Hyounghun Kim, Abhay Zala, Graham Burri, Hao Tan, Mohit Bansal
论文原文:https://arxiv.org/abs/2011.07660
论文出处:EMNLP Findings 2020
论文被引:13(11/18/2023)
论文代码:https://github.com/hyounghk/ArraMon,4 star
项目主页:https://arramonunc.github.io/

CerealBar

论文标题:Executing Instructions in Situated Collaborative Interactions
论文作者:Alane Suhr, Claudia Yan, Charlotte Schluger, Stanley Yu, Hadi Khader, Marwa Mouallem, Iris Zhang, Yoav Artzi
论文原文:https://arxiv.org/abs/1910.03655
论文出处:EMNLP 2019 long paper
论文被引:68(11/18/2023)
论文代码:https://github.com/lil-lab/cerealbar,26 star
项目主页:https://lil.nlp.cornell.edu/cerealbar/

Other Simulator

iGibson

论文标题:Interactive Gibson Benchmark (iGibson 0.5): A Benchmark for Interactive Navigation in Cluttered Environments
论文作者:Fei Xia, William B. Shen, Chengshu Li, Priya Kasimbeg, Micael Tchapmi, Alexander Toshev, Li Fei-Fei, Roberto Martín-Martín, Silvio Savarese
论文原文:https://arxiv.org/abs/1910.14442
论文出处:RAL 2020
论文被引:181(11/18/2023)
论文代码:https://github.com/StanfordVL/iGibson,581 star
项目主页:https://sites.google.com/view/interactivegibsonenv

iGibson 1.0

论文标题:iGibson 1.0: a Simulation Environment for Interactive Tasks in Large Realistic Scenes
论文作者:Bokui Shen, Fei Xia, Chengshu Li, Roberto Martín-Martín, Linxi Fan, Guanzhi Wang, Claudia Pérez-D’Arpino, Shyamal Buch, Sanjana Srivastava, Lyne P. Tchapmi, Micael E. Tchapmi, Kent Vainio, Josiah Wong, Li Fei-Fei, Silvio Savarese
论文原文:https://arxiv.org/abs/2012.02924
论文出处:IROS 2021
论文被引:100(11/18/2023)
论文代码:https://github.com/StanfordVL/iGibson,581 star
项目主页:https://svl.stanford.edu/igibson/

iGibson 2.0

论文标题:iGibson 2.0: Object-Centric Simulation for Robot Learning of Everyday Household Tasks
论文作者:Chengshu Li, Fei Xia, Roberto Martín-Martín, Michael Lingelbach, Sanjana Srivastava, Bokui Shen, Kent Vainio, Cem Gokmen, Gokul Dharan, Tanish Jain, Andrey Kurenkov, C. Karen Liu, Hyowon Gweon, Jiajun Wu, Li Fei-Fei, Silvio Savarese
论文原文:https://arxiv.org/abs/2108.03272
论文出处:CoRL 2021
论文被引:105(11/18/2023)
论文代码:https://github.com/StanfordVL/iGibson,581 star
项目主页:https://svl.stanford.edu/igibson/

SoundSpaces

论文标题:SoundSpaces: Audio-Visual Navigation in 3D Environments
论文作者:Changan Chen, Unnat Jain, Carl Schissler, Sebastia Vicenc Amengual Gari, Ziad Al-Halah, Vamsi Krishna Ithapu, Philip Robinson, Kristen Grauman
论文原文:https://arxiv.org/abs/1912.11474
论文出处: ECCV 2020
论文被引:203(11/18/2023)
论文代码:https://github.com/facebookresearch/sound-spaces,281 star
项目主页:https://vision.cs.utexas.edu/projects/audio_visual_navigation/

VirtualHome

论文标题:VirtualHome: Simulating Household Activities via Programs
论文作者:Xavier Puig, Kevin Ra, Marko Boben, Jiaman Li, Tingwu Wang, Sanja Fidler, Antonio Torralba
论文原文:https://arxiv.org/abs/1806.07011
论文出处:CVPR 2018 Oral
论文被引:314(11/18/2023)
论文代码:https://github.com/xavierpuigf/virtualhome,323 star
项目主页:http://virtual-home.org/

SAPIEN

论文标题:SAPIEN: A SimulAted Part-based Interactive ENvironment
论文作者:Fanbo Xiang, Yuzhe Qin, Kaichun Mo, Yikuan Xia, Hao Zhu, Fangchen Liu, Minghua Liu, Hanxiao Jiang, Yifu Yuan, He Wang, Li Yi, Angel X. Chang, Leonidas J. Guibas, Hao Su
论文原文:https://arxiv.org/abs/2003.08515
论文出处:CVPR 2020
论文被引:286(11/18/2023)
论文代码:https://github.com/haosulab/SAPIEN,266 star
项目主页:–

ThreeDWorld ※

论文标题:ThreeDWorld: A Platform for Interactive Multi-Modal Physical Simulation
论文作者:Chuang Gan, Jeremy Schwartz, Seth Alter, Damian Mrowca, Martin Schrimpf, James Traer, Julian De Freitas, Jonas Kubilius, Abhishek Bhandwaldar, Nick Haber, Megumi Sano, Kuno Kim, Elias Wang, Michael Lingelbach, Aidan Curtis, Kevin Feigelis, Daniel M. Bear, Dan Gutfreund, David Cox, Antonio Torralba, James J. DiCarlo, Joshua B. Tenenbaum, Josh H. McDermott, Daniel L.K. Yamins
论文原文:https://arxiv.org/abs/2007.04954
论文出处:NeurIPS 2021
论文被引:186(11/18/2023)
论文代码:https://github.com/threedworld-mit/tdw,426 star
项目主页:https://www.threedworld.org/

PyBullet

项目主页:https://pybullet.org/wordpress/

Github:https://github.com/bulletphysics/bullet3,11.3k star

MuJoCo

论文标题:MuJoCo: A physics engine for model-based control
论文作者:Emanuel Todorov; Tom Erez; Yuval Tassa
论文原文:https://ieeexplore.ieee.org/document/6386109
论文出处:2012 IEEE/RSJ International Conference on Intelligent Robots and Systems
论文被引:4752(11/18/2023)
论文代码:https://github.com/google-deepmind/mujoco,6.5k star
项目主页:https://mujoco.org/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/160724.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

恕我直言,大模型对齐可能无法解决安全问题,我们都被表象误导了

是否听说过“伪对齐”这一概念? 在大型语言模型(LLM)的评估中,研究者发现了一个引人注目的现象:当面对多项选择题和开放式问题时,模型的表现存在显著差异。这一差异根源在于模型对复杂概念的理解不够全面&…

SpringCloud 之Feign的性能优化

Feign底层默认是JDK自带的HttpURLConnection,它是单线程发送HTTP请求的,不能配置线程池,我们使用Okhttp或者HttpClien 朵发送http请求,并且它们两个都支持线程池。 常见HTTP客户端 HttpClient HttpClient 是 Apache Jakarta Comm…

数位和相等数对的最大和【教3妹学编程-算法题】数位和相等数对的最大和

3妹:2哥,你有没有看到新闻“18岁父亲为4岁儿子落户现身亲子鉴定” 2哥 : 啥?18岁就当爹啦? 3妹:确切的说是14岁好吧。 2哥 : 哎,想我30了, 还是个单身狗。 3妹:别急啊, 2…

mfc140u.dll丢失的解决方法,以及针对每个解决mfc140u.dll丢失办法的优缺点

在使用电脑的过程中,有时会遇到一些与动态链接库文件(DLL)相关的错误。其中,mfc140u.dll丢失是一种常见的问题,它可能导致应用程序无法正常运行。在本文中,我们将探讨关于mfc140u.dll丢失的解决办法&#x…

PS学习笔记——初识PS界面

文章目录 PS界面 PS界面 我使用的是PS2021,可能不同版本界面有所不同,但大体来说没有太多差异 可以看到下面这个图就是ps的主界面,大体分为菜单栏、选项栏、工具栏、面板、以及最中央的工作区。 ps中的操作基本都能在菜单栏中找到 可以从菜…

(c语言进阶)内存函数

一.memcpy(void* dest,void* src,int num) &#xff0c;操作单位为字节&#xff0c;完成复制且粘贴字符串 1.应用 #include <stdio.h> #include<string.h> int main() {int arr1[] { 1,2,3,4,5,6,7,8,9,10 };int arr2[20] { 0 };memcpy(arr2, arr1, 20);//从…

Source Insight 安装及使用方法

Source Insight 安装及使用方法 Source Insight 安装及使用方法Source Insight 简介Source Insigth 安装Source Insight 使用方法 Source Insight 安装及使用方法 Source Insight 简介 Source Insight是一款非常流行的程序编辑器和代码浏览器&#xff0c;它主要用于阅读、编写…

Nuxt3框架全局引用外部JS/CSS文件的相关配置方法

全局引入外部文件方法&#xff1a; 找到根目录下的nuxt.config.ts配置文件&#xff1b;然后如上图所示&#xff0c;在defineNuxtConfig配置对象下app选项节点下&#xff0c;head对象中即可配置全局需要的JS或CSS文件&#xff1b; // https://nuxt.com/docs/api/configuration/…

C# 字节数组按照指定大小拆分保存至TXT文件

1.按照4个字节拆分为一行显示示例代码 byte[] result new byte[] {0x01,0x02,0x03,0x04,0x05,0x06,0x07,0x08 };using (StreamWriter writer new StreamWriter("output.txt")){for (int i 0; i < result.Length; i 4) //按照四个字节拆分{byte[] tempArray n…

计算机网络学习笔记(六):应用层(待更新)

6.2 文件传送协议FTP(File Transfer Protocol) 6.2.1 FTP概述 文件传送&#xff1a;将某台计算机中的文件通过网络传送到可能相距很远的另一台计算机中&#xff08;网络环境中的一项基本应用&#xff09; 问题引入&#xff1a;初看起来&#xff0c;在两个主机之间传送文件是很…

DAY56 647. 回文子串 + 516. 最长回文子序列

647. 回文子串 题目要求&#xff1a;给定一个字符串&#xff0c;你的任务是计算这个字符串中有多少个回文子串。 具有不同开始位置或结束位置的子串&#xff0c;即使是由相同的字符组成&#xff0c;也会被视作不同的子串。 示例 1&#xff1a; 输入&#xff1a;"abc&q…

【机器学习 | 假设检验】那些经常被忽视但重要无比的假设检验!! 确定不来看看?(附详细案例)

&#x1f935;‍♂️ 个人主页: AI_magician &#x1f4e1;主页地址&#xff1a; 作者简介&#xff1a;CSDN内容合伙人&#xff0c;全栈领域优质创作者。 &#x1f468;‍&#x1f4bb;景愿&#xff1a;旨在于能和更多的热爱计算机的伙伴一起成长&#xff01;&#xff01;&…

云服务器安装宝塔Linux面板

最近趁双11优惠&#xff0c;买了个腾讯云轻量应用服务器&#xff0c;尝试在这上面搭建一个个人的网站。 研究了一下&#xff0c;通过宝塔软件安装的话&#xff0c;非常降低&#xff0c;上手快。 服务器配置&#xff1a; CPU 2核内存 2G云硬盘&#xff1a;50G带宽&#xff1a;…

手撕单链表(C语言)

目录 1.单链表的物理结构 2.头文件的实现 3.SList.c文件的实现 3.1尾插、创建节点 3.2打印 3.3头插 3.4尾删 3.5头删 3.6查找 3.7指定位置之前插入数据 3.8指定位置之后插入数据 3.9删除指定位置节点 3.10删除pos之后的节点 3.11销毁链表 4 所有的代码 1.单链表的物理结构 众所…

美团外卖18元神券节红包优惠券怎么抢?

美团外卖红包天天免费领取活动规则 1、每月18日可领美团外卖18元神券节红包优惠券&#xff1b; 2、每月15、16、17日可领美团外卖神券节预热12元红包优惠券&#xff1b; 3、每周星期一、星期三可领美团外卖节9元红包优惠券&#xff1b; 4、每天可领美团外卖天天神券3-7元美…

初刷leetcode题目(1)——数据结构与算法

&#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️Take your time ! &#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️…

业务架构、技术架构、项目管理的有机结合

新入职的创业公司一年不行了。 这一年来没有上班&#xff0c;也因为大龄的问题找不到合适的工作。然后考了几个项目管理证书&#xff0c;又思考了一个技术兑现的问题。 技术本身是架构的执行层面&#xff0c;如果上面的公司战略、业务架构变小&#xff0c;缩水&#xff0c;或者…

VUE基础入门

一、VUE入门 1、环境准备 2、预备知识 3、实战演练 vue官网 Vue.js - 渐进式 JavaScript 框架 | Vue.js 基础语法&#xff0c;vue2和vue3区别不大&#xff0c;但是后面路由会有很大区别。 前期基础语法&#xff0c;我们通过链接的方式使用vue&#xff0c;后面会用npm进行安装…

手机LiDAR-based激光雷达标定板提高无人汽车智能化程度

手机LiDAR-based 3D扫描和建模测试系统是一种利用激光雷达&#xff08;LiDAR&#xff09;技术进行三维扫描和模型创建的工具&#xff0c;它可以在手机上运行。这种测试系统可以用于各种应用&#xff0c;如地形测绘、建筑物建模、机器人视觉、无人驾驶汽车导航等。 手机LiDAR-ba…

【Java从入门到大牛】多线程

&#x1f525; 本文由 程序喵正在路上 原创&#xff0c;CSDN首发&#xff01; &#x1f496; 系列专栏&#xff1a;Java从入门到大牛 &#x1f320; 首发时间&#xff1a;2023年11月18日 &#x1f98b; 欢迎关注&#x1f5b1;点赞&#x1f44d;收藏&#x1f31f;留言&#x1f4…