机器人入门路线及参考资料(机器人操作方向)

机器人(操作方向)入门路线及参考资料

  • 前言
  • 1 数理基础和编程
  • 2 机器人学理论
  • 3 计算机视觉
  • 4 机器人实操
  • 5 专攻方向
  • 总结
  • Reference:


前言

随着机器人和具身智能时代的到来,机器人越来越受到大家的重视,本文就介绍了机器人(机器人操作方向)的入门路线及重要参考资料,包括数理和编程基础,机器人操作,计算机视觉,机器人实操以及具体的方向突破。


1 数理基础和编程

首先需要具备的就是一定的数理基础和计算机编程能力,这两项也是工科生最先接触的知识。

数理基础包括高数,线代,概率论等。可能很多学生包括博主在内在学习这些数学课程时,并不知道这些数学知识到底和专业之间是什么关系。为了引起大家对数理基础的重视,这里简单举例说明数理知识的重要性。比如力学分析(理力,材力,流力)会用到高数,控制理论会用到高数和线代,计算机视觉会涉及矩阵和概率论,而机器人学则会涉及到以上所有技术。

在学习以上数学知识的同时,可以练习数理推导软件如Matlab,Mathematica等辅助计算,这些软件也可用于机器人的计算和仿真。

计算机编程的底层逻辑想通,按照大学培养方案,最先接触的语言是C语言,重点培养编程的逻辑和程序设计方法。在机器人工程中,用到较多的语言是C++和Python两种语言,一种语言学会之后,再学其他语言速度就会很快。

2 机器人学理论

对于机器人理论部分,首先需要具备机器人学的基础知识,如位姿表示与变换,欧拉角和RPY角,机器人的正逆运动学等。可参考的书籍为熊有伦的《机器人技术基础》。

掌握这些基本概念之后,可以针对专题进行深入研读,如规划or控制,操作or移动,工业机器人or服务机器人,不同专题涉及到的技术侧重点不同。

本文主要针对机器人操作方向,所以重点介绍一下机器人操作方向。该方向主要是研究机器人基于视觉或触觉利用末端执行器(刚性或柔性,仿人手或二指夹爪)与被操作对象进行交互(如抓取,放置,推,重定向等)的科学。
拾起盘子

人手操作(拾起)盘子的案例 [1]。

从力学角度分类可分为运动学操作,静态操作,准静态操作和动态操作,具体概念可以参考卡内基梅隆大学Mason的原著中译本书籍《机器人操作中的力学原理》。从被操作对象角度可分为刚性物体操作和柔性物体的操作,由于刚性物体操作的力锁合和形锁合假设不再适用于柔性物体的操作,所以柔性物体的操作也是当下的研究热点。

此处,也给出MIT的机器人操作课程的官方链接:Robotic Manipulation - Perception, Planning, and Control,供需要的小伙伴自学。

3 计算机视觉

计算机视觉于机器人而言就是机器人的眼睛,可用于机器人的抓取与操作,导航,人机交互等任务中。在机器人操作方面,计算机视觉主要用来识别物体的位姿和状态估计,抓取点检测等。

经典的计算机视觉任务包括图像预处理,图像的分割,图像的特征表述等。这些基本的概念需要了解,可以参考张岩等翻译的中译本书籍《计算机视觉基础》。然后在OpenCV上进行实践,OpenCV提供了丰富的C++和Python语言的API接口,可以直接调用,相关的书籍《学习OpenCV3》和其官方教程https://docs.opencv.org/4.x/d9/df8/tutorial_root.html。

接下来就是学习基于深度学习的计算机视觉,常用的套路如下 [2]:

1 学习吴恩达的《机器学习》和《深度学习》课程,了解一些机器学习的知识。
2 了解一些经典的CV模型,如Alexnet、R-CNN系列、YOLO等。
3 在github上找一些tensorflow、pytorch实现上述模型的开源代码。
4 下载VOC、ImageNet、COCO、kaggle等数据集。
5 按照开源代码中的Readme准备数据集,跑一下结果。

传统视觉和基于深度学习的视觉各有优缺点 [3, 4],在实际项目中,大多数情况下需要结合使用。

4 机器人实操

在了解以上基本概念之后,就可以上手真实机器人实践了,这里以基于ROS的机器人抓取系统为例,阐述需要掌握知识和要解决的问题。

首先,ROS(机器人操作系统)的一些基本概念要清楚,如节点,话题,功能包等基本概念,以及如何创建发布者和订阅者以及定义要发布的消息等,这些是机器人操作系统的基本通信的机制。

其次,学会使用ROS中的常用组件,如launch,rqt,rviz,rosbag等常用组件,这些组件是机器人调试时非常方便的工具。

最后,就是针对机器人类型进行建模和仿真,对于机械臂来说,ROS中已经集成了用于机械臂操作的开发平台——MoveIt,我们可以直接使用MoveIt来控制我们的机械臂。

ROS的参考资料可以参考古月居(胡春旭)的视频课程ROS入门21讲和书籍《ROS机器人开发实践》。

在掌握了ROS之后,就是在此基础上进行开发了,包括手眼标定,夹爪通信,机械臂规划等。下图所示为京东2017 JRC X机器人挑战赛上其中一个参赛队伍的机器人系统 [5],一个基于ROS开发的机器人移动操作系统。
京东机器人挑战赛

5 专攻方向

当具备基础知识和实操能力之后,就需要根据具体的专攻方向学习最新的论文,开展工程或者研究工作。如3D感知与操作,类人操作,移动操作,人机交互,柔性物体的操作等。

一般情况下,较新的方向是没有书籍的,可以先从综述开始,然后是方向密切相关文献的精读。关注专攻方向最新动态,如顶会的Workshop等,还有跟踪领域内的牛人的发文。

2024年是具身智能到来的时代,当然,具身智能也可以和机器人操作相结合,即将大模型或者Learning应用于机器人操作任务中去,具身智能的入门路线参考具身智能入门学习技术路线。

最后推荐一下机器人操作方向上的媒体号:
关于机器人操作方向,推荐公众号:机器人操作前沿动态,每周更新全球最新学术进展。
关于柔性物体的操作,推荐博客:机器人的柔性物体操作综述汇总(持续更新),汇总了近几年的柔物操作的综述文章。


总结

以上就是今天要讲的内容,本文介绍了机器人操作方向的入门路线,从数理基础和编程,到机器人学理论和计算机视觉,再到机器人的实操和方向突破,阐述了机器人操作方向所需要的知识体系并给出重要参考资料。当然,入门时,不一定要按照顺序学习,边学边应用效果更佳。

Reference:

[1] MIT机器人操作课程:Robotic Manipulation - Perception, Planning, and Control
[2] 知乎文章:计算机视觉学习路线
[3] CSDN博客:论文笔记:传统CV和深度学习方法的比较
[4] O’Mahony N, Campbell S, Carvalho A, et al. Deep learning vs. traditional computer vision[C]//Advances in Computer Vision: Proceedings of the 2019 Computer Vision Conference (CVC), Volume 1 1. Springer International Publishing, 2020: 128-144.
[5] CSDN博客:ROS下实现机器人序列任务的执行控制

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/763680.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

方正小标宋简体、仿宋GB2312、楷体GB2312字体

文章目录 下载地址所有的文件wps使用方正小标宋简体、仿宋GB2312、楷体GB2312 字体用途方正小标宋简体仿宋GB2312楷体GB2312 下载地址 【金山文档 | WPS云文档】 方正小标宋简体、仿宋GB2312、楷体GB2312 https://kdocs.cn/l/cksgHDLneqDk 所有的文件 wps使用 方正小标宋简体…

一场前端框架的“武林大会”,三大主流框架之间的性能比较!!!

大家好,我是CodeQi! 在前端开发的江湖中,Vue.js、React 和 Angular 可谓是三大门派,个个身怀绝技,堪称“武林三杰”。 我,作为一名勤奋的代码侠士,决定深入研究这三大门派的奥义,探讨它们在性能方面的表现。且听我细细道来。 什么是 Vue? Vue.js 是由尤雨溪创建的前…

【Python机器学习】模型评估与改进——打乱划分交叉验证

打乱划分交叉验证是一种非常灵活的交叉验证策略。 在打乱划分交叉验证中,每次划分为训练集取样train_size个点,为测试集取样test_size个不相交的点。将这一划分方法重复n_iter次。 举例: import matplotlib.pyplot as plt import mglearnm…

2007年上半年软件设计师【上午题】试题及答案

文章目录 2007年上半年软件设计师上午题--试题2007年上半年软件设计师上午题--答案2007年上半年软件设计师上午题–试题

高优先线程

你开发的时候有么有遇到过一个问题:服务器的一个服务线程过几个小时断连一次,断连之后会马上重连这种情况。这是由于CPU负载较高,线程调度时将处理数据的线程挂起了一段时间导致的。 因此,我有考虑到把cpu的核心进行分散开来,就类…

【stm32】大一上学期笔记复制

砌墙单片机 外设是什么? ipage 8 nx轴 128 X0-127 y0-63 PWM脉冲宽度调制 PWM脉冲宽度调制 2023年10月13日 基本特性:脉冲宽度调制PWM是一种对模拟信号进行数字编码的方法。广泛引用于电机控制,灯光的亮度调节,功率控制等领域…

【C++】——【 STL简介】——【详细讲解】

目录 ​编辑 1. 什么是STL 2. STL的版本 3. STL的六大组件 1.容器(Container): 2.算法(Algorithm): 3.迭代器(Iterator): 4.函数(Function): 5.适配器(Adapter): 6.分配器(Allocator): 4. STL的…

Java开发者如何使用RunFlow内置的QLExpress

原文发表于 solo独立开发者社区《Java开发者如何使用RunFlow内置的QLExpress》 效率工具RunFlow完全手册之Java开发者篇 本文是为Java开发者写的手册,如果您不是Java开发者可以阅读我们的开发者篇手册,当然如果您感兴趣也可以继续阅读。 输入 qe 进入QL…

2024年注册安全工程师报名详细流程

一、用户注册 1.1全国专业技术人员资格考试报名服务平台 注册登录网址http://zg.cpta.com.cn/examfront/login/initLogin.html 1.2填写资料 1.3进入照片维护,上传证件照。 需要使用【照片审核处理工具】 将照片处理成符合要求的大小格式。 ①下载照片处理工具http:/…

CTFHUB-SSRF-FastCGI协议

本题需要用到: 在线编码网址:https://icyberchef.com/ gopherus工具:https://mp.csdn.net/mp_blog/creation/editor/139440201 开启题目,页面空白 使用gopherus工具,进入到gopherus工具目录 ./gopherus.py --explo…

【软件测试】 性能测试 JMeter脚本开发!

一、JMeter脚本开发实战 实例:查询一个城市的天气预报 使用抓包工具观察请求所产生的请求列表,筛选最核心API。 A、获取城市代码 http://toy1.weather.com.cn/search?cityname西安 B、获取天气 http://www.weather.com.cn/weather1d/101110101.sht…

【学习笔记】Redis学习笔记——第5章 跳跃表

第5章 跳跃表 有序集合,ZSet关键组成部分,时间复杂度媲美平衡树,且实现简单。 5.1 跳跃表的实现 可以简单理解为每个节点会有一些指向后面跨越N个节点的指针,比如说Node1不仅有指向Node2的指针,还可以有Node5的&…

尚硅谷k8s 2

p54-56 k8s核心实战 service服务发现 Service:将一组 Pods 公开为网络服务的抽象方法。 #暴露Deploy,暴露deploy会出现在svc kubectl expose deployment my-dep --port8000 --target-port80#使用标签检索Pod kubectl get pod -l appmy-depapiVersion: v1 kind: Service metad…

使用Python实现钉钉Stream模式服务开发及内部程序通信

1、什么是Stream模式 Stream 模式是钉钉开放平台提供的一种集成方式,它可以监听机器人回调、事件订阅回调和注册卡片回调。使用 Stream 模式接入,钉钉开放平台将通过 Websocket 连接与应用程序通讯,Stream 模式将极大降低接入门槛和资源依赖…

Android- Framework 非Root权限实现修改hosts

一、背景 修改system/etc/hosts,需要具备root权限,而且remount后,才能修改,本文介绍非root状态下修改system/etc/hosts方案。 环境:高通 Android 13 二、方案 非root,system/etc/hosts只有只读权限&…

工业智能网关的功能特点有哪些?工业智能网关在工业企业的应用-天拓四方

随着工业4.0时代的到来,数字化转型已成为工业企业提升竞争力、实现可持续发展的必经之路。在这一过程中,工业智能网关以其强大的连接、数据处理和安全防护能力,成为推动工业数字化转型的关键力量。本文将深入探讨工业智能网关的功能特点、应用…

基于Java中的SSM框架实现大学生就业预测系统项目【项目源码+论文说明】计算机毕业设计

基于Java中的SSM框架实现大学生就业预测系统演示 摘要 科技不断飞速发展,人类文明走向一个又一个的高峰。在科技进步的浪潮中,计算机技术得到了巨大的发展,随着技术的完善,生产成本的降低,计算机走进千家万户。计算机…

API-Window对象

学习目标: 掌握Window对象 学习内容: BOM(浏览器对象模型)定时器-延时函数JS执行机制location对象navigation对象history对象 BOM(浏览器对象模型): BOM是浏览器对象模型。 window对象是一个全…

Outlook 2021 LTSC for Mac v16.86.2中文正式版

Outlook 2021是微软公司推出的一款电子邮件、日历、联系人管理器和任务管理器应用程序。它是Microsoft 365套件的一部分,适用于Windows、macOS以及iOS和Android移动设备。Outlook 2021在界面设计、功能性和性能方面进行了多项改进,以帮助用户更有效地管理…

(超详细)数据结构——“队列”的深度解析

目录 前言: 1.队列的概念 2.队列的实现 3.代码实现队列 3.1 队列的初始化 3.2 插入 3.3 删除 3.4 队列的队头,队尾和大小 3.5 判空 3.6 销毁 3.7 测试 前言: 队列与栈都是线性表,它们的结构也非常类似&#…