行业报告|3D感知技术快速发展,打造“机器之眼”,助推各行业加速升级!

原创 | 文 BFT机器人 

图片

01

3D视觉感知全栈式平台,硬核实力蓄势待发

1.1 3D视觉感知为“机器之眼”,未来市场空间广阔

3D视觉感知技术充分弥补了2D成像技术的以上不足,可获取空间几何尺寸信息。

过去数十年2D成像技术蓬勃发展,分辨率从几十万像素发展到现在的上亿像素,色彩还原更真实,逆光环境下也能通过HDR技术提升图像质量。

然而,2D图像仅能够提供纹理无法提供实现更精准识别、追踪等功能所需的空间形貌、几何尺寸、位姿等信息。

3D视觉的本质是将光源发射到物体再反射回来,根据图像传感器拍摄的画面计算每个图像的变形量或者根据反射回来的时间计算出距离,形成深度图和点云图,再经算法重现1:1还原的3D模型。有了这些信息作为基础,应用场景会大大增多,性能也会大幅提升。

图片

3D视觉感知技术逐步在消费级、工业级等领域应用,经历了以下几个阶段:

(1)技术启蒙期:3D视觉感知技术最早应用于工业领域,主要用于工业设备与零部件的高精度三维测量以及物体、材料的微小形变测量等,代表产品如德国高慕公司(GOM)的ATOS系列三维扫描仪等,用于工业级的设备通常成本高、体积大、功耗高,该阶段应用普及缓慢。

(2)技术起步期:随着底层元器件、核心算法等的快速发展,3D视觉感知技术不再拘泥于工业领域,逐步向消费领域推广,如微软2010年发布的Kincect、英特尔2013年发布的RealSense、奥比2015年发布的Astra,该阶段国内外共振助力3D视觉感知发展。

(3)技术发展期:前两个阶段发布的产品大多聚焦在三维建模、人机交互等领域,随着3D视觉感知技术的进一步迭代与优化,也逐渐向对成本、功耗、体积等要求更加严格的应用领域拓展,比如智能手机、移动支付、AIoT等。

(4)技术爆发期:随着底层元器件和核心算法的不断更迭,3D视觉感知技术逐步人工智能化,消费级应用产品也不断向高端化发展,如2020年苹果在iphone 12pro上搭建了基于dToF技术的Lidar扫描仪,谷歌于2020年在凤凰城推出无人驾驶租车服务等,3D视觉感知进入快速增长时期。

图片

2025年全球3D成像和传感市场规模达150亿美元,市场空间广阔。随着2D成像逐步向3D视觉感知升级,3D视觉感知市场处于规模快速增长的爆发前期,3D成像和传感市场受到传感器、发射器、光学元件、模块技术发展和研发工作推动,目前3D成像和感知朝着多样化、智能化方向发展,未来将各领域共同放量。

根据法国市场研究与战略咨询公司Yole发布的全球3D成像和传感市场研究报告,2019年全球3D视觉感知市场规模为50亿美元,且市场规模将快速发展,预计在2025年达到150亿美元,2019-2025年CAGR约为20%。

3D视觉赛道千亿市场多领域开花,消费电子和汽车领域增速领衔。根据法国市场研究与战略咨询公司Yole发布的全球3D成像和传感市场研究报告显示,3D视觉感知市场主要由消费电子、工业、医疗、汽车及消费电子领域组成,到2025年其细分板块占3D感知市场的比分别为54%、11%、2%、8%和25%,消费电子和汽车的增速较高。

未来随着像素内混合堆叠(in-pixel hybrid stacking)、激光雷达光源由近红外光(NIR)慢慢移动到短波红外线(SWIR)等技术的发展与渗透,将会有越来越多新兴产业进入3D视觉感知市场,比如3D打印设备、人形机器人、虚拟现实混合等,值得期待。

图片

1.2 深耕3D视觉感知,以技术为核心打造全栈式平台

3D视觉感知经过近十年的不断探索、研发及应用,已形成完善的产业化链条。其中,上游主要是3D传感器硬件供应商,主要由深度引擎芯片、光学成像模组、激光投影模组以及其他电子器件、结构件等构成,公司自主研发生产专用感光芯片和传感器模组。

中游是3D视觉感知方案供应商,主要是基于深度引擎算法结合应用进行各类3D视觉传感器的方案设计,其中部分3D视觉感知方案商已具备完整的3D视觉感知方案的能力,如苹果、微软、英特尔、华为、奥比中光等。

下游主要是应用算法供应商,如图像分割/增强优化算法、和VSLAM算法等;应用终端则有消费电子、生物识别等领域。

图片

(1)双目:类似于人眼,通过两个摄像头同时拍摄一个物体,然后利用计算机算法计算两个摄像头之间的视差(两个摄像头同时拍摄同一个物体时,物体在两个图像上的位置是有差异的),从而获取物体的深度信息。双目比较依赖于自然光,且无法处理无纹理的物体。

(2)结构光:通过投射仪主动发射一束光源(通常是红外光束),通过光学元件形成一束带有条纹编码的光,打到物体上反射回来的光由于物体的形状不同导致带编码光束产生不同的变形,通过分析这种畸变的大小和形状可以获取物体的深度信息。结构光适用于近距离,随着距离变远精度和分辨率都会变差,且容易收到环境光的干扰。

(3)ToF:相机通过打出一束光(通常是红外线光束)到目标物体上,这束光经物体反射回来,相机的光电二极管阵列接收反射光,并测量光的时间飞行(ToF)从而获取物体的距离信息。测量时间飞行的方式有两种,一种是dToF即直接计算光束飞行的时间(发射与接收到的时间),一种是iToF即间接测量光束飞行的时间,iToF是通过计算前后发出的两束光的相位差来得到光飞行的时间。ToF的分辨率不高,但是对光有抗干扰能力。

(4)Lidar:目前激光雷达的测距方法ToF、相干法和三角法等,其中三角法较为常用,是指一束光发射至物体表面,激光在物体表面发生反射和折射,在另一角度利用透镜对反射激光汇聚成像,光斑成像在CCD位置传感器上。当被测物体沿激光方向发生移动时,位置传感器上的光斑将产生移动,其位移大小对应被测物体的移动距离,以此来计算物体距离。

(5)工业三维测量:通过特定光源将有光学编码的图案投射到被测物体上,通过分析物体表面变形的光学图案,利用相机标定等方法获得特定光源和相机的位姿关系,采用三角测量法获得物体表面的空间三维信息,最终获得待测物体表面的点云数据。

图片

不同应用领域或场景对3D视觉的测量范围、测量精度、尺寸和功耗等性能要求均不同。其中结构光、iToF、双目、dToF、Lidar主要是运用于消费级应用场景的技术,其中结构光和双目的分辨率较高,更多适用于手机前置和机器人等领域。

ToF技术的抗干扰性和视角较宽,但分辨率较低,更多用于手机后置、扫地机器人等对分辨率要求没有那么高的领域。


工业三维测量则是专用于工业领域,适用于高精度工业测量、材料和结构的测量,其分辨率和测量精度都极高。

图片

1.3 芯片到算法全线技术打造消费级应用设备,产品性能一流

3D视觉传感器的深度引擎芯片具备更快更精确的计算能力,公司具备定制化生产能力。3D视觉传感器主要由结构件外壳、激光投影/RGB成像/感光芯片的IR成像等模组、衍射光学元件、感光芯片、深度引擎芯片等组成,深度引擎芯片具备更快的计算效率以及更精确的计算能力,是实现3D视觉传感器由实验室走向量产、产品化的核心。

图片

在消费级具备全线系统设计、芯片设计、光学设计、软件开发和量产的能力。消费级3D视觉感知技术先进性体现在以下几个方面:

(1)系统设计能力:公司依托从底层到上层技术的全栈式布局,在系统设计时可以更好地进行深入优化与融合,使得系统设计更加合理。


(2)芯片设计能力:公司的芯片团队具备数字及模拟芯片的研发实力,目前已成功完成四代深度引擎芯片、两款iToF感光芯片、两款dToF感光芯片的开发。

(3)算法研发上布局了深度引擎和消费场景多种算法。

(4)公司可以依据客户要求提供定制化光学产品。

(5)二次软件开发包SDK使得客户二次开发更为便利。

(6)量产组装能力。

图片

1.4 工业级3D视觉感知技术先进,国产替代进行时

3D视觉感知在工业领域主要应用于三维扫描、微小形变测量、弯管角度测量分析、工业机器人的定位与导航等方面。

三维测量一直是工业领域不可或缺的技术环节,通过使用高精度相机、光纤光栅等设备,可以实现对物体在力学载荷下的形变、应变、三维形态、曲率等参数的测量,细致、精确、快速获取,结合全局自动拼接技术,可以实现几十米超大工件的快速高精度测量。

02

原有下游稳固,新兴科技应用场景助推发展

2.1 引领服务机器人3D视觉感知市场,人形机器人再续航

机器人视觉相比工业视觉对深度引擎芯片、3D建模算法、分辨率和集成度的要求更高。

机器人视觉和机器视觉都属于计算机视觉,机器视觉通常用于工业,工业视觉的核心是以光学设备+控制系统+执行机构,代替人眼来完成生产制造中的识别、测量、定位、检测等工作,场景单一,对集成度、算力要求较低。

而机器人视觉则需要将机器人对运动场景、物体位置、物体形状实时计算,场景非常复杂,因此对于应用算法、分辨率和物体建模的要求较高,且机器人的体积较小,视觉传感器需要高度集。

图片

预计2027年我国机器视觉市场(包含2D平面图像和3D视觉)预计达560亿,其中3D视觉市场规模接近160亿元。

依据《2023机器视觉产业发展蓝皮书》显示,预计到2026年服务机器人产量有望达27万台,CGAR超27%。

目前来看,更多服务机器人配备2-4台传感器,其中以3D视觉传感器为主。预计未来几年,单台服务机器人搭载的传感器数量有望提升,传感器需求的复合增速超30%。

到2026年传感器需求量有望接近80万台,其中3D视觉传感器占比接近80%,未来市场空间广阔。

图片

多家厂商推出的人形机器人采用了3D视觉感知方案,人形机器人市场空间巨大。

今年以来,以GPT为代表的大模型快速发展,催生了人工智能产业新浪潮,具身智能机器人将成为人工智能终极形态。视觉能力各类智能终端的“眼睛”,是智能终端人机交互中不可或缺的关键一环,尤其是人形机器人,要更加“像人”和“仿生”,视觉感知不可或缺。

目前已有多家厂商在人形机器人上采用了3D视觉感知方案,如小米的CyberOne全尺寸人形机器人和CyberDog2、宇树科技的H1等。公司3D视觉感知技术是为人工智能提供三维视觉能力的关键共性技术,也是科技创新领域的前沿技术之一。

图片

图片

2.2 3D打印应用场景加速推广,千亿赛道蓄势待发

我国3D打印行业整体处于成长期,与国外仍有一定的差距。

我国3D打印行业整体起步较晚,起源于20世纪90年代,以清华大学等高校的研究力量为主。

1994年国内首台自主知识产权的工业级3D打印设备研制成功,1998年卢秉恒团队研制出国内首台光固化快速成型机,3D打印行业持续产生新的突破。

随后2012年中国工程院开始对3D打印行业进行市场调研,2013年中国3D打印技术产业联盟成立,标志着国家层面开始重视。

2017年至今,国家出台多项政策,支持国内3D产业发展,新企业不断进入,行业发展进入增速较快的阶段。

图片

据预测,2026年我国3D打印行业规模可达1101.9亿元,行业进入高增速时期。

3D打印是实施制造强国战略的主攻方向之一,被视为引领新一轮科技革命和产业变革的核心技术之一,3D打印具有零技能制造、设计空间无限、减少废弃副产品等优点,目前已经在军工、医疗、教育、服饰、模具等领域尝试应用。

据预测,2021年3D打印的市场规模为265亿,预计2026年行业规模可达千亿,复合增长率接近26.79%,当前行业已经进入高速发展期。

图片

2.3 智能座舱渗透率提升,千亿市场前景广阔

汽车从被动驾驶转向主动交互,智能座舱是必经之路。据IDC统计,2023年1季度渗透率已达88.8%。

近年来,汽车已经从简单的交通工具逐渐向智能终端转变,汽车的座舱涉及理解和塑造人与车辆之间的交互,尤其是交互领域中的感觉、感知、信息交换和决策等内容,传统的行车更多的是被动过程,未来随着驾驶技术更加先进,驾驶人员将有更多的时间选择来做驾驶之外的任务,智能座舱则相当于主动式的驾驶过程。智能座舱通常包括操控系统、娱乐系统、通信系统、交互系统和智能感知系统。

图片

中国智能座舱为千亿赛道,硬件端对深度摄像头等3D视觉传感器需求高。

据ICVTank统计,2022年中国智能座舱市场规模739亿元,预计2025年可达1030亿元,多家企业纷纷入场,行业进入高速发展阶段。

智能座舱为交互开辟了新的途径,主动式的引入了智能座舱概念,因此,越来越多的传感器被整合到车辆中,参考理想的L9,智能座舱中包含1个激光雷达、1个高精度毫米波雷达、4个环视摄像头、7个外部感知摄像头、1个内部驾驶员监控摄像头等传感器,其中智能座舱的视觉上采用3D视觉传感将会把人机交互体验推向更完美的状态。

图片

2.4 工业测量领域技术持续完善,下游覆盖行业丰富

预计2026年我国工业视觉市场规模可达543亿元,应用领域广阔。

3D视觉感知在工业领域主要应用于三维扫描、微小形变测量、弯管角度测量分析、工业机器人的定位与导航等方面。

通过使用高精度相机、光纤光栅等设备,可以实现对物体在力学载荷下的形变、应变、三维形态、曲率等参数的测量。

可应用于多种行业:汽车工业、航空航天工业、数码家电、文保文创及医学等。据甲子光年智库测算,2021年工业视觉市场规模为178亿,预计2026年可达543亿,市场规模持续放量。

图片

2.5 3D视觉感知助力AIOT和生物识别

(1)智慧生活系列:公司针对智慧零售、智慧农牧、智慧交通提出了3D视觉感知方案。

针对智慧零售,公司3D感知技术助力零售行业打造线上线下一体化的商业模式,实现消费市场提速升级,为传统零售店提供人体3D扫描、商品扫描识别等功能。

针对智慧农牧,公司提出了基于图像视频技术的猪只盘点、背膘测量等产品,解决猪场科学管理难题、提升管理效率、提高经济效益。


针对智慧交通,公司自研3D视觉感知技术赋能交通行业,实现交通客流统计分析智能化处理,形成高效、全面及3D数据为中心的智能交通决策系统,以推动智慧交通发展。

图片

(2)消费电子系列:针对家庭娱乐,公司结合人体骨架识别、AR抠图、人脸识别、物体识别等核心算法,打造“3D+AR”平台,覆盖亲子教育、家庭健身、互动娱乐、家庭看护等应用场景,目前公司家庭娱乐业务已覆盖全国多个省市。

为手机前置提供3D结构光解决方案,已为OPPO旗舰手机FindX定制开发超百万台3D视觉传感器;为手机后置提供iToF解决方案为魅族旗舰手机17Pro、18Pro定制开发ToF解决方案。

(3)生物识别:主要是刷脸支付、3D刷脸门锁、身份核验等解决方案。3D刷脸支付解决方案已在全国数百座城市普及,覆盖超市、药店、便利店等线下场景。

3D刷脸门锁门禁助力实现真3D智能门锁规模化量产,并在办公楼、商场、医院等多个场景广泛使用门禁产品。

提供于人脸识别的金融级KYC验证服务,通过身份信息录入、人脸活体检测、等可快速核验人员信息、分配人员权限等,可广泛应用于政府、医院、人才公寓、校园、产业园区等重要场所。

来源 | 国盛证券

排版 | 居居手

审核 | 柒柒

版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/100283.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Android 1.2 开发环境搭建

目录 1.2 开发环境搭建 1.JDK安装与配置 2.开发工具二选一 3.相关术语的解析 4.ADB命令行的一些指令 5.APP程序打包与安装的流程: 6.APP的安装过程: 7.本节小结 1.2 开发环境搭建 现在主流的Android开发环境有: ①Eclipse ADT SDK ②Android Stu…

CG MAGIC进行实体渲染后!分析渲染器CR和VR的区别之处!

新手小白来说,如何选择渲染器,都会提出疑问? 渲染效果图究竟用CR渲染器还是VR渲染器呢? 今天,CG MAGIC小编通过一个真实的项目场景,实例渲染之后,CR渲染器和VR渲染器区别有哪几点? 1…

分布式 - 服务器Nginx:基础系列之Nginx简介 | 下载安装 | 启动和停止服务

文章目录 01. Nginx 简介02. 正向代理和反向代理03. Nginx 和 Apache、Tomcat 之间的不同点04. Nginx 的优点05. Nginx 常用的功能特性06. Nginx 下载07. Nginx 安装1. 源码安装前的环境准备2. Nginx 源码简单安装方式3. Nginx yum 安装方式4. Nginx 源码复杂安装方式 08. Ngin…

大语言模型之七- Llama-2单GPU(T4 16G)微调(Fine-tune)

模型预训练colab脚本在github主页面。详见Finetuning_LLama_2_0_on_Colab_with_1_GPU.ipynb 在上一篇博客提到两种改进预训练模型性能的方法Retrieval-Augmented Generation (RAG) 或者 finetuning。本篇博客过一下模型微调。 微调:这是采用预训练的LLM并在较小的…

电磁式电压互感器直流电阻测试

试验目的 测量电磁式电压互感器直流电阻的目 的是检查其一次、 二次绕组的质量及回路的完整性, 以发现各种原因所造成的导线断裂、 接头开焊、 接触不良、 匝间短路等缺陷。 试验设备 变压器直流电阻测试仪 厂家: 湖北众拓高试 试验方法 一次绕组直流…

Spring——RESTful Web服务

文章目录 RESTful Web 服务介绍内容概览下载 Lombok 优化代码利器RESTful Web 服务开发运行项目并测试效果 RESTful Web 服务介绍 本节我们将开发一个简单的 RESTful Web 服务。 RESTful Web 服务与传统的 MVC 开发一个关键区别是返回给客户端的内容的创建方式:传…

使用Vue3和Vite升级你的Vue2+Webpack项目

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

JAVA基础-JDBC

本博客记录JAVA基础JDBC部分的学习内容 JDBC基本概念 JDBC : JAVA链接数据库,是JAVA链接数据库的技术的统称,包含如下两部分: 1. JAVA提供的JDBC规范(即各种数据库接口)存储在java.sql 和 javax.sql中的api 2. 各个数…

【基于交叉注意力的泛锐化深度展开迭代网络】

CADUI: Cross-Attention-Based Depth Unfolding Iteration Network for Pansharpening Remote Sensing Images (CADUI:基于交叉注意力的泛锐化深度展开迭代网络) 全色锐化是遥感成像系统获取高分辨率多光谱图像的重要技术。它主要通过融合低…

项目验收有哪些流程?

验收流程 科技计划项目验收/课题验收测试服务的被测对象是国家重大专项、科研课题的软件成果物,可以是一个模块、软件或系统等,也可以是软件套件或软件原型等。测试范围主要来源于课题的合同书/可行吧报告/申报书中的技术指标要求。所出具的科技项目验收…

CRM如何提高销售效率?三个功能实现销售自动化

销售效率对企业的盈利能力有着至关重要的联系。提高销售效率,就是要提高销售人员的工作效率和销售转化率。那么,企业如何提高销售效率呢?CRM销售自动化功能可以帮助企业实现这一目标。 一、线索管理 线索是指有潜在购买意向的客户&#xff…

git文件夹内容详解

.git文件夹是Git版本控制系统在项目根目录下创建的隐藏文件夹,包含了Git仓库的所有相关信息。如下是.git文件夹中常见的一些内容及其作用: HEAD:指向当前所在的分支(或者是一个特定的提交)。 branches:存储…

java+springboot+mysql校园跑腿管理系统

项目介绍: 使用javaspringbootmysql开发的校园跑腿管理系统,系统包含超级管理员,系统管理员、用户角色,功能如下: 超级管理员:管理员管理;用户管理(充值);任…

LuatOS 开发指南

NDK 开发 官方教程 官方例程 API 下载软件 下载官方NDK例程压缩包到本地,并解压。可以看到目录如下: doc: 文档教程 env: 编译环境 example: NDK示例 platform: 需要编译的平台(air72x/air8xx) tools: 其他辅助软件 VSCode 使…

jmeter传参base64卡顿如何解决

部分接口需要传图片base64格式参数,但是输入转为base64格式的图片参数,jmeter直接卡死,甚至电脑也卡死,此时,只需要去掉文件头描述:data:image/jpeg;base64, 即可

应用案例 | 基于三维机器视觉的机器人麻袋拆垛应用解决方案

​Part.1 项目背景 在现代物流和制造行业中,麻袋的拆垛操作是一个重要且频繁的任务。传统的麻袋拆垛工作通常由人工完成,分拣效率较低,人力成本较高,现场麻袋堆叠、变形严重,垛型不规则、不固定,严重影响分…

EXD 设计访谈|Vol.1 从“组件容器”聊到 B 端设计师的价值自证瓶颈

主持:元宝|嘉宾:赫本 《EXD 设计访谈》是由 EXD(易知微用户体验设计团队)制作的一档设计聊天栏目,主要和你分享我们在易知微这家公司里,关于 B 端工具设计、可视化内容设计、ToB 品牌运营设计方…

vue左侧漏斗切换 echart图表动态更新

这个需求是根据点击左侧的箭头部分&#xff0c;右侧图表切换&#xff0c;左侧选中数据高亮&#xff08;图片用的svg&#xff09; 一、效果图 二、vue组件 <template><div class"funnel_wrap"><div class"flex_between"><div class&q…

时序预测 | MATLAB实现基于TSO-XGBoost金枪鱼算法优化XGBoost的时间序列预测(多指标评价)

时序预测 | MATLAB实现基于TSO-XGBoost金枪鱼算法优化XGBoost的时间序列预测(多指标评价) 目录 时序预测 | MATLAB实现基于TSO-XGBoost金枪鱼算法优化XGBoost的时间序列预测(多指标评价)预测效果基本介绍程序设计参考资料 预测效果 基本介绍 Matlab实现基于TSO-XGBoost金枪鱼算…

基于YOLO v5的病虫害检测与优化

《A fast and lightweight detection algorithm for passion fruit pests based on improved YOLOv5》 a new point-line distance loss function is proposed to reduce redundant computations and shorten detection timethe attention module is added to the network for…