Aruco 库详解:计算机视觉中的高效标记检测工具

1. 引言:Aruco 在计算机视觉中的重要性

在计算机视觉领域,标记(Marker)检测和识别是许多应用的基础,包括 机器人导航、增强现实(AR)、相机标定(Calibration)以及物体跟踪 等。其中,Aruco 库 是一个广泛使用的 开源标记检测工具,它基于 OpenCV 开发,能够快速可靠地检测、识别和跟踪二维标记(fiducial markers)。

Aruco 标记是一种类似于二维码的方形图案,包含唯一的二进制 ID,并且能够被计算机视觉算法轻松识别。与传统的二维码不同,Aruco 主要用于 定位、空间映射和相机姿态估计(Pose Estimation),因此在机器人学、AR 应用和工业视觉检测中扮演着重要角色。

本文将深入解析 Aruco 库的 工作原理、核心功能、应用场景、实践示例 以及 潜在的挑战和优化策略,帮助你全面理解如何利用 Aruco 进行高效的计算机视觉开发。


2. Aruco 标记的基本概念

2.1 什么是 Aruco 标记?

Aruco 标记是一种 二进制方形标记,通常由一个黑色边框和一个内部的唯一编码组成,如下图所示:

+------------+
|            |
|  01010     |
|  11001     |
|  10100     |
|            |
+------------+

它与二维码(QR Code)的主要区别在于:

  • Aruco 不用于存储大规模数据,而仅用于存储少量 ID 信息。
  • 它的边框清晰,有助于 快速检测和姿态估计
  • 由于模式固定,Aruco 检测 速度更快,误识别率更低

Aruco 标记通常被用于相机标定、机器人导航、物体跟踪等任务中,特别适合需要 精确空间定位 的应用场景。


2.2 Aruco 库的核心模块

Aruco 库是 OpenCV 生态的一部分,主要提供以下核心功能:

标记检测(Marker Detection)
能够从图像中快速检测并识别 Aruco 标记的位置和 ID。

姿态估计(Pose Estimation)
通过标记的位置计算 相机的姿态(3D 位置和旋转角度),广泛用于 AR 和 SLAM(同步定位与建图)。

相机标定(Camera Calibration)
利用 Aruco 生成的标记阵列(Chessboard-like Pattern)来校正相机的 内参矩阵,提高计算机视觉系统的精度。

自定义字典(Custom Dictionary)
可以创建自定义标记集合,避免与已有的 Aruco ID 发生冲突,提高识别的安全性和唯一性。


3. Aruco 标记检测的工作原理

Aruco 标记检测的基本流程如下:

3.1 图像预处理
  • 灰度化(Grayscale Conversion):将输入图像转换为灰度,以减少计算量。
  • 阈值化(Thresholding):二值化处理,以突出黑白对比,提高检测精度。
3.2 轮廓检测
  • 通过 边缘检测(Edge Detection)连通区域分析(Connected Component Analysis) 提取可能的标记区域。
  • 利用 四边形拟合算法 识别出潜在的 Aruco 标记区域。
3.3 二进制编码解析
  • 将提取的方形区域按照预定义字典(Dictionary)进行比对。
  • 使用 汉明距离(Hamming Distance) 检查识别的正确性,并纠正误差。
3.4 姿态估计
  • 通过 PnP 算法(Perspective-n-Point) 计算相机的 3D 姿态。
  • 需要使用相机的 内参矩阵(Camera Intrinsics) 进行校正。

通过上述步骤,Aruco 库能够精准检测标记的位置和 ID,并计算它在 3D 空间中的姿态。


4. Aruco 的应用场景

Aruco 在多个计算机视觉领域中都有广泛应用,主要包括以下场景:

4.1 机器人导航 🚗🤖
  • 在机器人导航和自动驾驶中,Aruco 可以作为 路标,帮助机器人确定自身位置并规划路径。
  • 通过检测 Aruco 标记的 ID 和相对位置,机器人可以执行精准的路径跟踪。
4.2 增强现实(AR) 🎮📱
  • 在 AR 应用中,Aruco 标记可以用来 计算相机的姿态,从而让虚拟物体精准地叠加在现实环境中。
  • 许多 AR 设备(如 Microsoft HoloLens、Magic Leap)都使用类似的标记进行空间映射。
4.3 相机标定 📷
  • Aruco 库可以生成棋盘样式的标记阵列,用于相机 畸变校正焦距计算
  • 通过多个不同角度拍摄的 Aruco 阵列,可以提高相机校准的精度。
4.4 物体跟踪与测量 📏
  • 在工业检测和智能制造中,Aruco 标记可以帮助 精确测量物体的尺寸、角度和位置,提高自动化生产线的准确性。

5. Aruco 实践示例:Python 代码演示

生成一个图:

import cv2
import numpy as np

# 获取预定义的 ArUco 字典
aruco_dict = cv2.aruco.getPredefinedDictionary(cv2.aruco.DICT_ARUCO_ORIGINAL)

# 设定 4 个标记的 ID(可以自己调整)
marker_ids = [10, 20, 30, 40]  # 确保 ID 唯一
marker_size = 200  # 每个标记的大小(像素)

# 创建白色背景图像(比如 1000x1000 像素)
board_size = 1000
aruco_board = np.full((board_size, board_size), 255, dtype=np.uint8)

# 创建 4 个 ArUco 标记并放置在四个角落
for i, marker_id in enumerate(marker_ids):
    marker_img = cv2.aruco.drawMarker(aruco_dict, marker_id, marker_size)
    
    # 根据索引确定标记位置
    if i == 0:  # 左上角
        aruco_board[0:marker_size, 0:marker_size] = marker_img
    elif i == 1:  # 右上角
        aruco_board[0:marker_size, -marker_size:] = marker_img
    elif i == 2:  # 左下角
        aruco_board[-marker_size:, 0:marker_size] = marker_img
    else:  # 右下角
        aruco_board[-marker_size:, -marker_size:] = marker_img

# 保存 ArUco 标记板
cv2.imwrite("aruco_board.png", aruco_board)

# 显示结果
cv2.imshow("ArUco Board", aruco_board)
cv2.waitKey(0)
cv2.destroyAllWindows()

运行后:
在这里插入图片描述

以下是一个 基于 OpenCV 的 Aruco 标记检测代码,可以帮助你快速入门:

import cv2
import numpy as np
import imutils
#pip install opencv-contrib-python==4.6.0.66
def order_points(pts):
    # 初始化排序后的点的列表
    rect = np.zeros((4, 2), dtype=np.float32)
    
    # pts的和将作为排序的依据
    s = pts.sum(axis=1)
    # 左上角的点将有最小的和
    rect[0] = pts[np.argmin(s)]
    # 右下角的点将有最大的和
    rect[2] = pts[np.argmax(s)]
    
    # pts的差将作为排序的依据
    diff = np.diff(pts, axis=1)
    # 右上角的点将有最小的差
    rect[1] = pts[np.argmin(diff)]
    # 左下角的点将有最大的差
    rect[3] = pts[np.argmax(diff)]
    
    return rect

def detect_color_correction_card(image_path):
    # Load image
    image = cv2.imread(image_path)
    
    # Resize image 
    image = imutils.resize(image, width=600)
    
    # Convert to grayscale
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    
    # Create ArUco dictionary and parameters
    arucoDict = cv2.aruco.Dictionary_get(cv2.aruco.DICT_ARUCO_ORIGINAL)
    arucoParams = cv2.aruco.DetectorParameters_create()
    
    # Detect ArUco markers
    (corners, ids, rejected) = cv2.aruco.detectMarkers(gray, arucoDict, parameters=arucoParams)
    
    # Check if markers are detected
    if ids is not None and len(ids) > 0:
        try:
            ids = ids.flatten()
            print(ids)    
            if all(id in ids for id in ids):
                # 创建一个字典来存储每个ID对应的角点
                marker_corners = {}
                for i, marker_id in enumerate(ids):
                    corner = np.squeeze(corners[i])
                    marker_corners[marker_id] = corner
                
                # 收集所有标记的所有角点
                all_corners = []
                for corner in corners:
                    corner = np.squeeze(corner)
                    for point in corner:
                        all_corners.append(point)
                
                # 将所有角点转换为numpy数组
                all_corners = np.array(all_corners, dtype=np.float32)
                
                # 计算凸包
                hull = cv2.convexHull(all_corners)
                hull = np.squeeze(hull)
                
                # 找到最小外接矩形的四个角点
                rect = cv2.minAreaRect(hull)
                box = cv2.boxPoints(rect)
                box = np.array(box, dtype=np.float32)
                print(box)
                # 对这四个角点进行排序
                ordered_corners = order_points(box)
                
                # 找到ID为10的标记的位置
                marker_10_corners = marker_corners[10]
                marker_10_center = np.mean(marker_10_corners, axis=0)
                
                # 找到ordered_corners中最接近marker_10_center的点的索引
                distances = np.linalg.norm(ordered_corners - marker_10_center, axis=1)
                marker_10_idx = np.argmin(distances)
                
                # 如果ID为10的标记不在左上角,重新排序点
                if marker_10_idx != 0:
                    ordered_corners = np.roll(ordered_corners, -marker_10_idx, axis=0)
                
                # 扩大边界以确保包含所有标记
                # 计算边界扩展因子
                padding = 0  # 可以调整这个值
                
                # 获取排序后的角点
                topLeft, topRight, bottomRight, bottomLeft = ordered_corners
                
                # 向外扩展边界
                vector_top = topRight - topLeft
                vector_left = bottomLeft - topLeft
                
                topLeft = topLeft - (vector_top + vector_left) * padding / 100
                topRight = topRight + (vector_top - vector_left) * padding / 100
                bottomRight = bottomRight + (vector_top + vector_left) * padding / 100
                bottomLeft = bottomLeft + (-vector_top + vector_left) * padding / 100
                
                # print([topLeft, topRight, bottomRight, bottomLeft])
                # Prepare points for perspective transform
                pts1 = np.float32([topLeft, topRight, bottomRight, bottomLeft])
                
                # Define destination points
                width, height = 300, 600
                pts2 = np.float32([
                    [0, 0],            # Top-left (ID 10)
                    [width-1, 0],      # Top-right
                    [width-1, height-1],  # Bottom-right
                    [0, height-1]      # Bottom-left
                ])
                
                # Compute perspective transform matrix
                matrix = cv2.getPerspectiveTransform(pts1, pts2)
                
                # Apply perspective transformation
                warped = cv2.warpPerspective(image, matrix, (width, height))
                
                # Draw detected markers on original image
                cv2.aruco.drawDetectedMarkers(image, corners, ids)
                
                # Display results
                cv2.namedWindow('Original Image', cv2.WINDOW_NORMAL)
                cv2.namedWindow('Warped Image', cv2.WINDOW_NORMAL)
                
                cv2.imshow('Original Image', image)
                cv2.imshow('Warped Image', warped)
                
                cv2.waitKey(0)
                cv2.destroyAllWindows()
                
                return warped
            else:
                print("Not all expected markers found")
                return None
        
        except Exception as e:
            print(f"An error occurred: {e}")
            return None
    
    else:
        print("No ArUco markers detected")
        return None

# Usage example
result = detect_color_correction_card('14.png')

原图
在这里插入图片描述
识别后:
在这里插入图片描述
在这里插入图片描述

运行效果:

  • 代码会在图像中检测 Aruco 标记,并在检测到的标记上绘制边框和 ID。
  • 你可以尝试不同的 Aruco 字典(DICT_4X4_50、DICT_6X6_100 等) 来生成不同种类的标记。

6. Aruco 的挑战与优化策略

误检测问题

  • 复杂背景可能导致误检测,可以使用 自适应阈值化 提高精度。

标记角度影响

  • 角度过大时,透视变形可能影响识别,建议使用 PnP 进行姿态优化

光照变化

  • 低光环境下,推荐使用 HDR 预处理,增强标记的对比度。

7. 结论

Aruco 是一个强大且高效的计算机视觉工具,广泛应用于 机器人、AR、相机标定和物体跟踪 领域。它的高检测速度和低误识别率使其成为许多项目的首选方案。

如果你正在开发涉及 空间定位、相机标定或增强现实 的应用,Aruco 绝对是一个值得深入研究的技术! 🚀

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/983309.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SQL_语法

1 数据库 1.1 新增 create database [if not exists] 数据库名; 1.2 删除 drop database [if exists] 数据库名; 1.3 查询 (1) 查看所有数据库 show databases; (2) 查看当前数据库下的所有表 show tables; 2 数据表 2.1 新增 (1) 创建表 create table [if not exists…

react中的fiber和初次渲染

源码中定义了不同类型节点的枚举值 组件类型 文本节点HTML标签节点函数组件类组件等等 src/react/packages/react-reconciler/src/ReactWorkTags.js export const FunctionComponent 0; export const ClassComponent 1; export const IndeterminateComponent 2; // Befo…

AutoGen学习笔记系列(七)Tutorial - Managing State

这篇文章瞄准的是AutoGen框架官方教程中的 Tutorial 章节中的 Managing State 小节,主要介绍了如何对Team内的状态管理,特别是如何 保存 与 加载 状态,这对于Agent系统而言非常重要。 官网链接:https://microsoft.github.io/auto…

Compose Multiplatform+Kotlin Multiplatfrom 第四弹跨平台

文章目录 引言功能效果开发准备依赖使用gradle依赖库MVIFlow设计富文本显示 总结 引言 Compose Multiplatformkotlin Multiplatfrom 今天已经到compose v1.7.3,从界面UI框架上实战开发看,很多api都去掉实验性注解,表示稳定使用了!…

[Java基础-线程篇]7_线程设计模式与总结

摘要:懒汉单例模式怎么变得线程安全?Master-Worker归并模式,工作窃取算法。Java线程相关源码使用了什么设计模式? 资料引用:《Java高并发核心编程卷2》 目录 线程安全的单例模式 Master-Worker模式 工作窃取算法 …

Kubermetes 部署mysql pod

步骤 1: 创建 PersistentVolume 和 PersistentVolumeClaim 首先为 MySQL 创建一个 PersistentVolume (PV) 和 PersistentVolumeClaim (PVC) 来确保数据的持久性。 mysql-pv.yaml: apiVersion: v1 kind: PersistentVolume metadata:name: mysql-pv-volume spec:cap…

【四.RAG技术与应用】【12.阿里云百炼应用(下):RAG的云端优化与扩展】

在上一篇文章中,我们聊了如何通过阿里云百炼平台快速搭建一个RAG(检索增强生成)应用,实现文档智能问答、知识库管理等基础能力。今天咱们继续深入,聚焦两个核心问题:如何通过云端技术优化RAG的效果,以及如何扩展RAG的应用边界。文章会穿插实战案例,手把手带你踩坑避雷。…

交叉编译openssl及curl

操作环境:Ubuntu20.04 IDE工具:Clion2020.2 curl下载地址:https://curl.se/download/ openssl下载地址:https://openssl-library.org/source/old/index.html 直接交叉编译curl会报错找不到openssl,所以需要先交叉编…

在笔记本电脑上用DeepSeek搭建个人知识库

最近DeepSeek爆火,试用DeepSeek的企业和个人越来越多。最常见的应用场景就是知识库和知识问答。所以本人也试用了一下,在笔记本电脑上部署DeepSeek并使用开源工具搭建一套知识库,实现完全在本地环境下使用本地文档搭建个人知识库。操作过程共…

HarmonyOS 应用程序包结构 (发布态)

每个应用中至少包含一个.hap文件,可能包含若干个.hsp文件、也可能不含,一个应用中的所有.hap与.hsp文件合在一起称为Bundle,其对应的bundleName是应用的唯一标识(详见app.json5配置文件中的bundleName标签)。 当应用发…

idea中的查看git历史记录,不显示详细信息

一、正常情况显示 1、idea中git查看history正常显示如下图: 二、非正常情况下显示 1、idea中git查看history,现在不显示提交的历史文件详细信息,如下图: 三、解决方式 1、找到如下窗口中画红色框的黑色线条,鼠标放在…

江科大51单片机笔记【9】DS1302时钟可调时钟(下)

在写代码前,记得把上一节的跳线帽给插回去,不然LCD无法显示 一.DS1302时钟 1.编写DS1302.c文件 (1)重新对端口定义名字 sbit DS1302_SCLKP3^6; sbit DS1302_IOP3^4; sbit DS1302_CEP3^5;(2)初始化 因为…

数学建模笔记——层次分析法(AHP)

本文借鉴了数学建模清风老师的视频和课件,如有错误欢迎大家批评指正。原视频地址:清风数学建模:https://www.bilibili.com/video/BV1DW411s7wihttps://www.bilibili.com/video/BV1DW411s7wi 1.预备知识 层次分析法: 层次分析法(The Analytic Hierarchy Process,AHP)是一…

阿里云扩容操作步骤

在快照中备份服务器快照,时间为1天 进入块存储模块进行扩容 付款完成后进入账单进行查询,确认成功后找售后确认挂载盘情况 [rootatcoin ~]# df -h Filesystem Size Used Avail Use% Mounted on devtmpfs 1.8G 0 1.8G 0% /dev tmpfs…

【系统架构设计师】以数据为中心的体系结构风格

目录 1. 说明2. 仓库体系结构风格3. 黑板体系结构风格 1. 说明 1.以数据为中心的体系结构风格主要包括仓库体系结构风格和黑板体系结构风格。 2. 仓库体系结构风格 1.仓库(Repository)是存储和维护数据的中心场所。2.在仓库风格中,有两种不…

llamafactory大模型微调教程(周易大模型案例)

1.环境说明 操作系统:ubuntu 20 基础模型:Qwen2.5-1.5B-Instruct 工具:llamafactory GPU:四张4090 2、环境部署 2.1 下载基础模型 # 1、下载 modelscope pip install modelscope#2、模型下载 cd /data/ cat >> download…

go切片定义和初始化

1.简介 切片是数组的一个引用,因此切片是引用类型,在进行传递时,遵守引用传递的机制。切片的使用和数组类似,遍历切片、访问切片的元素和切片的长度都一样。。切片的长度是可以变化的,因此切片是一个可以动态变化的数…

2025年03月07日Github流行趋势

项目名称:ai-hedge-fund 项目地址url:https://github.com/virattt/ai-hedge-fund项目语言:Python历史star数:12788今日star数:975项目维护者:virattt, seungwonme, KittatamSaisaard, andorsk, arsaboo项目…

蓝桥杯每日一题:第一周周四哞叫时间

蓝桥杯每日一题:第一周周四哞叫时间 疑惑:如何把复杂度控制在Q(n),怎么枚举a和b,longlong的形式又该怎么输入(考虑用string) 思路:枚举倒数第二个b前面有多少个a 这是一…

常见排序算法鉴赏(原理剖析+动图演示)

目录 一、冒泡排序(BubbleSort) 二、选择排序( SelectSort) 三、插入排序(InsertSort) 四、希尔排序(ShellSort) 五、堆排序 六、快排(QuickSort) Hoa…