OpenCV距离变换函数distanceTransform的使用

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

功能描述

distanceTransform是OpenCV库中的一个非常有用的函数,主要用于计算图像中每个像素到最近的背景(通常是非零像素到零像素)的距离。它在计算机视觉和图像处理中有多种应用,以下是其中一些主要用途:

1.形态学分析:

  • 细化(Skeletonization):距离变换常用于细化图像,即获取图像的骨架,这对于字符识别、形状分析等很有帮助。
  • 膨胀和腐蚀:结合距离变换和阈值操作,可以实现精确的形态学膨胀和腐蚀。

2.物体分割:

  • 确定前景区域:距离变换可以帮助确定图像中的前景区域,特别是在二值图像中。
  • 种子点选择:在分水岭算法中,距离变换可以用于确定种子点,从而更好地分割物体。

3.特征提取:

  • 质心定位:对于连通组件,距离变换可以帮助找到其质心或重心。
  • 边缘检测:可以用于边缘增强,通过分析像素到边界点的距离来突出边缘。

4.路径规划和避障:

  • 在机器人导航和路径规划中,距离变换可以提供一个关于障碍物距离的信息图,帮助规划最优路径。

5.热力图生成:

  • 距离变换的结果可以被可视化为热力图,展示不同区域的“热度”或重要性。

6.形状描述符:

  • 在模式识别中,距离变换可以作为形状描述的一部分,帮助识别和分类不同的形状。

7.医学影像分析:

  • 在医疗图像处理中,距离变换可以用于测量结构的厚度或距离,例如血管壁的厚度。

cv::distanceTransform函数计算从二值图像中每个像素到最近零像素的近似或精确距离。对于零像素的图像,显然距离将为零。

当maskSize等于DIST_MASK_PRECISE且distanceType等于DIST_L2时,函数运行在文献[83]中描述的算法。此算法利用TBB库进行了并行化。

在其他情况下,使用文献[34]中的算法。这意味着对于每个像素,函数寻找到达最近零像素的最短路径,该路径由基本移动组成:水平、垂直、对角线或骑士移动(骑士移动适用于5×5的掩模)。总距离被计算为这些基本距离的总和。由于距离函数应当是对称的,所以所有的水平和垂直移动必须具有相同的代价(记作a),所有对角线移动必须具有相同的代价(记作b),所有骑士移动也必须具有相同的代价(记作c)。对于DIST_C和DIST_L1类型,距离被精确计算;而对于DIST_L2(欧几里得距离),距离只能计算出相对误差(5×5掩模给出更准确的结果)。对于a、b和c,OpenCV使用原论文中提出的值:

  • DIST_L1: a = 1, b = 2
  • DIST_L2:
    • 3 x 3: a=0.955, b=1.3693
    • 5 x 5: a=1, b=1.4, c=2.1969
  • DIST_C: a = 1, b = 1

通常,为了快速、粗略的距离估算DIST_L2,使用3×3掩模。为了更精确的距离估算DIST_L2,使用5×5掩模或精确算法。需要注意的是,无论是精确算法还是近似算法,它们的时间复杂度都是与像素数量线性的。

这种函数变体不仅计算每个像素(x,y)的最小距离,还标识出最近的由零像素组成的连通组件(当labelType等于DIST_LABEL_CCOMP)或最近的零像素(当labelType等于DIST_LABEL_PIXEL)。组件/像素的索引存储在labels(x, y)中。当labelType等于DIST_LABEL_CCOMP时,函数自动在输入图像中查找零像素的连通组件,并用不同的标签标记它们。当labelType等于DIST_LABEL_PIXEL时,函数遍历输入图像并对所有零像素标记不同的标签。

在这种模式下,复杂度仍然是线性的。也就是说,该函数提供了一种非常快速的方法来计算二值图像的Voronoi图。目前,第二种变体只能使用近似距离变换算法,即不支持maskSize= DIST_MASK_PRECISE。

函数原型

void cv::distanceTransform	
(	
	InputArray 	src,
	OutputArray 	dst,
	OutputArray 	labels,
	int 	distanceType,
	int 	maskSize,
	int 	labelType = DIST_LABEL_CCOMP 
)		

参数

  • src:这是输入的8位单通道(通常是二值化的)源图像。每个像素值要么是0(背景),要么是255(前景),函数会计算每个前景像素到最近背景像素的距离。

  • dst:这是输出图像,包含计算出的距离信息。它是一个8位或32位浮点型的单通道图像,与src图像具有相同的尺寸。每个像素值表示该像素到最近的背景像素的距离。

  • labels:这是输出的二维标签数组(离散的Voronoi图)。它具有CV_32SC1(32位整数)类型,并且与src图像具有相同的尺寸。每个像素值代表了最近的背景像素或背景像素组成的连通组件的标签。

  • distanceType:这指定了距离类型,它定义了计算距离的方式,具体包括:

    • DIST_L1:城市街区距离,也称为曼哈顿距离。
    • DIST_L2:欧几里得距离。
    • DIST_C:棋盘距离,也称为无限范数距离。
  • maskSize:这是距离变换所使用的掩模大小。它定义了计算距离时考虑的邻域大小。DIST_MASK_PRECISE在此变体中不受支持。对于DIST_L1或DIST_C距离类型,参数被强制为3,因为3×3的掩模可以给出与5×5或任何更大窗口相同的距离结果。

  • labelType:这定义了要构建的标签数组的类型,具体包括:

    • DIST_LABEL_CCOMP:每个连通组件的背景像素都被赋予一个唯一的标签。
    • DIST_LABEL_PIXEL:每个背景像素都被赋予一个唯一的标签。

函数原型2


void cv::distanceTransform	
(	
	InputArray 	src,
	OutputArray 	dst,
	int 	distanceType,
	int 	maskSize,
	int 	dstType = CV_32F 
)		

参数2

  • src 这是输入的8位单通道(通常是二值化的)源图像.
  • dst 这是输出图像,包含计算出的距离信息,它是一个8位或32位浮点型的单通道图像,与src图像具有相同的尺寸。
  • distanceType 距离的类型,参见DistanceTypes
    maskSize 距离变换掩模的大小,参见DistanceTransformMasks。在DIST_L1或DIST_C距离类型的情况下,该参数被强制为3,因为3×3的掩模可以得到与5×5或任何更大孔径相同的结果.
  • dstType 输出图像的类型。它可以是CV_8U或CV_32F。CV_8U类型仅能用于函数的第一个变体,并且当distanceType等于DIST_L1时。

示例源码

#include <iostream>
#include <opencv2/opencv.hpp>

int main()
{
    // 读取图像
    cv::Mat src = cv::imread( "/media/dingxin/data/study/OpenCV/sources/images/hawk.jpg", 0 );  // 以灰度模式读取图像

    if ( src.empty() )
    {
        std::cout << "Error : Image cannot be loaded..!!" << std::endl;
        return -1;
    }

    cv::Size sz2Sh( 300, 400 );

    resize( src, src, sz2Sh, 0, 0, cv::INTER_LINEAR_EXACT );

    // 将图像转换为二值图像
    cv::Mat binary;
    cv::threshold( src, binary, 127, 1, cv::THRESH_BINARY );

    // 计算距离变换
    cv::Mat dist;
    cv::distanceTransform( binary, dist, cv::DIST_L2, 3 );

    // 将距离变换结果归一化到[0,255]范围
    cv::normalize( dist, dist, 0, 1, cv::NORM_MINMAX );

    // 显示原始图像和距离变换结果

    cv::imshow( "Source Image", src );
    cv::imshow( "Distance Transform", dist );

    cv::waitKey( 0 );

    return 0;
}

运行结果

原图:
在这里插入图片描述

距离变换图:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/789388.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

「C++系列」C++ 修饰符类型

文章目录 一、C 修饰符类型1. 访问修饰符&#xff08;Access Modifiers&#xff09;2. 存储类修饰符&#xff08;Storage Class Specifiers&#xff09;3. 类型修饰符&#xff08;Type Modifiers&#xff09;4. 函数修饰符 二、C 修饰符类型-案例1. 访问修饰符案例2. 存储类修饰…

JavaSE 面向对象程序设计进阶 IO流 字符输入输出流及底层原理

目录 字符输入流FileReader 空参的read方法 带参的read方法 字符输出流FileWriter 字符输入流底层原理 字符输出流底层原理 字符输入流FileReader 输入流 一次读一个字节 遇到中文时 一次读多个字节 输出流 底层会把数据按照指定的编码方式进行编码 在变成直接写到文件当…

Defensor 4.5:构建数据资产为中心的安全运营体系

5月31日“向星力”未来数据技术峰会上&#xff0c;星环科技重磅发布数据安全管理平台 Defensor 4.5版本。新版本引入了以数据资产为中心的数据安全运营体系&#xff0c;通过智能化大模型技术&#xff0c;帮助企业快速、精准地识别核心重要资产&#xff1b;建设全局的数据安全策…

昇思MindSpore学习笔记6-04计算机视觉--Shufflenet图像分类

摘要&#xff1a; 记录MindSpore AI框架使用ShuffleNet网络对CIFAR-10数据集进行分类的过程、步骤和方法。包括环境准备、下载数据集、数据集加载和预处理、构建模型、模型训练、模型评估、模型测试等。 一、概念 1.ShuffleNet网络 旷视科技提出的CNN模型 应用在移动端 通…

【JavaSE】图书管理系统

目录 最终效果book包Book类BookList类 user包User类AdmiUser类&#xff08;管理员类&#xff09;NormalUser类&#xff08;普通用户类&#xff09; opeeration包IOperation接口FindOpertion类&#xff08;查找操作&#xff09;AddOpertion类&#xff08;增加操作&#xff09;De…

关于解决双屏幕鼠标移动方向问题

1.点开设置》系统》屏幕 2.分清屏幕标识&#xff0c;一般笔记本为1 3.点击要移动的屏幕&#xff0c;然后按住鼠标左键不方进行移动 感谢您的浏览&#xff0c;希望可以帮到您&#xff01;

探索多模态预训练:MAnTiS、ActionCLIP、CPT与CoOp的Prompt技巧

上一篇博文整理了 预训练新范式&#xff08;Prompt-tuning&#xff0c;Prefix-tuning&#xff0c;P-tuning&#xff09; &#xff0c;主要是围绕NLP上的成果&#xff0c;具体的概念本文也不做过多赘述。本篇文章将主要整理几篇有代表性的Prompt方法在多模态领域中的应用。 Mult…

unity使用 MQTT复现plant simulate仿真

unity使用 MQTT复现plant simulate仿真 一、plant simulate端配置 1、plant simulate MQTT组件配置,该组件在类库的信息流类目下,端口不变,填写ip即可; 2、设备配置界面,在控件入口和出口处各挂一个脚本,当物料出入该设备时会分别触发执行这两个脚本,粘贴如下代码; E…

视频怎么压缩变小?最佳视频压缩器

即使在云存储和廉价硬盘空间时代&#xff0c;大视频文件使用起来仍然不方便。无论是存储、发送到电子邮件帐户还是刻录到 DVD&#xff0c;拥有最好的免费压缩软件可以确保您快速缩小文件大小&#xff0c;而不必担心视频质量下降。继续阅读以探索一些顶级最佳 免费视频压缩器选项…

小红书矩阵管理系统:多账号运营的智能解决方案

随着社交媒体的多元化发展&#xff0c;内容创作者和品牌商越来越需要一个能够高效管理多个账号的系统。小红书作为国内领先的生活分享平台&#xff0c;其矩阵管理系统应运而生&#xff0c;为用户带来了多账号发布、批量剪辑视频以及一键分发的便捷功能。本文将详细介绍小红书矩…

必看!微信小程序必备证书!

微信小程序必备SSL证书。在日益增长的数字经济中&#xff0c;微信小程序已成为商家与消费者之间重要的交互平台。由于其便捷性和广泛的用户基础&#xff0c;越来越多的企业选择通过小程序来提供服务。然而&#xff0c;在开发和部署微信小程序时&#xff0c;确保数据安全是一个不…

数据结构笔记之树常考性质6

总结&#xff1a; 具有n个结点的m叉树的最小高度可以通过计算并向下取整得到。高度最小时的情况是所有结点都有m个孩子。

计算机前端面试题总结-暑期实习(答案补充2)

目录 技术方面 二、js 1.js数据类型 1&#xff09;值类型(基本类型) 2&#xff09;引用数据类型&#xff08;对象类型&#xff09; ​编辑 2.判断数据类型是否为数组类型 1&#xff09;Array.isArray() 2&#xff09;instanceof操作符 3&#xff09; Object.prototyp…

飞猪惹怒12306,一张火车票让第三方平台耍尽手段……

小柴已经记不清铁路12306是多少次发出提醒&#xff0c;似乎每一次出行高峰&#xff0c;都会提醒一次。 比如一再强调&#xff0c;购买加速包、付费成为会员就能优先出票&#xff0c;找朋友助力砍一刀&#xff0c;就能获得更高的出票概率……都是假的。‍‍ 因为&#xff0c;铁…

PostgreSQL 中如何处理数据的并发更新冲突解决?

文章目录 一、并发更新冲突的场景二、PostgreSQL 中的并发控制机制&#xff08;一&#xff09; 封锁机制&#xff08;二&#xff09; 事务隔离级别 三、并发更新冲突的解决方法&#xff08;一&#xff09; 重试机制&#xff08;二&#xff09; 使用乐观并发控制&#xff08;三&…

使用机器学习 最近邻算法(Nearest Neighbors)进行点云分析

使用 NearestNeighbors 进行点云分析 在数据分析和机器学习领域&#xff0c;最近邻算法&#xff08;Nearest Neighbors&#xff09;是一种常用的非参数方法。它广泛应用于分类、回归和聚类分析等任务。下面将介绍如何使用 scikit-learn 库中的 NearestNeighbors 类来进行点云数…

打开excel时弹出stdole32.tlb

问题描述 打开excel时弹出stdole32.tlb 如下图&#xff1a; 解决方法 打开 Microsoft Excel 并收到关于 stdole32.tlb 的错误提示时&#xff0c;通常意味着与 Excel 相关的某个组件或类型库可能已损坏或不兼容。 stdole32.tlb 是一个用于存储自动化对象定义的类型库&#x…

【解读大模型(LLM)的token】

文末有福利&#xff01; 当人们谈论大型语言模型的大小时&#xff0c;参数会让我们了解神经网络的结构有多复杂&#xff0c;而token的大小会让我们知道有多少数据用于训练参数。 正像陆奇博士所说的那样&#xff0c;大型语言模型为从文本生成到问题回答的各种任务提供了令人印象…

2024年的设计理念革新:快速获取设计趋势的资源集合!

随着2024年第三季度开始&#xff0c;今年的设计趋势也逐渐出现。与2023 年设计相比&#xff0c;趋势变化空间不大&#xff0c;大部分是在 2023 年度设计趋势的延伸和发展。即使趋势不会一直改变&#xff0c;了解趋势对设计师来说仍然非常重要。接下来&#xff0c;本文将与你分享…

拥抱应用创新,拒绝无谓的模型竞争

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…