OpenCV学习 基础图像操作(十七):泛洪与分水岭算法

原理

泛洪填充算法和分水岭算法是图像处理中的两种重要算法,主要用于区域分割,但它们的原理和应用场景有所不同,但是他们的基础思想都是基于区域迭代实现的区域之间的划分

泛洪算法

泛洪填充算法(Flood Fill)是一种经典的图像处理算法,用于确定和标记与给定点连接的区域,通常在图像填充、分割、边界检测等方面应用广泛。为了更直观地理解泛洪填充算法,我们可以通过一系列生动的图像和步骤来介绍其工作原理。

假设我们有一个二维图像,每个像素可以有不同的颜色或灰度值。泛洪填充算法的目标是从某个起始像素开始,填充所有与其相连且具有相同颜色的像素。常见的应用包括图像编辑中的填充工具(如油漆桶工具)和迷宫求解等。

算法流程

以下是泛洪填充算法的基本步骤,配合图像说明:

  1. 选择起始点和目标颜色

    1. 选择图像中的一个起始像素点(如鼠标点击的位置),记作 (x, y)。
    2. 确定要填充的目标颜色。
  2. 初始化队列

    • 将起始点 (x, y) 加入队列。
  3. 处理队列

    当队列不为空时,重复以下步骤:
    • 从队列中取出一个像素点 (cx, cy)。
    • 如果 (cx, cy) 的颜色等于目标颜色,则进行填充。
    • 将 (cx, cy) 的四个邻居(上、下、左、右)加入队列(如果这些邻居还没有被处理过且颜色等于目标颜色)。

分水岭算法

分水岭算法是一种基于形态学和拓扑学的图像分割技术。它将图像视为一个拓扑地形,通过标记图像的不同区域(例如山脉和盆地)进行分割。分水岭算法的基本思想是通过模拟雨水从山顶流向盆地的过程,确定图像中不同区域的边界。

分水岭迭代过程:

  1. 把梯度图像中的所有像素按照灰度值进行分类,并设定一个测地距离阈值。
  2. 找到灰度值最小的像素点(默认标记为灰度值最低点),让threshold从最小值开始增长,这些点为起始点。
  3. 水平面在增长的过程中,会碰到周围的邻域像素,测量这些像素到起始点(灰度值最低点)的测地距离,如果小于设定阈值,则将这些像素淹没,否则在这些像素上设置大坝,这样就对这些邻域像素进行了分类。
  4. 随着水平面越来越高,会设置更多更高的大坝,直到灰度值的最大值,所有区域都在分水岭线上相遇,这些大坝就对整个图像像素的进行了分区。

实际应用时常结合其他预处理,来实现前后景的分割:

算法流程

  1. 梯度计算: 首先计算图像的梯度,梯度可以使用 Sobel 算子或其他方法计算。梯度图像反映了图像中像素值变化的幅度。

    G(x,y)=\sqrt{(\frac{\partial I}{\partial x})^2+(\frac{\partial I}{\partial y})^2}

    其中,𝐼 是原始图像,𝐺是梯度图像。

  2. 标记区域: 对图像进行标记,将前景对象和背景标记出来。可以使用形态学操作来获取这些标记。

    • 确定前景:使用距离变换和阈值化来确定前景区域。

      D(x,y)=distance\_tranform(I)
      foreground(x,y)=\begin{cases} 1 & \text{ if } D(x,y) > 1 \\ 0 & \text{ if } othersize \end{cases}

    • 确定背景:通过膨胀操作扩展前景区域,从而确定背景区域。

      background(x,y)=dilate(foreground,kernel)

  3. 确定未知区域: 未知区域是背景和前景的差集。

    unknown=background-foreground

  4. 连接组件标记: 对前景区域进行连通组件标记,每个连通组件代表一个独立的前景对象。

    markers=connected\_components(foreground)

  5. 分水岭变换: 使用分水岭变换对梯度图像进行处理,分割图像中的不同区域。

    markers=watershed(G,markers)

    分水岭变换后,标记图像的边界区域将被标记为 -1。

API介绍

floodfill

int cv::floodFill	(	InputOutputArray 	image,   //输入图像
    InputOutputArray 	mask,                        //输入输出的maks
    Point 	seedPoint,                               //种子点
    Scalar 	newVal,                                  //信的
    Rect * 	r    ect = , 0                           // 存储填充区域的边界
    Scalar 	loDiff = , Scalar()                      // 允许填充的像素值差的下届
    Scalar 	upDiff = , Scalar()                      // 允许填充的像素值差的上届
    int 	flags = 4                                // 4联通或8联通
)	
import cv2
import numpy as np
import matplotlib.pyplot as plt
def main():
    # 加载图像
    image_path = 'D:\code\src\code\lena.jpg'  # 替换为你的图像路径
    image = cv2.imread(image_path)
    if image is None:
        print("Error: Unable to load image.")
        return


    # 定义种子点和新颜色
    seed_point = (30, 30)  # 替换为你希望的种子点 (x, y)
    new_color = (0, 0, 255)  # 新颜色为绿色 (B, G, R)

    # 创建掩码,比原图多出两行两列
    mask = np.zeros((image.shape[0] + 2, image.shape[1] + 2), np.uint8)

    # 设置差值范围
    lo_diff = (10, 10, 10)
    up_diff = (10, 10, 10)

    image_src = image.copy()

    # 执行泛洪填充
    flags = 4  # 4-连通
    num, im, mask, rect = cv2.floodFill(image, mask, seed_point, new_color, lo_diff, up_diff, flags)

    # 显示填充后的图像
    plt.subplot(131),plt.imshow(image_src[...,::-1]),plt.title('Source Image'), plt.xticks([]), plt.yticks([])
    plt.subplot(132),plt.imshow(mask[...,::-1]),plt.title('Mask Image'), plt.xticks([]), plt.yticks([])
    plt.subplot(133),plt.imshow(image[...,::-1]),plt.title('Filled Image'), plt.xticks([]), plt.yticks([])
    plt.show()



if __name__ == '__main__':
    main()

watermeshed

cv::watershed	(	InputArray 	image,  //输入图像
InputOutputArray 	markers             //输入出的标记
)	
//即根据传入的确信区域以及原图,经过分水岭迭代后,得到的确信区域
import cv2
import numpy as np
import matplotlib.pyplot as plt
import imageio

def plot_image(image, title, save_path):
    plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
    plt.title(title)
    plt.axis('off')
    plt.savefig(save_path)
    plt.close()

def save_gif(frames, filename, duration=0.5):
    imageio.mimsave(filename, frames, duration=duration)

def watershed_segmentation(image_path):
    # Read the image
    image = cv2.imread(image_path)
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    # Apply thresholding
    ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # Noise removal with morphological operations
    kernel = np.ones((3, 3), np.uint8)
    opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=2)

    # Sure background area
    sure_bg = cv2.dilate(opening, kernel, iterations=3)

    # Finding sure foreground area
    dist_transform = cv2.distanceTransform(opening, cv2.DIST_L2, 5)
    ret, sure_fg = cv2.threshold(dist_transform, 0.7 * dist_transform.max(), 255, 0)

    # Finding unknown region
    sure_fg = np.uint8(sure_fg)
    unknown = cv2.subtract(sure_bg, sure_fg)

    # Marker labelling
    ret, markers = cv2.connectedComponents(sure_fg)

    # Add one to all labels so that sure background is not 0, but 1
    markers = markers + 1

    # Now, mark the region of unknown with zero
    markers[unknown == 255] = 0

    # Apply watershed
    markers = cv2.watershed(image, markers)
    image[markers == -1] = [255, 0, 0]  # Mark boundaries with red color

    # Collect frames for GIF
    frames = []
    for step in ['Original', 'Threshold', 'Morph Open', 'Sure BG', 'Sure FG', 'Unknown', 'Markers', 'Watershed']:
        if step == 'Original':
            frame = image.copy()
        elif step == 'Threshold':
            frame = cv2.cvtColor(thresh, cv2.COLOR_GRAY2BGR)
        elif step == 'Morph Open':
            frame = cv2.cvtColor(opening, cv2.COLOR_GRAY2BGR)
        elif step == 'Sure BG':
            frame = cv2.cvtColor(sure_bg, cv2.COLOR_GRAY2BGR)
        elif step == 'Sure FG':
            frame = cv2.cvtColor(sure_fg, cv2.COLOR_GRAY2BGR)
        elif step == 'Unknown':
            frame = cv2.cvtColor(unknown, cv2.COLOR_GRAY2BGR)
        elif step == 'Markers':
            frame = np.zeros_like(image)
            for i in range(1, ret + 1):
                frame[markers == i] = np.random.randint(0, 255, size=3)
        elif step == 'Watershed':
            frame = image.copy()
        
        frame_path = f"{step.lower().replace(' ', '_')}.png"
        plot_image(frame, step, frame_path)
        frames.append(imageio.imread(frame_path))
    
    return frames

# Main execution
image_path = 'D:\code\src\code\R-C.png'  # Replace with your image path
frames = watershed_segmentation(image_path)
save_gif(frames, 'watershed.gif', duration=1000)

参考链接

OpenCV(26)图像分割 -- 距离变换与分水岭算法(硬币检测、扑克牌检测、车道检测)_分水岭算法分割咖啡豆-CSDN博客

图像处理之漫水填充算法(flood fill algorithm)-腾讯云开发者社区-腾讯云 (tencent.com)

【OpenCV(C++)】分水岭算法_opencv分水岭c++-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/669824.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

seaborn和matplotlib显示两条曲线图例

总结,添加label和plt.legend,以下由chatgpt生成 在使用 Seaborn 的 kdeplot(核密度估计图)时,显示图例也是一个常见需求,尤其是当你想比较多个不同分布的数据时。下面我将提供一个示例,说明如何…

实战还原AI驱动的网络攻击:如何构建SecOps智能自动化防线

随着AI技术的迅猛发展,网络攻击手段日益多样化和高度自动化,给企业和个人带来了巨大网络安全挑战。在此背景下,为企业提供全面高效安全保障的Fortinet SecOps解决方案应运而生。在Fortinet 2024网安攻防“Demo季”第二期直播中,Fo…

【GD32】从零开始学GD32单片机高级篇——SDIO外设详解(GD32F470ZGT6)

目录 简介总线拓扑总线操作“无响应” 和 “无数据” 操作多块读写操作数据流读写操作 总线协议命令响应R1/R1b (普通命令响应)R2 (CID, CSD 寄存器)R3 (OCR 寄存器)R4 (Fast IO)R4b(Fast IO)R5 (中断请求)R5b(中断请求)R6 (发布的…

代码随想录算法训练营第36期DAY46

DAY46 完全背包 在闫氏DP法里学过:第i个物品选k个,纸质直至不能选,k从0开始取。就有递推式了。 代码随想录的视频也看了。 518零钱兑换ii 注意与 目标和 那题区分开。 完全背包问题,正向遍历背包容量,就能实现“多次…

【项目经理】什么是领导

引言:        项目管理是一个不断发展的领域,它要求项目经理不断学习、适应和创新。通过本系列文章,我们希望能够帮助每一位项目经理提升自己的专业能力,成为引领项目成功的舵手。 持续更新。。。。。。。。。。。。。。。…

Pycharm使用时的红色波浪线报错——形如‘break‘ outside loop

背景: 我在一个方法中,写了一个if判断,写了一个break,期望终止这个函数,编辑器出现报错 形如下图 视频版问题教程: Pycharm下出现波浪线报错,形如break outside loop 过程: 很奇…

echarts 图表不显示的问题

是这样的,点击详情,再点击统计,切换的时候就不会显示echarts图表,刚开始使用的是next Tick,没有使用定时器,后来加上了定时器就实现了如下所示: 代码是如下 const chartContainer ref(null); …

线程思维导图

列出线程所有知识的框架结构,帮助理解线程相关知识,有更好的知识体系 Java相关进阶知识 多线程相关知识,超详细,易懂

NextJs 渲染篇 - 什么是CSR、SSR、SSG、ISR 和服务端/客户端组件

NextJs 渲染篇 - 什么是CSR、SSR、SSG、ISR 和服务端/客户端组件 前言一. 什么是CSR、SSR、SSG、ISR1.1 CSR 客户端渲染1.2 SSR 服务端渲染1.3 SSG 静态站点生成① 没有数据请求的页面② 页面内容需要请求数据③ 页面路径需要获取数据 1.4 ISR 增量静态再生1.5 四种渲染方式的对…

案例实践 | 基于长安链的首钢供应链金融科技服务平台

案例名称-首钢供应链金融科技服务平台 ■ 建设单位 首惠产业金融服务集团有限公司 ■ 用户群体 核心企业、资金方(多为银行)等合作方 ■ 应用成效 三大业务场景,共计关联29个业务节点,覆盖京票项目全部关键业务 案例背景…

CSS选择器的常见用法

大家好,本期博客整理了前端语言 CSS 中选择器的入门级常见用法,希望能对大家有所帮助 CSS 选择器的主要功能就是选中⻚⾯指定的标签元素,选中了元素,才可以设置元素的属性。 那么,css选择器有哪几种呢? 以…

win10修改conda环境和缓存默认路径

win10修改conda环境和缓存默认路径 conda环境和缓存的默认路径(envs directories 和 package cache)不一定要默认存储在用户目录,我们可以将他们设置到盈余空间稍大的其他目录来缓解这种空间压力,只要保证不同用户之间的设置不同…

OrangePi AIpro 变身 Android 打包机

主板基本信息介绍 OrangePi AIpro,是香橙派联合华为精心打造,建设人工智能新生态而设计的一款开发板,这次为大家分享下我上手的这款 OrangePi AIpro 8GB(算力达8TOPS) 的一些小小的经验。 基本参数如下: …

【权威出版】2024年新媒体、网络与电子商务国际会议(NMNE 2024)

2024年新媒体、网络与电子商务国际会议 2024 International Conference on New Media, Networking, and E-commerce 【1】会议简介 2024年新媒体、网络与电子商务国际会议即将召开,这是一次集结全球新媒体、网络与电子商务领域精英的学术盛会。 本次会议将深…

Vue3实战笔记(57)—一键换肤:在Vuetify中打造个性化主题切换体验

文章目录 前言一键换肤总结 前言 在当今追求极致用户体验的时代,为应用程序提供个性化的主题切换功能已经成为提升用户满意度和留存率的关键因素之一。Vuetify,作为基于Vue.js的流行前端框架,以其丰富的组件库和高度可定制性,为开…

牛客网刷题 | BC104 翻转金字塔图案

目前主要分为三个专栏,后续还会添加: 专栏如下: C语言刷题解析 C语言系列文章 我的成长经历 感谢阅读! 初来乍到,如有错误请指出,感谢! 描述 KiKi学习了循环&am…

Hadoop+Spark大数据技术 第七次作业

第七次作业 1. 简述Spark SQL使用的数据抽象DataFrame与Dataset的区别。 DataFrame: 基于 Row 对象的二维表格结构,类似于关系型数据库中的表。 行和列都有明确的 Schema(模式),可以进行类型推断。 提供了丰富的操作接口&#xff…

打开C语言常用的内存函数大门(三) —— memset()函数(内含讲解用法和模拟实现)

文章目录 1. 前言2. memset函数2.1 memset函数原型2.2 memset函数参数的介绍2.3 memset函数的使用演示 3. memset函数的模拟实现4. 总结 1. 前言 哈喽,我们又见面了。通过前面两个内存函数(memcpy、memmove函数)讲解的锤炼后,对如何解析一个自己从来没有…

9. C++通过epoll+fork的方式实现高性能网络服务器

epollfork 实现高性能网络服务器 一般在服务器上,CPU是多核的,上述epoll实现方式只使用了其中的一个核,造成了资源的大量浪费。因此我们可以将epoll和fork结合来实现更高性能的网络服务器。 创建子进程函数–fork( ) 要了解线程我们先来了解…

Linux input输入子系统

Linux input 更多内容可以查看我的github Linux输入子系统框架 Linux输入子系统由驱动层、核心层、事件处理层三部分组成。 驱动层:输入设备的具体驱动程序,负责与具体的硬件设备进行交互,并将底层的硬件输入转化为统一的事件形式&#xff…