imgaug库指南(六):从入门到精通的【图像增强】之旅

引言

在深度学习和计算机视觉的世界里,数据是模型训练的基石,其质量与数量直接影响着模型的性能。然而,获取大量高质量的标注数据往往需要耗费大量的时间和资源。正因如此,数据增强技术应运而生,成为了解决这一问题的关键所在。而imgaug,作为一个功能强大的图像增强库,为我们提供了简便且高效的方法来扩充数据集。本系列博客将带您深入了解如何运用imgaug进行图像增强,助您在深度学习的道路上更进一步。我们将从基础概念讲起,逐步引导您掌握各种变换方法,以及如何根据实际需求定制变换序列。让我们一起深入了解这个强大的工具,探索更多可能性,共同推动深度学习的发展。


前期回顾

链接主要内容
imgaug库指南(一):从入门到精通的【图像增强】之旅介绍了imgaug库的主要功能、安装方式、提供一个简单的数据增强示例(针对一副图像)
imgaug库指南(二):从入门到精通的【图像增强】之旅介绍了如何利用imgaug库对批量图像进行数据增强并可视化
imgaug库指南(三):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 高斯模糊
imgaug库指南(四):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 均值模糊
imgaug库指南(五):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 中值模糊/滤波,并介绍了如何利用【中值滤波】过滤椒盐噪声

在本博客中,我们将向您详细介绍imgaug库的数据增强方法 —— 双边模糊/滤波


双边模糊/滤波(BilateralBlur)

功能介绍

iaa.BilateralBlurimgaug库中的一个方法,用于对图像进行双边模糊。双边模糊是一种特殊的模糊技术,它在模糊图像的同时考虑了像素的空间信息和灰度值信息。这意味着双边模糊可以更好地保护图像的边缘和细节,同时去除噪声。

语法

import imgaug.augmenters as iaa
aug = iaa.BilateralBlur(
    d=(3, 10), sigma_color=(10, 250), sigma_space=(10, 250))
  • d: 滤波过程中每个像素邻域的直径;

    • d为整数,则每个像素邻域的直径为d;
    • d为包含两个整数的元组 (a, b),直径将从 [a…b] 区间中随机采样;
  • sigma_space: 控制模糊程度的空间标准差。较大的值会导致更强的模糊效果。

    • sigma_space为整数,则空间标准差为sigma_space
    • sigma_space为包含两个整数的元组 (a, b),空间标准差将从 [a…b] 区间中随机采样;
  • sigma_color: 控制模糊程度的颜色标准差。较大的值会导致更强的模糊效果。

    • sigma_color为整数,则空间标准差为sigma_color
    • sigma_color为包含两个整数的元组 (a, b),空间标准差将从 [a…b] 区间中随机采样;

示例代码

  1. 使用不同标准差参数
import cv2
import imgaug.augmenters as iaa
import matplotlib.pyplot as plt

# 读取图像
img_path = r"D:\python_project\lena.png"
img = cv2.imread(img_path)
image = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)


# 创建双边模糊增强器
aug1 = iaa.BilateralBlur(d=7, sigma_color=50, sigma_space=50)
aug2 = iaa.BilateralBlur(d=7, sigma_color=150, sigma_space=150)
aug3 = iaa.BilateralBlur(d=7, sigma_color=200, sigma_space=200)


# 对图像进行双边模糊处理
blurred_image1 = aug1(image=image)
blurred_image2 = aug2(image=image)
blurred_image3 = aug3(image=image)

# 展示原始图像和模糊后的图像
fig, axes = plt.subplots(2, 2, figsize=(10, 10))
axes[0][0].imshow(image)
axes[0][0].set_title("Original Image")
axes[0][1].imshow(blurred_image1)
axes[0][1].set_title("Blurred Image1")
axes[1][0].imshow(blurred_image2)
axes[1][0].set_title("Blurred Image2")
axes[1][1].imshow(blurred_image3)
axes[1][1].set_title("Blurred Image3")
plt.show()

运行结果如下:

图1 原图及中值模糊/滤波结果可视化

注意事项:

  1. 性能考虑:双边模糊是一种相对较耗时的操作。因此,在处理大图像或视频时,需要考虑到计算资源的需求。
  2. 结果的可重复性:由于双边模糊是非线性操作,每次应用可能会产生稍微不同的结果。如果你需要结果的可重复性,可以使用aug.to_deterministic()方法将增强器转换为确定性状态。

总结

iaa.BilateralBlurimgaug库中的一个非常有用的数据增强方法。它是一种非线性的滤波方法,结合了图像的空间邻近度和像素值相似度,旨在达到保边去噪的目的。双边滤波器的好处是可以做边缘保存,它能够有效地将影像上的噪声去除,同时保存影像上的边缘信息。具体来说,双边滤波器在平滑图像的同时,能更好地保留图像中的边缘信息,对于高频细节的保护效果也优于传统的滤波器。然而,双边滤波器对于彩色图像里的高频噪声的处理效果并不理想,可能会保留过多的高频信息。


小结

imgaug是一个强大的图像增强库,它可以帮助你创建出丰富多样的训练数据,从而改进你的深度学习模型的性能。通过定制变换序列和参数,你可以轻松地适应各种应用场景,从计算机视觉到医学影像分析。随着深度学习的发展,imgaug在未来将继续发挥重要作用。因此,将imgaug纳入你的数据增强工具箱是一个明智的选择。

参考链接


结尾

亲爱的读者,首先感谢抽出宝贵的时间来阅读我们的博客。我们真诚地欢迎您留下评论和意见,因为这对我们来说意义非凡。
俗话说,当局者迷,旁观者清。的客观视角对于我们发现博文的不足、提升内容质量起着不可替代的作用。
如果您觉得我们的博文给您带来了启发,那么,希望能为我们点个免费的赞/关注您的支持和鼓励是我们持续创作的动力
请放心,我们会持续努力创作,并不断优化博文质量,只为给带来更佳的阅读体验。
再次感谢的阅读,愿我们共同成长,共享智慧的果实!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/298344.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Open CASCADE学习|基于visual studio 2022编译源码

目录 1、简介 2、下载 2.1下载visual studio 2022 community 2.2下载下载cmake工具 2.3下载源码 2.4下载第三方插件 3、安装 3.1安装visual studio 2022 community 3.2安装cmake 4、编译源码 5、测试 1、简介 Open CASCADE(简称…

DrGraph原理示教 - OpenCV 4 功能 - 直方图

OpenCV直方图是一种可以对整幅图的灰度分布进行整体了解的图示。它是带有像素值(从0到255,不总是)的图在X轴上,在y轴上的图像对应的像素个数。通过观察图像的直方图,我们可以直观的了解图像的对比度、亮度、亮度分布等…

Qt——TCP UDP网络编程

目录 前言正文一、TCP二、UDP1、基本流程2、必备知识 三、代码层级1、UDP服务端 END、总结的知识与问题1、如何获取QByteArray中某一字节的数据,并将其转为十进制?2、如何以本年本月本日为基础,获取时间戳,而不以1970为基础&#…

MySQL之数据类型建表以及约束

SELECT(查询) 查询操作用于从数据库中检索数据 查询可以基于不同的条件,如字段值、范围、排序等 查询结果可以返回单个记录或多个记录 查询指定列 select 列名 from 表名 列名:代表从指定的列名中查找 , 如果是查找对应的多列,则用英文…

Linux部署Yearning并结合内网穿透工具实现公网访问本地web管理界面

文章目录 前言1. Linux 部署Yearning2. 本地访问Yearning3. Linux 安装cpolar4. 配置Yearning公网访问地址5. 公网远程访问Yearning管理界面6. 固定Yearning公网地址 前言 Yearning 简单, 高效的MYSQL 审计平台 一款MYSQL SQL语句/查询审计工具,为DBA与开发人员使用…

Ps 滤镜:高反差保留

Ps菜单:滤镜/其它/高反差保留 Filter/Others/High Pass 高反差保留 High Pass滤镜常用于锐化、保护纹理、提取线条等图像编辑工作流程中。它的工作原理是:只保留显示图像中的高频信息(即图像中的细节和边缘区域),而图像…

MongoDB索引详解

概述 索引是一种用来快速查询数据的数据结构。BTree 就是一种常用的数据库索引数据结构,MongoDB 采用 BTree 做索引,索引创建 colletions 上。MongoDB 不使用索引的查询,先扫描所有的文档,再匹配符合条件的文档。使用索引的查询&…

【数据结构】二叉树的概念及堆

前言 我们已经学过了顺序表、链表、栈和队列这些属于线性结构的数据结构,那么下面我们就要学习我们第一个非线性结构,非线性结构又有哪些值得我们使用的呢?那么接下来我们就将谈谈树的概念了。 1.树的概念与结构 1.1树的概念 树是一种非线性…

Microsoft edge@常见问题@由组织管理@策略组@版本问题

文章目录 本地edge浏览器由组织管理功能受限检查例:侧边栏功能被禁用解出限制(删除相关注册表条目)解除限制检查refs 页面加载问题this page having a problem 禁止edge更新refs 版本回滚 本地edge浏览器由组织管理功能受限检查 浏览器输入edge://management/检查通过修改注册表…

【数据仓库与联机分析处理】多维数据模型

目录 一、数据立方体 二、数据模型 (一)星形模型 (二)雪花模式 (三)事实星座模式 三、多维数据模型中的OLAP操作 (一)下钻 (二)上卷 (三…

宏电股份5G RedCap终端产品助力深圳极速先锋城市建设

12月26日,“全城全网,先锋物联”深圳移动5G-A RedCap助力深圳极速先锋城市创新发布会举行,宏电股份携一系列5G RedCap终端产品应邀参与创新发布会,来自全国5G生态圈的各界嘉宾、专家学者济济一堂,共探信息化数字化创新…

mysql之视图mysql连接案例索引

文章目录 一、视图1.1 含义1.2 操作1.2.1 创建视图1.2.2 视图的修改1.2.3 删除视图1.2.4 查看视图 二、连接案例01)查询" 01 "课程比" 02 "课程成绩高的学生的信息及课程分数02)查询同时存在" 01 "课程和" 02 "课程的情况03&#xff0…

ios 裁剪拼装图片

//1.获取图片UIImage *image [UIImage imageNamed:"123.jpg"];//处理图片//2.获取图片的长度long length image.size.width/4;//3.图片顶点索引long indices[] {length * 2,length,//右 right0,length,//左 leftlength,0,//上 toplength,length * 2,//底 bottomle…

Rustdesk打开Win10 下客户端下面服务不会自启,显示服务未运行

环境: Rustdesk1.19 问题描述: Rustdesk打开Win10 下客户端下面服务不会自启,显示服务未运行 解决方案: 1.查看源代码 pub async fn start_all() {crate::hbbs_http::sync::start();let mut nat_tested = false;check_zombie()

SwinTransformer

patch embedding (b,3,224,224)->(b,N,96) N:patch数量 为每个stage中的每个Swin Transformer block设置drop_rate,根据设置[2,2,6,2],每个Swin Transformer block的drop_path为0~0.1等间距采样的12个小数,参数0.1也可以更改。还有个drop参…

网络安全红队常用的攻击方法及路径

一、信息收集 收集的内容包括目标系统的组织架构、IT资产、敏感信息泄露、供应商信息等各个方面,通过对收集的信息进行梳理,定位到安全薄弱点,从而实施下一步的攻击行为。 域名收集 1.备案查询 天眼查爱企查官方ICP备案查询 通过以上三个…

数据矩阵集成可提高印刷电路板识别的准确性

在复杂的印刷电路板 (PCB) 世界中,准确的电路板元件识别对于简化故障排除至关重要。它确保电子设备高效运行。 本文将探讨数据矩阵码在提高 PCB 零件识别效率方面的作用。数据矩阵码提供了一种简单的解决方案来编码和解码与 PCB 组件相关的信息,在简化识…

安卓Android Studioy读写NXP ICODE2 15693标签源码

本示例使用的发卡器&#xff1a;https://item.taobao.com/item.htm?spma1z10.5-c-s.w4002-21818769070.11.4391789eCLwm3t&id615391857885 <?xml version"1.0" encoding"utf-8"?> <androidx.constraintlayout.widget.ConstraintLayout xm…

『C++成长记』日期类的实现

&#x1f525;博客主页&#xff1a;小王又困了 &#x1f4da;系列专栏&#xff1a;C &#x1f31f;人之为学&#xff0c;不日近则日退 ❤️感谢大家点赞&#x1f44d;收藏⭐评论✍️ 目录 一、日期类的实现 &#x1f4d2;1.1日期类功能 &#x1f4d2;1.2拷贝日期 &#…

C++面试宝典第13题:计算餐厅账单

题目 假如你是一家餐厅的收银员,需要编写一个程序来计算顾客的账单。程序应该能够接受顾客点的菜品和数量,并根据菜品的单价计算出总价。另外,程序还应该能够处理折扣和优惠券,并输出最终的账单金额。 解析 这道题主要考察应聘者使用面向对象的设计方法来解决实际问题的能力…