OpenCV中的图像处理3.11(10) OpenCV中的图像变换

目录

  • 3.11 OpenCV中的图像变换
    • 3.11.1 傅里叶变换
      • 目标
      • 理论
      • Numpy中的傅里叶变换
      • OpenCV中的傅立叶变换
      • DFT的性能优化
      • 为什么Laplacian是一个高通滤波器?
      • 其他资源

翻译及二次校对:cvtutorials.com

编辑者:廿瓶鲸(和鲸社区Siby团队成员)

3.11 OpenCV中的图像变换

3.11.1 傅里叶变换

目标

在本节中,我们将学习:

  • 使用OpenCV找到图像的傅里叶变换
  • 利用Numpy中的FFT函数
  • 傅立叶变换的一些应用
  • 我们将看到以下函数:cv.dft(), cv.idft()等。

理论

傅里叶变换被用来分析各种过滤器的频率特性。对于图像,二维离散傅里叶变换(DFT)被用来寻找频域。一种叫做快速傅里叶变换(FFT)的快速算法被用来计算DFT。关于这些的细节可以在任何图像处理或信号处理教科书中找到。请看其他资源部分。

对于一个正弦信号,x(t)=Asin(2πft),我们可以说f是信号的频率,如果取其频域,我们可以在f处看到一个尖峰。如果信号被采样形成离散信号,我们得到相同的频域,但在[-π,π]或[0,2π]范围内是周期性的(或者对于N点DFT来说是[0,N])。你可以把图像看作是一个在两个方向上被采样的信号。因此,在X和Y两个方向上进行傅里叶变换,就可以得到图像的频率表示。

更直观地说,对于正弦信号,如果振幅在短时间内变化得很快,你可以说它是一个高频信号。如果它变化缓慢,它就是一个低频信号。你可以把同样的想法延伸到图像上。在图像中,哪里的振幅变化剧烈?在边缘点,或噪音。所以我们可以说,边缘和噪音是图像中的高频内容。如果振幅没有太大的变化,那就是低频成分。(一些链接被添加到附加资源中,它用例子直观地解释了频率变换)。

现在我们来看看如何找到傅里叶变换。

Numpy中的傅里叶变换

首先我们将看到如何使用Numpy找到傅立叶变换。np.fft.ft2()为我们提供了频率变换,它将是一个复数。它的第一个参数是输入图像,它是灰度的。第二个参数是可选的,决定输出数组的大小。如果它大于输入图像的大小,在计算FFT之前,输入图像将被填充零。如果它小于输入图像,输入图像将被裁剪。如果没有传递参数,输出数组的大小将与输入相同。

现在一旦你得到结果,零频率分量(直流分量)将在左上角。如果你想把它带到中心,你需要把结果在两个方向上移位N/2。这可以通过函数np.fft.fftshift()简单地完成。(它更容易分析)。一旦你找到了频率变换,你就可以找到幅值谱了。

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img = cv.imread('messi5.jpg',0)
f = np.fft.fft2(img)
fshift = np.fft.fftshift(f)
magnitude_spectrum = 20*np.log(np.abs(fshift))
plt.subplot(121),plt.imshow(img, cmap = 'gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(magnitude_spectrum, cmap = 'gray')
plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])
plt.show()

结果如下:

Image Name

看,你可以看到中心的白色区域更多,显示出低频内容更多。

所以你找到了频率变换 现在你可以在频域做一些操作,比如高通滤波和重建图像,即找到反DFT。为此,你只需用一个大小为60x60的矩形窗口进行遮蔽,以去除低频。然后用np.fft.ifftshift()进行反移位,使直流成分再次出现在左上角。然后使用np.ifft2()函数找到反FFT。其结果也是一个复数。你可以取其绝对值。

rows, cols = img.shape
crow,ccol = rows//2 , cols//2
fshift[crow-30:crow+31, ccol-30:ccol+31] = 0
f_ishift = np.fft.ifftshift(fshift)
img_back = np.fft.ifft2(f_ishift)
img_back = np.real(img_back)
plt.subplot(131),plt.imshow(img, cmap = 'gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(132),plt.imshow(img_back, cmap = 'gray')
plt.title('Image after HPF'), plt.xticks([]), plt.yticks([])
plt.subplot(133),plt.imshow(img_back)
plt.title('Result in JET'), plt.xticks([]), plt.yticks([])
plt.show()

结果如下:

Image Name

结果显示高通滤波是一种边缘检测操作。这就是我们在图像梯度一章中看到的情况。这也表明大部分的图像数据存在于频谱的低频区域。总之我们已经看到了如何在Numpy中找到DFT、IDFT等。现在让我们看看如何在OpenCV中实现。

如果你仔细观察结果,特别是最后一张JET颜色的图像,你可以看到一些伪影(其中一个例子我已经用红色箭头标出)。它显示了一些类似波纹的结构,这被称为振铃效应。这是由我们用于遮蔽的矩形窗口造成的。这个掩膜被转换为sinc形状,导致了这个问题。所以矩形窗口不能用于滤波。更好的选择是高斯窗口。

OpenCV中的傅立叶变换

OpenCV为此提供了cv.dft()和cv.idft()函数。它返回的结果与前面的相同,但有两个通道。第一个通道将有结果的实部,第二个通道将有结果的虚部。输入的图像应该首先被转换为np.float32。我们将看到如何做到这一点。

import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt
img = cv.imread('messi5.jpg',0)
dft = cv.dft(np.float32(img),flags = cv.DFT_COMPLEX_OUTPUT)
dft_shift = np.fft.fftshift(dft)
magnitude_spectrum = 20*np.log(cv.magnitude(dft_shift[:,:,0],dft_shift[:,:,1]))
plt.subplot(121),plt.imshow(img, cmap = 'gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(magnitude_spectrum, cmap = 'gray')
plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])
plt.show()

注意:你也可以使用cv.cartToPolar(),它可以一次性返回幅值和相位。

所以,现在我们要做反DFT。在上一节课中,我们创建了一个HPF,这次我们将看到如何去除图像中的高频内容,即我们对图像应用LPF。它实际上模糊了图像。为此,我们首先创建一个掩膜,在低频处用高值(1),即我们通过低频内容,而在高频区域用0。

rows, cols = img.shape
crow,ccol = rows/2 , cols/2
# create a mask first, center square is 1, remaining all zeros
mask = np.zeros((rows,cols,2),np.uint8)
mask[crow-30:crow+30, ccol-30:ccol+30] = 1
# apply mask and inverse DFT
fshift = dft_shift*mask
f_ishift = np.fft.ifftshift(fshift)
img_back = cv.idft(f_ishift)
img_back = cv.magnitude(img_back[:,:,0],img_back[:,:,1])
plt.subplot(121),plt.imshow(img, cmap = 'gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(img_back, cmap = 'gray')
plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])
plt.show()

结果如下:

Image Name

注意事项:像往常一样,OpenCV函数cv.dft()和cv.idft()比Numpy的对应函数要快。但Numpy函数更方便用户使用。关于性能问题的更多细节,请看下面的章节。

DFT的性能优化

DFT计算的性能对于某些数组大小来说是比较好的。当数组大小为2的幂时,它是最快的。对于那些大小为2、3、5的乘积的数组,处理起来也相当有效。因此,如果你担心你的代码的性能,你可以在寻找DFT之前将数组的大小修改为任何最佳大小(通过填充零)。对于OpenCV,你必须手动填充零。但是对于Numpy来说,你指定FFT计算的新大小,它就会自动为你填充零。

那么我们如何找到这个最佳尺寸呢?OpenCV为此提供了一个函数,cv.getOptimalDFTSize()。它同时适用于cv.dft()和np.fft.fft2()。让我们用IPython的神奇命令timeit来检查它们的性能。

In [16]: img = cv.imread('messi5.jpg',0)
In [17]: rows,cols = img.shape
In [18]: print("{} {}".format(rows,cols))
342 548
In [19]: nrows = cv.getOptimalDFTSize(rows)
In [20]: ncols = cv.getOptimalDFTSize(cols)
In [21]: print("{} {}".format(nrows,ncols))
360 576

看,大小(342,548)被修改为(360, 576)。现在让我们用零来填充它(对于OpenCV来说),并找到它们的DFT计算性能。你可以通过创建一个新的零数组并将数据复制到其中,或者使用cv.copyMakeBorder()来完成。

nimg = np.zeros((nrows,ncols))
nimg[:rows,:cols] = img

或者:

right = ncols - cols
bottom = nrows - rows
bordertype = cv.BORDER_CONSTANT #just to avoid line breakup in PDF file
nimg = cv.copyMakeBorder(img,0,bottom,0,right,bordertype, value = 0)

现在我们计算一下Numpy函数的DFT性能比较。

In [22]: %timeit fft1 = np.fft.fft2(img)
10 loops, best of 3: 40.9 ms per loop
In [23]: %timeit fft2 = np.fft.fft2(img,[nrows,ncols])
100 loops, best of 3: 10.4 ms per loop

它显示了4倍的速度提升。现在,我们将用OpenCV函数进行同样的尝试。

In [24]: %timeit dft1= cv.dft(np.float32(img),flags=cv.DFT_COMPLEX_OUTPUT)
100 loops, best of 3: 13.5 ms per loop
In [27]: %timeit dft2= cv.dft(np.float32(nimg),flags=cv.DFT_COMPLEX_OUTPUT)
100 loops, best of 3: 3.11 ms per loop

它还显示了4倍的速度。你还可以看到OpenCV函数比Numpy函数快3倍左右。这也可以用于反FFT的测试,而这也是留给你的一个练习。

为什么Laplacian是一个高通滤波器?

在一个论坛上也有一个类似的问题。问题是,为什么Laplacian是高通滤波器?为什么Sobel是高通滤波器?而给出的第一个答案是傅里叶变换。就拿拉普拉斯的傅里叶变换来说吧,它的FFT大小较高。对它进行分析。

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
# simple averaging filter without scaling parameter
mean_filter = np.ones((3,3))
# creating a gaussian filter
x = cv.getGaussianKernel(5,10)
gaussian = x*x.T
# different edge detecting filters
# scharr in x-direction
…mag_spectrum = [np.log(np.abs(z)+1) for z in fft_shift]
for i in range(6):
    plt.subplot(2,3,i+1),plt.imshow(mag_spectrum[i],cmap = 'gray')
    plt.title(filter_name[i]), plt.xticks([]), plt.yticks([])
plt.show()

结果:

Image Name

从图像中,你可以看到每个核阻挡了什么频率区域,以及它通过什么区域。根据这些信息,我们可以说为什么每个核是HPF或LPF。

其他资源

  • Steven Lehar对傅里叶理论的直观解释
  • HIPR的傅里叶变换
  • 在图像方面,频域表示什么?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/28265.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux中的用户和组的分类

目录 Linux中的用户和组的分类 用户分类 超级用户 系统用户 普通用户 组的分类 基本组(私有组) 附加组(公有组) 系统组 Linux中用户和用户组的配置文件 在Linux中,用户账号、密码、用户组信息和用户组密码均…

KEGG注释:KEGG富集可视化柱状图

很久很久以前,看到过文章中的KEGG富集可视化结果图。是对KEGG通路进行注释的。后来在一些测序公司的宣传页上也见到过类似的图: image.png image.png 其实这个图就是多了一个KEGG通路注释,近期也有小伙伴寻求怎么做。网上很多在线工具可以完…

Windows/Linux搭建Stable Diffusion WebUI

什么是Stable Diffusion WebUI?能用来干嘛? Stable Diffusion WebUI(以下简称SD)是一个基于Gradio库的Stable Diffusion的浏览器界面,可以方便地配置和生成AI绘画作品,并且进行各种精细地配置。Stable Dif…

今天面试招了个23K的人,从腾讯出来的果然都有两把刷子···

公司前段时间缺人,也面了不少测试,前面一开始瞄准的就是中级的水准,也没指望来大牛,提供的薪资在15-25k,面试的人很多,但平均水平很让人失望。看简历很多都是4年工作经验,但面试中,不…

微信小程序实现一个文字展开收起功能

1.0 需求背景 需求很常见,就是当一行文字过多时,显示省略号,然后显示展开两个字,点击,文字完全展示开,点击收起,回到省略形式,如下图 2.0 需求分析 有了上图,应该能更好…

总结排查服务器上传下载慢的几种手段与查看服务器带宽的具体方法

一、排查服务器上传下载 最近出现的一个情况,服务器上传和下载比较慢,因此我排查了种种手段,特此记录下几种常见的手段。 1、使用speedtest-cli 测试网速: 该方法是测试网速的速度怎么样,看看是否真的慢? …

软考A计划-2023系统架构师-知识点集锦(4/4)

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例点击跳转>软考全系列 👉关于作者 专注于Android/Unity和各种游戏开发技巧&#xff…

Spring Security--自动登录

也就是remember me 在配置链上加一个 然后发送请求时加上:remember-me字段 value值可以为,ture,1,on 我们记住登录后,关掉浏览器再打开,访问一下接口,可以访问,说明记住登录成功了。 因为有的…

JavaScript:从入门到精通:初始JS

JS基本思想 1. 浏览器对 JS 支持2. JS程序的组成3. JS 开发工具 1. 浏览器对 JS 支持 🧡背景 1997年 微软和网景公司合作发布了 ECMAScript 的语言规范 从那时起,微软所有浏览器都支持ECMAScript 标准 1999年,ECMAScript 第三版,…

mybatis-plus用法(二)

(5条消息) mybatis-plus用法(一)_渣娃工程师的博客-CSDN博客 AR模式 ActiveRecord模式,通过操作实体对象,直接操作数据库表。与ORM有点类似。 示例如下 让实体类User继承自Model package com.example.mp.po; import com.bao…

【026】C++的内联函数、函数重载、函数的默认参数与占位参数

C的内联函数、函数重载、函数的默认参数与占位参数 引言一、内联函数1.1、声明内联函数1.2、宏函数和内联函数的区别1.3、内联函数的注意事项 二、函数重载2.1、函数重载的概述2.2、函数重载的条件2.3、函数重载的底层实现原理 三、函数的默认参数四、占位参数五、extern "…

量化投资 现代投资组合理论(MPT)

量化投资 现代投资组合理论(MPT) 问题:构建投资组合,达到目标收益率的同时拥有最小的 risk exposure. 有 J J J 个可交易证券,期望收益率为 R [ R 1 , ⋯ , R j ] T R[R_1,\,\cdots,\,R_j]^T R[R1​,⋯,Rj​]T&…

监控、审计和运行时安全

监控、审计和运行时安全 目录 文章目录 监控、审计和运行时安全目录1、分析容器系统调用:SysdigSysdig介绍安装sysdigsysdig常用参数sysdig常用命令Chisels(实用的工具箱)其它命令 2、监控容器运行时:FalcoFalco介绍Falco架构安装falco自定义扩展规则文件…

千万级入口服务[Gateway]框架设计(一)

本文将以技术调研模式编写,非技术同学可跳过。 文章目录 背景问题[不涉及具体业务]目标技术选型语言框架模式实现一:go 原生组件Demo 实现Benchwork 基准性能小结实现二:开源 go-plugin 附录入口服务演变 背景 在历史架构的迭代中&#xff…

Apache Kafka学习

目录 一、简介 1.概念: 2.kafka四大API: 3.Kafka消费模式 4.Kafka的基础架构 5.kafka文件存储方式 二、特性 三、优点 1.解耦 2.异步处理 3.流量削峰 4.数据持久化 5.顺序保证 6.可恢复性 四、名词解释 五、QA Q:如何保证数据高可靠、不…

从美颜算法到AI美颜SDK:美丽的背后隐藏着什么?

在年轻人的生活中,通过美颜SDK类型的美颜工具进行拍摄已经成为了一种全新的文化现象。时下,AI美颜、美颜SDK讨论热点极高,那么大家知道美颜算法和AI美颜到底有什么不同吗?它们背后隐藏着什么样的技术和思想? 一、美颜算…

在Windows11平台安装JDK11(双11)

目录 引言一、安装前说明1.系统要求2.多版本安装 二、JDK11安装三、安装成功验证1.验证2.Path环境变量 总结 引言 本文主要是详细讲解在 Windows 11 系统上安装 JDK 11,安装时有一些注意事项需要说明。与 JDK 8 的安装过程有少许不一样。 一、安装前说明 1.系统要…

Atair 柱状比例图

如何熟练掌握可视化库和应对使用过程的疑难问题? 基本用法不妨访问 GeeksforGeeks 疑难问题优先搜索 https://stackoverflow.com 尽量使用官方文档: numpy的学习访问 https://numpy.org/doc/stable/user/index.html 例如: 一则 altair 使用过…

小程序中半屏打开其他小程序,开发者工具调试半屏

前言: 有需要是在当前小程序中,点击操作时,如果他没有注册会员,则强制去另一个小程序去注册会员,注册成功在返回,在这期间,打开另一个小程序是半屏来展示的。 实现效果: 在a小程序中…

阿里4年测试经验分享 —— 测试外包干了3年后,我废了...

去年国庆,我分享了一次一位阿里朋友的技术生涯,大家反响爆蓬,感觉十分有意思,今天我来分享一下我另一位朋友的真实经历,是不是很想听? 没错,我这位朋友是曾经外包公司的测试开发,而…