目录
什么是几何变换?
为什么要对图像进行几何变换?
2.1 仿射变换(二维)
2.2 投影变换(三维)
2.3 极坐标变换
2.3.1 将笛卡尔坐标转化为极坐标
2.3.2 将极坐标转换为笛卡尔坐标
2.3.3 利用极坐标变换对图像进行变换
几何变换:放大、缩小、旋转等,改变空间位置。
完成几何变换需要两个独立的算法:1.实现空间坐标转换(像素如何从初始位置移动到终止位置),2.插值算法(完成输出图像每个像素值的灰度值)
什么是几何变换?
将一组图像数据经过某种数学运算,映射成另外一组图像数据的操作,主要包括放大、缩小、旋转等。
为什么要对图像进行几何变换?
几何变换可以在一定程度上的消除图像由于角度、透视关系、拍摄等原因造成的几何失真。几何变换处理是深度学习中数据增强的一种常用手段,是进行图像识别前的数据预处理工作内容。比如,在车牌识别过程中,并不能保证被检测的物体在图像的相同位置和方向,所以我们首先要解决的就是被检测物体的位置和方向。
2.1 仿射变换(二维)
平移、放大和缩小、旋转、插值算法。
像素的三维矩阵:宽度,高度和颜色通道
缩放:OpenCV提供了resize()函数来实现这种目的。使用resize()函数需要注意两点:(1)指定的目标大小必须为整数;(2)指定目标大小列数在前,行数在后,与numpy.array的shape属性相反。
#!/user/bin/env python3
# -*- coding: utf-8 -*-
"""
几何变换:放大、缩小、旋转等,改变空间位置
完成几何变换需要两个独立的算法:
1.实现空间坐标转换(像素如何从初始位置移动到终止位置),
2.插值算法(完成输出图像每个像素值的灰度值)
"""
import cv2
import numpy as np
import sys
import math
# 仿射变换(二维)
image = cv2.imread('../Img/7418.jpeg')
h,w = image.shape[:2]
# 缩小两倍
A1 = np.array([[0.5,0,0],[0,0.5,0]],np.float32)
d1 = cv2.warpAffine(image,A1,(w,h),borderValue = 125)
# 先缩小两倍,再平移
A2 = np.array([[0.5,0,w/4],[0,0.5,100]],np.float32)
d2 = cv2.warpAffine(image,A2,(w,h),borderValue = 125)
# 在d2的基础上,绕图像的中心点旋转
A3 = cv2.getRotationMatrix2D((w/2.0,h/2.0),90,0.5)
d3 = cv2.warpAffine(d2,A3,(w,h),borderValue=125)
cv2.imshow('image',image)
cv2.imshow('d1',d1)
cv2.imshow('d2',d2)
cv2.imshow('d3',d3)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.warpAffine(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]])
warpAffine(原图,变换矩阵,输出图像尺寸,输出图像=None,插值方法=None,边界像素模式=None,边界填充值=None)
①flages表示插值方式,默认为 flags=cv2.INTER_LINEAR,表示线性插值,此外还有:cv2.INTER_NEAREST(最近邻插值) cv2.INTER_AREA (区域插值) cv2.INTER_CUBIC(三次样条插值) cv2.INTER_LANCZOS4(Lanczos插值)
②borderMode默认值为 cv2.BORDER_CONSTANT,指定边界模式(例如:cv2.BORDER_REPLICATE 表示复制边界,cv2.BORDER_WRAP 表示环绕边界,cv2.BORDER_REFLECT 表示反射边界,cv2.BORDER_REFLECT_101 表示边界反射,等等)
③borderValue,默认为 黑色(0, 0, 0),是 borderMode 中边界像素的值。
cv2.getRotationMatrix2D(center, angle, scale):旋转中心、旋转角度、尺度因子
np.float16、np.float32、np.float64 分别代表 Numpy 库中的三种不同的浮点数类型,分别对应着半精度浮点数、单精度浮点数和双精度浮点数。它们之间的区别主要有以下几个方面:
①精度:半精度浮点数只能表示小数点后 3 位的数字,单精度浮点数能表示小数点后 7 位的数字,而双精度浮点数能表示小数点后 15 位的数字。因此,半精度浮点数的精度最低,而双精度浮点数的精度最高。
②内存占用:半精度浮点数只占用 2 个字节的内存空间,单精度浮点数占用 4 个字节,而双精度浮点数占用 8 个字节。因此,半精度浮点数占用的内存最少,而双精度浮点数占用的内存最多。
③运算速度:由于半精度浮点数占用的内存最少,因此在计算时速度最快。而双精度浮点数占用的内存最多,在计算时速度最慢。
2.2 投影变换(三维)
投影变换也称透视变换。
#!/user/bin/env python3
# -*- coding: utf-8 -*-
"""
投影变换(三维):
"""
import cv2
import numpy as np
import math
image = cv2.imread('../Img/7418.jpeg')
h,w = image.shape[:2]
print(h)
print(w)
# 原图的4个点,与投影变换的4个点
src = np.array([[0,0],[w-1,0],[0,h-1],[w-1,h-1]],np.float32)
dst = np.array([[550,50],[600,50],[0,500],[w-1,500]],np.float32)
# 计算投影变换矩阵
p = cv2.getPerspectiveTransform(src,dst)
# 利用计算出的投影变换矩阵进行头像的投影变换
r = cv2.warpPerspective(image,p,(w,h),borderValue=125)
cv2.imshow('image',image)
cv2.imshow('warpPerspective',r)
cv2.waitKey(0)
cv2.destroyAllWindows()
2.3 极坐标变换
笛卡尔坐标和极坐标是两种不同的描述平面上点位置的方式。
笛卡尔坐标系是平面直角坐标系,用两个垂直的轴(通常是x轴和y轴)来描述平面上任意一点的位置。每个点的坐标用一个有序的数对 (x,y) 来表示,其中第一个数表示点在x轴上的距离,第二个数表示点在y轴上的距离。
极坐标系则是将平面上的点描述为一个距离和一个角度的组合。用极坐标系描述点的方式是将点与原点的连线看作是一个半径,而这个半径与x轴的夹角(通常用弧度表示)就是点的极角。点的坐标用一个有序的数对 (r,θ) 来表示,其中r表示点到原点的距离,θ表示点与x轴的夹角。
极坐标变换:通常用来校正图像中圆形物体或者被包含在圆环中的物体
2.3.1 将笛卡尔坐标转化为极坐标
cv2.cartToPolar(x, y, magnitude=None, angle=None, angleInDegrees=None)
# 1.将笛卡尔坐标转化为极坐标
# 举例:(11,13)以(3,5)为中心进行极坐标变换:
r = math.sqrt(math.pow(11-3,2)+math.pow(13-5,2))
theta = math.atan2(13-5,11-3)/math.pi*180
print(r, "\n", theta)
# 举例:计算(0,0)(1,0)(2,0)(0,1)(1,1)(2,1)(0,2)(1,2)(2,2)这9个点以(1,1)为中心进行的极坐标变换。
x = np.array([[0,1,2],[0,1,2],[0,1,2]],np.float64)-1
y = np.array([[0,0,0],[1,1,1],[2,2,2]],np.float64)-1
r, theta = cv2.cartToPolar(x,y,angleInDegrees=True)
print(r, "\n", theta)
2.3.2 将极坐标转换为笛卡尔坐标
# 2.将极坐标转换为笛卡尔坐标
# 举例:已知极坐标(角度,半径)中的(30,10)、(31,10)、(30,11)、(31,11).
# 求笛卡尔坐标中哪四个坐标以(-12,15)为中心经过极坐标变换后得到这四个坐标
angle = np.array([[30,31],[30,31]],np.float32)
r = np.array([[10,10],[11,11]],np.float32)
x,y = cv2.polarToCart(r,angle,angleInDegrees=True)
x = x-12
y = y+15
print(x, "\n", y)
2.3.3 利用极坐标变换对图像进行变换
def polar(I,center,r,theta=(0,360),rstep=1.0,thetastep=360.0/(180*8)):
- 线性极坐标变换linearPolar
dst = cv2.linearPolar(src,(550,550),550,cv2.INTER_LINEAR) # 变换中心,变换的最大距离
- 对数极坐标函数logPolar
dst = cv2.logPolar(src,(550,550),150,cv2.INTER_LINEAR) # 变换中心,系数(大一点)
cv2.logPolar(原图,变换中心,要变换的边界圆的半径,插值方法)
# 3.利用极坐标变换对图像进行变换
a = np.array([[1,2],[3,4]])
b = np.tile(a,(2,3)) # 将a分别在垂直方向和水平方向上复制2次和3次
print(b)
# 参数分别为:输入图像、极坐标变换中心、二元元组(代表最大距离和最小距离)、rstep=r的变换步长,
# thetastep=角度的变换步长,默认为1/4,
def polar(I,center,r,theta=(0,360),rstep=1.0,thetastep=360.0/(180*8)):
# 获取极坐标变换中心坐标
cx, cy = center
# 得到距离最小、最大范围
minr, maxr = r
# 角度的范围
mintheta,maxtheta = theta
# 输出图像的宽、高
H = int((maxr-minr)/rstep)+1
W = int((maxtheta-mintheta)/thetastep)+1
O = 125*np.ones((H,W),I.dtype)
print(O)
# 极坐标变换
r = np.linspace(minr,maxr,H)
r = np.tile(r,(W,1))
r = np.transpose(r)
theta = np.linspace(mintheta,maxtheta,W)
theta = np.tile(theta,(H,1))
x,y = cv2.polarToCart(r,theta,angleInDegrees=True)
# 最近邻插值
for i in range(H):
for j in range(W):
px = int(round(x[i][j])+cx)
py = int(round(y[i][j])+cy)
if((px>=0 and px<=w-1) and (py>=0 and py<=h-1)):
O[i][j] = I[py][px]
return O
I = cv2.imread("../Img/1685776846611.jpg")
i = cv2.cvtColor(I,cv2.COLOR_BGR2GRAY)
h,w = I.shape[:2]
# 极坐标变换中心
cx, cy = 550,550 # 圆形
cv2.circle(I,(int(cx),int(cy)),10,(255.0,0,0),3)
#j
O = polar(i,(cx,cy),(0,550)) # 范围
O = cv2.flip(O,0)
# cv2.imshow('I',I)
# cv2.imshow('O',O)
# cv2.waitKey(0)
# cv2.destroyAllWindows()
# 3.1 线性极坐标变换linearPolar
import cv2
src = cv2.imread('../Img/1685776846611.jpg')
# cv2.imshow("src",src)
dst = cv2.linearPolar(src,(550,550),550,cv2.INTER_LINEAR) # 变换中心,变换的最大距离
# cv2.imshow('dst',dst)
# cv2.waitKey(0)
# cv2.destroyAllWindows()
# 3.2 对数极坐标函数logPolar
import cv2
src = cv2.imread('../Img/1685776846611.jpg')
cv2.imshow("src",src)
dst = cv2.logPolar(src,(550,550),150,cv2.INTER_LINEAR) # 变换中心,系数(大一点)
cv2.imshow('dst',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()