【数字图像处理】2.几何变换

目录

什么是几何变换?

为什么要对图像进行几何变换?

2.1 仿射变换(二维)

2.2 投影变换(三维)

2.3 极坐标变换

2.3.1 将笛卡尔坐标转化为极坐标

2.3.2 将极坐标转换为笛卡尔坐标

2.3.3 利用极坐标变换对图像进行变换


几何变换:放大、缩小、旋转等,改变空间位置。

完成几何变换需要两个独立的算法:1.实现空间坐标转换(像素如何从初始位置移动到终止位置),2.插值算法(完成输出图像每个像素值的灰度值)

什么是几何变换?

将一组图像数据经过某种数学运算,映射成另外一组图像数据的操作,主要包括放大、缩小、旋转等。

为什么要对图像进行几何变换?

几何变换可以在一定程度上的消除图像由于角度、透视关系、拍摄等原因造成的几何失真。几何变换处理是深度学习中数据增强的一种常用手段,是进行图像识别前的数据预处理工作内容。比如,在车牌识别过程中,并不能保证被检测的物体在图像的相同位置和方向,所以我们首先要解决的就是被检测物体的位置和方向。

2.1 仿射变换(二维)

平移、放大和缩小、旋转、插值算法。

像素的三维矩阵:宽度,高度和颜色通道

缩放:OpenCV提供了resize()函数来实现这种目的。使用resize()函数需要注意两点:(1)指定的目标大小必须为整数;(2)指定目标大小列数在前,行数在后,与numpy.array的shape属性相反。

#!/user/bin/env python3
# -*- coding: utf-8 -*-
"""
几何变换:放大、缩小、旋转等,改变空间位置
完成几何变换需要两个独立的算法:
1.实现空间坐标转换(像素如何从初始位置移动到终止位置),
2.插值算法(完成输出图像每个像素值的灰度值)
"""
import cv2
import numpy as np
import sys
import math

# 仿射变换(二维)
image = cv2.imread('../Img/7418.jpeg')
h,w = image.shape[:2]
# 缩小两倍
A1 = np.array([[0.5,0,0],[0,0.5,0]],np.float32)
d1 = cv2.warpAffine(image,A1,(w,h),borderValue = 125)

# 先缩小两倍,再平移
A2 = np.array([[0.5,0,w/4],[0,0.5,100]],np.float32)
d2 = cv2.warpAffine(image,A2,(w,h),borderValue = 125)

# 在d2的基础上,绕图像的中心点旋转
A3 = cv2.getRotationMatrix2D((w/2.0,h/2.0),90,0.5)
d3 = cv2.warpAffine(d2,A3,(w,h),borderValue=125)


cv2.imshow('image',image)
cv2.imshow('d1',d1)
cv2.imshow('d2',d2)
cv2.imshow('d3',d3)
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.warpAffine(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]])

warpAffine(原图,变换矩阵,输出图像尺寸,输出图像=None,插值方法=None,边界像素模式=None,边界填充值=None)

flages表示插值方式,默认为 flags=cv2.INTER_LINEAR,表示线性插值,此外还有:cv2.INTER_NEAREST(最近邻插值) cv2.INTER_AREA (区域插值) cv2.INTER_CUBIC(三次样条插值) cv2.INTER_LANCZOS4(Lanczos插值)

borderMode默认值为 cv2.BORDER_CONSTANT,指定边界模式(例如:cv2.BORDER_REPLICATE 表示复制边界,cv2.BORDER_WRAP 表示环绕边界,cv2.BORDER_REFLECT 表示反射边界,cv2.BORDER_REFLECT_101 表示边界反射,等等)

borderValue,默认为 黑色(0, 0, 0),是 borderMode 中边界像素的值。

cv2.getRotationMatrix2D(center, angle, scale)旋转中心、旋转角度、尺度因子

np.float16、np.float32、np.float64 分别代表 Numpy 库中的三种不同的浮点数类型,分别对应着半精度浮点数、单精度浮点数和双精度浮点数。它们之间的区别主要有以下几个方面:

①精度:半精度浮点数只能表示小数点后 3 位的数字,单精度浮点数能表示小数点后 7 位的数字,而双精度浮点数能表示小数点后 15 位的数字。因此,半精度浮点数的精度最低,而双精度浮点数的精度最高。

②内存占用:半精度浮点数只占用 2 个字节的内存空间,单精度浮点数占用 4 个字节,而双精度浮点数占用 8 个字节。因此,半精度浮点数占用的内存最少,而双精度浮点数占用的内存最多。

③运算速度:由于半精度浮点数占用的内存最少,因此在计算时速度最快。而双精度浮点数占用的内存最多,在计算时速度最慢。

2.2 投影变换(三维)

投影变换也称透视变换。

#!/user/bin/env python3
# -*- coding: utf-8 -*-
"""
投影变换(三维):
"""
import cv2
import numpy as np
import math
image = cv2.imread('../Img/7418.jpeg')
h,w = image.shape[:2]
print(h)
print(w)
# 原图的4个点,与投影变换的4个点
src = np.array([[0,0],[w-1,0],[0,h-1],[w-1,h-1]],np.float32)
dst = np.array([[550,50],[600,50],[0,500],[w-1,500]],np.float32)

# 计算投影变换矩阵
p = cv2.getPerspectiveTransform(src,dst)

# 利用计算出的投影变换矩阵进行头像的投影变换
r = cv2.warpPerspective(image,p,(w,h),borderValue=125)
cv2.imshow('image',image)
cv2.imshow('warpPerspective',r)
cv2.waitKey(0)
cv2.destroyAllWindows()

2.3 极坐标变换

笛卡尔坐标和极坐标是两种不同的描述平面上点位置的方式。

笛卡尔坐标系是平面直角坐标系,用两个垂直的轴(通常是x轴和y轴)来描述平面上任意一点的位置。每个点的坐标用一个有序的数对 (x,y) 来表示,其中第一个数表示点在x轴上的距离,第二个数表示点在y轴上的距离。

极坐标系则是将平面上的点描述为一个距离和一个角度的组合。用极坐标系描述点的方式是将点与原点的连线看作是一个半径,而这个半径与x轴的夹角(通常用弧度表示)就是点的极角。点的坐标用一个有序的数对 (r,θ) 来表示,其中r表示点到原点的距离,θ表示点与x轴的夹角。

极坐标变换:通常用来校正图像中圆形物体或者被包含在圆环中的物体

2.3.1 将笛卡尔坐标转化为极坐标

cv2.cartToPolar(x, y, magnitude=None, angle=None, angleInDegrees=None)

# 1.将笛卡尔坐标转化为极坐标

# 举例:(11,13)以(3,5)为中心进行极坐标变换:
r = math.sqrt(math.pow(11-3,2)+math.pow(13-5,2))
theta = math.atan2(13-5,11-3)/math.pi*180
print(r, "\n", theta)

# 举例:计算(0,0)(1,0)(2,0)(0,1)(1,1)(2,1)(0,2)(1,2)(2,2)这9个点以(1,1)为中心进行的极坐标变换。
x = np.array([[0,1,2],[0,1,2],[0,1,2]],np.float64)-1
y = np.array([[0,0,0],[1,1,1],[2,2,2]],np.float64)-1
r, theta = cv2.cartToPolar(x,y,angleInDegrees=True)
print(r, "\n", theta)

2.3.2 将极坐标转换为笛卡尔坐标

# 2.将极坐标转换为笛卡尔坐标

# 举例:已知极坐标(角度,半径)中的(30,10)、(31,10)、(30,11)、(31,11).
# 求笛卡尔坐标中哪四个坐标以(-12,15)为中心经过极坐标变换后得到这四个坐标
angle = np.array([[30,31],[30,31]],np.float32)
r = np.array([[10,10],[11,11]],np.float32)
x,y = cv2.polarToCart(r,angle,angleInDegrees=True)
x = x-12
y = y+15
print(x, "\n", y)

2.3.3 利用极坐标变换对图像进行变换

def polar(I,center,r,theta=(0,360),rstep=1.0,thetastep=360.0/(180*8)):

  1. 线性极坐标变换linearPolar

dst = cv2.linearPolar(src,(550,550),550,cv2.INTER_LINEAR) # 变换中心,变换的最大距离

  1. 对数极坐标函数logPolar

dst = cv2.logPolar(src,(550,550),150,cv2.INTER_LINEAR) # 变换中心,系数(大一点)

cv2.logPolar(原图,变换中心,要变换的边界圆的半径,插值方法)

# 3.利用极坐标变换对图像进行变换

a = np.array([[1,2],[3,4]])
b = np.tile(a,(2,3)) # 将a分别在垂直方向和水平方向上复制2次和3次
print(b)

# 参数分别为:输入图像、极坐标变换中心、二元元组(代表最大距离和最小距离)、rstep=r的变换步长,
# thetastep=角度的变换步长,默认为1/4,

def polar(I,center,r,theta=(0,360),rstep=1.0,thetastep=360.0/(180*8)):
    # 获取极坐标变换中心坐标
    cx, cy = center

    # 得到距离最小、最大范围
    minr, maxr = r

    # 角度的范围
    mintheta,maxtheta = theta

    # 输出图像的宽、高
    H = int((maxr-minr)/rstep)+1
    W = int((maxtheta-mintheta)/thetastep)+1
    O = 125*np.ones((H,W),I.dtype)
    print(O)
    # 极坐标变换
    r = np.linspace(minr,maxr,H)
    r = np.tile(r,(W,1))
    r = np.transpose(r)
    theta = np.linspace(mintheta,maxtheta,W)
    theta = np.tile(theta,(H,1))
    x,y = cv2.polarToCart(r,theta,angleInDegrees=True)

    # 最近邻插值
    for i in range(H):
        for j in range(W):
            px = int(round(x[i][j])+cx)
            py = int(round(y[i][j])+cy)
            if((px>=0 and px<=w-1) and (py>=0 and py<=h-1)):
                O[i][j] = I[py][px]

    return O



I = cv2.imread("../Img/1685776846611.jpg")
i = cv2.cvtColor(I,cv2.COLOR_BGR2GRAY)
h,w = I.shape[:2]
# 极坐标变换中心
cx, cy = 550,550  # 圆形
cv2.circle(I,(int(cx),int(cy)),10,(255.0,0,0),3)
#j
O = polar(i,(cx,cy),(0,550))  # 范围
O = cv2.flip(O,0)
# cv2.imshow('I',I)
# cv2.imshow('O',O)
# cv2.waitKey(0)
# cv2.destroyAllWindows()

# 3.1 线性极坐标变换linearPolar
import cv2

src = cv2.imread('../Img/1685776846611.jpg')
# cv2.imshow("src",src)
dst = cv2.linearPolar(src,(550,550),550,cv2.INTER_LINEAR) # 变换中心,变换的最大距离
# cv2.imshow('dst',dst)
# cv2.waitKey(0)
# cv2.destroyAllWindows()

# 3.2 对数极坐标函数logPolar
import cv2

src = cv2.imread('../Img/1685776846611.jpg')
cv2.imshow("src",src)
dst = cv2.logPolar(src,(550,550),150,cv2.INTER_LINEAR) # 变换中心,系数(大一点)
cv2.imshow('dst',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/30919.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

汇编学习教程:寻址大总结

前言 在上篇博文中&#xff0c;我们主要学习了一个全新的寄存器&#xff1a;bp。bp 寄存器在功能和使用上与 bx 有着异曲同工之妙&#xff0c;只不过两人绑定的服务对象不同&#xff1a;bx 默认绑定的是 DS 段寄存器&#xff0c;而 bp 默认绑定的是 SS 段寄存器。bx 和 bp 有着…

Unity之透明度混合与ps的透明度混合计算结果不一致

一、问题 前段时间学习shader时发现了一个问题&#xff0c;一张纯红色透明度为128的图片叠加在一张纯绿色的图片上得出的结果与ps中的结果不一致。网上查找了ps中的透明混合的公式为 color A.rgb*A.alpha B.rgb*(1-A.alpha)。自己使用代码在unity中计算了一下结果总是不对。…

【Java基础学习打卡09】JRE与JDK

目录 前言一、JRE二、JDK三、JDK、JRE和JVM关系总结 前言 本文将介绍JRE、JDK是什么&#xff0c;以及JDK、JRE和JVM关系三者之间的关系。 一、JRE JRE全称为Java Runtime Environment&#xff0c;是Java应用程序的运行时环境。JRE包括Java虚拟机&#xff08;JVM&#xff09;、…

车辆救援道路救援预约汽修托运小程序

道路救援&#xff1a;指汽车道路紧急救援&#xff0c;为故障车主提供包括诸如&#xff1a;拖吊、换水、充电、换胎、送油以及现场小修等服务(Road-Side Service)&#xff1b; 同时也指交通事故道路救援&#xff0c;包括伤员救治、道路疏导等。 随着我国巨大的汽车拥有量&…

基础篇:新手使用vs code新建go项目(从0开始到运行)

学习新语言&#xff0c;搭建新环境。在网上找了一些教程&#xff0c;感觉还是写一个比较详细的方便以后自己使用。其实vs code没有新建项目这个功能&#xff0c;具体怎么运行go语言的项目请看下文。 一、下载GO安装包 1.点击go安装包下载链接下载相应的版本&#xff08;本次下…

了解 Dockerfile 和搭建 Docker 私有仓库:让容器化部署变得更简单

目录 1、Dockerfile 1.1什么是Dockerfile 1.2常用命令 1.3使用脚本创建镜像 2、Docker私有仓库 2.1私有仓库介绍&#xff1a; 2.2私有仓库搭建与配置 2.3上传镜像到私有仓库&#xff1a; 1、Dockerfile 1.1什么是Dockerfile Dockerfile是由一些列命令和参数构成的脚本…

《网络安全0-100》安全事件案例

网络安全事件案例分析 2017年Equifax数据泄露事件 Equifax是美国一家信用评级机构&#xff0c;2017年9月&#xff0c;该公司披露发生了一起重大的数据泄露事件&#xff0c;涉及1.43亿美国人的个人信息&#xff0c;包括姓名、出生日期、社会安全号码等敏感信息。经过调查&#…

【数据分析】如何使用docker部署程序并移植(算法、接口)

原文作者&#xff1a;我辈李想 版权声明&#xff1a;文章原创&#xff0c;转载时请务必加上原文超链接、作者信息和本声明。 文章目录 前言一、Docker的基本使用1.安装Docker2.列出本地镜像3.获取镜像,创建本地ubuntu:13.10镜像4.查找镜像5.删除本地镜像6.创建自定义镜像7.镜像…

第一章 基础算法(二)——高精度,前缀和与差分

文章目录 高精度运算高精度加法高精度减法高精度乘法高精度除法 前缀和二维前缀和 差分二维差分 高精度练习题791. 高精度加法792. 高精度减法793. 高精度乘法794. 高精度除法 前缀和练习题795. 前缀和796. 子矩阵的和 差分练习题797. 差分798. 差分矩阵 高精度运算 两个大数做…

【Unity Shader】从入门到感慨(2)用C#画一个立方体

文章目录 一、构成一个立方需要多少个顶点?二、定义三角面的索引数组:三、定义UV坐标数组:四、最后构建Mesh:五、完整代码:一、构成一个立方需要多少个顶点? 这个问题是面试经常被问到的题。如上图,我们知道在几何中立方体有6个面,8个顶点。但在图形学中,顶点指的是模…

翻过那座山——Gitlab流水线任务疑难之编译有子模块的项目指南

&#x1f4e2;欢迎点赞 &#xff1a;&#x1f44d; 收藏 ⭐留言 &#x1f4dd; 如有错误敬请指正&#xff0c;赐人玫瑰&#xff0c;手留余香&#xff01;&#x1f4e2;本文作者&#xff1a;由webmote 原创&#x1f4e2;作者格言&#xff1a;新的征程&#xff0c;我们面对的不是…

QT入门基础知识

什么是QT QT是一个跨平台的C图像用户界面应用程序框架QT在1991年由奇趣科技开发QT的优点 跨平台,几乎支持所有平台接口简单&#xff0c;容易上手一定程度上简化了内存回收机制有很好的社区氛围可以进行嵌入式开发 QWidget QT注意事项 命名规范 类名 首字母大写&#xff0c;单…

golang vscode环境报错gopls was not able to find modules in your workspace的解决方式

目录 错误提示 分析 解决方式 方法一&#xff1a;将workspace与项目路径保持一致 方案二&#xff1a;使用go work指明纳入工作区的的module 总结 错误提示 golang从老版本升级到go1.20.5后打开vscode&#xff0c;发现代码不能自动补全了&#xff0c;而且vscode跳出一下的…

微服务基础介绍

Part1一、基本概念 微服务最主要的功能是根据业务拆分成一个一个的子服务&#xff0c;实现功能的去耦合&#xff0c;每一个微服务提供单个业务功能的服务&#xff0c;各司其职&#xff0c;从技术角度看就是一种灵活独立的单元&#xff0c;能够自行单独启动和关闭&#xff0c;一…

Docker学习笔记1

PaaS&#xff1a; 一、虚拟化分类&#xff1a; 虚拟化资源提供者&#xff1a; 1&#xff09;硬件平台虚拟化 2&#xff09;操作系统虚拟化 虚拟化实现方式&#xff1a; type I: 半虚拟化 type II&#xff1a;硬件辅助全虚拟化 type III&#xff1a; 软件全虚拟化&#xff1a; …

【C++】模版进阶

目录 一、非类型模版参数二、模板的特化1、概念2、函数模版特化3、类模板特化1.全特化2.偏特化3.类模板特化应用示例 三、模版分离编译1、什么是分离编译2、模板的分离编译3、模板的优缺点 一、非类型模版参数 模版参数分为类型模版参数与非类型模版参数 类型模版参数&#x…

[进阶]网络通信:UDP通信,一发一收、多发多收

UDP通信 特点&#xff1a;无连接、不可靠通信。不事先建立连接&#xff1b;发送端每次把要发送的数据&#xff08;限制在64KB内&#xff09;、接收端1P、等信息封装成一个数据包&#xff0c;发出去就不管了。Java提供了一个java.net.Datagramsocket类来实现UDP通信。 Datagram…

Springboot项目使用原生Websocket

目录 1.启用Websocket功能2.封装操作websocket session的工具3.保存websocket session的接口4.保存websocket session的类5.定义websocket 端点6.创建定时任务 ping websocket 客户端 1.启用Websocket功能 package com.xxx.robot.config;import org.springframework.context.a…

NSSCTF MOBILE [SWPU 2019]easyapp 详细题解

文章目录 一. 前言二. 安装安卓SDK三. 安装安卓模拟器(推荐夜神模拟器)四. 安装frida和objection五. 解题过程六. 总结 一. 前言 题目地址:[SWPU 2019]easyapp大佬题解[SWPU 2019]easyapp pwjcw的WriteUp 大佬的题解很简单,直接hook就可以看到返回值,但是我看了半天没看明白是…

Redis简介

Redis是基于内存&#xff0c;也可以基于磁盘持久化nosql数据库&#xff0c;使用c语言开发。 数据存储结构&#xff1a;key-value 安装环境准备 Redis使用c语言开发&#xff0c;需要使用gcc编译程序进行编译。 1&#xff09; 安装gcc a) 从磁盘镜像中进行安装&#xff1a;&…