Python 语言学习——应用1.2 数字图像处理(第二节,变换)

目录

1.基础知识

        1.图像几何变换概念

        2.图像几何变换方式 

        3.插值运算

        4.几何变换步骤 

2.各类变换 

        1.位置变换

         2.形状变换

        3.代数运算 

3.实战演练 


1.基础知识

        1.图像几何变换概念

  • 在图像处理过程中,为了观测需要,常常需要对 图像进行几何变换,如几何失真图像的校正、图 像配准、电影、电视和媒体广告等的影像特技处 理等,是图像变形以及校正变形的基础。
  • 图像几何变换将图像中任一像素映射到一个新位置,是一种空间变换,关键在于确定图像中点与点之间的映射关系

        2.图像几何变换方式 

  • 首先有齐次坐标:用n+1维向量表示n维向量的方法称为齐次坐标 表示法。原图像用点集[x,y,1]^{T}(转置的意思)表示。好处:齐次坐标中,对原图像进行平移、缩放、旋转等 几何变换,可用一个变换矩阵表示。
  • 然后是变换矩阵:a,b,c,d用于图形的比例、对称、 错切、旋转等基本变换;k,m用于 图形的平移变换;p,q用于投影变 换;s用于全比例变换。
  • 实现2D图像几何变换的基本变换的一般过程是:变换矩阵T×变换前的点集矩阵=变换后的点集矩阵。 

        3.插值运算

  • 为什么会有这玩意:当你调整图像的大小,特别是缩小图像时,由于目标大小的像素数量少于原图像的像素数量,就需要通过插值算法来估算新像素的值。在进行旋转、平移、拉伸等几何变换时,图像的像素位置可能会发生变化(比如原x,y的像素点变成0.8x,0.9y算出来是个小数,则相应位置像素值不知道是多少)应用一些滤波器或处理器时,如模糊、锐化等操作,会导致像素值的变化,需要通过插值来重新计算像素值。

  • 概念:指利用已知邻近像素点的灰度值来产生未知像素点的灰度值(各通道)

  • 常用插值运算方法:

  1. 最近邻插值:非整数像素灰度值就等于距离最近 的坐标都为整数的像素的灰度值。 
  2. 双线性插值:利用非整数像素点周围的四个像素 点的相关性,通过双线性算法计算得出。图1算法或图2算法(利用周边四个点)。

  3. 双三次插值:利用非整数像素点周围的16个像素 点进行计算。

        4.几何变换步骤 

  1. 根据不同的几何变换公式计算新图像的尺寸
  2. 根据几何变换的逆变换,对新图像中的每一点确 定其在原图像中的对应点
  3. 按对应关系给新图像中各个像素赋值
  • 若新图像中像素点在原图像中的对应点坐标存 在,直接赋值
  • 若新图像中像素点在原图像中的对应点坐标超 出图像宽高范围,直接赋背景色
  • 若新图像中像素点在原图像中的对应点坐标在 图像宽高范围内,采用插值的方法计算 

2.各类变换 

        1.位置变换

  • 图像的位置变换是指图像的大小和形状不发生变化,只是图像像素点的位置发生变化,含平 移、镜像、旋转
  • 平移:若不想丢失信息,可能需要扩大画布

  • 镜像:M为总行数,N为总列数 

  • 旋转: θ为正,代表逆时针旋转,若要确定变换后的尺寸大小:计算原图像四个角在 旋转后的坐标;确定新图像的分辨率,M'=max x'-min x'+1;N'=max y'-min y'+1(结果向上取整).对于不在原点旋转的,先要将坐标系平移到原点,再按绕原点旋转进行变换,然后平移回原坐标原点。得到新图像的M',N'后,需依次确定[0,M'-1]+minx',[0,N'-1]+miny'各个像素点的值。也就是再逆变换回去,根据步骤第三点的三条进行赋值。

         2.形状变换

  • 缩放

  • 错切:平面景物在投影平面上的非垂直投 影,使图像中的图形产生扭变

     

        3.代数运算 

  • 加法运算如下图,应用主要有:多幅图像相加求平均去除叠加性噪声,将一幅图像的内容经配准后叠加到另一幅图像 上去,以改善图像的视觉效果,在多光谱图像中,通过加法运算加宽波段,如 绿色波段和红色波段图像相加可以得到近似全色图像,用于图像合成和图像拼接。

  • 减法运算如下图,应用主要有:显示两幅图像的差异,检测同一场景两幅图像 之间的变化;去除不需要的叠加性图案,加性图案可能是缓 慢变化的背景阴影或周期性的噪声,或在图像 上每一个像素处均已知的附加污染等;图像分割:如分割运动的车辆,减法去掉静止 部分,剩余的是运动元素和噪声;生成合成图像。 

  • 乘法运算主要是部分图框出来,也就是图像的局部显示和提取:用二值模板图像与 原图像做乘法来实现 。

  • 逻辑运算:原理如图。


3.实战演练 

P1. 试编写程序,对图像逆时针旋转60°,采用双线性插值的方法

from PIL import Image  # 导入PIL库,用于图像处理
import math #用于旋转时计算三角函数

def bilinear_interpolation(image, x, y):
    # 将坐标转换为整数
    x1, y1 = int(x), int(y)
    x2, y2 = x1 + 1, y1 + 1

    # 处理边界情况
    if x2 >= image.width:
        x2 = x1
    if y2 >= image.height:
        y2 = y1

    # 获取四个相邻像素的RGB值
    q11 = image.getpixel((x1, y1))
    q21 = image.getpixel((x2, y1))
    q12 = image.getpixel((x1, y2))
    q22 = image.getpixel((x2, y2))

    r = []#空列表的创建

    # 处理 RGB 值的每个通道
    for i in range(3):  # 0: 红色通道, 1: 绿色通道, 2: 蓝色通道
        r.append(q11[i] * (x2 - x) * (y2 - y) + q21[i] * (x - x1) * (y2 - y) + q12[i] * (x2 - x) * (y - y1) + q22[i] * (x - x1) * (y - y1))

    return tuple(map(int, r))  # 返回处理后的 RGB 值

def rotate_image(image, angle):
    # 旋转图像函数
    angle = angle % 360
    if angle == 0:
        return image

    rotated_image = Image.new("RGB", image.size)  # 创建旋转后的图像对象

    for x in range(rotated_image.width):
        for y in range(rotated_image.height):
            # 计算旋转后的坐标,即逆变换找到原坐标位置
            x_original = ((x - rotated_image.width / 2) * math.cos(math.radians(angle)) -
                          (y - rotated_image.height / 2) * math.sin(math.radians(angle)) + image.width / 2)
            y_original = ((x - rotated_image.width / 2) * math.sin(math.radians(angle)) +
                          (y - rotated_image.height / 2) * math.cos(math.radians(angle)) + image.height / 2)

            if 0 <= x_original < image.width - 1 and 0 <= y_original < image.height - 1:
                # 应用双线性插值
                rotated_image.putpixel((x, y), bilinear_interpolation(image, x_original, y_original))#注意写法,这个函数第二个参数是元组表示的一组rgb的值

    return rotated_image

# 打开图像文件
image = Image.open("rainbow.jpg")

# 逆时针旋转60°
rotated_image = rotate_image(image, 60)

# 保存旋转后的图像
rotated_image.save("rotated_image.jpg")  # 保存旋转后的图像

说明:map(int, r): 这部分使用了Python内置的 map 函数,它接受一个函数和一个可迭代对象作为参数。在这里,int 函数被应用于可迭代对象 r 中的每个元素,将每个元素转换为整数。tuple(...): tuple() 函数用于将一个可迭代对象转换为元组(tuple)。在这里,map(int, r) 返回一个迭代器,然后 tuple() 将这个迭代器转换为一个由整数组成的元组。

P2. 打开一幅图像,依次完成下列要求:顺时针旋转20°,做水平镜像,做错切变换,缩小图像。若需要插值运算,采用双线性插值方法;要求输出显示原图、中间结果和最后结果。(作为模板题)

import math #用于旋转时计算三角函数
from PIL import Image


def resize_image(image, width_scale, height_scale):
    # 获取图像的宽度和高度
    width, height = image.size

    # 计算放大或缩小后的宽度和高度
    new_width = int(width * width_scale)
    new_height = int(height * height_scale)

    # 创建一个新图像对象,用于存储放大或缩小后的图像
    resized_image = image.resize((new_width, new_height))

    return resized_image


def shear_image(image, shear_factor):
    # 获取图像的宽度和高度
    width, height = image.size

    # 计算错切后的宽度,只需计算宽度即可
    new_width = width + int(abs(shear_factor) * height)

    # 创建一个新图像对象,用于存储错切后的图像
    sheared_image = Image.new("RGB", (new_width, height))

    # 错切处理
    for x in range(new_width):
        for y in range(height):
            # 计算错切后的坐标,逆旋转
            new_x = x - int(shear_factor * y)

            if 0 <= new_x < width:
                # 获取原始图像中的像素值
                pixel = image.getpixel((new_x, y))
                # 将像素值复制到错切图像中
                sheared_image.putpixel((x, y), pixel)

    return sheared_image


def mirror_image(image):
    # 获取图像的宽度和高度
    width, height = image.size

    # 创建一个新图像对象,用于存储镜像后的图像
    mirrored_image = Image.new("RGB", (width, height))

    # 镜像处理
    for x in range(width):
        for y in range(height):
            # 获取原始图像中的像素值
            pixel = image.getpixel((x, y))
            # 将像素值复制到镜像图像中,但是在水平方向上镜像
            mirrored_image.putpixel((width - x - 1, y), pixel)

    return mirrored_image


def bilinear_interpolation(image, x, y):
    # 将坐标转换为整数
    x1, y1 = int(x), int(y)
    x2, y2 = x1 + 1, y1 + 1

    # 处理边界情况
    if x2 >= image.width:
        x2 = x1
    if y2 >= image.height:
        y2 = y1

    # 获取四个相邻像素的RGB值
    q11 = image.getpixel((x1, y1))
    q21 = image.getpixel((x2, y1))
    q12 = image.getpixel((x1, y2))
    q22 = image.getpixel((x2, y2))

    r = []#空列表的创建

    # 处理 RGB 值的每个通道
    for i in range(3):  # 0: 红色通道, 1: 绿色通道, 2: 蓝色通道
        r.append(q11[i] * (x2 - x) * (y2 - y) + q21[i] * (x - x1) * (y2 - y) + q12[i] * (x2 - x) * (y - y1) + q22[i] * (x - x1) * (y - y1))

    return tuple(map(int, r))  # 返回处理后的 RGB 值

def rotate_image(image, angle):
    # 旋转图像函数
    angle = angle % 360
    if angle == 0:
        return image

    rotated_image = Image.new("RGB", image.size)  # 创建旋转后的图像对象

    for x in range(rotated_image.width):
        for y in range(rotated_image.height):
            # 计算旋转后的坐标,即逆变换找到原坐标位置
            x_original = ((x - rotated_image.width / 2) * math.cos(math.radians(angle)) -
                          (y - rotated_image.height / 2) * math.sin(math.radians(angle)) + image.width / 2)
            y_original = ((x - rotated_image.width / 2) * math.sin(math.radians(angle)) +
                          (y - rotated_image.height / 2) * math.cos(math.radians(angle)) + image.height / 2)

            if 0 <= x_original < image.width - 1 and 0 <= y_original < image.height - 1:
                # 应用双线性插值
                rotated_image.putpixel((x, y), bilinear_interpolation(image, x_original, y_original))#注意写法,这个函数第二个参数是元组表示的一组rgb的值

    return rotated_image

# 打开图像文件
image = Image.open("rainbow.jpg")
image.show()

# 逆时针旋转-20°
rotated_image = rotate_image(image, -20)
rotated_image.show()

mirror=mirror_image(rotated_image)
mirror.show()

share=shear_image(mirror,2)
share.show()

resize=resize_image(share,0.2,0.2)
resize.show()

P3. 打开两幅图像,利用几何变换、图像代数运算,生成一幅精美的合成图像

from PIL import Image

def resize_image(image, width_scale, height_scale):
    # 获取图像的宽度和高度
    width, height = image.size

    # 计算放大或缩小后的宽度和高度
    new_width = int(width * width_scale)
    new_height = int(height * height_scale)

    # 创建一个新图像对象,用于存储放大或缩小后的图像
    resized_image = image.resize((new_width, new_height))

    return resized_image

def add_images(sun_image, sky_image, output_path):

    # 获取太阳图像和天空图像的宽度和高度
    sun_width, sun_height = sun_image.size
    sky_width, sky_height = sky_image.size

    # 确保太阳图像完全在天空图像内
    if sun_width <= sky_width and sun_height <= sky_height:
        # 创建一个新的图像对象,用于存储混合后的图像
        result_image = Image.new("RGB", (sky_width, sky_height))

        # 将天空图像复制到结果图像中
        result_image.paste(sky_image, (0, 0))

        # 将太阳图像叠加到左上角
        result_image.paste(sun_image, (0, 0), sun_image)

        # 保存混合后的图像
        result_image.show()
    else:
        print("Sun image is too large to fit entirely on the sky image.")

# 图像文件路径

sun_path = "sun.png"
sun_image = Image.open(sun_path)
sun_image.show()
sun=resize_image(sun_image,0.2,0.2)
sky_path = "sky.jpg"
output_path = "result_image.jpg"
sky_image = Image.open(sky_path)
sky_image.show()
# 执行图像混合操作
add_images(sun, sky_image, output_path)

 说明,paste函数的使用:语法为image.paste(image_to_paste, box, mask)image_to_paste: 要粘贴的图像对象。box: 表示将图像粘贴到另一个图像的位置,通常是一个元组 (x, y),表示左上角的坐标。mask: 用于指定一个掩码图像,一般而言为数值,从0不透明到255透明,也可以是一个二值图像,如果提供了掩码图像,它将根据掩码的像素值来控制被粘贴图像的透明度,使得被粘贴图像可以部分透明地展现在目标图像上。

题外话:不要吐槽图像的精美程度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/887754.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何创建免费版本的ABP分离模块?

由于ABP最近官方大改革&#xff0c;我们打开ABP.IO 官方会发现通过Cli创建模板的时候不能创建Trered类型的了 就是创建一个分层的解决方案&#xff0c;其中Web和Http API层在物理上是分开的。如果不勾选&#xff0c;则创建一个分层的解决方案&#xff0c;它不那么复杂&#xf…

PasteForm最佳CRUD实践,实际案例PasteTemplate详解之3000问(三)

作为“贴代码”力推的一个CRUD实践项目PasteTemplate,在对现有的3个项目进行实战后效果非常舒服&#xff01;下面就针对PasteForm为啥我愿称为最佳CRUD做一些回答: 哪里可以下载这个PasteForm的项目案例 目前“贴代码”对外使用PasteForm的项目有"贴Builder(PasteSpide…

【Android 13源码分析】Activity生命周期之onCreate,onStart,onResume-2

忽然有一天&#xff0c;我想要做一件事&#xff1a;去代码中去验证那些曾经被“灌输”的理论。                                                                                  – 服装…

微服务Sleuth解析部署使用全流程

目录 1、Sleuth链路追踪 1、添加依赖 2、修改日志配置文件 3、测试 2、zipkin可视化界面 1、docker安装 2、添加依赖 3、修改配置文件 4、查看页面 5、ribbon配置 1、Sleuth链路追踪 sleuth是链路追踪框架&#xff0c;用于在微服务架构下开发&#xff0c;各个微服务之…

[水墨:创作周年纪念] 特别篇!

本篇是特别篇&#xff01;&#xff01; 个人主页水墨不写bug // _ooOoo_ // // o8888888o // // 88" . "88 …

GO网络编程(二):客户端与服务端通信【重要】

本节是新知识&#xff0c;偏应用&#xff0c;需要反复练习才能掌握。 目录 1.C/S通信示意图2.服务端通信3.客户端通信4.通信测试5.进阶练习&#xff1a;客户端之间通信 1.C/S通信示意图 客户端与服务端通信的模式也称作C/S模式&#xff0c;流程图如下 其中P是协程调度器。可…

《CUDA编程》5.获得GPU加速的关键

从本章起&#xff0c;将关注CDUA程序的性能&#xff0c;即执行速度 1 用CUDA事件计时 在前几章中&#xff0c;使用的是C的<time.h>库进行程序运行计时&#xff0c;CUDA也提供了一种基于CUDA event的计时方式&#xff0c;用来给一段CUDA代码进行计时&#xff0c;这里只介…

系统架构设计师-下午案例题(2021年下半年)

1.试题一(共25分) 阅读以下关于软件架构设计与评估的叙述在答题纸上回答问题1和问题2。 【说明】某公司拟开发一套机器学习应用开发平台支持用户使用浏览器在线进行基于机器学习的智能应用开发活动。该平台的核心应用场景是用户通过拖拽算法组件灵活定义机器学习流程&#xf…

【含开题报告+文档+PPT+源码】基于SSM + Vue的养老院管理系统【包运行成功】

开题报告 随着社会的发展和经济的进步&#xff0c;人口老龄化问题逐渐凸显。统计数据显示&#xff0c;全球范围内的老龄人口比例正在逐年上升&#xff0c;养老需求也随之增长。养老院作为提供专业养老服务的机构&#xff0c;承担着照料老人、提供医疗保健和社交活动等责任。传…

什么是pip? -- Python 包管理工具

前言 不同的编程语言通常都有自己的包管理工具&#xff0c;这些工具旨在简化项目的依赖管理、构建过程和开发效率&#xff0c;同时促进代码的复用和共享。每个包管理工具都有其独特的特点和优势&#xff0c;开发者可以根据自己的编程语言和项目需求选择合适的包管理工具。 pip是…

车辆重识别(2021ICML改进的去噪扩散概率模型)论文阅读2024/9/29

所谓改进的去噪扩散概率模型主要改进在哪些方面&#xff1a; ①对数似然值的改进 通过对噪声的那个方差和T进行调参&#xff0c;来实现改进。 ②学习 这个参数也就是后验概率的方差。通过数据分析&#xff0c;发现在T非常大的情况下对样本质量几乎没有影响&#xff0c;也就是说…

TIM的PWM模式

定时器的工作流程: 定时器对时钟传来的脉冲次数计数&#xff0c;并且在次数到达范围值时触发中断。如向下计数模式时为0&#xff0c;向上计数为达到自动重装载计时器的值时触发中断。 四个输出比较单元 更改占空比的函数 STM32里面的定时器有多个定时器。 如TIM1、TIM2…

k8s 之安装metrics-server

作者&#xff1a;程序那点事儿 日期&#xff1a;2024/01/29 18:25 metrics-server可帮助我们查看pod的cpu和内存占用情况 kubectl top po nginx-deploy-56696fbb5-mzsgg # 报错&#xff0c;需要Metrics API 下载 Metrics 解决 wget https://github.com/kubernetes-sigs/metri…

nginx 负载均衡1

遇到的问题 大型网站都要面对庞大的用户量&#xff0c;高并发&#xff0c;海量数据等挑战。为了提升系统整体的性能&#xff0c;可以采用垂直扩展和水平扩展两种方式。 垂直扩展&#xff1a;在网站发展早期&#xff0c;可以从单机的角度通过增加硬件处理能力&#xff0c;比如 C…

LeetCode讲解篇之239. 滑动窗口最大值

文章目录 题目描述题解思路题解代码题目链接 题目描述 题解思路 我们维护一个长度为k的窗口&#xff0c;然后窗口从数组最左边一直移动到最右边&#xff0c;记录过程中窗口中的最大值&#xff0c;就是答案 我们每次查询长度为k的窗口最大值是什么时间复杂度是O(k)的&#xff0…

黑神话:仙童,数据库自动反射魔法棒

黑神话&#xff1a;仙童&#xff0c;数据库自动反射魔法棒 Golang 通用代码生成器仙童发布了最新版本电音仙女尝鲜版十一及其介绍视频&#xff0c;视频请见&#xff1a;https://www.bilibili.com/video/BV1ET4wecEBk/ 此视频介绍了使用最新版的仙童代码生成器&#xff0c;将 …

使用 Python 遍历文件夹

要解决这个问题&#xff0c;使用 Python 的标准库可以很好地完成。我们要做的是遍历目录树&#xff0c;找到所有的 text 文件&#xff0c;读取内容&#xff0c;处理空行和空格&#xff0c;并将处理后的内容合并到一个新的文件中。 整体思路&#xff1a; 遍历子目录&#xff1…

计算机毕业设计 基于Hadoop的智慧校园数据共享平台的设计与实现 Python 数据分析 可视化大屏 附源码 文档

&#x1f34a;作者&#xff1a;计算机编程-吉哥 &#x1f34a;简介&#xff1a;专业从事JavaWeb程序开发&#xff0c;微信小程序开发&#xff0c;定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事&#xff0c;生活就是快乐的。 &#x1f34a;心愿&#xff1a;点…

国外电商系统开发-运维系统拓扑布局

点击列表中设备字段&#xff0c;然后定位到【拓扑布局】中&#xff0c;可以看到拓扑发生了变化 再回头&#xff0c;您再次添加一个服务器到系统中&#xff0c;并且选择该服务器的连接节点为您刚才创建的“SDN路由器”&#xff0c;保存后&#xff0c;您可以看到这个服务器连接着…