计算机视觉(opencv-python)入门之图像的读取,显示,与保存

        在计算机视觉领域,Python的cv2库是一个不可或缺的工具,它提供了丰富的图像处理功能。作为OpenCV的Python接口,cv2使得图像处理的实现变得简单而高效。

 示例图片


目录

opencv获取方式

图像基本知识

颜色空间

RGB

HSV

图像格式

BMP格式

  TIFF格式

GIF格式

JPEG格式

PNG格式

读取图像cv2.imread()

  imread各flags参数含义详解

读取结果说明

Ndarray说明

获取单通道颜色矩阵

显示图像

使用cv2.imshow()显示图像

cv2.waitKey()

cv2.destroyAllWindows()

使用plt.imshow()显示图像

保存图像cv2.imwrite()

总结


 opencv获取方式

pip install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple opencv-python

图像基本知识

颜色空间

        颜色空间是一种用来表示颜色的数学模型,它描述了如何将颜色信息数字化,以便于计算机进行处理和分析。在计算机视觉和图像处理领域,常见的颜色空间包括RGB、HSV等。

RGB

        RGB颜色空间是最常用的颜色空间之一,它基于红(Red)、绿(Green)、蓝(Blue)三种基本颜色,通过调整这三种颜色的强度和组合,可以产生各种颜色。

        在RGB颜色空间中,每个颜色的强度值范围通常在0到255之间,分别代表红、绿、蓝三种颜色的亮度。通过调整这些亮度值,可以混合出各种颜色。例如,当RGB三个通道的强度值都为0时,表示黑色;当RGB三个通道的强度值都为255时,表示白色。

RGB颜色调色板 

        HEX是一种常用于网页设计和图像处理中的颜色表示方法,它通过六位十六进制数来表示RGB颜色空间中的颜色。在HEX表示法中,前两位代表红色强度,中间两位代表绿色强度,最后两位代表蓝色强度。 

        通过改变这三个值的不同组合,可以得到一个包含2^24=16777216种颜色的调色板,但是人眼可见的却远远少于这个数字。

        例如我们总是认为乌鸦是黑色的,但其实在不同的光照条件下,乌鸦的羽毛可能会呈现出彩色的光泽。这正是因为RGB颜色空间虽然能够表示大量的颜色,但人眼的颜色感知却受到环境、光照等多种因素的影响。

 乌鸦羽毛五彩斑斓的黑

HSV

        HSV(Hue, Saturation, Value)是根据颜色的直观特性 色调(Hue)、饱和度(Saturation)和明度(Value)三个参数。由A. R. Smith在1978年创建的一种颜色空间, 也称六角锥体模型(Hexcone Model)。

 HSV分量可以通过RGB各分量值转化得到,计算公式如下:

其中,R,G,B分别为RGB颜色空间中的3个分量。 


图像格式

常见的图像格式有BMP格式,TiIFF格式,GIF格式,JPEG格式,PNG格式等。

BMP格式

        BMP格式是windows环境中的一种标准(但很多microsoft应用程序不支持它),这种格式采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。

  TIFF格式

        TIFF格式是一种灵活的图像存储格式,广泛应用于印刷、出版和扫描领域。它支持多种色彩模式,包括灰度、RGB、CMYK等,并允许无损压缩,以在保证图像质量的同时减少文件大小。TIFF格式还支持多层图像和透明度,使其在处理复杂图像时具有显著优势。此外,TIFF格式具有良好的兼容性,能够被多种图像编辑和处理软件所支持。

GIF格式

        GIF格式是一种广泛用于网络传输的图像格式。GIF格式以其独特的无损压缩技术和支持透明背景的特性而著称,这使得GIF图像在保持高质量的同时,文件大小相对较小,非常适合在网络上快速加载和显示。此外,GIF格式还支持动画效果,能够创建简单的动态图像,这一特性使其在社交媒体和网页设计中备受欢迎。尽管GIF格式的色彩深度有限,通常只能显示256种颜色,但这并不妨碍它在特定应用场景下的广泛应用。

JPEG格式

        JPEG格式源自对相对静止灰度或彩色图像的一种压缩标准,在使用有损压缩方法时可节省的空间是相当大的,目前数码相机中均使用这种格式。尽管JPEG格式采用有损压缩,可能会导致一定的图像质量损失,但通过调整压缩级别,用户可以在图像质量和文件大小之间找到理想的平衡点。这种灵活性使得JPEG格式成为存储和传输大量图片的优选方案,尤其是在存储空间有限或网络带宽受限的情况下。此外,JPEG格式还具有良好的跨平台兼容性,几乎可以被所有主流的图像查看器和编辑器所支持。

PNG格式

        PNG是一种无损压缩的图像格式,支持透明背景和Alpha通道,使得图像在保持高质量的同时,还能展现出更为丰富的层次感和细腻度。与GIF格式相比,PNG格式在色彩深度上不再受限,能够显示1600多万种颜色,这为图像的色彩表现提供了更广阔的空间。此外,PNG格式还支持多种图像编辑功能,如伽玛校正、文本注释等,进一步增强了其在图像处理和编辑领域的实用性。由于其无损压缩的特性,PNG格式在需要保持图像原始质量和细节的应用场景中,如网页设计中的图标、按钮等,具有不可替代的优势。

需要注意的是PNG格式的图片相对于其他格式图片来说,除了RGB三通道以外还多了一层alpha通道,这一层alpha通道使得PNG图片支持透明度设置,即可以实现图片的半透明效果,或者是抠图后的图片背景透明化。


读取图像cv2.imread()

#cv2.imread读取图像
import cv2
image=cv2.imread(filename='test.jpg',flags=cv2.IMREAD_UNCHANGED)
#filename:图像文件的路径
#flags:
    #cv2.IMREAD_COLOR:BGR格式彩色图像 
    #cv2.IMREAD_GRAYSCALE:灰度图像,是单通道的 
    #cv2.IMREAD_UNCHANGED:包括alpha通道,即透明通道
    #cv2.IMREAD_COLOR_BGR,以BGR格式读取图像,彩色
    #cv2.IMREAD_COLOR_RGB,以RGB格式读取图像,彩色
    #cv2.IMREAD_ANYDEPTH:读取任意深度的图像
    #cv2.IMREAD_ANYCOLOR:读取任意颜色的图像
    #cv2.IMREAD_LOAD_GDAL:使用GDAL读取图像
    #cv2.IMREAD_REDUCED_COLOR_2:读取1/2的彩色图像
    #cv2.IMREAD_REDUCED_COLOR_4:读取1/4的彩色图像
    #cv2.IMREAD_REDUCED_COLOR_8:读取1/8的彩色图像
    #cv2.IMREAD_REDUCED_GRAYSCALE_2:读取1/2的灰度图像
    #cv2.IMREAD_REDUCED_GRAYSCALE_4:读取1/4的灰度图像
    #cv2.IMREAD_REDUCED_GRAYSCALE_8:读取1/8的灰度图像
    #cv2.IMREAD_IGNORE_ORIENTATION:忽略图像的方向信息
    #cv2.IMREAD_COLOR是默认值,读取的图像是彩色BGR格式相当与cv2.IMREAD_COLOR_BGR
print(image.shape)

  cv2.imread()函数各flags参数含义详解

                cv2.imread()函数只有两个参数,filename与flages,filename指图像文件路径,flags是指定图像读取的方式。

以下是所有flags释义:
         

flags
cv2.IMREAD_COLOR读取彩色图像
cv2.IMREAD_GRAYSCALE读取单通道的灰度图像
cv2.IMREAD_UNCHANGED:按照图像原格式读取图像,若图像是png图像那么包括alpha通道,即透明通道,此时图像是四通道的,若图像不是png格式那么还是三通道。
 cv2.IMREAD_COLOR_BGR以BGR格式读取图像,彩色
 cv2.IMREAD_COLOR_RGB以RGB格式读取图像,彩色
cv2.IMREAD_ANYDEPTH读取任意深度的图像
 cv2.IMREAD_ANYCOLOR读取图像时自动检测并保留图像的原始颜色通道数。
cv2.IMREAD_LOAD_GDAL使用GDAL读取图像。GDAL 是专门用于处理地理空间数据格式的库,如 GeoTIFF、ENVI、HFA 等。
cv2.IMREAD_REDUCED_COLOR_2读取1/2的彩色图像
cv2.IMREAD_REDUCED_COLOR_4读取1/4的彩色图像
 cv2.IMREAD_REDUCED_COLOR_8:读取1/8的彩色图像
cv2.IMREAD_REDUCED_GRAYSCALE_2读取1/2的灰度图像
cv2.IMREAD_REDUCED_GRAYSCALE_4读取1/4的灰度图像
cv2.IMREAD_REDUCED_GRAYSCALE_8读取1/8的灰度图像
cv2.IMREAD_IGNORE_ORIENTATION忽略图像的方向信息

读取结果说明

Ndarray说明

          Ndarray的一般结构为:

[行数,列数,深度]

        其中行和列都是一维数组,我们知道行*列便可以构成矩阵,而深度则用来表示不同的行*列构成的矩阵的在最外层的数组中的索引。简而言之,ndarray就是数组内嵌套矩阵的格式,这样会十分方便理解。

          上述代码中的image为读取结果,由于我们的示例图片是.jpg格式没有alpha通道,所以flags使用cv2.IMREAD_UNCHANGED与cv2.IMREAD_COLOR并没有区别,通道数都为3。

 image的shape:(1161, 1080, 3)

        cv2.imread()函数的结果是ndarray,我们打印出其shape的结果中前两个参数是图像的高与宽,第三个参数是image的维度,这里的维度其实就是图像的RGB通道数。

获取单通道颜色矩阵

        倘若我们想要分别切片获取image的三个通道数对应的颜色矩阵那么我们可以这样写.

blue=image[:,:,0]
green=image[:,:,1]
red=image[:,:,2]
#或者
blue=image[0:1161,0:1080,0]
green=image[0:1161,0:1080,1]
red=image[0:1161,0:1080,2]

           在第一种写法中,这里要说明一下的是,ndarray的切片方法与python的list切片方法一致,切片时有一个特殊用法就是[:],它相当与[0:len(array)]用来直接获取整个数组所有值,倘若你要是不知道某一维这个数组的长度(比如上边我们读取的图像高1161宽1080,直接切片需[0:1161,0:1080]),又想获取整个数组的所有内容,可以使用这种方法。

        当然,为了方便,cv2已经内置了split函数替我们直接获取三个颜色通道的矩阵。

blue,green,red=cv2.split(image)

显示图像

使用cv2.imshow()显示图像

import cv2#opencv读取的格式是BGR
image=cv2.imread('test.jpg')
image=cv2.resize(image,(500,500))#更改一下图像大小,为了方便显示
cv2.imshow('image',image)
cv2.waitKey(0)
cv2.destroyAllWindows()

        这里的image是一个shape为(500,500,3)的ndarray,表示这是一个500x500像素的彩色图像,具有红、绿、蓝三个颜色通道。每个颜色通道都是一个500x500的二维数组。

结果

cv2.waitKey()

        cv2.waitKey()是用来在OpenCV(cv2)库中暂停程序执行并等待用户按键的函数。这个函数通常在显示图像时使用,比如在一个窗口中显示图像后,我们希望程序在用户按下任意键后再继续执行后续操作,这时就可以使用cv2.waitKey()函数。该函数接受一个整数参数,表示等待的毫秒数。如果参数为0,则表示无限期等待,直到用户按下键盘上的任意键。在按下键后,cv2.waitKey()会返回按键的ASCII码值,我们可以根据这个返回值来判断用户按下了哪个键。需要注意的是,在使用cv2.waitKey()之前,必须已经创建了一个图像显示窗口,否则该函数将无法正常工作。

cv2.destroyAllWindows()

      cv2.destroywindows()是用来关闭所有OpenCV创建过的窗口的,这些窗口实际是都是使用python内置库tkinter编写的,先前的tkinter窗口会阻塞主线程。所以,当我们完成图像处理或显示操作后,经常需要关闭这些窗口以释放资源。倘若不将他们关闭当前图像窗口可能无法显示。

使用plt.imshow()显示图像

import cv2#opencv读取的格式是BGR
import matplotlib.pyplot as plt#matplotlib读取的格式是RGB
image=cv2.imread('test.jpg')
image=cv2.resize(image,(500,500))
#使用plt.imshow(),需要先将BGR转化成RGB,这里使用cv2.cvtColor颜色通道转换函数完成
image=cv2.cvtColor(image,cv2.COLOR_RGB2BGR)
plt.axis('off')
plt.imshow(image)

结果

        这里需要注意的是opencv读取的图像时默认格式是BGR,而matplotlib读取的格式是RGB,如果我们在读取图像时不指定读取方式且不使用cv2.cvtColor()通道转换函数将颜色通道转换成RGB的话,那么显示出来的图像的颜色便会怪怪的。。。

        这是因为,matplotlib把原本是红色的通道误认为是蓝色通道,而原本是蓝色的通道则被认为是红色通道。这种颜色通道的错位就会导致图像颜色显示异常、

        但是,无论如何,cv2.imshow与plt.imshow这两个函数在显示图像时,需要传入的都是图像的ndarray数据。

保存图像cv2.imwrite()

#cv2.imwrite保存图像
import cv2
image=cv2.imread(filename='test.jpg',flags=cv2.IMREAD_UNCHANGED)
#图像经过某些变换或操作后需要保存
cv2.imwrite(filename='newImage.jpg',img=image,params=[int(cv2.IMWRITE_JPEG_QUALITY), 50])
#filename:保存图像文件名称
#img:图像颜色矩阵
#params:参数是一个可选的序列(通常是列表或元组),用于传递图像编码和压缩相关的参数。

        当我们需要保存图像时,直接调用cv2.imwrite()函数即可。 

总结

        本文主要介绍了opencv图像的读取与显示,后序还将分享更多相关图像处理技术,以及如何利用cv2进行图像特征提取和匹配。并且还会将所有内容合并到专栏中,免费订阅。

        通过本专栏的学习,读者将能够利用cv2库解决实际的图像处理问题,为计算机视觉项目打下坚实基础。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/980820.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

.h264/.h265文件 前端直接播放

由于接收摄像头 告警视频,需要前端直接播放,不想后端转码后传输。 摄像头 判断到告警后往服务器上报 .h264 /.h265 视频文件。 解决方式:html5直接采用 ffmpeg 进行转码 ,然后塞入 video标签,进行播放 目前改动ffmp…

【ATXServer2】Android无法正确显示手机屏幕

文章目录 现象原因分析与解决排查手机内部minicap 解决minicap问题查看移动端Android SDK版本查看minicap支持版本单次方案多次方案 现象 原因分析与解决 由于atxserver2在与Android动终端的链接过程中使用了agent:atxserver2-android-provider,按照项目…

Halcon 算子-承接车牌识别

1.rgb1_to_gray(Image,GrayImage) Image: 输入的图像GrayImage: 输出的灰度图像 2.threshold(GrayImage,Regions,Sigma,Sigma) GrayImage: 输入的图像Regions: 输出的区域Sigma: 调节的参数 3…

【Spark+Hive】基于Spark大数据技术小红书舆情分析可视化预测系统(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅

目录 一、项目背景 二、项目目标 三、算法介绍 四、开发技术介绍 五、项目创新点 六、项目展示 七、权威教学视频 源码获取方式在文章末尾 一、项目背景 在数字经济蓬勃发展的当下,社交电商平台小红书凭借其"内容电商"的独特模式,已…

Markdown 区块的妙用

Markdown 区块是我们最常用且功能强大的区块之一。它从轻量级文本提示到简单的 HTML 样式,甚至可以承担重要的业务逻辑,功能多样而灵活。 一、Markdown 区块的基本功能 由于 Markdown 区块具有灵活、公开和随时可更改的特点,它常被用于展示…

c++(7)模板初阶

1. 泛型编程 如何实现一个通用的交换函数呢? void Swap(int& left, int& right) {int temp left;left right;right temp; } void Swap(double& left, double& right) {double temp left;left right;right temp; } void Swap(char& left,…

anything文本分割优化

1、文本分割优化&#xff0c;建议 200 和40&#xff0c;把文档切得更碎一些方便检索命中。 2、RAG接口进一步优化 /*** RAG知识库接口** param prompt* return*/GetMapping(value "/rag/chat", produces MediaType.TEXT_EVENT_STREAM_VALUE)public Flux<ChatCom…

HarmonyOS学习第13天:布局进阶,从嵌套到优化

布局嵌套初体验 在 HarmonyOS 应用开发中&#xff0c;布局嵌套是构建复杂界面的重要手段。就像搭建一座高楼&#xff0c;布局嵌套能让各个界面元素有序组合&#xff0c;构建出功能丰富、层次分明的用户界面。我们以日常使用的电商 APP 为例&#xff0c;在商品展示区&#xff0c…

基于机器学习的智能谣言检测系统

在信息爆炸的时代&#xff0c;谣言和虚假信息的传播速度比以往任何时候都快。为了应对这一挑战&#xff0c;我们可以利用机器学习技术构建一个智能谣言检测系统。本文将带你从零开始&#xff0c;使用 Python 和 PyQt5 构建一个功能强大的谣言检测工具&#xff0c;并深入探讨其背…

数据结构——单调栈

一.单调栈简介 1.1单调栈定义与特性 本质&#xff1a;单调栈是一种特殊的栈结构&#xff0c;其内部元素始终保持单调递增或单调递减的顺序。核心规则&#xff1a;当新元素入栈时&#xff0c;会通过弹出破坏单调性的栈顶元素来维持有序性。单调方向&#xff1a; 单调递增栈&…

网络编程相关概念

一 网络概念 1.国际网络体系结构&#xff1a; OSI模型: open system interconnect 理论模型 1977 国际标准化组织 各种不同体系结构的计算机能在世界范围内互联成网。 OSI模型 应用层:要传输的数据信息&#xff0c;如文件传输&#xff0c;电子…

Trae:国内首款AI原生IDE,编程效率大提升

今年一月&#xff0c;在新闻上看到字节跳动面向海外市场推出了一款名为Trae的AI集成开发环境&#xff08;IDE&#xff09;。起初&#xff0c;我并未给予过多关注&#xff0c;因为市面上已有不少IDE集成了AI插件&#xff0c;功能也非常全面&#xff0c;而字节跳动自家的MarsCode…

Metasploit multi/handler 模块高级选项解析

multi/handler 是 Metasploit 框架中至关重要的模块&#xff0c;主要用于监听目标机的连接并处理来自目标的反向 shell 或会话。它可以灵活地适应不同渗透测试场景&#xff0c;提供高度的自定义选项以优化监听器的行为。 在 Metasploit msf6 框架中&#xff0c;当使用 exploit…

【前端】在WebStorm中安装Node.js与nvm与npm的详细过程

文章目录 一、Node.js安装二、nvm安装三、验证安装成功总结 一、Node.js安装 首先到node.js官网下载安装文件。 https://nodejs.org/zh-cn 直接运行安装文件进行安装&#xff1a; 跳过继续安装&#xff1a; 完成安装&#xff1a; 完成后的安装路径&#xff1a; 环境变量的…

广域互联方案与技术概述

《广域互联方案与技术概述》属于博主的“广域网”专栏&#xff0c;若想成为HCIE&#xff0c;对于广域网相关的知识需要非常了解&#xff0c;更多关于广域网的内容博主会更新在“广域网”专栏里&#xff0c;请持续关注&#xff01; 一.前言 广域网有着悠久的历史&#xff0c;广…

华硕电脑开启电池保养模式的方法

华硕电脑开启电池保养模式的方法 打开华硕电脑管家(可以桌面左下角搜索MyASUS打开)进入首页(可以不注册&#xff0c;点击跳过&#xff0c;进入首页)&#xff0c;点击电池&#xff1a; 之后在新的页面点击电池保养模式&#xff1a; 开启电池保养模式

一键安装Mysql部署脚本之Linux在线安装Mysql,脚本化自动化执行服务器部署(附执行脚本下载)

相关链接 一键安装Redis部署脚本之Linux在线安装Redis一键安装Mysql部署脚本之Linux在线安装Mysql一键安装JAVA部署脚本之Linux在线安装JDK一键安装Nginx部署脚本之Linux在线安装NginxNavicat最新版(17)详细安装教程Xshell客户端免费版无需注册XFtp客户端免费版无需注册 前言…

JavaScript阻塞

JS对DOM树的阻塞 DOM的定义&#xff1a;文档对象模型&#xff0c;是JS操作网页的接口&#xff0c;指代页面中的元素。DOM树的定义&#xff1a;是指元素与元素之间的关系&#xff0c;可以指页面的结构。 JS在执行时会阻塞DOM树的结构&#xff0c;此时DOM树是不完整的&#xff0…

Mysql进阶(一)

1. 在ubuntu下安装MySQL数据库 1.1 查看操作系统版本 操作系统版本为Ubuntu22.04. LTS lsb_release -a; 安装成功之后&#xff0c;查看mysql的状态 1.2 查看mysql的状态 1.3 登录mysql mysql -uroot -p; 1.4 退出mysql quit&#xff1b; exit&#xff1b; 2. mysql 程序的…

安卓基础组件Looper - 03 java层面的剖析

文章目录 workflow工作线程 准备Looper创建LooperActivity主线程其他情况 Looper.prepare()大体流程java申请Loopernew LooperMessageQueue初始化 nativejniNativeMessageQueue Looper.loop()大体流程java获取Looper获取msg&#xff0c;处理msgLooper.loop()Looper.loopOnce &a…