opencv学习:图像视频的读取截取部分图像数据颜色通道提取合并颜色通道边界填充数值计算图像融合

一、计算机眼中的图像

1.图像操作

构成像素点的数字在0~255之间

RGB叫做图像的颜色通道

 h=500,w=500

 

 2.灰度图像

3. 彩色图像

 4.图像的读取

 5.视频的读取

cv2.VideoCapture()--在OpenCV中,可以使用VideoCapture来读取视频文件,或是摄像头数据。

cv2.VideoCapture.isOpened()--判断文件打开是否成功,可以使用cv2.VideoCapture.isOpened()这个函数。

cv2.VideoCapture.read()--cv2.VideoCapture.read()提供了一个最简单的视频帧处理方式,集合了抓起Grab(),解码retrieve()两个功能,返回解码之后的数据。需要特别注意的是,如果获取到空帧,抓取失败或是文件结束,返回值会是一个空指针

示例:

VideoCapture也是支持读取摄像头的,提供rtsp码流即码流地址,

 二

1.截取部分图像数据
import os   
import cv2 
 
# 遍历指定目录,显示目录下的所有文件名
def CropImage4File(filepath,destpath):
    pathDir =  os.listdir(filepath)    # 列出文件路径中的所有路径或文件
    for allDir in pathDir:
        child = os.path.join(filepath, allDir)
        dest = os.path.join(destpath,allDir)
        if os.path.isfile(child):
        	image = cv2.imread(child) 
            sp = image.shape            #获取图像形状:返回【行数值,列数值】列表
            sz1 = sp[0]                 #图像的高度(行 范围)
            sz2 = sp[1]                 #图像的宽度(列 范围)
            #sz3 = sp[2]                #像素值由【RGB】三原色组成
            
            #你想对文件的操作
            a=int(sz1/2-64) # x start
            b=int(sz1/2+64) # x end
            c=int(sz2/2-64) # y start
            d=int(sz2/2+64) # y end
            cropImg = image[a:b,c:d]   #裁剪图像
            cv2.imwrite(dest,cropImg)  #写入图像路径
           
if __name__ == '__main__':
    filepath ='F:\\\maomi'             #源图像
    destpath='F:\\maomi_resize'        # resized images saved here
    CropImage4File(filepath,destpath)
2. 截取部分图像数据-批量处理
"""
处理数据集 和 标签数据集的代码:(主要是对原始数据集裁剪)
    处理方式:分别处理
    注意修改 输入 输出目录 和 生成的文件名
    output_dir = "./label_temp"
    input_dir = "./label"
"""
import cv2
import os
import sys
import time


def get_img(input_dir):
    img_paths = []
    for (path,dirname,filenames) in os.walk(input_dir):
        for filename in filenames:
            img_paths.append(path+'/'+filename)
    print("img_paths:",img_paths)
    return img_paths


def cut_img(img_paths,output_dir):
    scale = len(img_paths)
    for i,img_path in enumerate(img_paths):
        a = "#"* int(i/1000)
        b = "."*(int(scale/1000)-int(i/1000))
        c = (i/scale)*100
        time.sleep(0.2)
        print('正在处理图像: %s' % img_path.split('/')[-1])
        img = cv2.imread(img_path)
        weight = img.shape[1]
        if weight>1600:                         # 正常发票
            cropImg = img[50:200, 700:1500]    # 裁剪【y1,y2:x1,x2】
            #cropImg = cv2.resize(cropImg, None, fx=0.5, fy=0.5,
                                 #interpolation=cv2.INTER_CUBIC) #缩小图像
            cv2.imwrite(output_dir + '/' + img_path.split('/')[-1], cropImg)
        else:                                        # 卷帘发票
            cropImg_01 = img[30:150, 50:600]
            cv2.imwrite(output_dir + '/'+img_path.split('/')[-1], cropImg_01)
        print('{:^3.3f}%[{}>>{}]'.format(c,a,b))

if __name__ == '__main__':
    output_dir = "../img_cut"           # 保存截取的图像目录
    input_dir = "../img"                # 读取图片目录表
    img_paths = get_img(input_dir)
    print('图片获取完成 。。。!')
    cut_img(img_paths,output_dir)
3. 多进程(加快处理)
#coding: utf-8
"""
采用多进程加快处理。添加了在读取图片时捕获异常,OpenCV对大分辨率或者tif格式图片支持不好
处理数据集 和 标签数据集的代码:(主要是对原始数据集裁剪)
    处理方式:分别处理
    注意修改 输入 输出目录 和 生成的文件名
    output_dir = "./label_temp"
    input_dir = "./label"
"""
import multiprocessing
import cv2
import os
import time


def get_img(input_dir):
    img_paths = []
    for (path,dirname,filenames) in os.walk(input_dir):
        for filename in filenames:
            img_paths.append(path+'/'+filename)
    print("img_paths:",img_paths)
    return img_paths


def cut_img(img_paths,output_dir):
    imread_failed = []
    try:
        img = cv2.imread(img_paths)
        height, weight = img.shape[:2]
        if (1.0 * height / weight) < 1.3:       # 正常发票
            cropImg = img[50:200, 700:1500]     # 裁剪【y1,y2:x1,x2】
            cv2.imwrite(output_dir + '/' + img_paths.split('/')[-1], cropImg)
        else:                                   # 卷帘发票
            cropImg_01 = img[30:150, 50:600]
            cv2.imwrite(output_dir + '/' + img_paths.split('/')[-1], cropImg_01)
    except:
        imread_failed.append(img_paths)
    return imread_failed


def main(input_dir,output_dir):
    img_paths = get_img(input_dir)
    scale = len(img_paths)

    results = []
    pool = multiprocessing.Pool(processes = 4)
    for i,img_path in enumerate(img_paths):
        a = "#"* int(i/10)
        b = "."*(int(scale/10)-int(i/10))
        c = (i/scale)*100
        results.append(pool.apply_async(cut_img, (img_path,output_dir )))
        print('{:^3.3f}%[{}>>{}]'.format(c, a, b)) # 进度条(可用tqdm)
    pool.close()                        # 调用join之前,先调用close函数,否则会出错。
    pool.join()                         # join函数等待所有子进程结束
    for result in results:
        print('image read failed!:', result.get())
    print ("All done.")



if __name__ == "__main__":
    input_dir = "D:/image_person"       # 读取图片目录表
    output_dir = "D:/image_person_02"   # 保存截取的图像目录
    main(input_dir, output_dir)
 4.颜色通道提取

在OpenCV中,cv2.split() 函数用于将多通道数组(如彩色图像)拆分为多个单通道数组。彩色图像通常由多个颜色通道组成,例如BGR(蓝绿红)彩色空间中的三个通道。cv2.split() 函数将这些通道拆分为独立的数组,每个数组只包含一个通道的信息。

以下是使用 cv2.split() 的示例代码:

import cv2

# 读取一张彩色图片
image = cv2.imread('path_to_your_color_image.jpg')

# 使用 cv2.split() 拆分通道
b, g, r = cv2.split(image)

# 此时,b, g, r 分别包含蓝色、绿色和红色通道的图像数据

# 如果你想查看每个通道的图像,可以这样做:
cv2.imshow('Blue Channel', b)
cv2.imshow('Green Channel', g)
cv2.imshow('Red Channel', r)

# 等待按键,然后关闭窗口
cv2.waitKey(0)
cv2.destroyAllWindows()
 5.合并颜色通道

cv2.merge() 是 OpenCV 中用来合并多个单通道图像为一个多通道图像的函数。它的工作原理与 cv2.split() 相反。如果你有几个单通道图像(例如,从 cv2.split() 得到的),并且你想将它们合并成一个多通道图像(例如,一个彩色图像),那么你可以使用 cv2.merge()。

以下是 cv2.merge() 的基本用法:

import cv2

# 假设你有三个单通道图像:b, g, r
# 这些通常是通过 cv2.split() 从一个彩色图像中得到的
b = ... # 蓝色通道图像
g = ... # 绿色通道图像
r = ... # 红色通道图像

# 使用 cv2.merge() 将它们合并为一个彩色图像
bgr_image = cv2.merge([b, g, r])

# 现在 bgr_image 是一个包含 b, g, r 三个通道的彩色图像

在 cv2.merge() 函数中,你需要传递一个列表作为参数,该列表包含你想要合并的所有单通道图像。合并的顺序很重要,因为它决定了输出图像中通道的顺序。在上述示例中,我们按照 BGR(蓝绿红)的顺序合并了通道,这是 OpenCV 中彩色图像的标准通道顺序。

如果你想合并的通道顺序与 BGR 不同,例如 RGB(红绿蓝)顺序,你需要相应地调整通道的顺序:

rgb_image = cv2.merge([r, g, b])

请注意,cv2.merge() 要求所有输入图像都具有相同的大小和类型。如果它们的大小或类型不匹配,函数将抛出一个错误。

在处理图像时,理解通道的顺序和类型非常重要,因为不同的图像处理库和函数可能会使用不同的通道顺序和数据类型。OpenCV 使用 BGR 顺序,而一些其他库(如 PIL/Pillow)则使用 RGB 顺序。因此,在将图像从一个库传递到另一个库时,可能需要进行通道顺序的转换。

6.边界填充

cv2.copyMakeBorder() 是 OpenCV 库中的一个函数,用于在图像周围创建边框。cv2.copyMakeBorder(src,top,bottom,left,right,borderType,value)

下面是该函数的参数及其解释:

src:要处理的输入图像。
top:在源图像的顶部添加的像素数目。
bottom:在源图像的底部添加的像素数目。
left:在源图像的左侧添加的像素数目。
right:在源图像的右侧添加的像素数目。
borderType:边框类型,可以是以下之一:
cv2.BORDER_CONSTANT:添加一个常量值的边框。此时需要提供一个value参数,用于指定常量值。
cv2.BORDER_REPLICATE:复制源图像的边界像素。
cv2.BORDER_REFLECT:对源图像的边界进行反射,比如:fedcba|abcdefgh|hgfedcb
cv2.BORDER_REFLECT_101:对源图像的边界进行反射,但略微不同,比如:gfedcb|abcdefgh|gfedcba
cv2.BORDER_WRAP:对源图像的边界进行包装,比如:cdefgh|abcdefgh|abcdefg
value(可选):当borderType为cv2.BORDER_CONSTANT时,指定的常量值。
该函数返回一个新的图像,其大小为原始图像加上指定边框大小,并且根据指定的边框类型进行填充。

 示例代码:

image = cv2.imread('./img/dog21.png')
image=cv2.cvtColor(image,cv2.COLOR_BGR2RGB)
# 定义填充参数
top_border = 10
bottom_border = 10
left_border = 10
right_border = 10

# 使用常数填充,填充值为0
bordered_image_constant = cv2.copyMakeBorder(image, top_border, bottom_border, left_border, right_border, cv2.BORDER_CONSTANT, value=0)

# 使用边界复制
bordered_image_replicate = cv2.copyMakeBorder(image, top_border, bottom_border, left_border, right_border, cv2.BORDER_REPLICATE)

# 使用边界反射
bordered_image_reflect = cv2.copyMakeBorder(image, top_border, bottom_border, left_border, right_border, cv2.BORDER_REFLECT)

# 使用边界反射101
bordered_image_reflect_101 = cv2.copyMakeBorder(image, top_border, bottom_border, left_border, right_border, cv2.BORDER_REFLECT_101)

# 使用边界包裹
bordered_image_wrap = cv2.copyMakeBorder(image, top_border, bottom_border, left_border, right_border, cv2.BORDER_WRAP)




# 创建子图
fig, ((ax1, ax2, ax3),(ax4, ax5,ax6)) = plt.subplots(2, 3, figsize=(20, 10), sharex=True, sharey=True)



# 显示图像
ax1.imshow(image.copy())
ax1.set_title('original')
ax2.imshow(bordered_image_constant)
ax2.set_title('constant')
ax3.imshow(bordered_image_replicate, cmap='gray')
ax3.set_title('replicate')
ax4.imshow(bordered_image_reflect, cmap='gray')
ax4.set_title('reflect')
ax5.imshow(bordered_image_reflect_101, cmap='gray')
ax5.set_title('reflect_101')
ax6.imshow(bordered_image_wrap, cmap='gray')
ax6.set_title('wrap')
plt.show()

Python OpenCV库中的边界填充通常用于图像处理,比如二值化后的边缘增强、腐蚀膨胀操作后的填补空洞等。边界填充函数cv2.floodFill()是一个常用工具。这个函数会在指定起点周围填充特定颜色,直到遇到另一个更大区域或者达到边界条件。

以下是一个基本的使用示例:

import cv2
import numpy as np

# 假设img是你的输入图像,前景像素是白色,背景是黑色
img = ...  # 你的图像数组

# 定义起始点和填充的颜色
seed_point = (x, y)  # 起始填充点的坐标
new_color = (255, 255, 255)  # 填充的新颜色,这里是白色

# 应用 floodFill
mask = np.zeros(img.shape[:2], dtype=np.uint8)
cv2.floodFill(img, mask, seed_point, new_color)

# 显示结果
cv2.imshow("Filled Image", img)
cv2.waitKey(0)
cv2.destroyAllWindows()
 7.数值计算

 

 cv2.add()函数中,如果像素点相加之和超过255则最大只能为255,不超过则不变

8.图像融合

两个图片shape值如果不一样不能做数值计算

resize函数

 

 

 1.图像尺寸调整
cv2.resize(img,(w,h)):调整图像img尺寸到w*h;
cv2.resize(img,(0,0),fx=3,fy=1):将w、h设置为0,fx为x向相对原图的比例,fy为y向相对于原图的比例,fx与fy大于1时图像为放大,小于1时为缩小。
2.图像融合
imgf=cv2.addWeighted(img1,α,img2,β,b)
img1与img2为需要融合的图像
α和β为两张图的融合系数
b为图像偏置量
计算方式:imgf=α×img1+β×img2+b
注意:两张可融合的图片必须尺寸一致,如不一致,需通过resize操作调整为一致方可融合
示例代码

import cv2
import os
os.chdir('e://text')
img1=cv2.imread('wanzi.png')
img2=cv2.imread('car.jpg')
def cv_show(name,img):
    cv2.imshow(name,img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
print(img1.shape)
print(img2.shape)
img2=cv2.resize(img2,(396,203))
#注意此句,img.shape的数值时(h,w),而resize需要的输入是(w,h),两者是颠倒的
print(img2.shape)
a=cv2.addWeighted(img,1,img2,0.5,0)
#注意:相加后,像素中加和超过255的值会被置为255
cv_show('a',a)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/802619.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

专业电脑硬盘修复教程,教你轻松搞定!

电脑硬盘作为电脑存储系统的重要组成部分&#xff0c;其健康状态直接影响到数据的安全和系统的运行速度。硬盘出现问题可能导致数据丢失、系统崩溃&#xff0c;甚至无法启动。及时进行硬盘修复&#xff0c;不仅可以恢复数据&#xff0c;还能延长硬盘的使用寿命。本文将详细介绍…

【经验分享】关于静态分析工具排查 Bug 的方法

文章目录 编译器的静态分析cppcheck安装 cppcheck运行 cppcheck 程序员的日常工作&#xff0c;不是摸鱼扯皮&#xff0c;就是在写 Bug。虽然这是一个梗&#xff0c;但也可以看出&#xff0c;程序员的日常一定绕不开 Bug。而花更少的时间修复软件中的 Bug&#xff0c;且不引入新…

华为USG6000V防火墙安全策略用户认证

目录 一、实验拓扑图 二、要求 三、IP地址规划 四、实验配置 1&#x1f923;防火墙FW1web服务配置 2.网络配置 要求1&#xff1a;DMZ区内的服务器&#xff0c;办公区仅能在办公时间内(9:00-18:00)可以访问&#xff0c;生产区的设备全天可以访问 要求2&#xff1a;生产区不…

(01)Unity使用在线AI大模型(使用百度千帆服务)

目录 一、概要 二、环境说明 三、申请百度千帆Key 四、使用千帆大模型 四、给大模型套壳 一、概要 在Unity中使用在线大模型分为两篇发布&#xff0c;此篇文档为在Python中使用千帆大模型&#xff0c;整体实现逻辑是&#xff1a;在Python中接入大模型—>发布为可传参的…

NSSCTF中24网安培训day2中web题目【下】

[NISACTF 2022]easyssrf 这道题目考察的是php伪协议的知识点 首先利用file协议进行flag查找 file:///flag.php 接着我们用file协议继续查找fl4g file:///fl4g 接着我们访问此文件&#xff0c;得到php代码如下 这里存在着stristr的函数&#x…

CREC晶振产品分类

CREC晶振大类有石英晶体谐振器、石英晶体振荡器、石英晶体滤波器 其中石英晶体谐振器&#xff1a; KHZ石英谐振器 车规级32.768KHz石英谐振器 专为汽车RTC应用而设计&#xff0c;通过AECQ-200可靠性测试&#xff0c;满足汽车电子的高标准时频需求&#xff0c;为客户提供可靠…

打破平台限制,使智能手机和平板电脑上无缝运行Windows x86/x64架构的软件和游戏的一款安卓应用

大家好&#xff0c;今天给大家分享一款专为Android设备设计的模拟器应用Winlator。其核心功能是能够在基于ARM架构的智能手机和平板电脑上无缝运行Windows x86/x64架构的软件和游戏。 Winlator是一款Android应用程序&#xff0c;它允许用户使用Wine和Box86/Box64在Android设备上…

通过Dockerfile构建镜像

案例一&#xff1a; 使用Dockerfile构建tomcat镜像 cd /opt mkdir tomcat cd tomcat/ 上传tomcat所需的依赖包 使用tar xf 解压三个压缩包vim Dockerfile FROM centos:7 LABEL function"tomcat image" author"tc" createtime"2024-07-16"ADD j…

4. JavaSE ——【移位运算符】

&#x1f4d6; 开场白 亲爱的读者&#xff0c;大家好&#xff01;我是一名正在学习编程的高校生。在这个博客里&#xff0c;我将和大家一起探讨编程技巧、分享实用工具&#xff0c;并交流学习心得。希望通过我的博客&#xff0c;你能学到有用的知识&#xff0c;提高自己的技能&…

《后端程序员 · Nacos 常见配置 · 第一弹》

&#x1f4e2; 大家好&#xff0c;我是 【战神刘玉栋】&#xff0c;有10多年的研发经验&#xff0c;致力于前后端技术栈的知识沉淀和传播。 &#x1f497; &#x1f33b; CSDN入驻不久&#xff0c;希望大家多多支持&#xff0c;后续会继续提升文章质量&#xff0c;绝不滥竽充数…

MQ基础1

对应B站视频&#xff1a; MQ入门-01.MQ课程介绍_哔哩哔哩_bilibili 微服务一旦拆分&#xff0c;必然涉及到服务之间的相互调用&#xff0c;目前我们服务之间调用采用的都是基于OpenFeign的调用。这种调用中&#xff0c;调用者发起请求后需要等待服务提供者执行业务返回结果后…

C#小结:未能找到类型或命名空间名“xxx”(是否缺少 using 指令或程序集引用?)

方案一&#xff1a;移除类库这些失效的引用&#xff0c;下载对应版本的dll&#xff08;如有则不需要重复下载&#xff09;&#xff0c;重新添加引用 方案二&#xff1a;类库右键属性-调整目标框架版本&#xff08;一般是降低版本&#xff09; 方案三&#xff1a;调整类库编译顺…

【TensorRT】Yolov5-DeepSORT 目标跟踪

Yolov5-DeepSORT-TensorRT 本项目是 Yolo-DeepSORT 的 C 实现&#xff0c;使用 TensorRT 进行推理 &#x1f680;&#x1f680;&#x1f680; 开源地址&#xff1a;Yolov5_DeepSORT_TensorRT&#xff0c;求 star⭐ ~ 引言 ⚡ 推理速度可达25-30FPS&#xff0c;可以落地部署&…

分布式 I/O 系统Modbus TCP 耦合器BL200

BL200 耦合器是一个数据采集和控制系统&#xff0c;基于强大的 32 位微处理器设计&#xff0c;采用 Linux 操作系统&#xff0c;可以快速接入现场 PLC、SCADA 以及 ERP 系统&#xff0c; 内置逻辑控制、边缘计算应用&#xff0c;支持标准 Modbus TCP 服务器通讯&#xff0c;以太…

<数据集>铁轨缺陷检测数据集<目标检测>

数据集格式&#xff1a;VOCYOLO格式 图片数量&#xff1a;844张 标注数量(xml文件个数)&#xff1a;844 标注数量(txt文件个数)&#xff1a;844 标注类别数&#xff1a;3 标注类别名称&#xff1a;[Spalling, Squat, Wheel Burn] 序号类别名称图片数框数1Spalling3315522…

FastAPI 学习之路(五十)WebSockets(六)聊天室完善

我们这次只是对于之前的功能做下优化&#xff0c;顺便利用下之前的操作数据的接口&#xff0c;使用下数据库的练习。 在聊天里会有一个上线的概念。上线要通知大家&#xff0c;下线也要通知大家谁离开了&#xff0c;基于此功能我们完善下代码。 首先&#xff0c;我们的登录用…

亲子母婴行业媒体邀约宣发资源

传媒如春雨&#xff0c;润物细无声&#xff0c;大家好&#xff0c;我是51媒体网胡老师。 亲子母婴行业是一个综合性的产业&#xff0c;涉及多个领域&#xff0c;包括儿童食品&#xff0c;儿童玩具&#xff0c;服装&#xff0c;洗护&#xff0c;月子中心&#xff0c;母婴护理&a…

Is Temperature the Creativity Parameter of Large Language Models?阅读笔记

最近有小伙伴来问LLM的参数该如何设计&#xff0c;废话不多说来看看paper吧。首先&#xff0c;常见的可以进行调参的几个值有temperature&#xff0c;top-p和top-k。今天这篇文章是关于temperature的。 原文链接&#xff1a;https://arxiv.org/abs/2405.00492 temperature如果…

Google如何构建AlphaFold 3来预测所有生命分子的结构和相互作用

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

硕博电子智能控制器、触摸显示屏在集装箱跨运车上的应用

港口跨运车&#xff0c;又称跨运车或轮胎式龙门吊(RTG)&#xff0c;专门用于集装箱码头的装卸和搬运作业&#xff0c;能够迅速完成集装箱在码头前沿、堆场区域以及仓库之间的运输和堆垛&#xff0c;大幅度缩短了装卸周期&#xff0c;提高了港口物流周转效率。 现代跨运车往往配…