深度学习——自己的训练集——图像分类(CNN)

图像分类

    • 1.导入必要的库
    • 2.指定图像和标签文件夹路径
    • 3.获取文件夹内的所有图像文件名
    • 4.获取classes.txt文件中的所有标签
    • 5.初始化一个字典来存储图片名和对应的标签
    • 6.遍历每个图片名的.txt文件
    • 7.随机选择一张图片进行展示
    • 8.构建图像的完整路径
    • 9.加载图像
    • 10.检查图像是否为空

随机找100张图片,然后进行打标签,我用的labelImg打标签,存储的格式为.txt格式。
图片存储在‘561’文件夹中,标签存储在‘99’文件夹中。
把100图片的标签分别是sad,happy,amazed,anger。

1.导入必要的库

cv2: 这是OpenCV库的别名,它是一个强大的计算机视觉库,用于图像和视频处理。
matplotlib.pyplot as plt: Matplotlib是一个绘图库,pyplot是其中的一个模块,它提供了一个类似于MATLAB的绘图框架。plt是matplotlib.pyplot的常用别名。
numpy as np: NumPy是一个用于科学计算的库,它提供了高效的数组处理能力,对于图像处理等任务非常有用。
os: 这个模块提供了与操作系统交互的功能,比如文件和目录操作。
random: 这个模块提供了生成随机数的函数。

import cv2
import matplotlib.pyplot as plt
import numpy as np
import os
import random

2.指定图像和标签文件夹路径

images_folder = 'D:/rgzn/face/DATASET/561'
labels_folder = 'D:/rgzn/face/DATASET/99'

3.获取文件夹内的所有图像文件名

os.listdir()函数用于列出指定目录下的所有文件和子目录。
os.path.isfile()函数用于检查一个路径是否指向一个文件。
os.path.join()函数用于将目录和文件名组合成一个完整的文件路径。

这行代码的目的是从一个指定的文件夹中获取所有图像文件的列表。

image_files = [f for f in os.listdir(images_folder) if os.path.isfile(os.path.join(images_folder, f))]

os.listdir(images_folder):这个函数调用返回一个列表,包含images_folder目录下的所有文件和子目录的名称。

for f in os.listdir(images_folder):这是一个循环,它遍历images_folder目录下的每个文件和子目录的名称。在每次迭代中,f变量被设置为当前文件或子目录的名称。
os.path.isfile(os.path.join(images_folder, f)):这个条件用于检查f是否是一个文件。os.path.join(images_folder, f)创建一个完整的文件路径,将images_folder目录的路径和f(文件或子目录的名称)连接起来。

[f for f in os.listdir(images_folder) if os.path.isfile(os.path.join(images_folder, f))]:这个列表推导式创建一个新的列表,只包含那些通过os.path.isfile()检查确认为文件的f值。

4.获取classes.txt文件中的所有标签

with open(os.path.join(labels_folder, 'classes.txt'), 'r') as file:
    labels = file.readlines()
labels = [label.strip() for label in labels]  # 去除末尾的换行符

with open(os.path.join(labels_folder, ‘classes.txt’), ‘r’) as file:

os.path.join(labels_folder, 'classes.txt'):这个函数调用用于创建一个完整的文件路径,将labels_folder目录的路径和classes.txt文件名连接起来。
with open(...) as file:这是一个上下文管理器(context manager),它用于自动处理文件资源的打开和关闭。当with语句执行完成后,文件会自动关闭,即使遇到异常也是如此。
file:这是上下文管理器创建的一个文件对象,可以用来读取文件内容。

labels = file.readlines()

file.readlines():这个方法调用用于读取文件中的所有行,并将它们作为一个字符串列表返回。每一行都是一个列表项。
labels = ...:这个赋值语句将读取到的行列表赋值给变量labels。

labels = [label.strip() for label in labels]

这是一个列表推导式(list comprehension),它遍历labels列表中的每个字符串(即文件中的每行内容)。
label.strip():这个方法调用用于去除字符串首尾的空白字符(如空格、换行符等)。
for label in labels:这个循环遍历labels列表中的每个字符串。
[...]:这个列表推导式创建一个新的列表,包含去除空白字符后的字符串。

5.初始化一个字典来存储图片名和对应的标签

image_labels = {}

6.遍历每个图片名的.txt文件

for image_file in image_files:
    # 构建图片名.txt文件的完整路径
image_name = os.path.splitext(image_file)[0]  # 获取不带扩展名的图片名
    txt_path = os.path.join(labels_folder, image_name + '.txt')
    
    # 读取图片名.txt文件的内容
    with open(txt_path, 'r') as file:
        lines = file.readlines()
    
    # 假设每行包含一个数字序列
    numbers = lines[0].strip().split()  # 假设每行由空格分隔
    
    # 根据数字序列的第一个数字确定标签
    # 根据您提供的映射关系
    label_index = int(numbers[0])
    label = labels[label_index]
    
    # 将图片名和对应的标签存储在image_labels字典中
image_labels[image_file] = label

image_name = os.path.splitext(image_file)[0]:

os.path.splitext(image_file):这个函数调用用于将image_file(一个文件名)分割成两部分:文件名和扩展名。返回的元组中的第一部分是文件名,第二部分是扩展名。
[0]:这个索引操作符用于获取元组中的第一个元素,即不带扩展名的文件名。

txt_path = os.path.join(labels_folder, image_name + ‘.txt’):

os.path.join(labels_folder, image_name + '.txt'):这个函数调用用于创建一个完整的文件路径,将labels_folder目录的路径和image_name(不带扩展名的文件名)连接起来,并在最后加上.txt扩展名。
txt_path:这个变量存储了.txt文件的完整路径。

with open(txt_path, 'r') as file::

with open(...) as file::这是上下文管理器,用于自动处理文件资源的打开和关闭。
file:这个变量是上下文管理器创建的文件对象,用于读取.txt文件的内容。

lines = file.readlines():

file.readlines():这个方法调用用于读取.txt文件中的所有行,并将它们作为一个字符串列表返回。每一行都是一个列表项。
lines:这个变量存储了.txt文件中所有行的列表。

numbers = lines[0].strip().split():

lines[0]:这个索引操作符用于获取.txt文件中第一行的内容。
.strip():这个方法调用用于去除字符串首尾的空白字符(如空格、换行符等)。
.split():这个方法调用用于根据指定的分隔符(在这个例子中是空格)将字符串分割成列表。
numbers:这个变量存储了.txt文件第一行内容去除空白字符并分割成列表后的版本。

label_index = int(numbers[0]):

int(numbers[0]):这个函数调用用于将列表numbers的第一个元素(即标签的索引)转换为整数。
label_index:这个变量存储了标签的索引。

label = labels[label_index]:

labels[label_index]:这个索引操作符用于根据label_index变量中存储的索引,从labels列表中获取对应的标签字符串。
label:这个变量存储了从.txt文件中解析出的标签。

7.随机选择一张图片进行展示

#调用用于生成一个随机整数,其范围是从0到image_files列表的长度减1。
random_index = random.randint(0, len(image_files) - 1)

#根据random_index变量中存储的随机索引值,从image_files列表中获取对应的图像文件名。
image_name = image_files[random_index]

#用于根据image_name变量中存储的图像文件名,从image_labels字典中获取对应的标签。
label = image_labels[image_name]

8.构建图像的完整路径

创建一个完整的文件路径,将images_folder目录的路径和image_name连接起来。
image_path:这个变量存储了随机选择的图像文件的完整路径。

image_path = os.path.join(images_folder, image_name)

9.加载图像

读取图像文件

image = cv2.imread(image_path)

10.检查图像是否为空

#用于确定image变量是否为None
if image is None:
#图像加载失败,打印一条错误消息。
    print("Error: Failed to load image.")
else:
# 显示图像
#将图像从OpenCV的BGR颜色空间转换为Matplotlib的RGB颜色空间。OpenCV默认使用BGR颜色空间,而大多数图像处理库和图形界面(如Matplotlib)使用RGB颜色空间。
    plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
plt.title(f'Label: {label}  Image: {image_name}')
#用于关闭图像的坐标轴。这使得图像占据整个窗口,而不是在坐标轴周围留有空白。
plt.axis('off')
#显示图像。
plt.show()

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/654596.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

消息队列实战应用

适用场景 耗时长,非核心业务,生产者不会用到消息处理结果的情况下,可以将消息交给异步服务去缓存与消费 部署MQ服务 version: "3.0" services:rabbitmq:container_name: rabbitmq-15672-1image: rabbitmq:3-managementports:- &…

短视频再度重逢:四川京之华锦信息技术公司

短视频再度重逢 在数字化时代的浪潮中,短视频以其独特的魅力迅速崛起,成为现代人生活中不可或缺的一部分。而当我们谈论起短视频,我们不仅仅是在谈论一种娱乐方式,更是在谈论一种情感的载体,一种回忆的媒介。今天&…

【ai】LiveKit Agent 的example及python本地开发模式工程实例

title: ‘LiveKit Agent Playground’ playgroundLiveKit Community playground的环境变量:LiveKit API # LiveKit API Configuration LIVEKIT_API_KEYYOUR_API_KEY LIVEKIT_API_SECRETYOUR_API_SECRET# Public configuration NEXT_PUBLIC_LIVEKIT_URLwss://YOUR_…

pytorch比较操作

文章目录 常用的比较操作1.torch.allclose()2.torch.argsort()3.torch.eq()4.torch.equal()5.torch.greater_equal()6.torch.gt()7.torch.isclose()8.torch.isfinite()9.torch.isif()10.torch.isposinf()11.torch.isneginf()12.torch.isnan()13.torch.kthvalue()14.torch.less_…

【从零开始学习RabbitMQ | 第二篇】如何确保MQ的可靠性和消费者可靠性

目录 前言: MQ可靠性: 数据持久化: Lazy Queue: 消费者可靠性: 消费者确认机制: 消费失败处理: MQ保证幂等性: 方法一: 总结: 前言: …

以梦为马,不负韶华(3)-AGI在企业服务的应用

AGI在企业服务中,各应⽤已覆盖企业全流程,包含⼈⼒、法务、财税、流程⾃动化、知识管理和软件开发各领域。 由于⼤语⾔模型对⽂本处理类场景有着天然且直接的适配性,⽂本总结、⽂本内容⽣成、服务指引等发展起步早且应⽤成熟度更⾼。 在数据…

Captura完全免费的电脑录屏软件

一、简介 1、Captura 是一款免费开源的电脑录屏软件,允许用户捕捉电脑屏幕上的任意区域、窗口、甚至是全屏画面,并将这些画面录制为视频文件。这款软件具有多种功能,例如可以设置是否显示鼠标、记录鼠标点击、键盘按键、计时器以及声音等。此…

LeetCode题练习与总结:有序链表转换二叉搜索树--109

一、题目描述 给定一个单链表的头节点 head ,其中的元素 按升序排序 ,将其转换为平衡二叉搜索树。 示例 1: 输入: head [-10,-3,0,5,9] 输出: [0,-3,9,-10,null,5] 解释: 一个可能的答案是[0,-3,9,-10,null,5],它表…

医疗图像处理2023:Transformers in medical imaging: A survey

医学成像中的transformer:综述 目录 一、介绍 贡献与安排 二、CNN和Transformer 1.CNN 2.ViT 三、Transformer应用于各个领域 1.图像分割 1)器官特异性 ①2D ②3D 2)多器官类别 ①纯transformer ②混合架构 单尺度 多尺度 3)…

Kubernetes——监听机制与调度约束

目录 前言 一、监听机制 1.Pod启动创建过程 2.调度过程 1.指定调度节点 1.1强制匹配 1.2强制约束 二、硬策略和软策略 1.键值运算关系 1.硬策略——requiredDuringSchedulingIgnoredDuringExecution 2.软策略——preferredDuringSchedulingIgnoredDuringExecution …

Varjo XR-4功能详解:由凝视驱动的XR自动对焦相机系统

Varjo是XR市场中拥有领先技术的虚拟现实设备供应商,其将可变焦距摄像机直通系统带入到虚拟和混合现实场景中。在本篇文章中,Varjo的技术工程师维尔蒂莫宁详细介绍了这项在Varjo XR-4焦点版中投入应用的技术。 对可变焦距光学系统的需求 目前所有其他XR头…

基于STM32实现智能饮水机控制系统

目录 引言环境准备智能饮水机控制系统基础代码示例:实现智能饮水机控制系统 温度传感器数据读取水泵和加热器控制水位传感器数据读取用户界面与显示应用场景:家庭和办公室的智能饮水管理问题解决方案与优化收尾与总结 1. 引言 本教程将详细介绍如何在S…

自适应感兴趣区域的级联多尺度残差注意力CNN用于自动脑肿瘤分割| 文献速递-深度学习肿瘤自动分割

Title 题目 Cascade multiscale residual attention CNNs with adaptive ROI for automatic brain tumor segmentation 自适应感兴趣区域的级联多尺度残差注意力CNN用于自动脑肿瘤分割 01 文献速递介绍 脑肿瘤是大脑细胞异常和不受控制的增长,被认为是神经系统…

第二证券炒股知识:股票破发后怎么办?

当一只新股的价格跌破其发行价时,往往会受到商场出资者的关注。关于股票破发后怎么办,第二证券下面就为我们具体介绍一下。 股票破发是指股票的商场价格低于其发行价格或最近一次增发价格,股票破发往往是由于多种要素共同作用的结果&#xf…

强化学习——学习笔记2

在上一篇文章中对强化学习进行了基本的概述,在此篇文章中将继续深入强化学习的相关知识。 一、什么是DP、MC、TD? 动态规划法(DP):动态规划法离不开一个关键词,拆分 ,就是把求解的问题分解成若…

亡羊补牢,一文讲清各种场景下GIT如何回退

系列文章目录 手把手教你安装Git,萌新迈向专业的必备一步 GIT命令只会抄却不理解?看完原理才能事半功倍! 常用GIT命令详解,手把手让你登堂入室 GIT实战篇,教你如何使用GIT可视化工具 GIT使用需知,哪些操作…

Meta 推出新型多模态 AI 模型“变色龙”(Chameleon),挑战 GPT-4o,引领多模态革命

在人工智能领域,Meta 近日发布了一款名为“变色龙”(Chameleon)的新型多模态 AI 模型,旨在挑战 OpenAI 的 GPT-4o,并刷新了当前的技术标准(SOTA)。这款拥有 34B 参数的模型通过 10 万亿 token 的…

2-EMMC启动及各分区文件生成过程

EMMC的使用比nand flash还是复杂一些,有其特有的分区和电器性能 1、启动过程介绍 跟普通nand或spi flash不同,uboot前面还有好几级 在vendor某些厂商的设计中,ATF并不是BOOTROM加载后的第一个启动镜像,可能是这样的: …

微信小程序多端应用Donut Android生成签名

一、生成签名的作用 确保应用的完整性:签名可以确保应用在发布后没有被修改。如果应用被修改,签名就会改变,Android系统就会拒绝安装。确定应用的唯一身份:签名是应用的唯一标识,Android系统通过签名来区分不同的应用…

【Postman接口测试】第二节.Postman界面功能介绍(上)

文章目录 前言一、Postman前言介绍二、Postman界面导航说明三、使用Postman发送第一个请求四、Postman 基础功能介绍 4.1 常见类型的接口请求 4.1.1 查询参数的接口请求 4.1.2 表单类型的接口请求 4.1.3 上传文件的表单请求 4.1.4 JSON 类…