使用YOLOv9训练和测试自己的数据集

任务:检测舌头上的裂纹和齿痕

已经有了labelme标注的数据集,并且转为了coco格式

参考:

详细!正确!COCO数据集(.json)训练格式转换成YOLO格式(.txt)_coco数据集的train.txt-CSDN博客

coco数据集转yolo数据集(简单易懂)_coco转yolo-CSDN博客

【模型复现】自制数据集上复现刚发布的最新 yolov9 代码_yolov9复现-CSDN博客

数据集转换

首先将coco格式转为YOLO格式

参考:coco数据集转yolo数据集(简单易懂)_coco转yolo-CSDN博客

我自己备份一下

转换代码

#COCO 格式的数据集转化为 YOLO 格式的数据集
#--json_path 输入的json文件路径
#--save_path 保存的文件夹名字,默认为当前目录下的labels。

import os
import json
from tqdm import tqdm
import argparse

parser = argparse.ArgumentParser()
#这里根据自己的json文件位置,换成自己的就行
parser.add_argument('--json_path', default='D:/workSpace/pycharm/yolov5/MyTest/SAR_coco/annotations/instances_val2017.json',type=str, help="input: coco format(json)")
#这里设置.txt文件保存位置
parser.add_argument('--save_path', default='D:/workSpace/pycharm/yolov5/MyTest/SAR_coco/Lable/val2017', type=str, help="specify where to save the output dir of labels")
arg = parser.parse_args()

def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = box[0] + box[2] / 2.0
    y = box[1] + box[3] / 2.0
    w = box[2]
    h = box[3]
#round函数确定(xmin, ymin, xmax, ymax)的小数位数
    x = round(x * dw, 6)
    w = round(w * dw, 6)
    y = round(y * dh, 6)
    h = round(h * dh, 6)
    return (x, y, w, h)

if __name__ == '__main__':
    json_file =   arg.json_path # COCO Object Instance 类型的标注
    ana_txt_save_path = arg.save_path  # 保存的路径

    data = json.load(open(json_file, 'r'))
    if not os.path.exists(ana_txt_save_path):
        os.makedirs(ana_txt_save_path)

    id_map = {} # coco数据集的id不连续!重新映射一下再输出!
    with open(os.path.join(ana_txt_save_path, 'classes.txt'), 'w') as f:
        # 写入classes.txt
        for i, category in enumerate(data['categories']):
            f.write(f"{category['name']}\n")
            id_map[category['id']] = i
    # print(id_map)
    #这里需要根据自己的需要,更改写入图像相对路径的文件位置。
    list_file = open(os.path.join(ana_txt_save_path, 'train2017.txt'), 'w')
    for img in tqdm(data['images']):
        filename = img["file_name"]
        img_width = img["width"]
        img_height = img["height"]
        img_id = img["id"]
        head, tail = os.path.splitext(filename)
        ana_txt_name = head + ".txt"  # 对应的txt名字,与jpg一致
        f_txt = open(os.path.join(ana_txt_save_path, ana_txt_name), 'w')
        for ann in data['annotations']:
            if ann['image_id'] == img_id:
                box = convert((img_width, img_height), ann["bbox"])
                f_txt.write("%s %s %s %s %s\n" % (id_map[ann["category_id"]], box[0], box[1], box[2], box[3]))
        f_txt.close()
        #将图片的相对路径写入train2017或val2017的路径
        list_file.write('./images/train2017/%s.jpg\n' %(head))
    print("convert successful!")
    list_file.close()



 修改json和txt地址即可

转换完成打开相关文件,检查一下路径、文件名之类的有没有问题。

根目录/my_datasets/
├─train.txt
├─val.txt
|─test.txt # 这个没有也OK
├─images
│	├──train2017
│	│	├──xxx.jpg		
│	│	└──xxx.jpg		
│	└──val2017
│		├──xxx.jpg		
│		└──xxx.jpg
│	└──test2017
│		├──xxx.jpg		
│		└──xxx.jpg		
└──labels
	├──train2017
	│	├──xxx.txt	
	│	└──xxx.txt			
	|──val2017
	|	├──xxx.txt			
	|	└──xxx.txt			
	└──classes.txt

YOLOv9的复现

先下载代码:GitHub - WongKinYiu/yolov9: Implementation of paper - YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information

下载预训练文件:YOLOv9-C

 点这儿下载的是yolov9-c-converted.pt,点下面将yolov9-c.pt下载到根目录即可。

 搭建虚拟环境

# 创建环境
conda create -n yolov9 python=3.8

# 激活环境
conda activate yolov9 

# torch 安装
# 本机 CUDA 为 11.8,故安装了符合要求的 pytorch==1.13,这里需要自行根据 CUDA 版本安装适配的 torch 版本
pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117


pip install Pillow==9.5.0
# pip 包
cd yolov9
pip install -r requirements.txt

 修改数据文件

在 yolov9/data 路径下新建 my_datasets.yaml 文件,以路径下的 coco.yaml 为标准进行参数配置,
修改 path 为数据存储路径
修改 names 为对应的标签名,编号名称要对应


path: ./datasets  # dataset root dir
train: train.txt  
val: val.txt  
test: test.txt  # optional

# Classes
names:
  0: chihen
  1: liewen2
  2: liewen1

 修改模型配置文件

./models/detect/yolov9-c.yaml

--nc        类别数量改一下就行

 

 配置训练的超参数

我们使用的是train_dual.py,val_dual.py,detect_dual.py都有_dual,使用train.py的话

修改train_dual.py,当然更妥当的方式应该是重写这个py文件

--weights        yolov9-c.pt 预训练权重文件的地址

--cfg       yolov9-c.yaml 文件的地址

--data        my_datasets.yaml文件的地址

--hyp        data/hyps/hyp.scratch-high.yaml   这个文件夹里面应该只有一个high没有low

--epochs

--batch-size

--imgsz

--dedvice        看你有几张卡,改一下

--optimizer        

 开始训练

终端输入命令

单卡训练指令

python train_dual.py


多卡训练指令

python -m torch.distributed.launch --nproc_per_node 8 train_dual.py

 看到下述界面,即成功开始训练!!!

 训练完

 exp里面会有训练的一些数据,exp15为例

配置验证超参数

修改val_dual.py

类似train_ dual.py,额外多一个

task:验证数据集选择,如val,test

开始验证

单卡验证指令

python val_dual.py

多卡验证指令

python -m torch.distributed.launch --nproc_per_node 8 val_dual.py

验证成功

配置推理超参数

修改detect_dual.py

 开始推理

单卡推理指令

python detect_dual.py

多卡推理指令

python -m torch.distributed.launch --nproc_per_node 8 detect.py

只要把需要推理的图片放在./datasets/images/test2017文件夹中,运行推理命令即可

推理的结果保存在runs\detect\exp 

可以查看评估一下

一些问题

遇到问题首先去官方issues里面查查

  我的问题都能在这里解决

Q1

Q2

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/652379.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Fiddler抓包工具】第五节.安卓、IOS抓包+fildder插件

文章目录 前言一、HTTPS抓包 1.1 HTTPS与HTTP区别 1.2 HTTPS抓包设置过程 1.3 错误解决方法 1.4 验证证书是否安装成功 1.5 Firefox HTTPS请求捕获二、IOS设备APP抓包 2.1 APP抓包Fiddler设置 2.2 APP抓包IOS设备设置 2.3 And…

拓展虚拟世界边界,云手机可以做到吗

虚拟世界,AI,VR等词汇是21世纪最为流行的词汇,在科技背后,这些词汇的影响变得越来越大,已经走进了人们的世界,比如之前APPLE发布的vision pro,使人们能够更加身临其境的体验到原生os系统&#x…

linux下docker 的使用(2)

上期我们讲了网络,现在来进行最后的 docker的基础内容 java项目的部署 假如说 我们java 项目已经写好了,现在在maven中打包一下我们的项目,然后会得到一个jar包,把jar包 上传到虚拟机上 点击package 命令,会得到一个…

js toFixed()四舍五入丢失精度问题处理

js toFixed()四舍五入丢失精度问题处理 错误展示 看了下lodash的代码,大概是通过使用科学计数法扩大10的n次,将操作数化为整数运算,可以避免精度丢失。 /*** Creates a function like _.round.** private* param {string} methodName The …

艾体宝干货 | 教程:使用ntopng和nProbe监控网络流量

本教程旨在分享如何通过 ntopng 和 nProbe 这两款工具,深入了解和掌握网络流量监控的艺术。我们将提供从基本概念到高级应用的全面指导,涵盖了在多种平台和设备上的部署和配置步骤。不论您是专业人员还是技术爱好者,跟随本教程,都…

IPD管理体系指南

目录 简介 CSDN学院 作者简介 简介 学习任何新的和识或体系,都是需要从这个体影涉及的概念开始的。 IPD 合集也是遵活的这个基础逻辑。 通过 100 例的内容,先将 IPD 涉及到的机含点做了一个统一的梳理。 而本期课程呢,作为IPD 体系的前…

文盘Rust -- 生命周期问题引发的 static hashmap 锁

100编程书屋_孔夫子旧书网 2021年上半年,撸了个rust cli开发的框架,基本上把交互模式,子命令提示这些cli该有的常用功能做进去了。项目地址:https://github.com/jiashiwen/interactcli-rs。 春节以前看到axum已经0.4.x了,于是想看看能不能用rust做个服务端的框架。 春节…

已解决ModuleNotFoundError : No module named ‘pandas亲测有效!!!

已解决ModuleNotFoundError : No module named ‘pandas亲测有效!!! 亲测有效 报错问题解决思路解决方法 报错问题 在运行Python代码时,你可能会遇到以下报错信息: ModuleNotFoundError: No module named pandas这个…

【算法】重建二叉树并进行后序遍历的Java实现

人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌…

[AIGC] Java常用的JSON库及简单示例

Java常用的JSON库及简单示例 在Java的世界里,JSON库广泛用于日常开发工作,本文将介绍几个常用的JSON库并配以简单的示例代码。 1. Gson Gson是Google提供的一个用来在Java对象和JSON数据之间进行转换的Java库。 它有一定的学习曲线,但一旦熟…

两年前的微信聊天记录能恢复吗?正确答案在这里(全)

微信已经成为我们日常沟通中不可或缺的一部分,承载着无数重要的对话和回忆。然而,面对手机更换、系统升级或意外删除等情况,许多人不禁要问:两年前的微信聊天记录能恢复吗?这个问题的答案并不简单,因为能否…

基于Docker搭建属于你的CC++集成编译环境

常常,我会幻想着拥有一个随时可以携带、随时可以使用的开发环境,那该是多么美好的事情。 在工作中,编译环境的复杂性常常让我头疼不已。稍有不慎,删除了一些关键文件,整个编译链就会瞬间崩溃。更糟糕的是,…

【leetcode1944--队列中可以看到的人数】

有n人排成一个队列,从左到右编号为0到n-1,height数组记录每个人的身高,返回一个数组,记录每个人能看到几个人。 类比:山峰问题,高的后面的矮的看不见。 从后往前,最后一个元素入栈&#xff0c…

ClickHouse数据管理与同步的关键技术

2024年 5 月 18 日,ClickHouse官方首届杭州 Meetup 活动成功举行。本次活动由 ClickHouse 和阿里云主办,NineData 和云数据库技术社区协办。围绕ClickHouse的核心技术、应用案例、最佳实践、数据管理、以及迁移同步等方面,和行业专家展开交流…

wps能打开caj文件吗?CAJ应该如何打开?caj转pdf

问题1:wps能打开caj文件吗? WPS不能直接打开CAJ文件。 CAJ是中国知网开发的一种文件格式,主要用于存储学术文献,需要使用专门的阅读器才能打开。 问题2:CAJ应该如何打开? 要打开CAJ文件,你可…

QT 圆盘百分比

1. /* 设置抗锯齿 */painter.setRenderHints(QPainter::Antialiasing, true);/* 最外层的圆 */QRect drawRect event->rect();QRadialGradient gradient1(drawRect.center(), drawRect.width() / 2, drawRect.center()); gradient1.setColorAt(0, Qt::transparent); gradi…

LangChain 0.2 - 基于 SQL 数据构建问答系统

本文翻译整理自:Build a Question/Answering system over SQL data https://python.langchain.com/v0.2/docs/tutorials/sql_qa/ 文章目录 一、项目说明⚠️ 安全说明⚠️架构 二、设置三、Chains1、将问题转换为 SQL查询2、执行 SQL查询3、回答问题 四、Agents1、S…

计算机网络-BGP基础概念

一、BGP的基本概念 BGP是一种实现自治系统AS之间的路由可达,并选择最佳路由的矢量性协议。早期发布的三个版本分别是BGP-1(RFC1105)、BGP-2(RFC1163)和BGP-3(RFC1267),1994年开始使用…

基础—SQL—DML(数据操作语言)插入数据

一、介绍 分类全称说明DMLData Manipulation Language数据操作语言。用来对数据库表中的数据进行增删改(插入、删除、修改) 则增、删、改是三个操作也就对应着三个关键字,分别是: 添加数据:( INSERT )修改数据&#…