目标检测脚本之mmpose json转yolo txt格式

目标检测脚本之mmpose json转yolo txt格式

一、需求分析

在使用yolopose及yolov8-pose 网络进行人体姿态检测任务时,有时需要标注一些特定场景的中的人型目标数据,用来扩充训练集,提升自己训练模型的效果。因为单纯的人工标注耗时费力,所以可以使用一些开源的大模型如(mmpose)来标注图片。以mmpose为例,对下面图片进行预测后生成的结果图如下所示:

1.预测图片

从预测图片可以看出,预测的结果还是不错的,目标框和关键点的位置预测的还是比较准确的。

mmpose 预测结果图

2. json 文件

从json 文件中可以看出,包含4个字段:Keyponts、keypoints_score、bbox、bbox_score,注意其中keypoints只包含关键点的(x,y)坐标值,并没有yolo格式中的v值。keypoints_score表示每个关键点的得分,bbox表示目标框的左上角和右下角坐标,bbox_score表示目标框的得分。

在这里插入图片描述
在这里插入图片描述

二、需求实现

1. 预计结果

如下图所示,希望通过脚本文件可以批量将mmpose生成的json文件转为yolo的txt标签格式

在这里插入图片描述

2. 源码实现:

# 处理 mmpose 推理后的json文件,生成coco格式关键点的标签文件
import json
import os
import cv2

# 目标检测框 x1y1x2y2 转 为 cls,x_center,y_center,w,h
def convert_xywh(box,image_width,image_height):
    x1,y1 = box[0],box[1]
    x2,y2 = box[2],box[3]
    x = (x2 + x1) /(2*image_width)
    y = (y2 + y1) /(2*image_height)
    width = (x2-x1) / image_width
    height = (y2-y1) / image_height
    class_id = 0
    return [class_id,round(x,4),round(y,4),round(width,4),round(height,4)]
    


#  判断目标的尺寸是否太小,这里设置了5以下返回True,可以自行根据实际情况更改
def is_too_small(label,image_width,image_height):
    if label[4] * image_width < 5 or label[3] * image_height< 5:
        return True


def json2txt(json_dir,image_dir,save_label_dir):
    """
    根据输入的json文件夹,图像文件夹,和保存标签的文件夹,生成coco格式的标签文件。
    
    Args:
        json_dir (str): 存放json文件的文件夹路径。
        image_dir (str): 存放图像文件的文件夹路径。
        save_label_dir (str): 保存标签文件的文件夹路径。
    
    Returns:
        None
    """
    print(save_label_dir)
    if not os.path.exists(save_label_dir):
        os.makedirs(save_label_dir)
    
    json_list = os.listdir(json_dir)
    for json_file in json_list:
        image_file = os.path.join(image_dir,json_file.split('.')[0]+'.jpg')
        img = cv2.imread(image_file)
        if img is None:
            continue
        width,height = img.shape[1],img.shape[0]
        json_path = os.path.join(json_dir,json_file)
        label_path = os.path.join(save_label_dir,json_file.split('.')[0]+'.txt')
        
        
        with open(json_path,'r',encoding='utf-8') as f:
            result = json.load(f)  # 读取json文件
            kepoints = []
            kepoints_scores = []
            boxes = []
            
            for item in result:
                kepoints.append(item.get("keypoints"))
                kepoints_scores.append(item.get("keypoint_scores"))
                boxes.append(item.get("bbox"))
            
            # print(len(boxes))
            
            coco_model_kepoints = []
            coco_boxes = []
            # 共有多少个目标,也相当于多少组关键点评分
            for i in range(len(kepoints_scores)):
                coco_model_kepoints_temp = []
                #每组关键点有17个,每个关键点有2个值,需要将每个关键点都转换成coco格式,补充为3个值
                for j in range(len(kepoints_scores[i])):                   
                    if kepoints_scores[i][j] >= 0.45:
                        x = kepoints[i][j][0]/width if kepoints[i][j][0]/width > 0 else 0
                        y = kepoints[i][j][1]/height if kepoints[i][j][1]/height > 0 else 0
                        v = 2
                    else:
                        x = 0
                        y = 0
                        v = 0
                    
                    if x > 1:
                        x = 1
                    if y > 1:
                        y = 1
                    x = round(x,4)
                    y = round(y,4)
                    coco_model_kepoints_temp.append(x)
                    coco_model_kepoints_temp.append(y)
                    coco_model_kepoints_temp.append(v)
                
                if all(v == 0 for v in coco_model_kepoints_temp) is False:
                    coco_boxes.append(convert_xywh(boxes[i][0],width,height))
                    coco_model_kepoints.append(coco_model_kepoints_temp)
                
            final_label = []   
            for k in range(len(coco_model_kepoints)):
                temp_label = []
                for item1 in coco_boxes[k]:
                    temp_label.append(item1)
                for item2 in coco_model_kepoints[k]:
                    temp_label.append(item2)
    
                final_label.append(temp_label)
            with open(label_path,'w',encoding='utf-8') as f1:
                for label in final_label:
                    if is_too_small(label,width,height):
                        continue
                    for item in label:
                        f1.write(str(item)+' ')
                    f1.write('\n')


if __name__ == '__main__':
    json_dir = '' # 放置使用mmpose 预测出来的图片的json 文件路径
    image_dir = '' # 放置用于预测的图片路径
    save_label_dir = '' # 用来保存最终label文件的路径

    json2txt(json_dir,image_dir,save_label_dir)


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/304214.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot多环境配置以及热部署

多环境配置 使用多环境配置的原因&#xff1a; 在SpringBoot项目的生命周期中&#xff0c;存在不同的环境&#xff0c;例如开发时的环境&#xff0c;测试时的环境&#xff0c;交付使用后的生产环境&#xff0c;每种环境的配置可能不一样&#xff0c;这种情况下可以通过多环境…

TS 36.212 V12.0.0-信道编码、复用和交织(3)-下行传输信道和控制信息

本文的内容主要涉及TS 36.212&#xff0c;版本是C00&#xff0c;也就是V12.0.0。

Redis黑马点评业务总结(含mac m1pro | windows11 wsl2 ubuntu环境配置 持续更新中~)

redis黑马点评项目分析业务学习笔记 含项目配置教学mac m1pro windows mac M1pro环境配置windows11 wsl2 ubuntu 环境配置一.短信登录1. 1发送验证码1.2短信登录注册1.3登录校验拦截器补缺Cookie Session Token1.4基于redistoken认证实现短信登陆1.5完善token认证的刷新机制 二…

Python图片格式转换与文字识别:技术与实践

目录 一、引言 二、Python图片格式转换 PIL库介绍 代码示例 质量优化 三、文字识别技术 四、Python实现文字识别 1、安装与配置OCR工具 2. 读取图片并提取文字 3. 优化与提高识别准确率 五、实践与应用案例 六、结论 一、引言 随着数字化时代的到来&#xff0c;图…

基于Python爬虫的B站弹幕可视化

介绍 这是一个基于Python的B站弹幕可视化项目&#xff0c;主要使用了python django、requests、jieba等库。该项目实现了以下功能&#xff1a; 1. 爬取Bilibili视频弹幕数据&#xff1a;通过爬虫获取视频的标题、视频总时长、封面图&#xff0c;视频地址以及所有弹幕数据等。 …

Linux 网络层收发包流程及 Netfilter 框架浅析

1. 前言 本文主要对 Linux 系统内核协议栈中网络层接收&#xff0c;发送以及转发数据包的流程进行简要介绍&#xff0c;同时对 Netfilter 数据包过滤框架的基本原理以及使用方式进行简单阐述。 内容如有理解错误而导致说明错误的地方&#xff0c;还请指正。如存在引用而没有添…

leetcode141.环形链表

题目 给你一个链表的头节点 head &#xff0c;判断链表中是否有环。 如果链表中有某个节点&#xff0c;可以通过连续跟踪 next 指针再次到达&#xff0c;则链表中存在环。 为了表示给定链表中的环&#xff0c;评测系统内部使用整数 pos 来表示链表尾连接到链表中的位置&#…

适合学生党的平价蓝牙耳机推荐,可以闭眼冲的平价开放式蓝牙耳机

一副可靠且平价的蓝牙耳机成为了学生党不可或缺的学习、娱乐利器&#xff0c;一款性价比高、品质过硬的平价开放式蓝牙耳机无疑是不可或缺的选择&#xff0c;我这就为你们盘点几款平价的蓝牙耳机&#xff0c;让你们闭眼冲也不心疼钱包&#xff0c;说到开放式蓝牙耳机其实这种耳…

欧洲编程语言四巨头

从左往右&#xff0c;依次是 尼克劳斯沃斯 (Niklaus Wirth)&#xff0c;迪杰斯特拉&#xff08;Edsger Dijkstra&#xff09;&#xff0c;霍尔&#xff08;Tony Hoare&#xff09; 尼克劳斯沃斯 (Niklaus Wirth) 瑞士人&#xff0c;一生发明了8种编程语言&#xff0c;其中最著…

OpenBLAS 的静态库命名分析 — — 以 x86_64 的静态库为例

在不同的机器上&#xff0c;生成的openblas生成的lib的名字可能是这样的&#xff1a; libopenblas_skylakexp-r0.3.26.dev.a libopenblas_skylakexp-r0.3.26.dev.so 也可能是这样的&#xff1a; liblapack_static_haswellp-r0.3.25.dev.a libopenblas_haswellp-r0.3.26.dev…

如何使用GaussDB创建脱敏策略(MASKING POLICY)

目录 一、前言 二、GaussDB中的脱敏策略 1、数据脱敏的定义 2、创建脱敏策略的语法说明 三、在GaussDB中如何创建数据脱敏策略(示例) 1、创建脱敏策略的一般步骤 2、GaussDB数据库中创建脱敏策略的完整示例 1&#xff09;开启安全策略开关&#xff0c;以初识用户omm登录…

Lumerical Monitors------frequency domain power monitor 频率域功率监视器

frequency domain power monitor 频率域功率监视器 引言正文引言 这里给大家介绍一下 frequency domain power monitor。 正文 首先,我们可以通过以下方式添加 frequency domain power monitor 到我们的工程文件中: 在 general tab 中,有一个共同的监视器设置 simulati…

【conda】conda 版本控制和环境迁移/安装conda加速工具mamba /conda常用指令/Anaconda配置

【conda】安装conda加速工具mamba /conda常用指令/Anaconda配置 0. conda 版本控制和环境迁移1. 安装conda加速工具mamba2. conda install version3. [Anaconda 镜像](https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/)使用帮助4. error deal 0. conda 版本控制和环境迁移…

电脑文件夹拒绝访问如何解决?

文件夹拒绝访问的问题是许多计算机用户在日常使用中可能会遇到的常见问题。当用户试图打开、读取、写入或修改一个文件夹时&#xff0c;可能会遇到“拒绝访问”的错误消息。这不仅会导致工作受阻&#xff0c;还可能引发对数据安全的担忧。为了解决这个问题&#xff0c;首先需要…

cocos creator 如何绑定参数到编辑器

很多cocos creator同学不知道如何绑定组件属性到编辑器上&#xff0c;今天我们来教大家如何绑定 1: 基本数据属性绑定到编辑器 这个非常简单&#xff0c;模板是属性名字: 默认的值; Is_debug: false, speed: 100, 2: 系统组件类型与节点绑定到编辑器 属性名字: { type: 组件…

YOLOv8改进 | 主干篇 | 12月份最新成果TransNeXt特征提取网络(全网首发)

一、本文介绍 本文给大家带来的改进机制是TransNeXt特征提取网络,其发表于2023年的12月份是一个最新最前沿的网络模型,将其应用在我们的特征提取网络来提取特征,同时本文给大家解决其自带的一个报错,通过结合聚合的像素聚焦注意力和卷积GLU,模拟生物视觉系统,特别是对于中…

数据结构-怀化学院期末题(322)

图的深度优先搜索 题目描述&#xff1a; 图的深度优先搜索类似于树的先根遍历&#xff0c;是树的先根遍历的推广。即从某个结点开始&#xff0c;先访问该结点&#xff0c;然后深度访问该结点的第一棵子树&#xff0c;依次为第二顶子树。如此进行下去&#xff0c;直到所有的结点…

【小白专用】(C#)用户、角色、权限控制体系

我们在开发很多项目的时候,都会用到用户权限管理,我也在很多项目里做过权限控制,所以,我也总结出一套条理清晰的角色权限控制体系。本文采用RBAC&#xff08;Role Based Access Control&#xff09;的基本思想&#xff0c;RBAC&#xff08;角色访问控制&#xff09;的基本思想可…

自动驾驶HWP的功能定义

一、功能定义 高速路自动驾驶功能HWP是指在一般畅通高速公路或城市快速路上驾驶员可以放开双手双脚&#xff0c;同时注意力可在较长时间内从驾驶环境中转移&#xff0c;做一些诸如看手机、接电话、看风景等活动&#xff0c;该系统最低工作速度为60kph。 如上两种不同环境和速度…

谷歌提出「边界注意力」模型,实现超越像素级检测精度!微弱边界也逃不过

有些情况下&#xff0c;当面临分辨率较低的图像时&#xff0c;可能会在进行诸如目标检测和图像分割等任务时遇到一些挑战和阻碍。这是因为低分辨率图像可能丢失了细节信息&#xff0c;使得计算机视觉系统难以准确捕捉和理解图像中的关键特征。在这种背景下&#xff0c;传统的方…