YOLO学习中的琐碎知识点

目录

一、导入的库

二、名词介绍

(1)pytorch张量

(2)边界框(bounding box)

三、pycharm操作

(1)参数设置

四、文件认识

五、YOLO如何训练自己的模型


一、导入的库

import torch

这行代码导入PyTorch库。

简单的说:PyTorch库是一个流行的深度学习框架,是一个基于Torch的Python开源机器学习库,用于自然语言处理等应用程序。

        Torch是一个有大量机器学习算法支持的科学计算框架,是一个与Numpy类似的张量(Tensor)操作库。

        对于PyTorch,通过反向求导技术,可以让你零延迟地任意改变神经网络的行为,而且其实现速度快。正是这一灵活性是PyTorch对比TensorFlow的最大优势。

优点:支持GPU;灵活,支持动态神经网络;底层代码易于理解;命令式体验;自定义扩展。

缺点:全面性处于劣势,目前PyTorch还不支持快速傅里叶、沿维翻转张量和检查无穷与非数值张量;针对移动端、嵌入式部署以及高性能服务器端的部署其性能表现有待提升;其次因为这个框架较新,使得他的社区没有那么强大,在文档方面其C库大多数没有文档。

pytorch简介和准备知识 - 夷则july的文章 - 知乎pytorch简介和准备知识 - 知乎

import cv2

这行代码导入OpenCV库,这是一个计算机视觉库,用于图像和视频处理。

import numpy as np

这行代码导入NumPy库,这是一个Python中用于科学计算的库,它提供了数组和矩阵的支持。

import time

这行代码导入time库,这是Python中用于测量时间的基本库之一。

import torchvision

这行代码导入torchvision库,这是PyTorch中专门用于计算机视觉任务的库,提供了一些常用的数据集、模型和预处理函数等。

from torchvision import transforms

这行代码从torchvision库中导入transforms模块,这个模块包含了一些常用的图像预处理函数,例如缩放、裁剪、旋转和标准化等。

二、名词介绍

(1)pytorch张量

        PyTorch张量是PyTorch中的核心数据结构,类似于多维数组。它们可以用来存储和操作数据,支持各种数学运算、线性代数操作和神经网络计算等。

        PyTorch张量类似于NumPy的多维数组,但是提供了额外的功能和优化,使其适用于深度学习任务。与NumPy数组相比,PyTorch张量还具有以下特点:

1. GPU加速:PyTorch张量可以在GPU上进行计算,通过将张量移动到GPU内存中,可以利用GPU的并行计算能力加速运算。

2. 自动求导:PyTorch张量可以自动跟踪和计算梯度。这对于使用梯度下降等优化算法来训练神经网络非常有用。

3. 动态计算图:PyTorch使用动态计算图,在每次前向传播时构建图形,从而允许更灵活的模型定义和控制流程。

4. 张量类型:PyTorch提供了不同类型的张量,如浮点型张量(torch.FloatTensor)、整数型张量(torch.LongTensor)和布尔型张量(torch.BoolTensor),以满足不同的需求。

通过使用PyTorch张量可以方便地进行各种数值计算、创建神经网络模型并进行训练。

(2)边界框(bounding box)

        边界框(bounding box)是指在图像或视频中标记物体位置的矩形框,通常用一组坐标表示。边界框可以用来描述目标物体的位置、大小和形状等信息。

        在计算机视觉领域,边界框是非常常见的一种数据结构,经常被用于目标检测、物体跟踪、人脸识别、姿态估计等任务中。例如,在目标检测中,我们需要从一张图像中找出所有的目标物体,并准确地框定它们的位置和大小。这时就需要使用边界框来描述每个目标物体的位置和尺寸。在物体跟踪中,我们需要不断地跟踪一个特定的物体,这时也需要使用边界框来描述物体的位置和大小。

三、pycharm操作

(1)参数设置

四、文件认识

instance_train.json是COCO数据集中的一个注释文件,其中包含了每张图片中所有物体的位置、类别、是否遮挡等信息。这些信息可以用于物体检测、语义分割等任务的训练和评估。

person_keypoints_train.json是COCO数据集中的另一个注释文件,它专门标注了人体关键点的位置信息,用于训练和评估人体姿态估计和动作识别等任务。

captions_val.json是COCO数据集中用于验证集的图像描述注释文件。它包含了每张图像的唯一标识符和对应的图像描述。每个图像通常会有多个描述,每个描述都是对该图像内容的自然语言描述。

captions:为图像描述的标注文件

instances:为目标检测与实例分割的标注文件

person_keypoints:为人体关键点检测的标注文件

注意:这些文件是自己下载的

推荐:COCO数据集(目标检测任务json文件内容总结) - Fangzh的文章 - 知乎
https://zhuanlan.zhihu.com/p/309549190

COCO数据集(.json)训练格式转换成YOLO格式(.txt)

推荐:http://t.csdnimg.cn/he7yq

五、YOLO如何训练自己的模型

推荐文章:http://t.csdnimg.cn/gT8vB

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/411019.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

五.AV Foundation 视频播放 - 标题和字幕

引言 本篇博客主要介绍使用AV Foundation加载视频资源的时候,如何获取视频标题,获取字幕并让其显示到播放界面。 设置标题 资源标题的元数据内容,我们需要从资源的commonMetadata中获取,在加载AVPlayerItem的时候我们已经指定了…

vue2实现无感刷新token

🎬 江城开朗的豌豆:个人主页 🔥 个人专栏 :《 VUE 》 《 javaScript 》 📝 个人网站 :《 江城开朗的豌豆🫛 》 ⛺️ 生活的理想,就是为了理想的生活 ! 目录 📘 引言: &#x1f4…

大概了解一下G1收集器

在上一篇文章中(链接:大概了解一下CMS收集器)我们提到,CMS是一种主要针对旧生代对象进行回收的收集器。与CMS不同,G1号称“全功能的垃圾收集器”,对初生代内存和旧生代内存均进行管理。鉴于此,这…

如何多环境切换?如何在微服务配置多环境?

问题本质: nacos配置中心的配置是如何被项目读取到的?(nacos的配置中心和项目是如何联系的?) 注意:nacos有配置管理和服务管理,别弄混。自动注册的是服务管理!!! 1. 如何注册到nacos服务管理中心…

如何使用视频号下载提取器提取视频,推荐2种方法使用!

视频号下载提取视频号视频,推荐大家2个方法​! 前者简单,后者较为复杂,不过都可以提取视频号视频,大家可根据实际情况来使用​。 视频号下载工具提取器​? 1:通过搜一搜的这款搜索引擎找到自己…

【前端素材】推荐优质后台管理系统Xmino Admin平台模板(附源码)

一、需求分析 后台管理系统通常是指一个用于管理网站、应用程序或系统的管理界面,通常由管理员使用。其功能和设计思路可以根据具体需求和系统复杂性有所不同,但一般包括以下几个方面的功能和设计考虑: 功能分析: 用户管理&…

vant安装教程(基于vue3)

1、先安装 npm i vant 如果不行安装这个 yarn add vant 2、在main.js中引入即可 import { createApp } from vue import App from ./App.vue import router from ./router import store from ./store import { Button } from vant; import vant/lib/index.css;createApp(App).…

qt-C++笔记之事件过滤器

qt-C笔记之事件过滤器 —— 杭州 2024-02-25 code review! 文章目录 qt-C笔记之事件过滤器一.使用事件过滤器和不使用事件过滤器对比1.1.使用事件过滤器1.2.不使用事件过滤器1.3.比较 二.Qt 中事件过滤器存在的意义三.为什么要重写QObject的eventFilter方法?使用QO…

土耳其商务团一行莅临优积科技考察交流

7月31日土耳其商务代表Emre Arif Parlak等一行三人莅临优积科技考察交流,公司CEO刘其东携团队成员热情接待并深入交流。 商务团首先参观了我司产品生产基地,详细了解了钢结构模块的生产加工工艺流程和质量控制体系。随后参观了我司模块化学校样板房、模块…

Jmeter系列(2)目录介绍

目录 Jmeter目录介绍bin目录docsextrasliblicensesprintable_docs Jmeter目录介绍 在学习Jmeter之前,需要先对工具的目录有些了解,也会方便后续的学习 bin目录 examplesCSV目录中有CSV样例jmeter.batwindow 启动文件jmeter.shMac/linux的启动文件jmete…

企业想要高效上云?如何实现?

进入数字化、智能化时代以后,企业数字化转型已成为企业发展的必然趋势。浪潮之中,越来越多的企业开始积极探索上云路径,云上创新已经成为企业加速数字化转型,提升竞争力的必经之路。 赞奇与华为携手共创云桌面SaaS产品—赞奇云工作…

医院管理系统小程序

**🍅点赞收藏关注 → 私信领取本源代码、数据库🍅 本人在Java毕业设计领域有多年的经验,陆续会更新更多优质的Java实战项目希望你能有所收获,少走一些弯路。🍅关注我不迷路🍅**一 、设计说明 1.1 研究背景…

解决方案 || 在Windows中运行含有bash命令的开源代码仓库

在Windows中运行含有bash命令的开源代码仓库 文章目录 在Windows中运行含有bash命令的开源代码仓库问题分析解决方案使用Git Bash使用Windows Subsystem for Linux (WSL)使用Cygwin 结论 问题分析 在开源社区中,许多项目都是基于Unix-like系统(如Linux或…

EXCEL如何从另一个表查找匹配信息

目录 1.背景:我们有一个目标呈现表,想要从另一个表中查询得到信息,比如根据身份证id查询该id的名字、性别等个人基本信息,或者从另一个财务信息表查询该id的工资信息等; 2.基础方法:利用VLOOKUP函数根据单…

操作系统--设备管理

一、设备控制器 我们的电脑设备可以接非常多的输入输出设备,比如键盘、鼠标、显示器、网卡、硬盘、打印机、音响等等,每个设备的用法和功能都不同。为了屏蔽设备之间的差异,每个设备都有一个叫设备控制器(Device Control&#xf…

淘金优化算法GRO求解不闭合MD-MTSP,可以修改旅行商个数及起点(提供MATLAB代码)

一、淘金优化算法GRO 淘金优化算法(Gold rush optimizer,GRO)由Kamran Zolf于2023年提出,其灵感来自淘金热,模拟淘金者进行黄金勘探行为。淘金优化算法(Gold rush optimizer,GRO)提…

PostgreSQL 与MySQL 对比使用

一、前言 博主的系统既有 用到MySQL 也有用到PostgreSQL ,之所以用到这两种数据库,主要是现在都是国产替代,虽然说这两款数据库也不是国产的,但是相对开源,oracle是不让用了。所以现在使用比较多的就是这两个关系型数据…

Canvas动画之豌豆射手

🌹作者主页:青花锁 🌹简介:Java领域优质创作者🏆、Java微服务架构公号作者😄 🌹简历模板、学习资料、面试题库、技术互助 🌹文末获取联系方式 📝 往期热门专栏回顾 专栏…

力扣1290. 二进制链表转整数

Problem: 1290. 二进制链表转整数 文章目录 题目描述思路复杂度Code 题目描述 思路 1.记录一个变量res初始化为0,指针p指向链表头; 2.循环每次res res * 2 p -> val;p p -> next;(充分利用二进制数的特性;其中利用指针先…

Spring的生命周期

文章目录 第一章 对象的生命周期1.1 什么是对象的生命周期1.2 为什么要学习对象的生命周期1.3 生命周期的 3 个阶段1.3.1 创建阶段1.3.2 初始化阶段1.3.3 销毁阶段 1.4 总结 第二章 后置处理Bean2.1 后置处理Bean的运⾏原理分析2.2 BeanPostProcessor的开发步骤 第一章 对象的生…