【大厂AI课学习笔记NO.52】2.3深度学习开发任务实例(5)需求采集考虑维度

今天来学习,怎么做需求分析,如何明确数据采集需求。

我把自己考试通过的学习笔记,都分享到这里了,另外还有一个比较全的思维脑图,我导出为JPG文件了。下载地址在这里:https://download.csdn.net/download/giszz/88868909

本系列都是基于腾讯人工智能AI课的内容,学习笔记,分享给大家,需要更看全面任务的,去腾讯云官网看原文。

详细见下表:

需求采集维度示例
待确认      说明确认结果

赛道样式

明确赛道样式,看是否有和标志类似的图案

使用场地与光照情况

明确模型使用场景与光照情况

  • 室内
  • 侧光,背光,面向光;
  • 信号灯的影响,都会有;

明确交通标志倾斜角度范围

需要检测的交通标志的俯仰角(pitch)、偏航角(yaw)、翻滚角(roll)

这里要有空间想象力,就是注意一点,不是以地面作为xy平面坐标,而是以这个标志牌为平面,再想象出一个z轴,就清晰了。

如上图,x为轴——俯仰角

y为轴——偏航角

z为轴——翻滚角

明确需要检测的交通标志包含哪些

明确需要检测的交通标志包含哪些;1.需要详细列举所有要被检测的交通标志,未被列举的标志不会被识别;2.交通标志的数量越多采集工作量越大;

检测框覆盖范围

需要明确范围细节,如:1.是否包含杆体2.边缘出框情况等等

1.对于交通标志牌子,标注范围是交通标志牌所处范围即可;

2.对于交通信号灯,标注范围是灯亮的区域;

3.对于行人,标注范围是整个行人范围;

4.对于边缘出框的场景,如果出框范围不超过50%,也应当予以检测(如图 2最左侧和最右侧的标志应当能够检出);

检出框分类

是否要对每个框体单独检出

不需要,只需要输出对应检测框即可

需要检测的交通标志的最小框

需要检测的交通标志的最小框最小框越小,运算量越大,执行效率越低;同时,太小的检测框容易使标注误差变大

玩具车速度较快,需要检测到距离车2米的标志,为后续的小车操控预留时间。

对图片模糊程度的要求

实际操作中摄像头模糊效果容忍程度怎样

玩具车摄像头帧率较高,且有处理算法,糊程度实际测试下来最大模糊程度如图

设备色差情况

是否存在设备色差

摄像头较好,无需考虑摄像头色差,但是在部分场景下可能产生由环境光引起的色域变化和噪点,如图

把上面这个表格理解透彻,基本就知道计算机视觉的需求采集,要考虑哪些内容了。

延伸学习:


在计算机视觉中进行需求采集时,需要考虑的维度和注意事项较多。以下是一些主要的维度和注意事项,以及相应的解决思路:

一、考虑的维度:

  1. 应用场景:明确计算机视觉系统的应用场景,如安防监控、自动驾驶、医疗诊断等,有助于确定所需的数据类型和处理方式。
  2. 数据类型:根据应用场景,确定需要采集的数据类型,如图像、视频、深度信息等。
  3. 数据量:评估所需的数据量,以确保训练出的模型具有足够的泛化能力。
  4. 数据质量:关注数据的清晰度、准确性、完整性和多样性,以提高模型的性能。
  5. 实时性要求:对于需要实时处理的应用场景,应关注算法的运算速度和效率。

二、公认的注意事项:

  1. 数据隐私和安全:在采集和处理数据时,应遵守相关法律法规,确保用户隐私和数据安全。
  2. 数据标注准确性:对于需要人工标注的数据集,应确保标注的准确性和一致性,以提高模型的训练效果。
  3. 数据偏差和不平衡问题:注意数据集中可能存在的偏差和不平衡问题,如类别不均衡、场景偏差等,这些问题可能导致模型在特定情况下的性能下降。

三、解决思路:

  1. 针对应用场景和数据类型,选择合适的采集设备和方案,确保数据的准确性和完整性。
  2. 对于数据量需求,可以通过数据增强、迁移学习等技术来扩充数据集,提高模型的泛化能力。
  3. 关注数据质量,采用图像预处理、去噪等技术改善图像质量,提高模型的性能。
  4. 针对实时性要求,优化算法和计算资源,提高处理速度。
  5. 遵守相关法律法规,加强数据加密和访问控制,确保数据隐私和安全。
  6. 建立完善的数据标注流程和质量控制机制,提高数据标注的准确性。
  7. 采用采样策略、数据扩充等技术解决数据偏差和不平衡问题,提高模型在各种情况下的性能。

总之,在计算机视觉中进行需求采集时,需要全面考虑应用场景、数据类型、数据量、数据质量和实时性要求等维度,并关注数据隐私、安全、标注准确性以及偏差和不平衡等问题。通过选择合适的采集方案、优化算法和计算资源以及加强质量控制等措施,可以有效地解决这些问题,提高计算机视觉系统的性能和可靠性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/407025.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

《Linux C编程实战》笔记:信号量

信号量在操作系统的书里一般都有介绍,这里就只写书上说的了。 信号量是一个计数器,常用于处理进程或线程的同步问题,特别是对临界资源访问的同步。临界资源可以简单地理解为在某一时刻只能由一个进程或线程进行操作的资源,这里的…

FairyGUI × Cocos Creator 3.x 使用方式

前言 上一篇文章 FariyGUI Cocos Creator 入门 简单介绍了FairyGUI,并且按照官方demo成功在Cocos Creator2.4.0上运行起来了。 当我今天使用Creator 3.x 再引入2.x的Lib时,发现出现了报错。 这篇文章将介绍如何在Creator 3.x上使用fgui。 引入 首先&…

EarMaster Pro 7 简体中文破解版下载 v7.2.0.42 电脑版

软件介绍 EarMaster Pro 简体中文破解版是一款由丹麦皇家音乐学院官方制作的多功能音乐品鉴教育软件,软件具有丰富的功能,它可以自定义培训课程,针对性地训练音准、节奏、和声等音乐要素,用户可以根据自身需求和水平选择不同难度…

Minimize Inversions

先来看看官方题解的做法,他一反常态的没有在逆序对题目里面考虑每个位置的贡献,而是直接回到定义考虑每对数是否是逆序对 我们考虑原数列中任意的一组数\((a_i,a_j)\)和\((b_i,b_j)\)。如果最开始两个都不是逆序对,那么交换之后两个都是逆序对…

RabbitMQ的死信队列和延迟队列

文章目录 死信队列如何配置死信队列死信队列的应用场景Spring Boot实现RabbitMQ的死信队列 延迟队列方案优劣:延迟队列的实现有两种方式: 死信队列 1)“死信”是RabbitMQ中的一种消息机制。 2)消息变成死信,可能是由于…

VBA语言専攻资料周末新增

各位T3学员∶本周VBA技术资料增加5讲到385讲,看到通知后联络我免费领取资料。成果来之不易,您更新后请说声谢谢,感恩我的成果。MF381:使工作表使用区域适合窗口MF382:引用复制后的工作表MF383:处理Excel中存…

外星文明会是朋友还是敌人?科学家用AI模拟揭示惊人答案!

引言:人类与外星文明的潜在互动 自古以来,人类就对外太空充满了好奇与向往,无数科幻作品中都描绘了人类与外星文明的潜在互动。然而,这些互动并非总是和平友好的,正如物理学家Stephen Hawking所警告的,盲目…

Linux安装jdktomcatMySQl一战完成

一、jdk安装具体步骤 1、查询是否有jdk java -version 2、进入opt目录 cd /opt/ 连接服务器工具 进入opt目录,把压缩文件上传 查询是否查询成功 进入解压到的目录 cd /usr/local/创建新文件夹 mkdir java 再回到opt目录进行解压 cd /opt 解压到刚刚创建的文…

如何使用 NFTScan NFT API 在 Mantle 网络上开发 Web3 应用

Mantle Network 是建立在以太坊区块链之上的第 2 层扩展解决方案,采用了 Optimistic Rollups 技术,由 BitDAO 孵化,以提供比以太坊更快速和更经济的交易体验。由于 Mantle 基础链构建在 OP Stack 之上并与 EVM 兼容,因此以太坊网络…

LeetCode 102. 二叉树的层序遍历

题目链接https://leetcode.cn/problems/binary-tree-level-order-traversal/description/ 通过队列实现层序遍历 class Solution {public List<List<Integer>> levelOrder(TreeNode root) {List<List<Integer>> res new ArrayList<>();Queue<…

读书笔记之《巨富》:如何成为全球顶级富豪?

《巨富—全球超级新贵的崛起和其他人的没落》的作者是[美]克里斯蒂娅•弗里兰&#xff0c; 原作名: Plutocrats: The Rise of the New Global Super-Rich and the Fall of Everyone Else &#xff0c;2013年出版。 克里斯蒂娅•弗里兰&#xff08;Chrystia Freeland&#xff…

Linux使用C语言获取进程信息

Linux使用C语言获取进程信息 Author: OnceDay Date: 2024年2月22日 漫漫长路&#xff0c;才刚刚开始… 全系列文章可查看专栏: Linux实践记录_Once_day的博客-CSDN博客 参考文档: Linux proc目录详解_/proc/mounts-CSDN博客Linux下/proc目录介绍 - 知乎 (zhihu.com)Linux内…

Android 如何添加自定义字体

Android 如何添加自定义字体 比如我要添加 jetbrains 相关字体 在 res 文件夹中添加 font 文件夹。里面放入你的字体文件 .ttf .otf&#xff0c;字体文件名需要是小写&#xff0c;只能是字母和下划线。 在 xml 布局文件中直接通过 android:fontFamily"font/jetbrainsmo…

Python实战:xlsx文件的读写

Python实战&#xff1a;xlsx文件的读写 &#x1f308; 个人主页&#xff1a;高斯小哥 &#x1f525; 高质量专栏&#xff1a;Matplotlib之旅&#xff1a;零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程 &#x1f448; 希望得到您的订阅和支持~ &#…

基于java Springboot实现教务管理系统

基于java Springboot实现教务管理系统《视频版-建议收藏》 博主介绍&#xff1a;5年java开发经验&#xff0c;专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 央顺技术团队 Java毕设项目精品实战案例《1000套》 欢迎点赞 收藏 ⭐留言 文…

Springboot集成prometheus快速入门demo

一、介绍 prometheus Prometheus 是由前 Google 工程师从 2012 年开始在 Soundcloud 以开源软件的形式进行研发的系统监控和告警工具包&#xff0c;自此以后&#xff0c;许多公司和组织都采用了 Prometheus 作为监控告警工具。Prometheus 的开发者和用户社区非常活跃&#xff0…

【深度学习笔记】3_5 图像分类数据集fashion-mnist

注&#xff1a;本文为《动手学深度学习》开源内容&#xff0c;仅为个人学习记录&#xff0c;无抄袭搬运意图 3.5 图像分类数据集&#xff08;Fashion-MNIST&#xff09; 在介绍softmax回归的实现前我们先引入一个多类图像分类数据集。它将在后面的章节中被多次使用&#xff0c…

抖音视频评论数据提取软件|抖音数据抓取工具

一、开发背景&#xff1a; 在业务需求中&#xff0c;我们经常需要下载抖音视频。然而&#xff0c;在网上找到的视频通常只能通过逐个复制链接的方式进行抓取和下载&#xff0c;这种操作非常耗时。我们希望能够通过关键词自动批量抓取并选择性地下载抖音视频。因此&#xff0c;为…

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的犬种识别系统(附完整代码资源+UI界面+PyTorch代码)

摘要&#xff1a;本文介绍了一种基于深度学习的犬种识别系统系统的代码&#xff0c;采用最先进的YOLOv8算法并对比YOLOv7、YOLOv6、YOLOv5等算法的结果&#xff0c;能够准确识别图像、视频、实时视频流以及批量文件中的犬种。文章详细解释了YOLOv8算法的原理&#xff0c;并提供…

RabbitMQ-消息队列:发布确认高级

18、发布确认高级 在生产环境中由于一些不明原因&#xff0c;导致 RabbitMQ 重启&#xff0c;在 RabbitMQ 重启期间生产者消息投递失败&#xff0c; 导致消息丢失&#xff0c;需要手动处理和恢复。于是&#xff0c;我们开始思考&#xff0c;如何才能进行 RabbitMQ 的消息可靠投…