经典的目标检测算法有哪些?

一、经典的目标检测算法有哪些?

目标检测算法根据其处理流程可以分为两大类:One-Stage(单阶段)算法和Two-Stage(两阶段)算法。以下是一些经典的目标检测算法:

单阶段算法:

  • YOLO (You Only Look Once): 是一种非常快速的目标检测算法,它将目标检测任务作为回归问题来解决,直接在图像中预测边界框和类别概率。
  • SSD (Single Shot MultiBox Detector): 通过在不同尺度的特征图上进行检测,能够有效地检测出不同大小的目标,速度和精度都较为平衡。
  • RetinaNet: 引入了Focal Loss来解决类别不平衡问题,提高了模型对于难分样本的识别能力,从而提升了检测性能。

两阶段算法:

  • R-CNN (Region-based Convolutional Neural Networks): 是最早的深度学习目标检测模型之一,它首先生成候选区域,然后对每个区域进行卷积神经网络特征提取,并使用支持向量机(SVM)进行分类,最后通过边界框回归精确定位目标位置。
  • Fast R-CNN: 在R-CNN的基础上进行了改进,使用全卷积网络提取图像特征,并通过区域池化操作将不同尺寸的候选区域对齐到固定尺寸的特征图上,然后进行分类和边界框回归。
  • Faster R-CNN: 引入了区域提议网络(RPN)来生成高质量的候选区域,进一步提高了检测的速度和精度。

这些算法各有优势,选择哪种算法通常取决于具体应用场景中对速度和精度的要求。

二、YOLO 的简单例子

from ultralytics import YOLO

# 加载模型
model = YOLO('E:\PycharmProjects\\yolov8n.pt')

# 识别图片的物体
results = model(['E:\\testImage\\cat1.png', 'E:\\testImage\\heixiong.jpg'])

# 处理图片列表
for result in results:
    boxes = result.boxes  # Boxes object for bounding box outputs
    masks = result.masks  # Masks object for segmentation masks outputs
    keypoints = result.keypoints  # Keypoints object for pose outputs
    probs = result.probs  # Probs object for classification outputs
    result.show()  # display to screen
    result.save(filename='result.jpg')  # save to disk
输出的结果图片:

 

模型下载地址:

Detect - Ultralytics YOLOv8 DocsOfficial documentation for YOLOv8 by Ultralytics. Learn how to train, validate, predict and export models in various formats. Including detailed performance stats.icon-default.png?t=N7T8https://docs.ultralytics.com/tasks/detect/

三、“糟心的PIP源

安装:

pip install ultralytics

但是总是很糟心的timeout

换国内的源速度杠杠的,分分钟搞定!!!

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

 国内的其他pip源:

# 清华

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 阿里

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

# 腾讯

pip config set global.index-url http://mirrors.cloud.tencent.com/pypi/simple

# 豆瓣

pip config set global.index-url http://pypi.douban.com/simple/ 

四、如果PIP不可用,咋办?

如果PIP不可用?请检查PIP的路径是否加入到path(本说明仅限windows平台)

报错:

pip : 无法将“pip”项识别为 cmdlet

配置成功后测试:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/581039.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java集合框架-Collection-queue

目录 一、Deque二、ArrayDequeArrayDeque层次结构图ArrayDeque概述ArrayDeque底层数据结构ArrayDeque常用方法(简略) 三、PriorityQueuePriorityQueue层次结构图PriorityQueue概述PriorityQueue 底层数据结构PriorityQueue常用方法(详细) Java里有一个叫做Stack的类&#xff0c…

[tkinter实现]汉字笔顺小软件

软件简介 本软件旨在帮助小学生通过互动式学习掌握汉字的基本笔画和笔顺。软件采用Tkinter库构建,提供了一个用户友好的图形界面,适合小学生使用。 主要功能: 汉字展示:软件能够展示单个汉字,并以动画形式演示其标准…

SAP SALV研究

1.SALV SALV用的是类cl_salv_table下的相关方法,一般用于对话框或者功能要求比较简单的数据显示,比如明细数据显示,不能单元格编辑或者某行某列编辑,可以实现全部数据编辑(实用性不强),如要实现编辑可参考这篇博文 https://mp.weixin.qq.com/s?__biz=MzU1MDAzMDY3MQ==…

车载系统的 加减串器应用示意

overview 车载系统上使用加减串器来实现camera, led液晶显示屏等 图像数据的远距离传输,将原先在短距离传输视频信号的mipi csi,dsi 等的TX,RX中间,插入加减串器,实现长距离的可靠传输。 示意图如下 往往…

开发 Chrome 浏览器插件入门

前言 简介 Chrome 插件是扩展 Chrome 浏览器的功能的软件程序。它们可以执行各种任务,例如阻止广告、增强隐私、添加新功能等等。 要开始编写 Chrome 插件,你需要掌握以下: 1.JavaScript语言 2.html 3.css 4.会使用chrome扩展开发手册…

C#设计树形程序界面的方法:创建特殊窗体

目录 1.TreeView控件 2.实例 (1)Resources.Designer.cs (2)Form1.Designer.cs (3)Form1.cs (4)生成效果 以树形来显示程序的菜单,可以更直观、更快捷地对窗体进行…

PostgreSQL大版本如何升级?

📢📢📢📣📣📣 哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10余年DBA及大数据工作经验 一位上进心十足的【大数据领域博主】!😜&am…

算法训练营day25

零、回溯算法理论 参考链接13.1 回溯算法 - Hello 算法 (hello-algo.com) 1.尝试与回退 之所以称之为回溯算法,是因为该算法在搜索解空间时会采用“尝试”与“回退”的策略。当算法在搜索过程中遇到某个状态无法继续前进或无法得到满足条件的解时,它会…

vue使用海康控件开发包——浏览器直接查看海康监控画面

1、下载控件开发包 2、安装插件(双击/demo/codebase/HCWebSDKPlugin.exe进行安装) 3、打开/demo/index.html文件 4、在页面上输入你的海康监控的登录信息进行预览 如果有监控画面则可以进行下面的操作 注意:以下操作都在Vue项目进行 5、复…

【Unity】shader中参数传递

1、前言 unity shader这个对于我来说是真的有点难,今天这篇文章主要还是总结下最近学习到的一些东西,避免过段时间忘记了,可能有不对,欢迎留言纠正。 2、参数传递的两种方式 2.1 语义传递 语义传递这个相对来说是简单的 shad…

ENVI不同版本个人使用对比

ENVI不同版本个人使用对比 文章目录 ENVI不同版本个人使用对比前言对比5.3学习版5.6学习版6.0试用版 总结 前言 目前来看,流传较广的可供大家免费获取的ENVI版本主要是5.3学习版 5.6学习版 6.0学习版这三个版本,不同的版本有不同特色,在此做…

21.7K Star力荐!跨平台的开源免费可视化爬虫,让数据采集不再是难题!

朋友们!你是否曾梦想着轻松地从网上抓取数据,却苦于编程技能的门槛?现在,有了EasySpider,这一切都变得触手可及!这不仅仅是一个工具,它是一个革命性的网络爬虫神器,让你能够像专业人士一样,无需编写一行代码,就能轻松设计和执行爬虫任务。无论是动态内容还是复杂页面…

【介绍下分布式系统】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

Spring Boot框架强大的事件驱动模型(ApplicationEvent)

文章目录 前言应用场景异步处理事务边界外的操作跨微服务通信系统监控与日志聚合UI更新生命周期管理工作流或业务流程缓存同步 小试牛刀定义事件实现事件处理器注册事件处理器发布事件测试事件 写在最后 前言 在Spring Boot应用中,事件处理器是指那些处理特定类型事…

实时采集麦克风并播放(springboot+webscoekt+webrtc)

项目技术 springbootwebscoektwebrtc 项目介绍 项目通过前端webrtc采集麦克风声音,通过websocket发送后台,然后处理成g711-alaw字节数据发生给广播UDP并播放。 后台处理项目使用线程池(5个线程)接受webrtc数据并处理g711-alaw字节数组放到Map容器中&…

将针孔模型相机 应用到3DGS

Motivation 3DGS 的 投影采用的是 CG系的投影矩阵 P P P, 默认相机的 principal point (相机光心) 位于图像的中点处。但是 实际应用的 绝大多数的 相机 并不满足这样一个设定, 因此我们 需要根据 f , c x , c y {f,c_x, c_y} f,cx​,cy​ 这几个参数重新构建3D …

Linux 安装 nvm,并使用 Jenkins 打包前端

文章目录 nvm是什么nvm下载nvm安装设置 nvm 环境变量设置 Jenkins 打包命令 nvm是什么 nvm全英文也叫node.js version management,是一个nodejs的版本管理工具。nvm和n都是node.js版本管理工具,为了解决node.js各种版本存在不兼容现象可以通过它可以安装…

电脑提示msvcp100.dll丢失的解决方法,多种有效的解决方法分享

在日常使用电脑进行工作的时候,我们常常依赖于各种高效软件来辅助完成任务,提升工作效率。然而,当你满怀期待地双击启动某个至关重要的办公软件时,屏幕上却弹出了一个令人措手不及的错误提示:“msvcp100.dll文件丢失”…

二. 搭建Nginx 直播流程服务器

目录 1. 前言 2. 安装 Nginx 依赖 3.下载源码 4. 编译安装 5.配置 rtmp 服务 6.验证配置 1. 前言 服务器由 NGINXRTMP 构成。 NGINX 是 HTTP 服务器, RTMP 是附加模块。 其中 NGINX 我选择的是用 源码编译方式 进行安装,因为这种方式可以自定义…

基于python语言气象水文数据处理及精美科研绘图实践技术

Python是功能强大、免费、开源,实现面向对象的编程语言,Python能够运行在Linux、Windows、Macintosh、AIX操作系统上及不同平台(x86和arm),Python简洁的语法和对动态输入的支持,再加上解释性语言的本质&…