冰狐智能辅助使用yolov8实现超高效率的找图和图片识别

YOLOv8(You Only Look Once)是YOLO系列中的最新版本,在目标检测任务中表现出色,其高效的速度和优秀的检测性能使其成为许多应用场景中的首选工具。YOLOv8可以用于“找图”任务,即图像检索或图像识别任务中的目标检测环节。

yolov8可以实现哪些任务

yolov8可以实现如下等任务:

找图

通常情况下一般使用opencv的模板匹配来实现找图,但是准确度和效率都太低了,很难完成比较复杂的任务,比如:在游戏中找图,由于游戏是动态的,进一步增加了找图的难度,此时使用yolov8就可以很容易解决。再比如匹配短视频app中的某些按钮图片等,由于视频是动态的,所以opencv出错的概率比较大,使用yolov8效果非常出色。

匹配滑块

我们在使用各种app中,有时候会遇到各种各样的滑块验证,很麻烦,需要手工滑到指定的匹配位置。此时使用yolov8,大量采集这些滑块,用于模型训练,最后使用训练出来的数据来识别滑块位置,可以直接实现自动化匹配,效率非常高

Yolo在冰狐中使用的例子

在冰狐中使用yolov8,非常简单,具体代码如下所示:

例子:使用yolo识别当前手机的界面
function main() {
    requestLockScreen();

    var yolo = new YoloV8();
    // model_name替换成自己的模型名,class1,class2为目标的类别名
    var b = yolo.init('/sdcard/model_name', ['class1', 'class2'])
    console.log('b:', b)

    // 会自动截屏,然后检测截图,识别目标
    var r = yolo.detect();
    console.log('r', r)
}

Yolov8的开发文档

YoloV8

YoloV8构造函数。

参数:
init

初始化,返回boolean。

参数:
参数名类型必填说明
modelNamestring必填模型名字,可以带路径,注意不要加后缀名。支持全路径、相对路径和资源文件。文件全路径,比如:/sdcard/model_name。相对路径,是相对手机外部存储目录,比如:model_name,该文件存储在手机外部存储目录下。资源路径,打包时把文件添加到apk,使用asset:来访问,比如:asset:model_name。点击这里查看如何训练模型
categoryList数组必填训练模式时,训练的目标类别名数组,比如['苹果','橘子'],注意顺序。
detect

检测目标。返回数组,比如:[{left:10, top:10, width:99, height: 100, prob:0.98, label: '苹果'}],prob表示识别出苹果的概率为98%。

参数:
参数名类型必填说明
probThresholdfloat选填概率阈值,低于了这个阈值不返回。默认为0.45
nmsThresholdfloat选填nms阈值,低于了这个阈值不返回。默认为0.65
bitmapBitmap选填位图,默认为null。如果为null,则使用截图识别

总结

YoloV8在找图任务中具有显著的优势和广泛的应用前景。通过充分利用其高效的速度和优秀的检测性能,我们可以实现更加准确和快速的图像检索或图像识别任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/942545.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

STM32-笔记11-手写带操作系统的延时函数

1、为什么带操作系统的延时函数,和笔记10上的延时函数不能使用同一种? 因为笔记10的延时函数在每次调用的时候,会一直开关定时器,而在FreeRTOS操作系统中,SysTick定时器当作时基使用。 时基是一个时间显示的基本单位。…

人工智能与物联网:从智慧家居到智能城市的未来蓝图

引言:未来已来,智能化的世界 想象一下,一个早晨,智能闹钟根据你的睡眠状态自动调整叫醒时间,咖啡机早已备好热腾腾的咖啡,窗帘缓缓拉开,迎接清晨的阳光。这不是科幻小说中的场景,而是…

流程控制

第一章 流程控制语句 在一个程序执行的过程中,各条语句的执行顺序对程序的结果是有直接影响的。所以,我们必须清楚每条语句的执行流程。而且,很多时候要通过控制语句的执行顺序来实现我们想要的功能。 1.1 流程控制语句分类 ​ 顺序结构 …

台球助教平台系统开发APP和小程序信息收藏功能需求解析(第十二章)

以下是开发台球助教系统客户端(APP,小程序,H5)几端的信息收藏功能的详细需求和功能说明,内容比较详细,可以说是一个教科书式的详细说明了,这套需求说明不仅仅用在我们的台球助教系统程序上&…

RISC-V 医疗芯片发展方向探究及展望

(一)研究背景与意义 近年来,RISC-V作为一种开源指令集架构在芯片领域迅速兴起。它起源于加州大学伯克利分校,于2011年首次公开发布,后凭借其独特优势吸引了全球众多企业、机构以及科研人员的关注与参与。RISC-V具有开…

三维动画的常用“视觉特效”有哪些?

在当今的视觉盛宴中,三维动画技术宛如一位神奇的魔法师,为视觉特效(VFX)领域施下了变革的咒语。从大荧幕上的震撼电影,到让人沉浸其中的视频游戏,再到夺人眼球的广告以及精细的模拟场景,三维动画…

【EtherCATBasics】- KRTS C++示例精讲(2)

EtherCATBasics示例讲解 目录 EtherCATBasics示例讲解结构说明代码讲解 项目打开请查看【BaseFunction精讲】。 结构说明 EtherCATBasics:应用层程序,主要用于人机交互、数据显示、内核层数据交互等; EtherCATBasics.h : 数据定义…

前端初学基础

一.Web开发 前端三件 HTML ,页面展现 CSS,样式 JS(JavaScript),动起来 二,HTML 1.HTML概念 网页,网站中的一个页面,网页是构成网站的基本元素,是承载各种网站应用的平台。通俗的说,网站就…

C语言结构体位定义(位段)的实际作用深入分析

1、结构体位段格式 struct struct_name {type [member_name] : width; };一般定义结构体,成员都是int、char等类型,占用的空间大小是固定的在成员名称后用冒号来指定位宽,可以指定每个成员所占用空间,并且也不用受结构体成员起始…

机器学习之PCA降维

主成分分析(PCA,Principal Component Analysis) 主成分分析(PCA)是一种常见的无监督学习技术,广泛应用于数据降维、数据可视化以及特征提取等任务。PCA的目标是通过线性变换将数据从高维空间映射到低维空间…

x86_64 Ubuntu 编译安装英伟达GPU版本的OpenCV

手把手带你在Linux上安装带GPU加速的opencv库(C版本)_opencv linux-CSDN博客 cmake \-D CMAKE_BUILD_TYPERELEASE \-D OPENCV_GENERATE_PKGCONFIGON \-D CMAKE_INSTALL_PREFIX/usr/local \-D OPENCV_EXTRA_MODULES_PATH/home/hwj/opencv/opencv_contrib…

Bert各种变体——RoBERTA/ALBERT/DistillBert

RoBERTa 会重复一个语句10次,然后每次都mask不同的15%token。丢弃了NSP任务,论文指出NSP任务有时甚至会损害性能。使用了BPE ALBERT 1. 跨层参数共享 可以共享多头注意力层的参数,或者前馈网络层的参数,或者全部共享。 实验结果…

ReMoE: Fully Differentiable Mixture-of-Experts with ReLU Routing

基本信息 📝 原文链接: https://arxiv.org/abs/2412.14711👥 作者: Ziteng Wang, Jianfei Chen, Jun Zhu🏷️ 关键词: Mixture-of-Experts, ReLU routing📚 分类: 机器学习 摘要 中文摘要 稀疏激活的专家混合模型(…

【C语言程序设计——选择结构程序设计】预测你的身高(头歌实践教学平台习题)【合集】

目录😋 任务描述 相关知识 1、输入数值 2、选择结构语句 3、计算结果并输出 编程要求 测试说明 通关代码 测试结果 任务描述 本关任务:编写一个程序,该程序需输入个人数据,进而预测其成年后的身高。 相关知识 为了完成本…

(Arxiv-2024)SwiftEdit:通过一步扩散实现闪电般快速的文本引导图像编辑

SwiftEdit:通过一步扩散实现闪电般快速的文本引导图像编辑 Paper是VinAI Research发表在Arxiv2024的工作 Paper Title:SwiftEdit: Lightning Fast Text-Guided Image Editing via One-Step Diffusion Code地址 Abstract 文本引导的图像编辑方面的最新进展利用了基于…

python langid识别一段字符串是哪国语言

分析: 在利用爬虫抓取亚马逊网站的数据时,有时会出现所抓页面的语言类型发生错误的情况(如抓取沙特站数据时想要英文页面,抓到的确是阿拉伯语页面)。在数据量大的时候人工排查这类异常情况是非常麻烦的,这时…

英特尔的创新困局与未来的转机:重塑还是消亡?

英特尔,这家曾引领全球半导体行业的巨头,如今正面临前所未有的挑战。从技术创新的停滞,到错失人工智能领域的制高点,再到被AMD和英伟达等竞争对手赶超,英特尔的创新之路似乎正走向尽头。但这是否意味着它的未来注定黯淡…

软考:系统架构设计师教材笔记(持续更新中)

教材中的知识点都会在。其实就是将教材中的废话删除,语言精练一下,内容比较多,没有标注重点 系统架构概述 定义 系统是指完成某一特定功能或一组功能所需要的组件集,而系统架构则是对所有组件的高层次结构表示,包括各…

No.1免费开源ERP:Odoo自定义字段添加到配置页中的技术分享

文 / 开源智造(OSCG) Odoo亚太金牌服务 在Odoo18之中,配置设定于管控各类系统配置层面发挥着关键之效用,使您能够对软件予以定制,以契合您特定的业务需求。尽管 Odoo 提供了一组强劲的默认配置选项,然而有…

YOLO11全解析:从原理到实战,全流程体验下一代目标检测

前言 一、模型介绍 二、网络结构 1.主干网络(Backbone) 2.颈部网络(Neck) 3.头部网络(Head) 三、算法改进 1.增强的特征提取 2.优化的效率和速度 3.更高的准确性与更少的参数 4.环境适应性强 5.…