funcaptcha手势指向验证码识别

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路
如有侵犯,请联系作者下架

本文滑块识别已同步上线至OCR识别网站: http://yxlocr.nat300.top/ocr/other/21

该验证码会给出某物品所有的角度,根据手指的朝向确定正确的物品,成果图如下:
请添加图片描述
请添加图片描述
请添加图片描述

解决思路

不用于之前的验证码,该验证码在确认物体的同时,还要确认物体角度,由于该物体是一个3D的效果,并且角度360度,也可能去做一个360的分类检测,这样太复杂了,而且很可能没有效果,360分类早在旋转验证码中就提出,是很难拟合数据集的,即使现在拟合了一部分数据集,对没有见过的物体也基本拟合不了,这样就没有做模型的必要了,因为咱们做模型,通常是要泛化出其他数据集,用我的话讲,与其做一个这样的垃圾模型,不如好好研究其他方案

那么,我们参考yolo官方可以看到,yolo-obb模型在检测物体位置的同时还能检测出物体的部分角度,为什么说部分角度呢,因为实际上是检测不出角度的,具体我们来看以下操作

正如yolo-obb官方介绍,这只是基于检测框的旋转框检测而已,并未有任何计算角度可言
在这里插入图片描述
其本质上是由正常检测框的两个点扩展到4个点,而且据官网的数据显示,这更多的基于卫星图像,也就是2D图像的旋转框检测,而我们这个作为3D图像的角度检测,那怎么办呢,那玩的就是一个抽象,照样使用,我们使用xanylabeling进行图像的标注,标注如下
在这里插入图片描述

我们需要将显示旋转角度打开,然后使用旋转框进行标注

通过快捷键 “zxcv” 旋转所选框,其中:

  • z:大角度逆时针旋转
  • x:小角度逆时针旋转
  • c:小角度顺时针旋转
  • v:大角度顺时针旋转

需要注意,旋转后的旋转框可能会超出图片大小,需要矫正过来,但是这样标注就行了吗,当然是不行的,我们标注的标签需要注意,这里必须将四个象限分开,不能用统一的角度进行标注,因为旋转框是计算不了角度,举个例子,我们在标注时,尽管已经确定了0度和180的x1y1x2y2x3y3x4y4的不同(也就是xy上下相反的),在角度上也是0度和180度区别,但是实际在检测中,yolo的推理返回给我们的只有一个0度的框(也就是xy上下相同的),在区分四个象限后,标注标签如下
在这里插入图片描述
然后通过一键导出yolo格式后,使用yolo-obb模型进行训练,训练完成后,在使用代码推理后,将每个旋转框的角度计算出来后+对应标签象限的角度即可得到最终的360角度

在这里插入图片描述
在这里插入图片描述
可以看到,角度不一定完全一样,实际上,通过实战观察也是一样,手指的角度和实际物品的角度并不是完全一样的(部分图中)只需要找到角度最接近的即可,预测代码如下:

model = YOLO("best.pt")
def predict_funxx(img_base64):
    img = base642cv(img_base64)
    results = model(img)[0]

    names = results.names
    boxes = results.obb.data.cpu()
    confs = boxes[..., 5].tolist()

    classes = list(map(int, boxes[..., 6].tolist()))
    boxes, angles = xywhr2xyxyxyxy(boxes[..., :5])

    hand = None
    for i, box in enumerate(boxes):
        confidence = round(confs[i], 2)
        if confidence < 0.5:
            continue
        label = classes[i]

        points = box.tolist()
        x1, y1 = points[0]

        angle = angles[i] + (classes[i] * 90)
        if y1 > 250:
            # 说明是手指
            if classes[i] == 0 and angle == 90:
                hand = [classes[i], 0]
            else:
                hand = [classes[i], angle]
            # print("hand", classes[i], angle)
            break

    if hand is None:
        print('未检测到手指朝向')
        return 1

    minangle = 999
    minbox = None
    for i, box in enumerate(boxes):
        confidence = round(confs[i], 2)
        if confidence < 0.5:
            continue
        label = classes[i]

        points = box.tolist()
        x1, y1 = points[0]

        angle = angles[i] + (classes[i] * 90)
        if classes[i] == 0 and angle == 90:
            angle = 0
        if y1 < 250:
            # print(classes[i], angle)
            if abs(hand[1] - angle) < minangle:
                minangle = abs(hand[1] - angle)
                minbox = box.tolist()

    if not minbox:
        print("未检测框位置")
        return 1
    left1, top1 = [int(b) for b in minbox[0]]
    left2, top2 = [int(b) for b in minbox[1]]
    center_x = (left1 + left2) // 2
    center_y = (top1 + top2) // 2

    xx = center_x // 200 + 1
    return xx

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/953894.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

GAMES101学习笔记(三):Rasterization 光栅化(三角形的离散化、抗锯齿、深度测试)

文章目录 视口变换 Viewport三角形网格 Triangle Mesh采样 Sampling走样/反走样 Aliasing/Antialiasing采样频率、空间域与频率域深入理解采样、走样、反走样反走样总结深度测试 Depth testing 课程资源&#xff1a;GAMES101-现代计算机图形学入门-闫令琪 Lec5 ~ Lec6 学习笔记…

vscode 扩展Cline、Continue的差别?

Cline和Continue都是VSCode的AI编程插件&#xff0c;它们在功能、用户体验、性能、适用场景以及配置和使用步骤等方面存在一些差别&#xff1a; 一、功能差异 编辑功能 Cline&#xff1a;能够分析项目的文件结构和源代码抽象语法树&#xff08;AST&#xff09;&#xff0c;通…

鸿蒙打包发布

HarmonyOS应用/元服务发布&#xff08;打包发布&#xff09; https://developer.huawei.com/consumer/cn/doc/harmonyos-guides-V13/ide-publish-app-V13?catalogVersionV13 密钥&#xff1a;包含非对称加密中使用的公钥和私钥&#xff0c;存储在密钥库文件中&#xff0c;格式…

晨辉面试抽签和评分管理系统之九:随机编排考生的分组(以教师资格考试面试为例)

晨辉面试抽签和评分管理系统&#xff08;下载地址:www.chenhuisoft.cn&#xff09;是公务员招录面试、教师资格考试面试、企业招录面试等各类面试通用的考生编排、考生入场抽签、候考室倒计时管理、面试考官抽签、面试评分记录和成绩核算的面试全流程信息化管理软件。提供了考生…

sparkRDD教程之必会的题目

1.前期准备 &#xff08;1&#xff09;看看上一期的博客&#xff0c;最好跟着上一期的博客把sparkRDD的基本命令给熟练掌握后&#xff0c;再来做这篇文章的任务。 上一期的博客&#xff1a;sparkRDD教程之基本命令-CSDN博客 &#xff08;2&#xff09;新建文件task6.scala …

stack和queue专题

文章目录 stack最小栈题目解析代码 栈的压入弹出序列题目解析代码 queue二叉树的层序遍历题目解析代码 stack stack和queue都是空间适配器 最小栈 最小栈的题目链接 题目解析 minst是空就进栈&#xff0c;或者是val < minst.top()就进栈 代码 class MinStack { public:M…

欧拉路径算法

欧拉图&#xff1a; 对于应该连通图G&#xff0c;有&#xff1a; 1欧拉路径&#xff1a;一条路径&#xff0c;它能够不重复地遍历完所有的边&#xff0c;这个性质很像不重复地一笔画完所有边&#xff0c;所以有些涉及到欧拉路径的问题叫做一笔画问题。 2欧拉回路&#xff1a…

【C#设计模式(23)——模板方法模式(Template Method Pattern)】

前言 在抽象类中封装算法的结构&#xff0c;具体的实现步骤由子类定义&#xff0c;从而达到不改变算法结构的&#xff0c;允许子类重定义方法内容。代码 public abstract class Teamplate {public void TeamplateMethod(){Step1();Step2();Step3();}protected abstract void …

MyBatis——XML映射文件

在MyBatis中&#xff0c;既可以通过注解的方式配置SQL语句&#xff0c;也可以通过XML映射文件的方式配置SQL语句。对于简单的SQL语句建议直接通过注解的方式配置SQL语句&#xff1a; Delete("delete from user where id#{id}") Integer deleteById(Integer id);但是…

Mysql--运维篇--安全性(数据库访问控制,最小权限原则,表空间加密,TLS加密,证书签发,SQL注入及防范等)

一、数据库访问控制 MySQL的访问控制是确保数据库安全的关键机制之一。通过合理的用户权限管理和访问控制策略&#xff0c;可以防止未经授权的用户访问、修改或删除敏感数据。 1、MySQL访问控制的工作原理 MySQL使用基于用户的访问控制模型&#xff0c;每个用户都有特定的权…

抽奖滚动功能

代码 <template><div class"box"><video class"video" src"../../assets/video/底层.mp4" loop autoplay muted></video><img class"choujiang" src"../../assets/image/抽奖1.png" alt"&…

【Python】Python之locust压测教程+从0到1demo:基础轻量级压测实战(1)

文章目录 一、什么是Locust二、Locust 架构组成三、实战 Demo准备一个可调用的接口编写一个接口测试用例编写一个性能测试用例执行性能测试用例代码1、通过 Web UI 执行&#xff08;GUI模式&#xff09;2、通过命令行执行&#xff08;非GUI模式&#xff09; 小知识&#xff1a;…

Microsoft

Microsoft Word目录1.目录编号与文字的间距设置2. 目录编号缩进设置 Excel函数MID&#xff08;提取字符&#xff09;CONCAT&#xff08;组合字符串&#xff09;EXACT&#xff08;比较字符串&#xff09; PowerPointwindows 11 恢复右键传统菜单 Word 目录 1.目录编号与文字的…

用 Python 处理 CSV 和 Excel 文件

&#x1f496; 欢迎来到我的博客&#xff01; 非常高兴能在这里与您相遇。在这里&#xff0c;您不仅能获得有趣的技术分享&#xff0c;还能感受到轻松愉快的氛围。无论您是编程新手&#xff0c;还是资深开发者&#xff0c;都能在这里找到属于您的知识宝藏&#xff0c;学习和成长…

JS后盾人--再一次的走进JS?

程序跑起来与避免延迟 如果你讲JS&#xff0c;你就不可能只讲JS 后盾人说开发就要用VScode&#xff08;确实&#xff0c;Windows和Linux都可以跑&#xff09; 然后就是第一天开发的时候装的那些插件 前端访问流程基本分析 托管到服务器上的东西&#xff0c;谁访问下载到谁的…

Android 调用系统服务接口获取屏幕投影(需要android.uid.system)

媒体投影 借助 Android 5&#xff08;API 级别 21&#xff09;中引入的 android.media.projection API&#xff0c;您可以将设备屏幕中的内容截取为可播放、录制或投屏到其他设备&#xff08;如电视&#xff09;的媒体流。 Android 14&#xff08;API 级别 34&#xff09;引入…

PT8M2102 触控型 8Bit MCU

1. 产品概述 PT8M2102 是一款基于 RISC 内核的 8 位 MTP 单片机&#xff0c;内部集成了电容式触摸感应模块、 TIMER 、 PWM、 LVR 、 LVD 、 WDT 等外设&#xff0c;其主要用作触摸按键开关&#xff0c;广泛适用于触控调光、电子玩具、消 费电子、家用电器等领域&am…

LangGraph 教程:初学者综合指南(2)

工具集成 将工具集成到 LangGraph 聊天机器人中可以显着增强其功能&#xff0c;使其能够按照您喜欢的方式访问和处理信息。 让我们修改上一节中创建的基本聊天机器人&#xff0c;以包含一个可以在网络上搜索信息的工具。我们将使用langchain_中community.tools TavilySearchR…

项目练习:若依管理系统字典功能-Vue前端部分

文章目录 一、情景说明二、若依Vue相关代码及配置1、utils代码2、components组件3、api接口代码4、main.js配置 三、使用方法1、html部分2、js部分 一、情景说明 我们在做web系统的时候&#xff0c;肯定会遇到一些常量选择场景。 比如&#xff0c;性别&#xff1a;男女。 状态…

oracle闪回表

文章目录 闪回表案例1&#xff1a;&#xff08;未清理回收站时的闪回表--成功&#xff09;案例2&#xff08;清理回收站时的闪回表--失败&#xff09;案例3&#xff1a;彻底删除表&#xff08;不经过回收站--失败&#xff09;案例4&#xff1a;闪回表之后重新命名新表总结1、删…