【专利】一种光伏产品缺陷检测AI深度学习算法

申请号CN202410053849.9
公开号(公开)CN118037635A
申请日2024.01.12
申请人(公开)超音速人工智能科技股份有限公司
发明人(公开)张俊峰(总); 叶长春(总); 廖绍伟

摘要

本发明公开一种光伏产品缺陷检测AI深度学习算法,涉及AI算法领域。该光伏产品缺陷检测AI深度学习算法,采用深度卷积神经网络作为预训练模型,使用特征金字塔网络结构FPN对预训练模型得到的不同尺度的特征图进行融合,采用区域提议网络RPN在特征图上生成候选框,该光伏产品缺陷检测AI深度学习算法通过使用预训练模型提取图像特征,使用FPN融合多尺度特征,使用RPN提取候选框,使用ROIAlign抽取局部特征,使用分类、回归、FCN进行缺陷分类、位置回归以及掩膜信息提取,对缺陷的分类以及输出缺陷效果的准确性好,对缺陷的定位精度高,对缺陷的描述准确且全面,从而提高了在光伏产品加工中,对产品的缺陷检测效果。

技术背景

硅光伏电池的质量直接影响到整个光伏系统的效率,在硅光伏电池的工业生产制造和光伏电池或组件的使用过程,缺陷和损坏是不可避免的,因此需要使用检测设备来对产品进行缺陷检测。
随着计算机AI发展,目前的无接触式光伏产品缺陷检测装置均使用学习算法,利用建立模型和训练模型的方式来进行产品图片的处理,输出产品的缺陷,形成检测,传统的算法对缺陷的分类以及输出缺陷效果的准确性不够好,对缺陷的定位精度不够高,因此对缺陷的描述不够准确和全面,从而降低了在光伏产品加工过程中对产品的缺陷检测效果,针对现有技术的不足,本发明提供了一种光伏产品缺陷检测AI深度学习算法,以解决上述问题。

我的理解

第一步:采用深度卷积神经网络作为预训练模型,对输入的光伏产品图像进行特征提取,获取图像的高层语义信息,得到不同尺度的特征图;首先选择适用于光伏产品缺陷检测任务的预训练模型,如ResNet、VGG等,然后,将预训练模型导入到算法中,并将待检测的光伏产品缺陷图像输入到模型中,通过前向传播,可以得到模型的中间层输出,即特征图。这些特征图包含了图像的高级语义特征。
通过使用预训练模型提取图像特征,可以避免从零开始训练模型的复杂过程,同时还可以利用预训练模型在大规模数据集上学习到的丰富特征,提高光伏产品缺陷检测的准确性和效率。
第二步:使用特征金字塔网络结构FPN对预训练模型得到的不同尺度的特征图进行融合,增强模型对不同尺寸产品缺陷的检测能力;利用特征金字塔网络融合来自不同尺度的特征图,同时利用低层特征图的空间信息和高层特征图的语义信息,将这些特征图进行融合,融合后的特征图具有更好的语义信息和空间分辨率,有助于更准确地检测光伏产品缺陷。
更进一步的,在步骤S3中,使用区域生成网络来提取候选框,RPN网络得到所有anchors的分类、回归信息,RPN基于特征图,通过滑动窗口的方式在不同位置生成候选框,并计算每个候选框的得分,得分高的候选框被认为是可能包含缺陷的区域。
第三步:采用区域提议网络RPN在特征图上生成候选框,这些候选框涵盖了存在缺陷的区域和信息,以实现后续产品的缺陷快速检测;
第四步:使用ROIAlign技术从候选框中抽取出局部特征,以供后续的分类和回归任务使用;使用ROIAlign操作来抽取候选框内的局部特征,根据RPN网络输出的分类、回归信息,经过NMS得到最终的ROIs,ROIAlign通过双线性插值的方式,将候选框内的像素映射到固定大小的特征图上,并进行采样,得到固定长度的特征向量,这些特征向量包含了候选框内的局部特征信息。
第五步:利用全卷积网络FCN对局部特征进行分类,并同时进行回归操作以精确定位缺陷的位置;对筛选出来的ROIs进行分类、回归、mask分割操作,使用分类器对候选框进行缺陷分类,分类器将局部特征作为输入,输出每个候选框属于不同缺陷类别的概率,分类器可以是传统的机器学习方法,如支持向量机SVM,分类器也可以是深度学习方法,如卷积神经网络CNN;
步骤S6:除了分类和位置回归外,还利用FCN从局部特征中提取掩膜信息,以得到缺陷的精确形状和大小。
在图像处理中,卷积神经网络CNN提取的特征比之前的手工特征效果更好,这是由于CNN特殊的组织结构来决定的,卷积层和池化层的共同作用使得CNN能提取出图像中较好的特征。卷积神经网络的网络模型多种多样,但一个卷积神经网络模型一般由若干个卷积层、池化层和全连接层组成。卷积层的作用是提取图像的特征;池化层的作用是对特征进行抽样,可以使用较少训练参数,同时还可以减轻网络模型的过拟合程度。卷积层和池化层一般交替出现在网络中,称一个卷积层加一个池化层为一个特征提取过程,但是并不是每个卷积层后都会跟池化层,大部分网络只有三层池化层。网络的最后一般为1~2层全连接层,全连接层负责把提取的特征图连接起来,最后通过分类器得到最终的分类结果。
特别公开的,在所述步骤S6中,通过位置回归,根据分类结果和候选框的位置信息,对缺陷的位置进行进一步的调整和修正,以提高缺陷的定位精度,同时,根据FCN得到的掩膜信息,可以进一步提取缺陷的形状和轮廓等信息,以便更全面地描述缺陷。
FCN指的是全卷积网络,是深度学习中用于图像处理任务的一种重要架构,相比于传统的卷积神经网络CNN,FCN不仅能够识别图像中的对象,还能在像素级别对图像进行预测,如图像分割、图像生成等。

扩展阅读

视频课程

先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。
https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176

相关推荐

我想对大家说的话
《喜缺全书算法册》以原理、正确性证明、总结为主。
按类别查阅鄙人的算法文章,请点击《算法与数据汇总》。
有效学习:明确的目标 及时的反馈 拉伸区(难度合适) 专注
闻缺陷则喜(喜缺)是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。
子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙,那算法就是他的是睛

测试环境

操作系统:win7 开发环境: VS2019 C++17
或者 操作系统:win10 开发环境: VS2022 C++17
如无特殊说明,本算法用**C++**实现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/739798.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

区块链实验室(37) - 交叉编译百度xuperchain for arm64

纠结了很久,终于成功编译xuperchain for arm64。踩到1个坑,说明如下。 1、官方文档是这么说的:go语言版本推荐1.5-1.8 2、但是同一个页面,又是这么说的:不推荐使用1.11之前的版本。 3、问题来了:用什么版本…

ONLYOFFICE 编辑器8.1,一个功能全面的编辑器

目录 官网地址:ONLYOFFICE - 企业在线办公应用软件 | ONLYOFFICE 一、PDF编辑 二、PPT播放 1. 多样化的幻灯片样式与布局 2. 强大的文本编辑与格式化功能 3. 丰富的图形与图表插入功能 4. 灵活的过渡效果与动画设置 5. 舒适的呈现与演讲辅助功能 6. 便捷的团…

Mac清理系统数据小技巧,告别卡顿烦恼 苹果电脑清理内存怎么清理

任何使用Mac的用户都会同意:没有什么比一台运行缓慢的电脑更能消磨人的耐心了。那些无休止的彩球旋转、程序响应迟缓、突然的系统冻结,这一切都让人想抓狂!但别担心,这里有一些简单的Mac清理系统数据小技巧和CleanMyMac X的神助攻…

游戏高度可配置化(一)通用数据引擎(data-e)及其在模块化游戏开发中的应用构想图解

游戏高度可配置化(一)通用数据引擎(data-e)及其在模块化游戏开发中的应用构想图解 码客 卢益贵 ygluu 关键词:游戏策划 可配置化 模块化配置 数据引擎 条件系统 红点系统 一、前言 在插件式模块化软件开发当中,既要模块高度独…

DDD(data display debugger)调试工具

文章目录 DDD安装界面说明 DDD data display debugger是命令行调试程序,可以理解为可视化的GDB。 安装 CentOS下使用以下命令进行安装: yum install ddd等待安装完成即可。 界面说明 顺便写一个测试程序,编译可执行文件 终端命令行输入…

[C++深入] --- malloc/free和new/delete

1 new运算符的拓展 1.1 自由存储区与堆的概念 在C++中,内存区分为5个区,分别是堆、栈、自由存储区、全局/静态存储区、常量存储区。 自由存储区是C++基于new操作符的一个抽象概念,凡是通过new操作符进行内存申请,该内存即为自由存储区。 new操作符从自由存储区(free st…

十大排序算法之->基数排序

一、计数排序简介 基数排序(Radix Sort)是一种非比较型整数排序算法,其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。具体做法是用0-9之间的所有整数作为键值,对数据集中的每一个数,按照从…

无线领夹麦克风哪个品牌音质最好,揭秘无线麦克风哪个牌子最好!

​在这个数字化、信息化的时代,短视频和直播已经成为了人们生活中不可或缺的一部分。而无线麦克风,则是这些活动中不可或缺的重要工具。它们能够轻松捕捉声音,让内容更加生动、真实。然而,市场上的无线麦克风种类繁多,…

深入解析与解决高并发下的线程池死锁问题

问题背景 在现代互联网应用中,高并发场景是常态,为了高效处理大量用户请求,后端服务通常会采用线程池来管理线程资源。然而,在一个复杂的微服务架构项目中,我们遇到了一个棘手的问题:在业务高峰期&#xf…

收银系统源码-千呼新零售2.0【线上营销】

千呼新零售2.0系统是零售行业连锁店一体化收银系统,包括线下收银线上商城连锁店管理ERP管理商品管理供应商管理会员营销等功能为一体,线上线下数据全部打通。 适用于商超、便利店、水果、生鲜、母婴、服装、零食、百货等连锁店使用。 详细介绍请查看&a…

数据结构-顺序表的插入排序

顺序表的排序可以看作数组排序的拓展。基本逻辑和数组排序的逻辑大同小异。 由于顺序表中可以存放不同种的数据类型,进而和结构体排序又有相似之处。其中要注意的是(->)和(.)的区别。 -> 符号是针对指针进行的操…

《计算机英语》Unit 1 Computer Overview 计算机概述

期末试卷组成 1、选择20道 2、判断20道 3、词汇翻译(单词词组,参照课后习题) 4、翻译2道(一道原题,参照作业) SectionA About Computer 关于计算机 algorithm n. 算法 operate v.…

6.19长难句打卡

The Flatiron School, where people pay to learn programming, started as one of the many coding bootcamps that’s become popular for adults looking for a career change. 人们在Flatiron学校里花钱学习编程,且Flatiron学校也成为在寻求职业变化的成年人之中…

超越招聘技术人才目标的最佳技术招聘统计数据

研究发现,难以找到的人才比以往任何时候都更难找到:根据新人才委员会招聘调查报告:2024年难以找到的人才的战略和战略,60%的受访者表示,熟练人才的招聘时间比一年前长。调查进一步揭示了以下关于招聘技术的关键事实&am…

与亚马逊云科技深度合作,再获WAPP、ISV认证

上半年,VERYCLOUD睿鸿股份加入亚马逊云科技的WAPP(Well-Architected Partner Programs)和ISV加速计划(ISV Accelerate Program),为客户带来更坚实优质的海外云服务。 Well-Architected 获得WAPP这项认证代表…

揭秘,如何轻松选出那瓶专属于你的心动红酒?

红酒,这个充满神秘与浪漫的液体,总能在不经意间触动我们的味蕾,引发无尽的遐想。然而,面对琳琅满目的红酒选择,如何挑选一瓶适合自己的红酒呢?今天,就让我们一起探讨这个话题,并特别…

艾斯迪克MPU60压力控制单元维修

一、艾斯迪克压力控制单元故障识别与诊断 首先,当出现ESTIC压力控制单元MPU60故障时,我们需要进行故障识别与诊断。这通常包括检查设备的显示屏、指示灯以及传感器等部分,以确定故障的具体位置。此外,还可以使用专业的故障诊断工具…

Conda创建与激活虚拟环境(指定虚拟环境创建位置)

1.Conda优势 Conda是一个开源的软件包管理系统和环境管理系统,主要用于在不同的计算环境中安装和管理软件包和其依赖项。它最初是为Python而设计的,但现在也可以用于管理其他语言的软件包。 Conda提供了对虚拟环境的支持,这使得用户可以在同…

解锁分布式云多集群统一监控的云上最佳实践

作者:在峰 引言 在当今数字化转型加速的时代,随着混合云、多云多集群环境等技术被众多企业广泛应用,分布式云架构已成为众多企业和组织推动业务创新、实现弹性扩展的首选,分布式云容器平台 ACK One(Distributed Clou…

Python应用开发——30天学习Streamlit Python包进行APP的构建(9)

st.area_chart 显示区域图。 这是围绕 st.altair_chart 的语法糖。主要区别在于该命令使用数据自身的列和指数来计算图表的 Altair 规格。因此,在许多 "只需绘制此图 "的情况下,该命令更易于使用,但可定制性较差。 如果 st.area_chart 无法正确猜测数据规格,请…