基于深度学习的瓷砖色差分类方法研究——学习笔记(评价:色差的定义太模糊。。。问题描述不清楚,太水了)

文章目录

  • 摘要
  • 0 引言
  • 1 瓷砖图像处理
    • 1.1 图像采集
    • 1.2 图像处理
  • 2 基于深度学习的瓷砖色差分类算法设计
    • 2.1 数据预处理
    • 2.2 卷积神经网络的设计
    • 2.3 实验设计
  • 3 瓷砖色差分类平台的设计与实现

在这里插入图片描述

摘要

瓷砖是人类建筑不可或缺的一种材料,而瓷砖品质最重要的指标之一就是色差,一批瓷砖中色差越小,品级越高。目前企业主要是由熟练工人在特定的光照及距离条件下进行筛查,劳动强度大并且效率低,没有固定的判断标准。因此提出利用基于深度学习算法的视觉检测系统代替人工进行瓷砖色差分类,**首先,经过数字图像处理算法对采集的瓷砖图像进行预处理,将瓷砖本体从背景中分割出来 ;然后,利用卷积神经网络分别提取具有色差的两类瓷砖特征,通过监督学习实现瓷砖的色差分类 ;最后,设计了图形用户界面将上述所有图像处理算法及分类算法进行实现,开发可视化人机交互式操作和分类结果显示系统。**实验结果表明 :基于深度学习的视觉检测系统能够在瓷砖色差分类任务上实现准确分类,且分类效率高、分类结果可视化,具有重要的应用价值

0 引言

在这里插入图片描述
瓷砖的色差指瓷砖间的色泽差异,包含颜色与光泽间的总体差别。传统瓷砖色差分类工作主要通过熟练工人用肉眼对同一批烧制的同类瓷砖来进行差异化区分 [1],且工人们需在特定光线环境下和一定距离内进行观察与对比,从而确定瓷砖的等级与色号 [2]。这种检测工作对检测人员的经验要求高,且工作强度大。与此同时传统瓷砖行业通过人工对瓷砖进行分色,其精度与效率已不能满足愈发增长的生产规模和对瓷砖品级区分精度的要求。因此可以采取基于机器视觉的方法,以机器代替人眼来进行瓷砖色差分类工作。

基于深度学习 [3] 的机器视觉系统首先在生产线采集数字瓷砖图像,然后用数字图像处理算法对原始数据进行预处理 [4] 与图像分割,进而采用基于深度学习的卷积神经网络算法 [5] 实现对具有色差的瓷砖图像间的分类分色,最后通过图形用户界面将瓷砖图像预处理及图像分割结果以及分类结果可视化。最后,将该系统应用于实际的瓷砖生产线下的色差分类任务,证明算法的有效性。

1 瓷砖图像处理

1.1 图像采集

在这里插入图片描述

1.2 图像处理

在这里插入图片描述
在这里插入图片描述
降噪处理 :对于实地采集的瓷砖图像来说,一般图像尺寸巨大,噪声鲜有肉眼能直接看到的,但这些噪声都是实实在在存在的。常见的图像噪声包括高斯噪声 [7]、瑞利噪声、伽马噪声以及椒盐(脉冲)噪声,其中椒盐噪声其与图像信号强度对比明显,对图像
污染较大,因而在原始图像中较为明显 [8]。本文采用中值滤波算法去除数字瓷砖图像中的椒盐噪声,如图3(a) 所示。
在这里插入图片描述
灰度化处理 [9] :为了方便计算机程序对数字图像的操作,并且简化图像分割时的计算量,本文在图像分割前对降噪后的数字图像做灰度化处理,灰度化处理后如图 3(b) 所示。二值化处理 :为了更好地让瓷砖与原始图像的背景相区分,对瓷砖的灰度图做进一步的二值化处理。本文采用基于阈值的二值化方法,即设置一个阈值 n,将输入的灰度图像中灰度值 f(x,y) ≥ n的点的灰度值设置为 255,并将这些点称为对象点 [10] ;其他的点之灰度值则设置为 0,这些点称为背景点。该算法的计算公式如(1)所示 :
在这里插入图片描述
式中 f(x,y) 为灰度图像素值,g(x,y) 为二值化后的新图像像素值 [11]。由于原始图像的前景与背景对比较为强烈,本文选用双峰法确定阈值。首先计算出灰度化后的图像的灰度直方图,如图 3© 所示。将两个主要的波峰之间的最低谷作为前景与后景之间的分界线,由于摄像头位于同一位置,所有瓷砖的背景相同,且此处阈值的选取精度要求不高,还需要后续处理,因此选取 100 作为二值化处理时的阈值。二值化处理后的瓷砖图像如图3(d),可以看出图中的噪声明显减少,并且瓷砖整体更加清晰突出。

形态学操作 :利用形态学的开操作去除流水线背景中的支架结构对二值图中瓷砖图像的污染以及其他一些微小的噪声 [12]。实验效果如图 4 所示,此时的二值图中基本上只存在形状接近矩形的残缺瓷砖。

基于透视变换的图像分割 :将形态学运算后的图像用轮廓检测算法得到轮廓集,并求出其中面积最大一个轮廓作为瓷砖轮廓,之后求出瓷砖轮廓最小外接矩形作为最终需要从原始图像中分割出来的瓷砖图像本身。这里使用的最小外接矩形算法为用主成分分析法(PCA)求出轮廓的主方向向量,进而得到轮廓的长宽,最小外接矩形的轮廓(绿色)如图 5。
在这里插入图片描述

已求出瓷砖最小外接矩形,由这个矩形的四个角点坐标进行透视变换,使瓷砖图像投影为规整的矩形并平行于转换后完整图像的长宽,最后将此新矩形按角点坐标从转换后完整图像中裁剪出来,如图 6 所示。
在这里插入图片描述

2 基于深度学习的瓷砖色差分类算法设计

2.1 数据预处理

在这里插入图片描述
为了减小输入卷积神经网络的数据量,将分割好的图像的尺寸缩小为 227×227 的标准尺寸,并且由于数据集本身样本数量不多,需对数据集进行扩充,从而使训练出的模型具有更好的泛化能力,防止神经网络算法可能产生的过拟合现象,本文使用旋转和水平翻转作为数据增广的方法 [13]。为了训练神经网络模型并测试其分类精度,本文将数据集划分为训练集和测试集。并为了保证数据集中不同种类分布的均一性,从两个色号中分别选取 80% 作为训练集,用于网络的特征学习,将两种色号分别剩下的 20% 作为测试集用于测试每次训练完成之后的模型分类效果。

2.2 卷积神经网络的设计

在这里插入图片描述
ResNet[14] 的提出就是为了解决深度学习网络随着层数的加深而导致的梯度消失使得网络学习停滞的问题,其巧妙地运用恒等映射并通过快捷连接将其赋予上一模块的输入,从而使得每一层梯度不可能为零,使得每一层的参数可以不断地更新学习下去而不会停滞,使得超深层网络可以实现更加深入的学习 [15]

文 献 中 介 绍 了 18/34/50/101/152 等 多 种 层 数的 ResNet 模 型, 实 验 使 用 的 是 具 有 18 层 结 构 的ResNet18 模型 [16]。对网络进行训练的损失函数选择交叉熵函数,优化算法选择 Adam 算法,并在网络中间引入 Batch Normalization 层防止网络的过拟合 [16]。

2.3 实验设计

在这里插入图片描述
超参数是指与数据集无关,只与模型结构相关需在训练之前设定好的参数,主要包括数据集训练周期(epoch)、批量大小(batch size)、优化器的学习率(learning rate)[17]。在上述瓷砖数据集上设定训练周期为 50,批量大小恒定为 64,再分别设定大小为 0.01、0.001、0.0001 的初始学习率进行训练。

如图 7 至图 9 所示,在训练前期,前两者验证模型时准确率波动更大,分析认为这是由于样本数据集不够庞大,两种色差数据较为相似,较高的学习率导致网络的权值与偏置在优化过程中变化过大,导致输出的预测分布无法稳定,但随着损失值逐渐减小,训练集与测试集最终准确率都达到 100% 而实现收敛。

在这里插入图片描述

3 瓷砖色差分类平台的设计与实现

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
之后我会持续更新,如果喜欢我的文章,请记得一键三连哦,点赞关注收藏,你的每一个赞每一份关注每一次收藏都将是我前进路上的无限动力 !!!↖(▔▽▔)↗感谢支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/269120.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ggplot2 | line plot 分组及均值线:聚类后的表达变化趋势图

1. 效果图 2. 预处理及绘图 # 输入数据 > head(dat)Species cid variable value 1 setosa 1 Sepal.Length 5.1 2 setosa 2 Sepal.Length 4.9 3 setosa 3 Sepal.Length 4.7 4 setosa 4 Sepal.Length 4.6 5 setosa 5 Sepal.Length 5.0 6 setos…

iOS技术博客:App备案指南

📝 摘要 本文介绍了移动应用程序(App)备案的重要性和流程。备案是规范App开发和运营的必要手段,有助于保护用户权益、维护网络安全和社会秩序。为了帮助开发者更好地了解备案流程,本文提供了一份最新、最全、最详的备…

React 路由传参

引言 在上一篇中&#xff0c;我们学习了 React 中使用路由技术&#xff0c;以及如何使用 MyNavLink 去优化使用路由时的代码冗余的情况。 这一节我们继续上一篇 React 路由进行一些补充 1. Switch 解决相同路径问题 首先我们看一段这样的代码 <Route path"/home&q…

C#与php自定义数据流传输

C#与php自定义数据流传输 介绍一、客户端与服务器数据传输流程图客户端发送数据给服务器&#xff1a;服务器返回数据给客户端&#xff1a; 二、自定义数据流C#版本数据流PHP版本数据流 三、数据传输测试1.在Unity中创建一个C#脚本NetWorkManager.cs2.服务器www目录创建StreamTe…

RHCE9学习指南 第8章 用户管理

8.1 基本概念 用户在操作系统中是非常重要的一块&#xff0c;我们登录系统&#xff0c;访问共享文件夹等都需要用户进行验证。所以&#xff0c;掌握管理用户的知识是非常有必要的。 说到用户&#xff0c;我们会提到两个名词账户信息和木马信息。 账户信息&#xff1a;我们可以…

新零售模式:重新定义商业未来

随着科技的飞速发展&#xff0c;我们的生活方式正在经历着前所未有的变革。其中&#xff0c;新零售模式正逐渐成为商业领域的新热点&#xff0c;它正在重新定义我们的购物方式&#xff0c;并为企业带来更多的商业机会。 一、新零售模式概述 新零售模式是指将互联网、大数据、…

阿里云服务器记录

阿里云服务器记录 CentOS 8.4 64位 SCC版 CentOS 7.9 64位 SCC版 CentOS 7.9 64位 CentOS 7.9 64位 UEFI版 Alibaba Cloud Linux Anolis OS CentOS Windows Server Ubuntu Debian Fedora OpenSUSE Rocky Linux CentOS Stream AlmaLinux 阿里云服务器有个scc版&#xff0c;这个…

用CHAT了解更多知识点

问CHAT&#xff1a;什么是硅基生命和碳基生命&#xff1f; CHAT回复&#xff1a;硅基生命和碳基生命是两种理论性的生物体类型&#xff0c;这些生物体主要是由硅或碳元素以及其他元素构成的。 碳基生命是我们当前所熟知的生命形式。碳元素能够形成稳定且复杂的分子&#xff0c;…

Java网络爬虫拼接姓氏,名字并写出到txt文件(实现随机取名)

目录 1.爬取百家姓1.爬取代码2.爬取效果 2.爬取名字1.筛选男生名字2.筛选女生名字 3.数据处理&#xff08;去除重复&#xff09;4.拼接数据5.将数据写出到文件中 1.爬取百家姓 目标网站&#xff0c;仅作为实验目的。 ①爬取姓氏网站&#xff1a; https://hanyu.baidu.com/shic…

【Linux系统基础】(5)在Linux上集群化环境前置准备及部署Zookeeper、Kafka软件详细教程

集群化环境前置准备 介绍 在前面&#xff0c;我们所学习安装的软件&#xff0c;都是以单机模式运行的。 后续&#xff0c;我们将要学习大数据相关的软件部署&#xff0c;所以后续我们所安装的软件服务&#xff0c;大多数都是以集群化&#xff08;多台服务器共同工作&#xf…

python使用apscheduler定时任务,固定周几运行程序

在add_job中添加参数day_of_week即可&#xff1a; day_of_week "0"表示&#xff1a;只有周一运行day_of_week "0-4"表示&#xff1a;周一到周五运行day_of_week "0,1,2"表示&#xff1a;周一二三运行 示例程序 from datetime import datet…

C++ boost planner_cond_.wait(lock) 报错1225

1.如下程序段 boost unique_lock doesn’t own the mutex: Operation not permitted 问题&#xff1a; 其中makePlan是一个线程。这里的unlock导致错误这个报错 boost unique_lock doesn’t own the mutex: Operation not permitted bool navigation::makePlan(){ //cv::named…

MySQL中如何快速定位占用CPU过高的SQL

作为DBA工作中都会遇到过数据库服务器CPU飙升的场景&#xff0c;我们该如何快速定位问题&#xff1f;又该如何快速找到具体是哪个SQL引发的CPU异常呢&#xff1f;下面我们说两个方法。聊聊MySQL中如何快速定位占用CPU过高的SQL。 技术人人都可以磨炼&#xff0c;但处理问题的思…

JVM内存结构Java内存模型Java对象模型

悟空老师思维导图&#xff1a;https://naotu.baidu.com/file/60a0bdcaca7c6b92fcc5f796fe6f6bc9https://naotu.baidu.com/file/60a0bdcaca7c6b92fcc5f796fe6f6bc9 1.JVM内存结构&&Java内存模型&&Java对象模型 1.1.JVM内存结构 1.2.Java对象模型 Java对象模型…

顺序表的实现

目录 一. 数据结构相关概念​ 二、线性表 三、顺序表概念及结构 3.1顺序表一般可以分为&#xff1a; 3.2 接口实现&#xff1a; 四、基本操作实现 4.1顺序表初始化 4.2检查空间&#xff0c;如果满了&#xff0c;进行增容​编辑 4.3顺序表打印 4.4顺序表销毁 4.5顺…

酷开系统千屏千面,深度探索消费者喜好

为什么大家这么喜欢用酷开系统呢&#xff1f;当然是因为它好用啊&#xff01;酷开系统基于人工智能技术&#xff0c;为消费者提供个性化的服务。它具有“千人千面”的推荐特性&#xff0c;即根据消费者的需求和喜好&#xff0c;自动生成个性化的内容推荐和界面布局。 01.更智能…

pngPackerGUI是一款免费的图集打包工具,png图片打包plist工具

pngPackerGUI是一款免费的图集打包工具&#xff0c;png图片打包plist工具 手把手教你使用pngPackerGUI_V2.0此软件是在pngpacker_V1.1软件基础之后&#xff0c;开发的界面化操作软件&#xff0c;方便不太懂命令行的小白快捷上手使用。1.下载并解压缩软件&#xff0c;得到如下目…

Python桌面开发技术 PyQt6教程专栏 一周快速上手,开发桌面应用

大家好&#xff0c;我是python222小锋老师。 近日锋哥又卷了一波课程&#xff0c;Python桌面开发技术 PyQt6教程&#xff0c;文字版视频版。一周掌握。 2024版 PyQt6 Python桌面开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili2024版 PyQt6 Python桌面开发 视频教程(…

LeetCode刷题--- 字母大小写全排列

个人主页&#xff1a;元清加油_【C】,【C语言】,【数据结构与算法】-CSDN博客 个人专栏 力扣递归算法题 http://t.csdnimg.cn/yUl2I 【C】 http://t.csdnimg.cn/6AbpV 数据结构与算法 http://t.csdnimg.cn/hKh2l 前言&#xff1a;这个专栏主要讲述递归递归、搜索与回…

cesium实现二三维联动

记录项目中实现二三维地图联动 效果如下&#xff1a; 第一步&#xff1a;现在页面中加载二三维地图&#xff08;地图的初始化已省略&#xff09; <template><div><div><button click"show">二三维联动</button></div><div&…