声明:文章是从本人公众号中复制而来,因此,想最新最快了解各类智能优化算法及其改进的朋友,可关注我的公众号:强盛机器学习,不定期会有很多免费代码分享~
目录
数据介绍与故障诊断讲解
1.数据预处理
2.特征提取
模型流程与创新点
GCN(图卷积神经网络)
结果展示
部分代码展示
完整代码
今天为大家带来一期利用GCN图卷积神经网络模型一键实现西储大学轴承故障诊断代码与原理讲解,非常新颖!
需要注意的是,本期代码直接附带了处理好的西储大学轴承数据集,并且是Excel格式,已经帮大家替换到了程序里!大家使用的时候只需要一键运行main即可出来所有图片与故障诊断结果(还有打印出来的损失函数曲线)!非常方便!不像其他程序一样需要运行很多文件!适合新手小白!
当然,如果你想替换成自己的其他分类数据集,也非常方便!只需替换Excel文件即可,无需更改代码!
数据介绍与故障诊断讲解
此处使用的数据是西储大学官方的轴承数据!首先说一下该数据集的处理步骤以及来源:
1.数据预处理
取官方下载的驱动端(DE)振动数据,分别为97.mat、107.mat、120.mat、132.mat、171.mat、187.mat、199.mat、211.mat、224.mat、236.mat,即转速为1750时的10种故障诊断类型(包括正常情况),并将所有的数据和类别综合到一个变量中。下图即为12K采样频率下的驱动端轴承故障数据(*表示数据不可用)
2.特征提取
利用VMD算法,选择最佳参数K和α(这里可利用各种优化算法进行优化),基于包络熵最小的准则,提取每个样本的最佳IMF分量,并丢弃其他分量,因为最佳IMF分量已经包含了故障特征的丰富信息!然后,对最佳IMF分量的9个指标进行计算,分别是:均值,方差,峰值,峭度,有效值,峰值因子,脉冲因子,波形因子,裕度因子(对应特征1-9),类别即故障类型,都已经整理好放在了Excel里,如下图所示!
最后,像往常一样,根据10种不同的故障类型直接送入模型进行分类预测即可!
这里顺便说一下10种不同的故障类型分别是什么意思:
类别1:正常情况
类别2:直径0.007英寸,转速为1750时的内圈故障
类别3:直径0.007英寸,转速为1750时的滚动体故障
类别4:直径0.007英寸,转速为1750时的外圈故障
类别5:直径0.014英寸,转速为1750时的内圈故障
类别6:直径0.014英寸,转速为1750时的滚动体故障
类别7:直径0.014英寸,转速为1750时的外圈故障
类别8:直径0.021英寸,转速为1750时的内圈故障
类别9:直径0.021英寸,转速为1750时的滚动体故障
类别10:直径0.021英寸,转速为1750时的外圈故障
也就是说,我们做故障诊断的目的就是为了判断出它到底是什么故障!之后我们才根据故障类型采取有效的解决措施!
更换自己的数据时,也只需最后一列放类别,其余列放特征即可,无需更改代码,非常方便!
模型流程与创新点
以下这些文字,如果大家需要用这个程序写论文,都是可以直接搬运的!
GCN(图卷积神经网络)
图卷积神经网络可以有效地从大量样本中学习到相应的特征,避免了复杂的特征提取过程。另外,图卷积神经网络通过简单的非线性模型从原始数据中提取更加抽象的特征,在整个过程中只需少量的人工参与,所以采用图卷积神经网络对不同故障特征进行分类具有不错的分类效果。
GCNNs本质上是采用图论的方法对二维图片的体征进行提取和运算,然后采用不同的卷积核来提取图形特征。其中,图包含有向图和无向图,其结构Gc可表示如下:
式中:V为顶点;E为边。图结构Gc=(V,E)的特征信息可以用拉普拉斯矩阵的形式表示,其表达式为:
采用归一化的拉普拉斯方程表示为:
其中:
式中:A为图的邻接矩阵;IN为N阶的单位矩阵;D为图中各顶点的度矩阵;Aij为图中点(i,j)的邻接矩阵。图形的关系矩阵经过傅里叶变换之后,图卷积公式的表达式为:
式中:x为图的Nd维信号,x∈RNd;g为卷积核;U为拉普拉斯矩阵L的特征向量。图卷积神经网络的基本结构如下图所示:
从GCNNs的结构图中可以看出,完整的GCNNs包含输入层、隐藏层和输出层,它的层与层之间的传播方式可以表述为:
其中
式中:I为单位矩阵;D为A的度矩阵;H为每一层节点的特征向量矩阵;σ为非线性激活函数;W(l)为当前层卷积的可训练的参数矩阵;l为网络层的标号。
在我们的模型中,邻接矩阵为不同特征之间的Spearson相关系数,不同特征被视作节点,以此输入进GCN中!
结果展示
这里已经贴心的帮大家把损失函数曲线图变成矢量图形式,方便大家放到论文里!
损失函数曲线图:
训练集预测结果:
测试集预测结果:
训练集混淆矩阵:
测试集混淆矩阵:
以上所有图片,作者都已精心整理过代码,都可以一键运行main直接出图,不像其他代码一样需要每个文件运行很多次!
不信的话可以看下面文件夹截图,仅仅只有4个文件,非常清晰明了!
适用平台:Matlab2022a版本及以上,没有的文件夹里已免费提供安装包!
部分代码展示
%% 清空环境变量
warning off % 关闭报警信息
close all % 关闭开启的图窗
clear % 清空变量
clc % 清空命令行
%% 读取数据
res = xlsread('故障诊断数据集.xlsx');
%% 分析数据
num_class = length(unique(res(:, end))); % 类别数(Excel最后一列放类别)
num_res = size(res, 1); % 样本数(每一行,是一个样本)
num_size = 0.7; % 训练集占数据集的比例
res = res(randperm(num_res), :); % 打乱数据集(不打乱数据时,注释该行)
flag_conusion = 1; % 标志位为1,打开混淆矩阵(要求2018版本及以上)
f_ = size(res, 2) - 1; % 输入特征维度
%% 设置变量存储数据
P_train = []; P_test = [];
T_train = []; T_test = [];
%% 划分数据集
for i = 1 : num_class
mid_res = res((res(:, end) == i), :); % 循环取出不同类别的样本
mid_size = size(mid_res, 1); % 得到不同类别样本个数
mid_tiran = round(num_size * mid_size); % 得到该类别的训练样本个数
P_train = [P_train; mid_res(1: mid_tiran, 1: end - 1)]; % 训练集输入
T_train = [T_train; mid_res(1: mid_tiran, end)]; % 训练集输出
P_test = [P_test; mid_res(mid_tiran + 1: end, 1: end - 1)]; % 测试集输入
T_test = [T_test; mid_res(mid_tiran + 1: end, end)]; % 测试集输出
end
%% 数据转置
P_train = P_train'; P_test = P_test';
T_train = T_train'; T_test = T_test';
%% 得到训练集和测试样本个数
M = size(P_train, 2);
N = size(P_test , 2);
%% 数据归一化
[P_train, ps_input] = mapminmax(P_train, 0, 1);
P_test = mapminmax('apply', P_test, ps_input);
%% 数据平铺
% 将数据平铺成1维数据只是一种处理方式
% 也可以平铺成2维数据,以及3维数据,需要修改对应模型结构
% 但是应该始终和输入层数据结构保持一致
p_train = double(reshape(P_train, f_, 1, M));
p_test = double(reshape(P_test , f_, 1, N));
t_train = T_train';
t_test = T_test' ;
%% 设置超参数
parameters = struct; % 初始化结构
numHiddenFeatureMaps = 32; % 隐藏层节点数
numInputFeatures = size(p_train, 2); % 输入特征数目(非节点数目)
%% 初始化网络权重 1
完整代码
点击下方小卡片,后台回复关键字,不区分大小写:
GZZDB
其他更多需求或想要的代码均可点击下方小卡片后后台私信,看到后会秒回~
更多代码链接:更多代码链接