论文阅读——Intrusion detection systems using longshort‑term memory (LSTM)

一.基本信息

论文名称:Intrusion detection systems using longshort‑term memory (LSTM)

中文翻译:基于长短期记忆(LSTM)的入侵检测系统

DOI:10.1186/s40537-021-00448-4

作者:FatimaEzzahra Laghrissi1* , Samira Douzi2*, Khadija Douzi1* and Badr Hssina1*

发表年份:2021年

发表期刊:《Journal Of Big Data》

中科院分区:计算机科学2区

JCR分区:Q1

影响因子:IF(5):12.4

二.论文阅读

1.研究背景

1.网络威胁日益严重,入侵检测技术越来越关键。

2.目前许多入侵检测系统基于机器学习模型,但是经典的机器学习模型无法解决实时性问题。

3.深度学习模型在入侵检测方面的应用有所增加

2.主要贡献

在KDD99数据集上,对三个模型(即LSTM,LSTM-PCA,LSTM-MI)进行二分类和多分类的测试

3.研究过程 

A.数据集的阐述:

      1.  KDD99 dataset:53个特征;4个攻击大类;
      2. 存在的问题:攻击记录的数量远远大于正常记录

B.数据预处理:

        二分类将标签分为两种类别:正常和攻击;接着 随机抽样来缓解数据集存在的问题
        多分类分成 三类 :正常攻击,拒绝服务攻击和R2L类别中的所有其他攻击

C.数据降维 

PCA方法:
        原数据的特征是53个,用PCA方法降维, 主成分1,2 或者 主成分1,2,3 即可描述重要特征(后面实验对比了2个主成分和3个主成分的效果)
                            

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

MI方法:
        1.定义: 互信息(Mutual Information )是一种用来计算两个变量之间统计依赖性的方法,这里的两个变量是“特征”与“目标值/标签”, 某个特征的互信息分数越高,说明该特征对标签结果的影响更大

        2.本实验的设置:

本实验的选择: 本实验分别用了4号特征和其余10个特

D.数据集的划分 

60%的预处理后的数据作为训练集;20%作为验证集;20%作为测试集

E.分类模型的设置

①分类模型:LSTM
②内部结构和参数设置:
        ▶整体模型及参数:

        

        ▶LSTM的结构:

4.研究结果 

性能评价指标1:准确度,召回率,精确度,F1分数

结果:

对于二分类和多分类来比较:二分类的效果好

对于三种模型来比较:LSMT-PCA效果最好

对于具体模型来说:

        LSTM-PCA:在选择两个主成分时效果更好

        LSTM-MI:选择4号特征比选择10个特征效果好

--------------------------------------------------------------------------------------------------------------------------

性能评价指标2:处理时间 

结果:

二分类比多分类快;LSTM-MI比其他模型快;添加更多的特征会增加处理时间

--------------------------------------------------------------------------------------------------------------------------

LSTM-PCA的最终评价:

        ①在 准确率和敏感度上超越其他模型。

        ②使用更少的特征 实现了 高效性能 ,适合 大规模实时环境
        ③模型具有通用性、高效性,在入侵检测系统中的潜在实用价值

5.总结

作者提出的 LSTM 模型能够有效区分正常网络流量和攻击流量。除此之外,模型结合主成分分析(PCA)和互信息作为降维方法。实验结果表明,基于 PCA 的模型(特别是使用2个主成分)在二分类和多分类任务中都表现最好,准确率分别达到 99.44% 和 99.39%。模型的准确性和敏感性优于其他比较方法,且使用少量特征(2个)使得模型训练更加高效,占用更少资源。

6.未来展望

研究LSTM的多种变体,以及其他神经网络算法和其他特征选择算法。

7.整个论文的思维导图

!!!声明!!!

这篇文章仅用于本人的学术学习,侵权即删,转载或学习请标明原论文的信息,正确引用!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/919807.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【网络系统管理】Centos7——配置主从mariadb服务器案例(下半部分)

【网络系统管理】Centos7——配置主从mariadb服务器案例-CSDN博客 接上个文档,我们已经完成了主服务器创建数据库备服务器可以看到 一、在DBMS2查看信息 File,Position这两个字段的数据要记好,等一下需要用到 show master status; 二、在…

Flowable工作流 -> 数据存储 -> 表结构梳理

一 前言 初学工作流,我发现集成SpringBoot之后,工作流的各项操作都比较简单,引擎,工作Service这些,直接自动装配即可。流程的定义(部署),流程实例启动,实例任务…

机器翻译基础与模型 之一: 基于RNN的模型

一、机器翻译发展历程 基于规则的-->基于实例的-->基于统计方法的-->基于神经网络的 传统统计机器翻译把词序列看作离散空间里的由多个特征函数描述的点,类似 于 n-gram 语言模型,这类模型对数据稀疏问题非常敏感。神经机器翻译把文字序列表示…

【优选算法篇】分治乾坤,万物归一:在重组中窥见无声的秩序

文章目录 分治专题(二):归并排序的核心思想与进阶应用前言、第二章:归并排序的应用与延展2.1 归并排序(medium)解法(归并排序)C 代码实现易错点提示时间复杂度和空间复杂度 2.2 数组…

DrugLLM——利用大规模语言模型通过 Few-Shot 生成生物制药小分子

摘要 小分子由于能够与特定的生物靶点结合并调节其功能,因此在药物发现领域发挥着至关重要的作用。根据美国食品和药物管理局(FDA)过去十年的审批记录,小分子药物占所有获批上市药物的 76%。小分子药物的特点是合成相对容易&…

「一」HarmonyOS端云一体化概要

关于作者 白晓明 宁夏图尔科技有限公司董事长兼CEO、坚果派联合创始人 华为HDE、润和软件HiHope社区专家、鸿蒙KOL、仓颉KOL 华为开发者学堂/51CTO学堂/CSDN学堂认证讲师 开放原子开源基金会2023开源贡献之星 「目录」 「一」HarmonyOS端云一体化概要 「二」体验HarmonyOS端云一…

架构师:使用 Atomix 实现分布式协调服务的技术指南

1、简述 Atomix 是一个强大的分布式协调框架,提供了分布式数据结构、协调工具和一致性协议,帮助开发者实现高可用、强一致性的分布式系统。它构建于 Raft 和 Paxos 等一致性协议之上,支持创建分布式锁、Leader 选举、分布式 Map、消息发布-订阅等功能,常用于微服务架构和分…

根据条件 控制layui的table的toolbar的按钮 显示和不显示

部分代码&#xff1a; <!-----查询条件-----> <input type"date" id"StartDate" onchange"PageList()" /> <input type"date" id"EndDate" onchange"PageList()" /><!-----表格Table-----&…

100.【C语言】数据结构之二叉树的堆实现 上

目录 1.顺序结构 2.示意图 ​编辑 从物理结构还原为逻辑结构的方法 3.父子节点编号的规律 4.顺序存储的前提条件 5.堆的简介 堆的定义 堆的两个重要性质 小根堆和大根堆 6.堆的插入 7.堆的实现及操作堆的函数 堆的结构体定义 堆初始化函数HeapInit 堆插入元素函…

CommonsBeanutils与Shiro发序列化利用的学习

一、前言 前面的学习中&#xff0c;过了一遍cc1-cc7的利用链&#xff0c;在CC2的利用链中&#xff0c;学习了 java.util.PriorityQueue&#xff0c;它在Java中是一个优先队列&#xff0c;队列中每一个元素都有自己的优先级。在反序列化这个对象时&#xff0c;为了保证队列顺序…

OpenGL入门008——环境光在片段着色器中的应用

本节将在片段着色器中应用环境光照(Ambient) 文章目录 一些概念光照模型环境光漫反射镜面反射总结 实战简介dependencieslightShader.vslightShader.fsshader.vsshader.fs utilsCube.hCube.cpp main.cppCMakeLists.txt最终效果 一些概念 光照模型 环境光 概述&#xff1a; 在…

cesium for unity的使用

先聊聊导入 看到这里的因该能够知道&#xff0c;官网以及网上绝大多数的方法都导入不进来&#xff0c;那么解决方法如下: 两个链接&#xff1a;按照顺序依次下载这两个tgz和zip&#xff0c;其中tgz为主要部分&#xff0c;zip为示例工程项目 如果您要查看示例工程项目的话&am…

stm32cubemx+VSCODE+GCC+makefile 开发环境搭建

title: stm32cubemxVSCODEGCCmakefile 开发环境搭建 tags: FreertosHalstm32cubeMx 文章目录 内容往期内容导航第一步准备环境vscode 插件插件配置点灯 内容 往期内容导航 第一步准备环境 STM32CubeMXVSCODEMinGWOpenOcdarm-none-eabi-gcc 然后把上面下载的软件 3 4 5 bin 文…

20241120-Milvus向量数据库快速体验

目录 20241120-Milvus向量数据库快速体验Milvus 向量数据库pymilvus内嵌向量数据库模式设置向量数据库创建 Collections准备数据用向量表示文本插入数据 语义搜索向量搜索带元数据过滤的向量搜索查询通过主键搜索 删除实体加载现有数据删除 Collections了解更多 个人主页: 【⭐…

【Axure高保真原型】3D农业管理大屏可视化案例

今天和大家分享3D农业管理大屏可视化案例的原型模板&#xff0c;里面包括重点指标分析、产量分析、种类分析、分布分析、收入分析和销售分析&#xff0c;具体效果可以点击下方视频观看或打开下方预览地址查看哦 【原型效果】 【Axure高保真原型】3D农业管理大屏可视化案例 【原…

使用 LSTM(长短期记忆网络) 模型对时间序列数据(航空旅客人数数据集)进行预测

代码功能 数据准备 加载数据&#xff1a;从公开的航空旅客人数数据集&#xff08;Airline Passengers Dataset&#xff09;中读取时间序列数据。 对数变换和平稳化&#xff1a;对数据应用 log1p 函数减少趋势和波动&#xff0c;使模型更容易学习规律。 归一化处理&#xff1a;…

Redis Search系列 - 第七讲 Windows(CygWin)编译Friso

目录 一、背景二、安装CygWin三、编译Friso四、运行Friso五、Friso分词效果测试 一、背景 最近在做RedisSearch的中文分词效果调研&#xff0c;底层的中文分词插件使用的就是Friso&#xff0c;目前手里的Linux环境上yum镜像仓库有问题导致没法安装gcc&#xff0c;又急于验证Fr…

【AI大模型引领变革】探索AI如何重塑软件开发流程与未来趋势

文章目录 每日一句正能量前言流程与模式介绍【传统软件开发 VS AI参与的软件开发】一、传统软件开发流程与模式二、AI参与的软件开发流程与模式三、AI带来的不同之处 结论 AI在软件开发流程中的优势、挑战及应对策略AI在软件开发流程中的优势面临的挑战及应对策略 结论 后记 每…

智领未来: 宏集物联网HMI驱动食品与包装行业迈向智能化新高度

行业现状与挑战 食品与包装行业对设备的自动化、智能化水平要求日益提高&#xff0c;特别是瓶装和灌装生产线需要实现高速、高效的生产。此外&#xff0c;该行业还需遵循严格的卫生标准和安全规范&#xff0c;以保证产品质量符合消费者需求。在提高生产效率的同时&#xff0c;…

LeetCode 热题100(九)【图论】(待更新)

目录 9.图论 9.1岛屿数量&#xff08;中等&#xff09; 9.2腐烂的橘子&#xff08;中等&#xff09; 9.3课程表&#xff08;中等&#xff09; 9.4实现 Trie (前缀树)&#xff08;中等&#xff09; 9.图论 9.1岛屿数量&#xff08;中等&#xff09; 题目描述&#xff1a;…