基于生成式人工智能的工业互联网安全技术与应用研究

摘要:近年来,人工智能技术飞跃式发展,工业互联网安全与大模型、生成式人工智能等新技术融合成为研究的重点方向和难题。针对工业互联网安全领域面临的突出性问题,对该领域人工智能应用现状进行了分析与研究,提出了一种适用于工业互联网安全的生成式人工智能应用的智能化分级标准;同时,对新技术、新概念、新领域的融合情况进行了总结与展望,旨在为后续工业互联网安全的研究起到指导和引领作用。

关键词:工业互联网安全;生成式人工智能;智能化分级标准;自动化渗透

0  引言

工业互联网安全有别于传统的网络安全和信息安全,其所面临的安全威胁既来自信息技术网络,也来自工业通信网络,可编程逻辑控制器、分散控制系统、数据采集与监视控制系统等工业控制设备及系统均会存在安全漏洞与威胁,利用这些漏洞及脆弱点则有可能会对工业生产环境造成致命性的打击。

世界各地均对涉及关键基础实施的行业(如能源、交通、水利、公共通信等)进行了大规模的安全评估与监管,并逐步加强了在工业安全领域的投入和研究[3]。但随着云计算、5G、边缘计算等技术的发展,越来越多的工业控制设备与工业生产系统开始接入公共互联网以提供远程操控、数字化生产等服务,而越来越多的重要工业数据也不断汇聚在工业系统中。尽管可以使用虚拟专用网络、防火墙、堡垒机等技术或设备对通信链路与网络边界进行加固与保护,但不同工业场景下的安全威胁不尽相同,仅仅对链路层及网络层进行保护无法应对勒索软件、社会工程学攻击、高级可持续性攻击、零日漏洞等新型网络攻击。因此,如何依靠机器学习、大模型、生成式人工智能等新技术对工业互联网安全应用进行迭代与升级成为了重点研究方向之一。本文的研究将有助于推动生成式人工智能在网络安全、工业互联网安全领域的持续发展,进一步提高工业互联网的安全防护水平与能力

1  研究思路

1.1  工业互联网安全亟需融合新技术

工业互联网安全是一个独特的技术领域,与一般计算机信息系统不同的是,工业互联网自下而上分别连接工业控制设备、工业控制系统、专有工控协议、通用网络设备、信息化生产系统、互联网设备等不同用途、不同层面的硬件与软件,任何一个组件都可能成为网络攻击的发起点或数据泄露的脆弱点。

传统网络安全注重网络结构,强调对网络边界的防护和设备自身的保护,工业互联网安全显然不只包含这两个防护要点,随着勒索攻击等新型网络攻击手段的迭代更新,新时代发展背景下信息化、智能化、数字化的发展浪潮也必将重构工业互联网安全的架构体系,工业数据势必将成为改变的核心要素。工业互联网拥有工业生产、安全日志、工控协议、网络流量、企业信息等多方位、多角度的海量安全相关数据,如何围绕这些数据并结合新技术将原有安全架构进行转变是当前环境下的重点研究方向。

人工智能、大模型等新技术的出现,可有效应对工业互联网领域数据清洗、分析的相关工作,同时面对不同类别、不同维度的数据(如企业运营信息、工业生产信息等),新技术也可通过大量的判断决策挖掘其内在的联系,从而进一步防止社会工程学攻击、内部人员攻击等传统安全技术手段难以应对的攻击形式。但现阶段业界并未在工业互联网安全的专项领域进行深层次的研究,新技术的融合程度也不高。

1.2  生成式人工智能可有效降低技术门槛

生成式人工智能是一种对输入的不确定数据及自然语言进行分析,而后利用特定的数据模型、规则做出与人类相似决策(或更优决策)并生成文本、图片、代码、指令等内容的计算机技术,也是人工智能技术的重要分支。

随着增强学习、深度学习、神经网络、自然语言处理、支持向量机等分支技术的提出与实践,人工智能技术在近十年迎来了爆发式发展,而广义网络安全技术的研究,也是通过对不确定的攻击数据或靶标信息进行分析,根据经验决策得出对应安全防护手段或渗透路径的过程,这与人工智能技术的内在逻辑几乎相同。此前,已有不少网络安全专家提出可通过人工智能技术加强漏洞挖掘、恶意代码检测、威胁流量分析等相关安全技术手段的及时性与准确性,但这些技术并未采用大模型,也并未形成清晰完整的“分析-决策”链,智能化程度不高。

随着聊天生成预训练转换器(ChatGPT)等大模型的发布,人工智能技术的发展迎来了新的高峰。大模型是一种机器学习模型,相比初期的小数据模型,其具备更大规模参数和更复杂的计算结构,相对也能处理更为复杂的不确定数据,生成更符合人类思维的决策结果。大模型在各行业领域均可起到作用,如语音识别及模拟、计算机视觉、艺术设计、医药研究等。在网络安全领域,大模型暂时还处在初级研究阶段,业界存在一批开源应用原型及商用智能化网络安全咨询机器人,但在工业互联网安全层面则几乎还未出现专为该领域设计的生成式人工智能应用及技术研究。如何通过人工智能技术对工业互联网面临的海量设备连接、海量数据汇聚等突出性安全隐患进行梳理、分析并最终实现自主防御是业界的主流研究思路。

2  应用现状与不足

本文按照功能侧重性对目前已经出现的工业互联网安全生成式人工智能应用与技术分为以下三类。

2.1  安全专家机器人

大模型应用离不开自然语言处理,ChatGPT等人工智能聊天机器人也是以高效的自然语言处理技术为基座,对输入的自然语言进行细致的分析处理,进而得到不同的回答。在网络安全行业,已有不少安全企业对安全大模型进行了研究,并提出了将安全专业书籍、安全技术原理、安全论文、安全事件、漏洞数据、恶意代码样本等众多安全数据为模型底座建立专用于安全领域的智能化机器人的技术路线。

相较于知识库类型的问答机器人,利用安全大模型构建的安全机器人在安全事件研判、威胁情报分析、恶意代码解读、漏洞信息筛选等以数据为基底的能力层面得到了大幅提升。

一直以来,企业面对网络安全事件时多以事先准备的安全应急预案作为应对手段,基于生成式人工智能技术的安全专家机器人可改善此类传统运营模式的效率,极大地提升企业面对安全威胁的实操与应对能力。同时,若将防火墙、漏洞扫描、入侵防御、入侵检测等相关安全设备与安全专家机器人进行接口关联和指令联动,也可达到更大范围的安全防御动作,真正意义上实现自动化安全防护。不过,该类型应用目前在工业互联网安全领域并未出现专用的分支,在已开源的安全大模型中也缺乏对工业安全知识的引入。

2.2  自动化渗透测试机器人

渗透测试是网络安全检测检验中的一项重要技术手段,检测人员利用漏洞扫描、网络嗅探、端口扫描、权限提升等方法,将自己“化身”为攻击入侵者,结合自身经验对目标系统进行渗透,从而达到挖掘目标系统风险点、安全漏洞等信息的目的,最后形成检测报告帮助目标系统进行安全加固与整改。

渗透测试有着明确的框架与步骤,一般包含信息收集、威胁建模分析、测试执行、路径优化及报告撰写等不同的流程,每一步骤均可对下一流程的决策产生影响,如何决策一般是测试人员根据自身经验及收集信息的内容来决定的。因此,使用人工智能技术对被测目标进行数据采集与分析进而就分析决策出最优渗透路径是目前业界自动化渗透机器人的主要技术框架(见图1)。目前,商用的自动化渗透机器人数量不多,开源领域则存在许多使用大模型接口进行自然语言处理并将之转换成相关指令调用第三方工具展开渗透测试的原型设计,这些开源应用中的生成式人工智能技术更多用于提升用户交互的友好度和自然语言处理的准确度。

图1   自动化渗透测试机器人常见技术框架

不过该类型应用仍旧缺乏对工业互联网安全、工业生产场景和工控安全的覆盖。在工业场景下的渗透测试,多针对工控设备漏洞、工控协议风险、组态软件漏洞等层面,因此渗透路径及所采用的第三方工具有所不同。

2.3  安全产品融合优化

漏洞挖掘、恶意代码检测、威胁情报分析、恶意行为检测等相关安全技术,均可采用生成式人工智能进行优化。例如恶意代码检测技术,传统方法通常基于已有的恶意代码样本库进行特征匹配,无法对新型或产生时间较短的恶意代码进行防范,而使用大模型与深度学习能够高效检测恶意代码片段并提高判断准确性,同时可对新产生的恶意代码进行甄别,大幅提升恶意代码检测效率。

大模型擅长的自然语言处理也可用于分析设备日志与报警信息,提取出有助于安全运营人员甄别的信息并进行自动化分类和总结,提高日志审计效率,减少运营成本。目前,工业互联网安全领域已有不少使用大模型加强工业安全威胁检测的案例,该类型技术在工业安全领域也可沿用与网络安全领域同样的技术路线和研究思路,用于加强工控漏洞挖掘、工业网络入侵检测等相关技术的效率与准确性,从而降低工业互联网的潜在安全风险,提升工业网络运行稳定性。

3  发展建议

3.1  工业安全模型分支

工业互联网领域存在不同的生产环境,有的注重工业控制设备的安全性,有的则重视网络边缘及内部网络的安全风险,且不同的工业生产场景所使用的设备、网络结构、网络协议都存在很大的差异,如果使用常见的安全专家机器人,只能对通用网络安全层面进行分析和决策,无法实现全范围的数据分析,也无法应对来自工控设备、工控协议等专业领域的安全威胁。因此,将海量工控安全知识、工控设备漏洞信息、工业协议数据、工业安全事件等数据及内容纳入到安全专家机器人的模型中,衍生发展出适用于工业安全的分支,训练出工业安全专家机器人,是未来发展的一个方向。

3.2  工业场景定制化

针对某些大型、复杂的工业场景,可以利用该场景的网络拓扑结构、资产信息、工控协议内容、网络数据包、设备日志等多维度、深层次的全量数据对该场景进行定制化的模型构建与数据训练,据此特化出的安全专家机器人可对该场景面临的网络安全、工业互联网安全及威胁进行更深度、更快速、更有效的分析与决策,从而辅助安全运营人员快速定位风险点,大幅减少生产停滞的风险。

同时,不同工业场景的网络结构与安全风险存在差异,因此渗透路径的选择及威胁模型的构建都需要借助渗透测试人员的丰富经验来决定。可将真实的渗透测试路径数据纳入自动化渗透机器人的训练数据集和验证数据集,并搭建环境进行再训练,对选取不同路径的行为设置不同的奖励分,引导机器人在工业场景中选择正确高效的渗透路径。

3.3  推动技术标准化

新产品的出现往往伴随着新的安全隐患,目前已有许多安全企业、科研机构、高校对生成式人工智能在工业互联网安全领域的发展投入了人员与资金,相信在不久的将来能看到更多高度智能化、自动化的工业安全应用与技术。为保障新型应用能够规范化、标准化发展,针对新领域的人工智能应用,有必要提前制定好智能化分级要求,一方面将有助于开发者按照不同级别的要求阶梯式完成不同层级产品或技术的研发,另一方面将有助于用户快速鉴别不同级别人工智能应用及技术可替代的工作范畴。

基于此,本文提出了一套适用于工业互联网安全领域的智能化分级标准。

4  智能化分级标准

基于汽车驾驶自动化分级国家标准的框架和工业互联网安全技术试验与测评工业和信息化部重点实验室多年来在该领域的积累,提出了一种在工业互联网安全领域对此类应用进行智能化与自动化程度分级的参考要求,为新领域的技术发展提供可参考的依据(见表1)。

表1   工业互联网安全生成式人工智能应用智能化分级

4.1 0级工业互联网安全智能化

分级要求:0级工业互联网安全智能化系统不能持续执行工业互联网安全行为与动作,具备持续分析部分工业互联网安全数据及以自然语言回答部分工业互联网安全问题的能力。

内容解读:工业互联网安全行为与动作包括但不限于防御、渗透、监测、响应等,0级工业互联网安全智能化系统使用的模型数据相对较少,其功能多以数据分析、自然语言安全问答等为主,可在工业互联网安全运营中为安全运维人员提供基础决策辅助。

4.2  1级工业互联网安全智能化

分级要求:1级工业互联网安全智能化系统在其设计的条件下可持续执行部分工业互联网安全行为与动作,具备持续分析工业互联网安全数据、研判及处置已知或普通安全威胁的能力,具备0级工业互联网智能化系统全部功能。

内容解读:1级工业互联网安全智能化系统能够在安全运维人员制定好的策略及框架下自动执行部分安全行为与动作,一般涉及网络边界管理和网络访问管理,可对工业互联网常见漏洞及场景进行简单分析与威胁信息的预研判,可为安全运维人员提供进阶决策辅助。

4.3  2级工业互联网安全智能化

分级要求:2级工业互联网安全智能化系统在其设计的条件下可持续执行部分工业互联网安全行为与动作,具备持续分析工业互联网安全数据、研判及处置未知及高级复杂安全威胁的能力,具备1级及以下智能化系统全部能力。

内容解读:2级工业互联网安全智能化系统能够在既定策略下自动执行大部分安全行为与动作,一般可涉及网络边界管理、网络访问管理、应急事件响应、威胁分析、安全告警、威胁处置等,可对工业互联网常见漏洞及场景进行深度分析,可对安全威胁直接进行研判和处置,可为安全运维人员提供高级决策辅助。

4.4  3级工业互联网安全智能化

分级要求:3级工业互联网安全智能化系统在其设计的条件下可持续执行全部工业互联网安全行为与动作,具备2级及以下智能化系统全部能力。

内容解读:3级工业互联网安全智能化系统能够在既定策略下自动执行全部安全行为与动作,若无策略限制则无法达到最小风险状态,可能出现错误操作,可由系统有条件地替代安全运维人员。

4.5  4级工业互联网安全智能化

分级要求:4级工业互联网安全智能化系统在其设计的条件下可持续执行全部工业互联网安全行为与动作并自动执行最小风险策略,具备3级及以下智能化系统全部功能。

内容解读:4级工业互联网安全智能化系统能够在既定策略与框架下自动执行全部安全行为与动作,无策略限制也可自动遵循最小风险策略,整个系统可达到最小风险状态,可由系统高度替代安全运维人员。

4.6  5级工业互联网安全智能化

分级要求:5级工业互联网安全智能化系统可在任意条件下持续执行全部工业互联网安全行为与动作并自动执行最小风险策略,且具备4级及以下智能化系统全部功能。

内容解读:5级工业互联网安全智能化系统能够自动执行全部安全行为与动作,无需策略限制,可由系统完全替代安全运维人员。

5  结束语

目前,生成式人工智能在网络安全领域的应用大多是以大语言模型作为技术底座,加入安全领域的相关数据与专业知识作为补充,在渗透与防御方向各自发展出了具备一定智能化程度的技术框架与设计,但在工业互联网行业并未出现相对应的专业领域安全大模型及应用。本文基于对现有安全领域大模型应用与技术的现状调研,将工业互联网安全领域近期可能出现的3种技术发展路线进行了详细的分析并提出了可行的优化方向,同时依据汽车驾驶自动化的分级标准框架,对工业互联网安全智能化系统进行了不同的分级,有利于未来该领域应用的规范化发展。未来,生成式人工智能与工业互联网安全的结合方向应重点面向不同行业进行细分与特化,针对制造业、能源、水务、电力、核能、航天、烟草等提出适用于该行业的智能化系统或安全大模型,采集不同行业的关键网络安全数据进行模型优化。同时,也应采用大模型对工业互联网安全检测、渗透测试、攻防演练、网络靶场等相关安全技术进行优化,进一步提升工业互联网整体安全防护水平。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/905956.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

神舟十九号发射取得圆满成功 科技自强自力筑梦天穹

10月30日凌晨神舟十九号载人飞船发射取得圆满成功! 图片来自网络 当日凌晨4时27分,搭载神舟十九号载人飞船的长征二号F遥十九运载火箭在酒泉卫星发射中心点火发射取得圆满成功。执行神舟十九号载人飞行任务的航天员乘组由蔡旭哲、宋令东、王浩泽3名航天…

PHP反序列化原生类字符串逃逸框架反序列化利用

PHP反序列化 概念 序列化的原因:为了解决开发中数据传输和数据解析的一个情况(类似于要发送一个椅子快递,不可能整个椅子打包发送,这是非常不方便的,所以就要对椅子进行序列化处理,让椅子分成很多部分在一起打包发送…

KINGBASE部署

环境:x86_64 系统:centos7.9 数据库–版本:KingbaseES_V008R006C008B0014_Lin64_install 授权文件–版本:V008R006-license-企业版-90天 一 前置要求 1.1. 硬件环境要求 KingbaseES支持通用X86_64、龙芯、飞腾、鲲鹏等国产C…

建筑行业知识库搭建:好处、方法与注意事项

在建筑行业,知识管理对于提升项目效率、降低成本、增强创新能力以及构建竞争优势具有至关重要的作用。搭建一个高效、系统的建筑行业知识库,不仅有助于实现知识的有效沉淀与便捷共享,还能促进知识在项目实践中的灵活应用,从而加速…

图书管理系统(JDBC)

AdminUser是管理员类 NormalUser是用户类 AddOperation是增加图书类 BorrowOperation是借书类 DelOperation是删除图书类 ExitOperation是退出类 FindOperation是查找图书类 IOPeration是接口 ReturnOperation是还书类 ShowOperation是显示所有图书类 注意&#xff1a…

liunx CentOs7安装MQTT服务器(mosquitto)

查找 mosquitto 软件包 yum list all | grep mosquitto出现以上两个即可进行安装,如果没有出现则需要安装EPEL软件库。 yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm查看 mosquitto 信息 yum info mosquitto安装 mosquitt…

如何保护网站安全

1. 使用 Web 应用防火墙(WAF) 功能:WAF 可以实时检测和阻止 SQL 注入、跨站脚本(XSS)、文件包含等常见攻击。它通过分析 HTTP 流量来过滤恶意请求。 推荐:可以使用像 雷池社区版这样的 WAF,它提…

【CPN TOOLS建模学习】设置变迁的属性

使用Tab键在属性之间进行切换 与一个变迁相关联的四个铭文,均为可选项: 变迁名称守卫(Guard)时间代码段 变迁延迟必须是一个正整数表达式。该表达式前面加上,这意味着时间铭文的形式为 delayexpr。在添加时间铭文之前,铭文的默…

Cityscapes数据集:如何将像素级的多边形标注的分割数据标注转为目标检测的bbox标注

Cityscapes数据集官网下载地址: https://www.cityscapes-dataset.com/ 相关介绍:从官网下载这三个压缩包文件leftImg8bit_trainvaltest.zip、gtCoarse.zip、gtFine_trainvaltest.zip 1)leftImg8bit_trainvaltest.zip分为train、val以及tes…

NVR批量管理平台EasyNVR多品牌NVR管理工具/设备关于远程控制的详细介绍

在数字化安防时代,视频监控技术已成为维护公共安全、提升管理效能的重要基石。随着科技的飞速发展,流媒体技术和视频监控正经历着前所未有的变革与融合。NVR批量管理平台EasyNVR,作为一款基于“云-边-端”一体化架构的视频融合云平台&#xf…

理解原子变量之一:从互斥锁到原子变量,最粗浅的认识

目录 三个实例对比 结论 多线程编程对于程序员来说,是一项非常重要的技能。在C11标准问世之前,C标准是不支持多线程的。在C11出台前,如果你想在linux平台进行多线程编程,就要使用linux的多线程库pthread,而pthread是…

eBay自养号测评养成攻略:从环境系统搭建到养号下单

eBay账号在测评中的重要性不言而喻,然而,新注册的账号往往面临被封禁或下单即封的风险。如何养成稳定的买家号,成为众多商家关注的焦点。以下将详细讲解eBay测评中如何稳定养成买家号。 一、账号注册后的初期养护 新注册的eBay账号&#xf…

Docker(二):Docker的基本使用

1 Docker的基本使用 1.1 镜像相关操作 1、从DockerHub搜索镜像 [rootmaster ~]# docker search centos # 镜像名字 描述 星标 是否官方(有OK表示为官方镜像) NAME …

【hector mapping参数设置】

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 hector mapping部分参数介绍调整hector_mapping中的参数ros常见问题总结 hector mapping部分参数介绍 在wiki.ros.org/hector_mapping界面找到3.1.4 Parameters章节…

使用wordcloud与jieba库制作词云图

目录 一、WordCloud库 例子: 结果: 二、Jieba库 两个基本方法 jieba.cut() jieba.cut_for_serch() 关键字提取: jieba.analyse包 extract_tags() 一、WordCloud库 词云图,以视觉效果提现关键词,可以过滤文本…

ios Framework版本号的问题。

自己创建的framework和普通的app的版本号设置的地方是有所有不同的。 framework 的版本号是在 TARGETS -> Build Settings -> current Project Version 这个地方设置的, 在创建framework的时候xcode 会自动创建一个framework.h的文件名,framewo…

Axure设计之多级菜单导航教程(中继器)

在数字化时代,优化产品设计,提升用户界面交互,是产品设计着重考虑的点。针对传统菜单导航复杂繁琐的问题,本设计提出了一套灵活的菜单导航方案,结合中继器与动态面板,实现一键搜索、菜单收藏、多级菜单导航…

真题总结和整理

补码的符号位在最高位 IEEE754 规格化要求 小数点前面是1,其他的认为是小数点后面为1即可 计算之前要对阶 左移和右移在寄存器中如果未说明定点数,可以通过移动小数点实现 涉及最小帧长要记得除以2 求用于外设的时钟周期数 指令两端只允许有寄存器,间接寻址要通过MA…

计组-层次化存储结构

这里主要看存储的整体结构,cache,内存 这里看存储结构是按什么样的层次来划分存储结构,速度由慢到快,容量由大到小,这是基于性价比的考虑,所以分为多级多层次,可以做到提高速度的同时没有增加多…

Rust整合Elasticsearch

Elasticsearch是什么 Lucene:Java实现的搜索引擎类库 易扩展高性能仅限Java开发不支持水平扩展 Elasticsearch:基于Lucene开发的分布式搜索和分析引擎 支持分布式、水平扩展提高RestfulAPI,可被任何语言调用 Elastic Stack是什么 ELK&a…