基于RAG大模型的变电站智慧运维-第十届Nvidia Sky Hackathon参赛作品

第十届Nvidia Sky Hackathon参赛作品

1. 项目说明

变电站是用于变电的设施,主要的作用是将电压转化,使电能在输电线路中能够长距离传输。在电力系统中,变电站起到了极为重要的作用,它可以完成电能的负荷分配、电压的稳定、容错保护等重要功能,是电力系统的重要组成部分。
变电运维操作站是根据无人值班变电站的运行维护 倒闸操作、事故处理、 设备巡视和文明生产管理的需要,在地理位置、供电区域和交通方面适宜对无人值班变电站进行高效、合理的管理而设立的变电运行班组。智慧变电站运维项目基于RAG技术创新构建智能对话机器人,通过 NVIDIA NIM的强大功能,将大模型技术赋能变电运维操作,充分结合远程无人化高清视频和机器人联合巡检等技术,打造变电站智慧运维新范式 。

2. 功能模块

团队将功能分解为3个功能模块和1个辅助模块,其中变电运维知识库,固定巡检点位校验,场景变化判别是3个功能模块。缺陷识别检测辅助判断为辅助模块。整体界面如下图所示:
图 1 UI界面

2.1 变电运维知识库

基于RAG技术搭建变电运维知识库,按照运行维护、事故处理、设备巡视和文明生产管理四部分组织处理文档,全方位监测和解决变电运维领域中可能出现的问题及其成因。采用ai-embed-qa-4对模型进行向量化,使用ai-nemotron-4-340b-instruct"大模型对对话进行生成。
变电运维知识库示例:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2固定巡检点位校验

当前,变电站巡检机器人所采用的方式为固定点与预置位相结合的巡检方式,具体而言,是借助自主导航系统抵达指定的巡检点位置,读取云台预置位的相关参数,设定云台的固定角度,进而完成图像信息的采集工作。然而,整个流程处于开环状态,难以控制,并且缺少对采集信息的反馈以及纠正机制。倘若在采集过程中,出现导航位置的偏差、摄像头的赃污、所采集设备位置的偏移,以及相机曝光参数设置不当等情况,均会致使巡检失效。
为此,团队运用 ai-phi-3-vision-128k-instruct大模型对采集的图像进行文本信息描述,实时判别采集设备是否正常采集信息。通过诸如图像是否模糊、曝光是否正常、所拍摄表计是否处于视野中心等一系列 image-to-text 问题,获取有效的信息,达成系统自动对固定巡检点位准确度的校验,主动察觉问题,并及时予以干预。
固定点为校验示例:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.3场景变化判别

针对监控远程无人化高清视频,因为其相对固定特性,故设计场景变化判别模块,采用对不同时刻相同同角度拍摄的两张或多张图片进行对比,当出现不同表明场景发生变化,进行事故警报。当前传统模型采用以changenet为主导的场景变化语义检测模型,模型需要依靠大量的人工采集标注,泛化能力差。
本项目采用image-to-text大模型方法进行场景变化判别,具体的,通过ai-microsoft-kosmos-2对输入的两张图片进行文本描述,然后根据文本描述信息比较文本的异同,通过文本异同程度判断场景是否发生变化。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.4 大模型+小模型融合的缺陷检测新范式

变电站的缺陷检测工作极其复杂,在检测过程中,需要面对诸多技术难题和复杂的设备运行状况。当前检测模型主要以yolov8与cascade-rcnn系列模型为主。通常情况下,检测工作会特别注重召回率,然而这却导致了误检率偏高的问题。比如说,在对某些细微的潜在缺陷进行检测时(渗漏油缺陷),为了尽可能多地发现可能存在的缺陷,检测系统会放宽判定标准,从而将一些并非真正缺陷的情况(水渍,阴影)也纳入检测结果之中,使得误检情况屡屡发生。这不仅增加了后续的排查工作量,还可能会对正常的运维工作造成一定的干扰和误导。
因此,为了改善这一状况,我们打算引入大模型语义特性,充分利用大模型的强大逻辑特性,来完成对缺陷检测结果的过滤。通过对检测数据进行深入的语义分析和逻辑推理,大模型能够更加准确地判断哪些是真正的缺陷,哪些是误检。具体流程,输入一张图片,ai-phi-3-vision-128k-instruc大语言模型进行文本生成,本地yolov8小模型进行缺陷检测,将两个结果结合输入ai-nemotron-4-340b-instruct语言大模型进行最后的结果输出。
在这里插入图片描述
在这里插入图片描述

2.5 可视化文本切分

RAG(Retrieval-Augmented Generation,检索增强生成)体系中,可视化文本切分策略占据着至关重要的地位,其重要性主要体现在以下几个方面:
首先,从效率层面来看,将文本进行合理的分割成较小的部分,能够显著降低模型所需处理的文本规模,进而大幅提升处理效率。例如,对于篇幅较长的文本,若不进行切分,模型在处理过程中可能会耗费大量的时间和计算资源。
其次,在语义理解方面,恰当的切分策略能够有效地保留文本的语义完整性和连贯性,从而助力模型更精准、深入地理解文本的内在含义。以复杂的科技文献为例,若切分不当,可能导致关键语义的丢失或曲解。
再者,就检索效果而言,这一策略有助于更精确地检索到与特定问题高度相关的文本片段,显著增强检索的精准度和有效性。例如,在大规模的文本数据库中,准确的切分能提高检索的命中率。
最后,在优化生成结果方面,能够为模型提供更具针对性和有效性的上下文信息,进而从根本上优化生成的结果质量。比如,在进行文本生成任务时,合适的切分所提供的精准上下文能引导模型生成更准确、合理的内容。
项目采用可视化文本切分策略,选取合适的text splitter方法,调优chunk size与overlap的设置,使其更适合变电领域的文本数据切分。工具链接:https://chunvisualization.streamlit.app/,感谢作者:果粒奶优有果粒(哔哩哔哩)
在这里插入图片描述

3.结语

感谢NVIDIA官方和活动组织者,谢谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/799767.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基坑安全:自动化监测系统的革新力量

在日新月异的基坑工程领域,基坑安全自动化监测系统犹如一位守护者,以其独特的优势,为工程的安全与质量保驾护航。该系统集先进的测量仪器、计算机技术与现代传感技术于一体,对基坑的围护结构及周边环境进行全方位、高精度的实时监…

【C++基础】初识C++(1)

目录 一、认识C 1.1 C 相关概念 1.2 C的发展 1.3 C的关键字 1.4 第一个程序 二、命名空间 2.1 namespace的定义 2.2 命名空间的使用 三、C输入和输出 四、缺省函数 五、函数重载 一、认识C 1.1 C 相关概念 1983年,Bjarne Stroustrup在C语⾔的基础上…

内网安全:权限维持的各种姿势

1.Linux权限维持 2.Windows权限维持 目录: 一.Linux权限维持: 1.webshell: 2.定时任务: 3.SUID后门: 4.SSH Key免密登录后门: 5.添加用户后门: 二.Windows权限维持 1.计划任务后门&…

NetSuite RPA技术实践

近期有同学提出一个需求。 “需要存取的報表是存貨分類帳(stock ledger),將查到的各個[Item|Location]作為一組key,分別將報表中的「期末庫存量」「期末平均成本」「期末庫存量價值」這三欄的值,在每個月月底的時候自動將這個報表的這三欄數…

rollup打包工具

rollup打包工具 在学习vite和vue3源码的时候,接触到了rollup,所以过来学习一下 什么是rollup rollup是一个模块化的打包工具,会将javascript文件进行合并。比起webpack,webpack在打包的时候会进行代码注入(保障兼容性)&#xf…

位图——哈希思想的应用

三、位图 0、位图概念 所谓位图,就是用每一个比特位来存放某种状态(0或1),是一种哈希思想的应用,适用于海量数据,整数,数据无重复的场景。通常是用来判断某个数据存不存在的。(注意…

GaussDB DWS 详解

文章目录 GaussDB DWS 详解一、简介二、DWS的分布式架构架构概述关键组件 三、分布式查询数据查询流程SQL执行的示例 批注:本文引鉴了Forlogen博主的一些内容,并加以补充,以供学习了解。 GaussDB DWS 详解 一、简介 DWS(Data Warehouse Ser…

数据库-三范式

第一范式 1 数据库所有字段都只有单一属性。 2 单一属性由基本数据类型构成。 3 数据库的表都是二维的行与列。 例如上面的例子就不满足第一范式,因为是可以继续拆分的,拆分为更多的属性。 第二范式 1 符合第一范式 2 表必须有个主建 3 其它字段可以…

《0基础》学习Python——第十一讲__时间函数

一、时间函数是Python中的内置函数和模块,用于处理日期和时间相关的操作。以下是常用的时间函数的种类和用法: 1、time.time():返回当前时间的时间戳。 时间戳(timestamp)是一种表示日期和时间的方式,它是一…

Linux--USB驱动开发(二)插入USB后的内核执行程序

一、USB总线驱动程序的作用 a)识别USB设备 1.1 分配地址 1.2 并告诉USB设备(set address) 1.3 发出命令获取描述符 b)查找并安装对应的设备驱动程序 c)提供USB读写函数 二、USB设备工作流程 由于内核自带了USB驱动,所以我们先插入一个U…

CSS-0_3 CSS和单位

文章目录 CSS的值和单位属性值长度单位CSS和绝对单位CSS和相对单位百分比em & rem视口 颜色单位 碎碎念 CSS的值和单位 我们知道,CSS是由属性和属性值所组成的表 随着CSS的发展,属性不说几千也有几百,我从来不支持去背诵所有的可能性。…

K8S系列-Kubernetes基本概念及Pod、Deployment、Service的使用

一、Kubernetes 的基本概念和术语 一、资源对象 ​ Kubernetes 的基本概念和术语大多是围绕资源对象 Resource Object 来说的,而资源对象在总体上可分为以下两类: 1、某种资源的对象 ​ 例如节点 Node) Pod 服务 (Service) 、存储卷 (Volume)。 2、…

Nginx入门到精通五(动静分离)

下面内容整理自bilibili-尚硅谷-Nginx青铜到王者视频教程 Nginx相关文章 Nginx入门到精通一(基本概念介绍)-CSDN博客 Nginx入门到精通二(安装配置)-CSDN博客 Nginx入门到精通三(Nginx实例1:反向代理&a…

从0-1搭建一个web项目(页面布局详解)详解

本章分析页面布局详解详解 ObJack-Admin一款基于 Vue3.3、TypeScript、Vite3、Pinia、Element-Plus 开源的后台管理框架。在一定程度上节省您的开发效率。另外本项目还封装了一些常用组件、hooks、指令、动态路由、按钮级别权限控制等功能。感兴趣的小伙伴可以访问源码点个赞 地…

java数组之冒泡排序、快速排序

一、排序算法概述 1.算法定义 排序&#xff1a;假设含有n个记录的序列为{R1&#xff0c;R2&#xff0c;...,Rn},其相应的关键字序列为{K1&#xff0c;K2&#xff0c;...,Kn}。将这些记录重新排序为{Ri1,Ri2,...,Rin},使得相应的关键字值满足条Ki1<Ki2<...<Kin,这样的…

使用Keepalived实现双机热备(虚拟漂移IP地址)详细介绍

&#x1f3e1;作者主页&#xff1a;点击&#xff01; &#x1f427;Linux基础知识(初学)&#xff1a;点击&#xff01; &#x1f427;Linux高级管理防护和群集专栏&#xff1a;点击&#xff01; &#x1f510;Linux中firewalld防火墙&#xff1a;点击&#xff01; ⏰️创作…

BI工具的AI革新:对话式分析如何引领企业智能转型?

在数据驱动的时代&#xff0c;数据分析早已成为企业决策制定的关键支撑。但是&#xff0c;很多企业在数字化转型的过程中&#xff0c;常常面临门槛高、流程复杂等问题。而AI技术的发展为解决上述问题带来了突破。 为了简化企业智能转型路径&#xff0c;帆软接入AI大模型技术&a…

Scherlokk - Mac 文件快速搜索对比工具

Scherlokk 是一款适用于 Mac 的文件内容快搜比较工具&#xff0c;在 Scherlokk 内输入关键词&#xff0c;即可在本地磁盘 / 移动硬盘 / 网络驱动器等区域内&#xff0c;查找包含该词的文件&#xff0c;快速定位所需文件&#xff0c;并提供文件比较、快速筛选过滤等功能。 两种…

SpringCloud--常用组件和服务中心

常用组件 Euroke和nacos 区别 负载均衡 负载均衡策略有哪些 自定义负载均衡策略

Power Apps使用oData访问表数据并赋值前端

在使用OData查询语法通过Xrm.WebApi.retrieveMultipleRecords方法过滤数据时&#xff0c;你可以指定一个OData $filter 参数来限制返回的记录集。 以下是一个使用Xrm.WebApi.retrieveMultipleRecords方法成功的例子&#xff0c;它使用了OData $filter 参数来查询实体的记录&am…