“具有分布式能源资源的多个智能家庭的能源管理的联邦强化学习”文章学习三——基于联邦深度学习的多智能家居能源管理

一、系统描述

        我们考虑一个基于FRL的HEMS,它由单个GS和N个LHEMS组成,如图2所示。如图2-C所示,FRL训练过程包括两个步骤:步骤1)使用本地数据对LHEMS(即本地神经网络的权重ωn)进行本地模型的训练和更新;步骤2)通过平均法(ωG = 1N [1]Nn=1 ωn)对GS进行全局模型的聚合和更新。更新后的本地模型和全局模型将迭代交换,直到满足某种停止标准。

        我们考虑LHEMS调度三种可控设备的情形:1)可减少设备(AC);2)具有非可中断负载的可调度设备(WM);3)具有可中断负载的可调度设备(ESS)。可减少设备的能源消耗可以降低电力成本。在分时电价方案下,可调度设备的能源消耗可以从一个时间段转移到另一个时间段,以最小化总电力成本。具有可中断或不可中断负载的可调度设备。在设备任务期间,HEMS控制不能停止具有不可中断负载的可调度设备的运行。相比之下,具有可中断负载的可调度设备可以随时中断。

        在HEMS中,AC、WM和ESS的代理通过A2C深度强化学习过程独立执行各自设备的提前一天调度,以1小时为调度分辨率,遵循分时电价。每个设备代理的目标是在满足消费者舒适水平和偏好的同时,降低电力成本并考虑设备运行特性。对于AC,给定状态SAC包括电价、室外温度和室内温度(如4所示),AC代理通过最大化Rt AC(如8所示)来决定AC的最优能耗调度[即,动作Et AC(7)],该函数为负电价和与室内温度相关的消费者舒适成本的之和。对于WM,给定状态SWM包括电价(如5所示),WM代理通过最大化Rt WM(如9所示)来计算WM的最优能耗调度[即,动作Et WM(7)],该函数为负电价和与WM首选运行时间相关的消费者舒适成本的之和。对于ESS,给定状态SESS包括电价、SOE和预测的PV发电量(如6所示),ESS代理通过最大化Rt ESS(如10所示)来计算ESS的最优充放电调度[即,动作Et ESS(7)],该函数为负电价和与ESS过充电和欠充电相关的可靠运行成本的之和。

        我们假设HEMS配备了智能电表和智能插头,为本地深度强化学习模块提供输入数据,例如消费者的净能耗和单个设备的能耗。接下来两节将阐述FRL方法的数学模型和算法——状态空间和动作空间的制定以及LHEMS代理的奖励函数和包括A2C方法在内的基于FRL的能量管理方法。

二、数学模型

        (1)状态空间:对于∀t = 1,..., 24,WM、AC和ESS代理的状态空间定义如下:

在状态空间定义里,t表示WM、AC和ESS的调度时间。状态Pt表示在t时刻的TOU价值。状态 是t时刻预测的室外温度。 是t时刻预测的室内温度,它的计算将使用到 ,用下式:

  。t时刻AC的能源消耗为 ,环境参数 为描述室内温度条件的参数。其它参数的定义类似。

        (2)动作空间:每个设备的最优动作取决于代理的环境,包括现在的状态,如(4)至(6)所示。WM、AC和ESS的动作空间如下所示:

每个动作空间的变量分别表示时间t上空调能耗、WM能耗以及ESS的充电或放电能量。

        (3)奖励函数:对于每个设备代理,奖励函数被制定为与消费者偏好的舒适度和设备运行特性相关的负电力成本和负不满成本的之和。首先,空调代理的奖励函数可表达为

其中, 是消费者热不适来定义的惩罚。这种不舒适的价值定义为消费者偏好的温度 之间的偏差。只有当 偏离 范围时,才将其视为带有负号的奖励。接下来,WM代理的奖励函数可表达为

        其中,ωs_pref 和 ωf_pref 分别是消费者偏好的 WM 起始和结束时间,而 δ 和 δ 分别是比消费者偏好的运行时间提前和延迟操作的惩罚。如果 WM 代理在 ωs_pref之前或 ωf_pref 之后安排 WM 的能耗,则将不满成本添加到奖励函数中并带有负值;否则,奖励函数只具有负电力成本。最后,ESS 代理的奖励函数定义为

其中,两个τ 分别代表 ESS 过充电和欠充电的惩罚。如果 SOE 低于 SOEmin(欠充电)或高于 SOEmax(过充电),则 ESS 发生能量利用不足。在 ESS 利用不足的情况下,将其视为奖励项,同时考虑在此期间的电力成本。每个代理都执行自己的学习过程,以在有限的时间间隔 T 内从环境中获得的总累积奖励最大化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/156281.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

全网首位数字军人“穆兰”惊艳亮相,与拓世法宝共同绘就未来社会图景

古有穆桂英、花木兰挂帅出征,今有全网首位虚拟数字军人“穆兰”展巾帼风采。今年国庆节后,中国军号在全网为解放军新闻传播中心数字记者暨全军首位超写实虚拟数字军人征名,历时一个多月,经过征名提交、评委初评、公众投票、专家共…

一种基于NB‑IOT的粮库挡粮门异动监测装置

一种基于NB‑IOT的粮库挡粮门异动监测装置,包括若干个NB‑IOT开门监测装置、物联网后台管理系统、NB‑IOT低功耗广域网络和用户访问终端;各个NB‑IOT开门监测装置通过NB‑IOT低功耗广域网络与物联网后台管理系统连接,物联网后台管理系统与用户访问终端连接。 我国以往粮食收储…

类BERT模型蒸馏原理

如果你曾经训练过 BERT 或 RoBERTa 等大型 NLP 模型,就就会知道这个过程非常漫长。 由于此类模型规模庞大,训练可能会持续数天。 当需要在小型设备上运行它们时,可能会发现你正在为当今不断提高的性能付出巨大的内存和时间成本。 幸运的是&a…

基于单片机设计的电子指南针(LSM303DLH模块(三轴磁场 + 三轴加速度)

一、前言 本项目是基于单片机设计的电子指南针,主要利用STC89C52作为主控芯片和LSM303DLH模块作为指南针模块。通过LCD1602液晶显示屏来展示检测到的指南针信息。 在日常生活中,指南针是一种非常实用的工具,可以帮助我们确定方向&#xff0…

如何创建react项目

可以直接通过react脚手架进行创建 首先确保自己是否安装了create-react-app npm install -g create-react-app 如果安装不成功有可能是有缓存,可以先清除缓存再重新安装 npm cache clean --force 安装成功后就可以使用脚手架创建自己的项目,my-react就是我的项…

项目架构设计说明书编制

目录 项目名称 1 简介 1.1 目的 1.2 范围 1.3 术语及缩略语 1.4 引用文档 1.5 概述 2 构架表示方式 3 构架目标和约束 4 用例视图 4.1 用例实现 5 逻辑视图 5.1 概述 5.2 在构架方面具有重要意义的设计包 5.3 内部接口设计与协作机制 5.4 对外接…

mysql 中with的用法(3)

有表(tb),数据如下: 请用SQL,生成如下的样式: 一、建表 CREATE TABLE tb (id varchar(3) DEFAULT NULL,pid varchar(3) DEFAULT NULL,name varchar(64) DEFAULT NULL ) INSERT INTO tb (id, pid, name) VALUES(002, 0, 浙江省)…

场效应管(MOSFET)笔记-nmos和pmos仿真测试

一、场效应管的介绍 场效应管是一种半导体器件,它可以用来放大或者控制电流。根据结构的不同,场效应管可以分为结型场效应管(JFET)和绝缘栅场效应管(MOSFET)。其中,JFET是由一个pn结构组成&…

系列二、垃圾

一、什么是垃圾 简单的说,垃圾就是内存中已经不再被使用到的空间就是垃圾。 二、 如何判断一个对象是否可以被回收 2.1、引用计数法 Java中,引用和对象是有关联的,如果要操作对象则必须要用引用进行。因此判断一个对象是否可以被回收&#x…

21款奔驰E300L升级HUD抬头显示 绚丽多彩的展示

随着科技飞速地发展,从汽车领域就可以看出,尤其是汽车的抬头显示器,一经推出就吸引了很多的车主。 升级HUD抬头显示,HUD与汽车系统进行完整的数据信息连接,整合成大数据,然后将一些重要信息映射到车窗玻璃…

2243. 计算字符串的数字和

2243. 计算字符串的数字和 Java:以 k 为步长进行跳!然后再延伸k class Solution {public String digitSum(String s, int k) {while (s.length() > k) {int n s.length();StringBuilder sb new StringBuilder(); // sb存!for (int i …

禁止文件外发,企业文件禁止外发

禁止文件外发,企业文件禁止外发 禁止文件外发是企业信息安全策略中的一项重要措施,用于防止敏感数据或机密文件被员工无意或有意地传送到外部,也是企业数据防泄密的一种方法,从而保护企业数据的安全性和保密性。 下载使用安企神…

PDF控件Spire.PDF for .NET【转换】演示:将PDF 转换为 HTML

由于各种原因,您可能想要将 PDF 转换为 HTML。例如,您需要在社交媒体上共享 PDF 文档或在网络上发布 PDF 内容。在本文中,您将了解如何使用Spire.PDF for .NET在 C# 和 VB.NET 中将 PDF 转换为 HTML。 Spire.Doc 是一款专门对 Word 文档进行…

【鸿蒙应用ArkTS开发系列】- 云开发入门简介

目录 概述开发流程工程概览工程模板工程结构 工程创建与配置 概述 HarmonyOS云开发是DevEco Studio新推出的功能,可以让您在一个项目工程中,使用一种语言完成端侧和云侧功能的开发。 基于AppGallery Connect Serverless构建的云侧能力,开发…

怎样备份电脑文件最安全

怎样备份电脑文件最安全 数据对一家公司来说是非常重要的资产,数据备份是非常重要的,主要是为了保护数据免受意外损失、文件损坏、硬件故障、恶意软件攻击、盗窃或灾难性事件等影响。 下载使用安企神电脑屏幕监控软件 备份电脑文件最安全的方法包括&am…

MS90C385B——+3.3V 150MHz 的 24bit 平板显示器(FPD) LVDS 信号发送器

MS90C385B 芯片能够将 28bit 的 TTL 数据转换成 4 通道的低压差分 信号 (LVDS) 。时钟通道经过锁相之后,与数据通道并行输出。当时钟频 率为 150MHz 时, 24bit 的 RGB 数据、 3bit 的 LCD 时序数据和 1bit 的控 制数据以 1050Mbps…

安装SSL证书有什么意义?

在当今的数字化时代,网络安全已经成为了一个重要的议题。为了保护网站和用户数据的安全,许多网站都选择了安装SSL证书。同时,很多用户不明白安装SSL证书到底有什么意义? 一、网站实现加密传输 用户通过http协议访问网站时&#x…

AI监管规则:各国为科技监管开辟了不同的道路

AI监管规则:各国为科技监管开辟了不同的道路 一份关于中国、欧盟和美国如何控制AI的指南。 编译 李升伟 茅 矛 (特趣生物科技有限公司,广东深圳) 插图:《自然》尼克斯宾塞 今年5月,科技公司OpenAI首席…

uniapp App 端 版本更新检测

function checkVersion() { var req { //升级检测数据 appid: plus.runtime.appid, version: plus.runtime.version }; const timestamp Date.parse(new Date()); config.server.query_news uni.reque…

《持续交付:发布可靠软件的系统方法》- 读书笔记(十五)

持续交付:发布可靠软件的系统方法(十五) 第 15 章 持续交付管理15.1 引言15.2 配置与发布管理成熟度模型15.3 项目生命周期15.3.1 识别阶段15.3.2 启动阶段15.3.3 初始阶段15.3.4 开发与发布15.3.5 运营阶段 15.4 风险管理流程15.4.1 风险管理…