差分升级在物联网水表上的实现与应用(学习)

摘要

当越来越多的物联网水表加入抄表系统后,实现了水表数据的信息化,并且当水表终端需要技术更新时,通过网络方式来升级产品可以高效修复设备面临的问题,减少用户损失,降低维护成本,但同时也对有限的网络资源形成负担。

当前终端的无线远程升级技术多采用单一的整包升级策略,存储空间占用率高,网络资源占用量大,升级成功率不高。

针对上述问题,引入了应用于Android端的开源差分算法HdiffPatch,介绍了差分升级在物联网抄表系统中的实现架构和方法,并通过重编译实现算法在Windows服务器端及嵌入式水表终端的应用。

引言

物联网水表指的是在计量基表的基础上,加入无线远传模块(GPRS、NB-IoT等),组成的新型智能水表,它实现了集流量计量、流量采集、数据存储及无线传输于一体的强大功能。

当越来越多的物联网水表加入抄表系统后,对用水片区的水量管理及数据分析提供了可靠的依据,为用户用水行为管控提供了及时有效的操作机制,也为水表设备运行的远程监测提供了方便的平台,但同时也对抄表系统的网络带宽提出了一定的要求。

当设备投入市场之后,由于相关技术的迭代,设备运行可能会暴露其软件代码中的某些致命弊端;由于客户需求更新,设备软件需要升级以增加或者修改原来的功能。

当物联网设备投入市场后,厂家开发安全有效的空中升级方案,只需要在网络平台上把升级软件通过无线方式下发给设备,实现设备中的可执行代码更新。

无线升级面临着几个考验:

  1. 网络平台资源紧张,尤其对物联网水表等这类小设备,有些运营商限制了其网络端口并发量,因此空中升级庞大的数据流量会引起网络拥塞,造成升级失败;
  2. 物联网设备多采用电池供电,尽量保持低功耗是保证其寿命的重要手段,空中升级的有限速率导致电池供电设备对耗电极为敏感。
  3. 受网络信号的影响,当无线升级失败时,想要设备继续进入运行状态,必须对接收到的新代码另行存储,以避免对原代码的覆盖,并且要具备重传机制,待网络稳定时,从断开处开始传输,避免重新传输,造成资源浪费。
  4. 当更新数据量大时,对设备 CPU 的 FLASH 空间及 RAM 提出了更高的要求[3]。

目前国内外固件设备的无线升级方案按照实现策略可分为整包升级和差分升级。

整包升级需要将新版本的完整软件包进行打包,设备接收完所有升级包,经过校验算法验证包的有效性和完整性后,替换旧版本的应用代码。

整包升级的方式接近于整个固件的镜像,操作简单,易于实现,对网络平台及设备端的设计实现要求不高。

差分升级算法

差分升级又叫增量升级,是将固件的新旧版本的程序数据文件做差异,形成升级需要增量包,而对于两个版本中相同部分则不需要做升级处理,以此通过传输更少的数据实现同样的升级效果。

在实现架构上,差分升级系统需要在升级服务器侧和终端设备上分别部署差分算法,服务器比较新版本文件对旧版本文件所作的修改,并通过差分算法对这些数据以特定的格式打包、优化压缩,形成差分文件(patch文件);然后通过指定的协议,设备端接收完该差分文件,校验完成后,利用差分算法还原差分文件,并通过组合旧版本程序文件,得到目标数据文件,实现升级。

在这里插入图片描述
显然,经过服务器侧后生成的patch文件,远远小于新版本程序文件,而对于固件资源受限的设备终端来说,如何寻找一种高效的差分算法,实现以最小数据量来描述差分信息,并且以有效稳定的方法进行信息传递和文件还原,是差分升级的重要研究内容。

在构造差分增量包中,常见的算法有Bsdiff算法、Xdelta算法、Hdiffpatch算法等。

Bsdiff算法

在匹配新旧文件过程中,有部分源代码内容完全相同,有部分源代码相似度很高,只有部分字节作了稀疏改动,另有一些源代码内容相同,但是存储地址存在一个固定的偏移量,对于这一特性的源代码数据,具有高度的可压缩性。Bsdiff算法引入了diff string的概念,在新旧文件中找到这样的两部分内容,求出字节的差异,作为diff string进行压缩。而对于不符合要求的新文件源码中新增部分,作为extra string进行保存。

Bsdiff算法在匹配时,先对旧文件的所有字符进行后缀排序形成一个字典,然后使用二分查找算法找到最优的匹配长度,依次得到整个文档所有的diff string和extra string,把这些文件信息以bzib2的方式压缩成升级增量文件。

Bsdiff算法的增量文件中的数据由四部分组成:Header,ctrl block,diff block,extra block。

  • Header 头文件包含了目标文件的起始地址,新文件大小,控制长度等。
  • ctrl block提供控制部分信息,指示旧文件中保留的长度,以 及 需 要 从 diff block 和 extra block 中提取的信息,在旧文件中信息的地址偏移量等。
  • diff block,extra block 分别包含所有的 diff string和 extra string。

设备端在接收到patch文件后,解压文件,并根据差分文件的组成格式,通过bspatch算法,还原生成新文件。

由Bsdiff算法原理可知,它所生成的patch文件并不会比源文件小,但是文件结构压缩性强,导致传输的升级数据量比完整升级要小很多,有效减少了冗余数据传输量。Bsdiff 算法高度依赖压缩算法,当升级文件修改的内容小概率地满足稀疏变化时,差分文件的压缩效率降低,相比整包升级的优势不明显。

Xdelta算法

Xdelta 和其他的差分升级算法一样,也需要对新文件和旧文件进行比较匹配作差分。在产生 patch 包时,Xdelta 可采用 hash 或者 suffix trees 等算法来寻找最大的匹配长度的字符串。

Xdelta 差分算法的 patch文件中用到了 add、run 及 copy 三种命令。其中 add 用于将匹配到的指定长度的字符串从源文件拷到目标文
件,run 用于在目标文件中加入新文件的增加部分,copy 将匹配到的文件成块的移动到目标文件中的目标地址上。

Xdelta 对增量文件采用 Vcdiff 格式的编码方式,用 128 进制的数据表示形式,经过重编码的字符,相较于原数据节省了存储空间,达到了高效压缩的目的[9]。

Xdelta 算法的 patch 生成过程可通过其他算法来优化,考虑到设备端的内存消耗,patch 过程引入了Windows 块技术,随着 Windows 块变大,可达到的最长字符串的匹配结果越精确,产生的 patch 文件越小,但同时也会消耗更多的内存资源。因此,采用高效的匹配优化算法和适合的 Windows 块大小,是 Xdelta 算法的关键。

Hdiffpatch

Hdiffpatch是一种高效的增量算法,在运行时间复杂度及内存空间占用率上相较于前两种算法存在很大的优势。

Hdiffpatch在差异文件生成阶段引入了覆盖线C的概念,用于标志新旧版本文件的匹配度。

算法将两版本程序文件看成两个具有不同长度的数组,分别表示newData[m]和oldData[n]。

覆盖线C是点Ei.jj的集合,其中newData[i] = oldDta[j]。
如果C = {Ei,j,Ei+1,j+1,…,eI+K,J+K},表示该覆盖线的长度为k。
由此可知,经过匹配之后存在许多长度不等的覆盖线,根据差分包制作经验,当覆盖线长度大于7时,增量算法优势明显。
patch文件就是所有满足要求的覆盖线和newData[m]中没有被匹配上的数据组成的文档。

其中覆盖线表示信息结构包括:newPos,表示在新文档中的起始位置i;oldPos,表示在旧文件中的起始位置j;length,表示覆盖线长度k。

Hdiffpatch算法对匹配的覆盖线采取优化措施。其中包括:

  1. 覆盖线包含。如果覆盖线a被另外一条完全包含,则在C中删除a信息,以减小重复信息来简化差分文件。
  2. 覆盖线合并。对于在一条直线上的两段覆盖线,如果它们之间的间隔长度小于某一值,则把这两条覆盖线合并成一条,其中的延长部分数据作为patch文件的一部分。
  3. 覆盖线删除。对于某些单独的覆盖线,做扩展成本比较大,无法进一步优化,在patch文件生成时,对此进行直接删除,以减小存储及升级的控制代价。

差分升级的实现

Hdiffpatch算法产生了较小的升级包,当水表终端接收到升级包并且还原成最新文件后,需要对控制CPU中的执行代码进行更新升级。

本方案中采用的智能水表终端使用 STM32L071,其具有 192KB 的 FLASH,6KB 的片内 EEPROM,20KB的 RAM,能够实现多种低功耗运行模式,完全满足智能水表终端在实现流量数据计量、存储及与无线服务器通信功能的基础上,加入差分升级的功能。

而在加入差分升级之后,bootloader 中还将包含 Hdiffpatch 算法及与服务器进行patch 差分包传输通信所有流程。

由于在 Hdiffpatch 算法中需要在旧文件的基础上作新程序文件还原,因此会存在两个版本的文件同时存在于 FLASH 的情况,这对于升级失败时,设备还能继续正常运行起到保障作用。对于 CPU 的存储区,水表终端作了如下划分[14]:
在这里插入图片描述
终端升级流程实现
终端升级实现是差分升级系统中的关键部分,它负责增量升级文件的接收、差分算法的还原及固件的更新。

基于终端控制器CPU的RAM区容量的限制,水表设备不能一次性接收升级文件,而是采用分帧多包的模式。
当所有帧都接收完全后,CPU按照Hdiffpatch算法的patch文件格式解析文档,进行算法还原。

在这里插入图片描述
本方案的协议采用的关键技术包括:

  1. 升级协议起始帧包含了本次升级的新软件版本号、升级的总包数及升级文件的总校验码。终端通过接收下发的版本号与当前的版本号对比,选择是否停止接收、完全接收或断点续传。文件总校验码用于在终端接收完升级文件后,判断文件的有效性。
  2. 水表终端根据总升级包数,向服务器逐条申请升级包,并对接收到相应的升级包进行包序号和校验码的判断。当出现接收超时或者存储空间无法容纳接收的数据时,终端会向服务器发出警告或者请求重传数据。
  3. 水表终端在请求升级数据包时,对每一步的操作进行记录,以实现断点续传的可操作性。
  4. 终端接收完升级文档后,通过Hdiffpatch还原算法,在FLASH的新程序存储区形成新版本代码后,通知服务器,并实行升级操作。服务器监控整个空中升级流程,对水表终端的升级状态也能实时反馈,提高了升级的可控性。

终端升级的低功耗设计

物联网智能水表使用一次性锂电池供电,保证安装及使用的便捷可靠。

在应用程序中,终端控制器合理使用 NB-IoT 的工作模式,并根据使用场景对表计量的频度和方法进行控制,既满足了客户的使用要求,又相对延长了产品电池使用寿命。

空中升级的使用频率相对较低,但是它一次使用的耗电量在所有应用功能中是最大的。
因此,如何采用合理的手段规避不必要的电耗也是空中升级系统要考虑的一个问题。

本方案采用Hdiffpatch算法来产生差分升级文件patch,在很大程度上缩小了空中升级的数据传输量,拉低了升级操作的总耗电量,成为降低升级功耗的关键技术。

升级一开始,服务器查询设备端当前软件版本号,如果与要下发的版本号一致,则认为没有升级的必要,退出升级操作。
这种架构,仅用一个交互信息就实现了升级流程走向,避免了不必要的传输步骤。

当空中传输过程出现网络故障时,终端收不到正确的服务器数据后,在连续申请三次升级包后,设备为了节省电耗,进入休眠模式。
待下一周期,网络恢复后,设备不需要重复传输已经接收完的数据包,而是进入断点续传,减少了冗余的操作,简化了升级步骤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/72681.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python Opencv实践 - 图像旋转

import cv2 as cv import numpy as np import matplotlib.pyplot as pltimg cv.imread("../SampleImages/pomeranian.png", cv.IMREAD_COLOR)#图像旋转 #Opencv中的旋转,首先通过cv.getRotationMatrix2D获得旋转矩阵 #cv.getRotationMatrix2D(center,ang…

navicat连接postgresql报错

navicat连接postgresql报错 navicat连接postgresql报错 现象 有小伙伴告诉我 安装了新的postgresql 使用navicat连接,报错 ERROR: column "datlastsysoid" does not existLINE 1: SELECT DISTINCT datlastsysoid FROM pg database column “datlastsy…

supervisor因为依赖安装失败的解决方法

安装FEATA时报错情况 下列软件包有未满足的依赖关系&#xff1a;supervisor : 依赖: python-pkg-resources 但是它将不会被安装依赖: python-meld3 但是它将不会被安装依赖: python:any (< 2.8)依赖: python:any (> 2.7.5-5~) E: 无法修正错误&#xff0c;因为您要求某些…

【Tomcat】(Tomcat 下载Tomcat 启动Tomcat 简单部署 基于Tomcat进行网站后端开发)

文章目录 Tomcat下载Tomcat启动Tomcat简单部署 基于Tomcat进行网站后端开发 Tomcat Tomcat 是一个 HTTP 服务器.HTTP 协议就是 HTTP 客户端和 HTTP 服务器之间的交互数据的格式. HTTP 服务器我们可以通过 Java Socket 来实现. 而 Tomcat 就是基于 Java 实现的一个开源免费,也是…

【C++ 学习 ⑬】- 详解 list 容器

目录 一、list 容器的基本介绍 二、list 容器的成员函数 2.1 - 迭代器 2.2 - 修改操作 三、list 的模拟实现 3.1 - list.h 3.2 - 详解 list 容器的迭代器 3.2 - test.cpp 一、list 容器的基本介绍 list 容器以类模板 list<T>&#xff08;T 为存储元素的类型&…

RabbitMQ工作流程详解

1 生产者发送消息的流程 (1)生产者连接RabbitMQ&#xff0c;建立TCP连接(Connection)&#xff0c;开启信道(Channel) (2)生产者声明一个Exchange (交换器)&#xff0c;并设置相关属性&#xff0c;比如交换器类型、是否持久化等 (3)生产者声明一个队列井设置相关属性&#xf…

IoTDB 1.x 开启外部访问

对于部署的IoTDB数据库&#xff0c;如果需要局域网内其他设备进行访问的处理。 1、防火墙开放端口 无论windows还是liunx都需要你将6667默认的端口加入防火墙中&#xff0c;否则肯定是无法访问端口 2、修改配置文件 对conf/iotdb-datanode.properties文件中的 修改为本机的…

接口测试实战,Jmeter正则提取响应数据-详细整理,一篇打通...

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 在测试时&#xf…

最新AI创作系统ChatGPT程序源码+详细搭建部署教程+微信公众号版+H5源码/支持GPT4.0+GPT联网提问/支持ai绘画+MJ以图生图+思维导图生成!

使用Nestjs和Vue3框架技术&#xff0c;持续集成AI能力到系统&#xff01; 新增 MJ 官方图片重新生成指令功能同步官方 Vary 指令 单张图片对比加强 Vary(Strong) | Vary(Subtle)同步官方 Zoom 指令 单张图片无限缩放 Zoom out 2x | Zoom out 1.5x新增GPT联网提问功能、手机号注…

静态网页和动态网页区别

1&#xff0c;静态网页和动态网页有何区别 1) 更新和维护 静态网页内容一经发布到网站服务器上&#xff0c;无论是否有用户访问&#xff0c;这些网页内容都是保存在网站服务器上的。如果要修改网页的内容&#xff0c;就必须修改其源文件&#xff0c;然后重新上传到服务器上。…

【C语言】每日一题(错误的集合)

最近在牛客、力扣上做题&#xff0c;花费海量时间&#xff0c;苦不堪言&#xff0c;有时绞尽脑汁也想不出&#xff0c;痛定思痛&#xff0c;每日记录写的比较困难的题。 错误的集合 题目如上图所示 题主乍看之下觉得很简单&#xff0c;再看例子&#xff0c;不就是一个有序数组…

线性回归学习总结

一 、引文 1 回归分析 回归是统计学上用来分析数据的方法&#xff0c;以了解两个或多个变量之前的关系。通常是建立被解释变量Y和解释变量X之间关系的模型。回归分析的最早形式是最小二乘法。 勒让德和高斯都将该方法应用于从天文观测中确定关于太阳的物体的轨道&#xff08;…

adb 通过wifi连接手机

adb 通过wifi连接手机 1. 电脑通过USB线连接手机2. 手机开启USB调试模式&#xff0c;开启手机开发者模式3.手机开启USB调试模式 更多设置-》开发者选项-》USB调试4.点击Wi-Fi 高级设置&#xff0c;可以查看到手机Wi-Fi的IP地址&#xff0c;此IP地址adb命令后面的ip地址&#xf…

百度云盘发展历程与影响

摘要&#xff1a; 百度云盘作为中国领先的云存储与共享服务提供商&#xff0c;自其创立至今经历了多个阶段的发展与变革。本论文通过对百度云盘的历史回顾与分析&#xff0c;探讨了其在技术、商业模式、用户体验以及对社会的影响等方面的演变。同时&#xff0c;还分析了在竞争激…

横向移动-域控提权

横向移动-域控提权 CVE-2021-42287 由于Active Directory没有对域中计算机和服务器账号进行验证&#xff0c;经过身份验证的攻击者利用该漏洞绕过完全限制&#xff0c;可将域中普通用户权限提升为域管理员权限并执行任意代码。 利用条件 前提条件&#xff1a;一个域内普通账…

计算机基础概论

一、计算机的组成 1.计算机组成的五大部件 &#xff08;1&#xff09;运算器&#xff1a;也叫算术逻辑单元&#xff0c;完成对数据的各种常规运算&#xff0c;如加减乘除&#xff0c;也包括逻辑运算&#xff0c;位移&#xff0c;比较等。 &#xff08;2&#xff09;控制器&a…

计算机网络-物理层(一)物理层的概念与传输媒体

计算机网络-物理层&#xff08;一&#xff09;物理层的概念与传输媒体 物理层相关概念 物理层的作用用来解决在各种传输媒体上传输比特0和1的问题&#xff0c;进而为数据链路层提供透明(看不见)传输比特流的服务物理层为数据链路层屏蔽了各种传输媒体的差异&#xff0c;使数据…

图像的镜像变换之c++实现(qt + 不调包)

1.基本原理 1.水平镜像变化 设图像的宽度为width&#xff0c;则水平镜像变化的映射关系如下&#xff1a; 2.垂直镜像变化 设图像的宽度为height&#xff0c;则垂直镜像变化的映射关系如下&#xff1a; 2.代码实现&#xff08;代码是我以前自学图像处理时写的&#xff0c;代码很…