文章目录
- WSN数据管理的基本概念
- 以数据为中心的WSN数据库
- 与分布式数据库相比具有的特殊性
- WSN数据管理技术的研究热点
- WSN数据管理的关键技术
- 无线传感器网络数据存储结构
- 网外集中式存储方案
- 网内分层存储方案
- 网内本地存储方案
- 以数据为中心的网内存储方案
- 数据查询处理技术
- 查询类型
- 查询系统结构
- 查询处理方案
- 数据压缩技术
- 数据融合技术
- 应用层中的数据融合
- 网络层中的数据融合
- 独立的数据融合协议层
WSN数据管理的基本概念
以数据为中心的WSN数据库
无线传感器网络应用中,节点大多随机撒播到监测区域,其位置存在不确定性,易产生片面性的感知信息,单个传感器数据的意义并不大。最终观察者感兴趣的是传感器网络产生的数据,即某一区域内的多个传感器数据的融合结果,并非传感器本身的位置信息(医学和健康监测例外)
因此,应把传感器节点视为感知数据流或感知数据源,传感器网络视为感知数据空间或感知数据库,以数据作为线索进行查询和计算处理
将网络数据抽象为数据库,并提供用户执行类SQL的数据库查询的数据处理方法的优点:
- 使用 “网络即数据库” 抽象概念可以对用户隐藏复杂的网络数据处理的过程,降低了对用户的理论基础要求
- 采用类SQL的通用数据库查询语言,便于用户快速学习和掌握传感器网络应用系统的使用
- 可以利用如数据融合、数据调度、数据存储等处理技术来简化传感器网络数据管理系统的设计
与分布式数据库相比具有的特殊性
- 无线传感器网络处理的是无限、连续、实时、流式的数据
- 节点上的存储、计算和能量资源非常有限
- 传输路径上的中间节点有对本身采集的数据和其他节点转发来的数据进行融合、缓存、转发的能力,可以减少冗余数据在传输中耗费的网络资源
- 邻居节点采集的数据通常具有相似性,是从不同监测点得到的同一事件的相关数据,所以数据存在冗余性
- 网络中的数据源是大规模分布的传感器节点,节点采用与IP地址类似的全局编址或局部标识,标识与节点物理位置无关
WSN数据管理技术的研究热点
WSN数据管理的关键技术
无线传感器网络数据存储结构
-
网外集中式存储方案
感知数据从数据普通节点通过无线多跳传送到网关节点,再通过网关传送到网外的基站节点,由基站保存到感知数据库
- 优点:网内处理简单,适合查询内容稳定不变且需要原始感知数据的应用,对于实时查询来说,如果查询数据量不大,查询的时效性较好
- 缺点:考虑到节点的大规模分布,大量冗余信息传输可能造成大量的能耗损失,而且容易引起通信瓶颈,造成传输延迟
-
网内分层存储方案
网内分层存储方案中两类传感器节点:
- 一类是大量的普通节点
- 一类是少量的有充足资源的簇头节点
基本思想:将原始的感知数据存放在普通的节点,在簇头节点上处理簇内节点的数据融合与数据摘要,在根节点形成一个网内数据的整体视图
- 优点:查询的时效性好,数据的可靠性高
- 缺点:必须采用特殊的固定簇头或轮转算法来保证簇头的稳定运行
典型代表:Cougar查询系统(康奈儿大学)
-
网内本地存储方案
采用该方案,数据源节点将其获取的感知数据就地存储
典型代表:TinyDB数据库系统(伯克利分校)
基站发出查询后向网内广播查询请求,所有节点均接收到请求,满足查询条件的普通节点沿融合路由树将数据送回到根节点,即与基站相连的网关节点。
- 优点:数据存储充分利用网内节点资源;减少了通信量
- 缺点:查询消息洪泛到整个网络、网内融合处理复杂度高、增加时延
-
以数据为中心的网内存储方案
采用以数据中心的思想,将网络中的数据按内容命名,并路由到与名称相关的位置
采用该方案时需要和以数据为中心的路由协议相配合。存储数据的节点除负担数据存储任务外,还要完成数据压缩和融合处理操作
- 优点:数据存储有规律,便于查找,加快了查询速度;便于进行同类型数据融合,减少了通信量
- 缺点:数据存储需要耗费一定的通信成本;同类型数据存储到相同的位置,从而可能造成某些节点的存储空间不足
四种数据存储结构比较
数据查询处理技术
传感器网络查询处理一直是一个十分活跃的研究领域,目前其主要的研究热点是:WSN数据模型、查询语言、数据融合技术、网内查询优化处理、查询节能管理、基于统计的数据查询等
-
查询类型
-
历史查询 :对从传感器网络获得的历史数据的查询
例如:列出2017-07~2018-01区域A的平均降水量
-
快照查询 :对传感器网络在某一给定时间点的查询
例如:查询当前区域B中所有节点的温度值
-
连续查询:关注在某一段时间间隔内传感器网络数据的变化情况。连续查询是用户使用最多的查询
例如:列出从现在开始区域A每30分钟的平均降雨量
-
-
查询系统结构
由于采用了分布式处理技术,传感器网络查询处理系统一般由全局查询处理器和在每个传感器节点上的局部查询处理器协作构成
当用户提交一个连续查询以后,全局查询处理器需要把查询分解成一系列的子查询提交到相关传感器节点上由局部查询处理器执行。这些子查询也是连续查询,需要扫描、过滤(即选择)和综合相关无限实时数据流,产生连续的部分查询结果流,返回给全局查询处理器,经过进一步全局综合处理,最终返回给用户
传感器节点上的局部查询处理器是连续查询处理的关键
各个连续子查询也需要执行很长时间。在连续子查询的长期执行过程中,传感器节点及其产生数据的特性、传感器节点的工作负载等情况都在不断地发生改变。因此局部查询处理器必须具有适应环境变化的自适应性
-
查询处理方案
WSN查询处理一般可分为两个步骤:
- 将全局查询处理器分解出的所有子查询发布到查询所指定的目标区域中
- 收到查询任务的普通节点执行查询,并返回查询结果数据
数据压缩技术
在WSN中,因受外界环境影响及自身节点原因,感知数据具有一定程度的不确定性,通常也允许有一定的误差。在保证需求的前提下,可以牺牲数据精度来降低网络中的数据的传输量
- 基于时间序列数据压缩方法
- 基于数据相关性压缩方法
- 分布式小波压缩方法
- 基于管道数据压缩方法
数据融合技术
无线传感器网络在收集数据过程中需要使用数据融合技术。数据融合是将来自多传感器或多源的信息和数据进行综合处理,得出更为准确完整的信息
主要是为了减少网络内的数据传输量,达到减少能源的消耗的目的
数据融合牺牲其他方面的性能作为代价
- 首先是时延代价:在数据传送过程中,寻找易于进行数据融合的路由、进行数据融合操作等,都可能增加网络的平均延迟。
- 其次是鲁棒性的代价:数据融合可以大幅度降低数据的冗余性,但丢失相同的数据也会损失信息,从而降低了网络的鲁棒性
-
应用层中的数据融合
在应用层设计中,可以利用分布式数据库技术,对采集到的数据进行逐步筛选以达到融合的效果,应用层接口也采用类似SQL的风格,提供如SUM、AVERAGE等
-
网络层中的数据融合
传感器网络中的路由方式可以根据是否考虑数据融合分为两类:
-
地址为中心的路由(AC路由):每个普通节点沿着到汇聚节点的最短路径转发数据,是不考虑数据融合的路由
-
数据为中心的路由(DC路由):数据在转发的路径中,中间节点根据数据的内容,对来自多个数据源的数据进行融合操作
普通节点并未各自寻找最短路径,而是在中间节点B处对数据进行融合,然后再继续转发
-
-
独立的数据融合协议层
独立于应用层的数据融合机制 (AIDA),其基本思想是不关心数据的内容,而是根据下一跳地址进行多个数据单元的合并,通过减少数据封装头部的开销及MAC层的发送冲突来达到节省能量的效果
提出 AIDA 的目的除了要避免依赖于应用的融合方案的弊端外,还将增强数据融合对网络负载状况的适应性
- 当网络负载较轻时不进行融合或进行低程度的融合
- 当网络负载较重时,MAC层发送冲突较严重时,进行较高程度的融合
AIDA 协议层位于网络层和MAC层之间,对上下协议层透明
AIDA可以划分为两个功能单元:融合功能单元和融合控制单元
- 融合功能单元负责对数据包进行融合或解融合操作
- 融合控制单元负责根据链路的忙闲状态控制融合操作的进行,调整融合的粒度(合并的最大分组数)