目录
- 文献阅读—A Data-driven Base Station Sleeping Strategy Based on Traffic Prediction
- 0、选这篇文章的原因
- 1、文章的主要内容和贡献
- 2、使用的数据集
- 3、结果及分析
- 4、郭郭有话说
文献阅读—A Data-driven Base Station Sleeping Strategy Based on Traffic Prediction
0、选这篇文章的原因
在我读的综述文献里面指出了cellular traffic prediction 的显著应用就是设计sleeping strategies for BSs。当基站的流量需求比较低的时候,部分基站可以关闭或者可以在保证用户的服务质量的同时使用low-function 状态来节约能量。我想看看具体的研究是怎么做的。
1、文章的主要内容和贡献
-
首先提出了时空小区流量预测模型:使用multi-graph convolutional network(MGCN)来提取空间特征,使用multi-channel LSTM提取时间特征。
-
对MBS和SBS进行建模,使用clustering(?)和transfer learning 来衡量MBS和SBS的容量(我的理解是他是不是把基站进行了聚类,不同的基站能够提供的容量不同,往下看)
- 问:为什么要对基站的容量进行建模?因为原始数据集不提供。
- 问:聚类的依据是什么?基站数量,POI数量,最大流量->Kmeans算法
- 问:迁移学习指的是什么?使用MBS的流量特征表征SBS的流量特征
-
最后提出来BS休眠策略,来最小化网络的功耗。从公共数据中收集一些有限的信息,比如总流量和基站数。基于小区的流量预测和基站的容量建模寻求一个区域内基站的最佳数量(?)
优化公式:
- 目标是最小化激活的基站的能量消耗
min n m , n s n m P m + n s P s \min_{n_m,n_s}n_mP_m+n_sP_s nm,nsminnmPm+nsPs - 约束条件
- 激活的基站应该能提供足够的容量,满足容量需求并且有剩余
C m ( r ⃗ , n m ) + C s ( r ⃗ , n s ) ⩾ μ + Δ C_m(\vec{r} ,n_m)+C_s(\vec{r} ,n_s) \geqslant \mu + \Delta Cm(r,nm)+Cs(r,ns)⩾μ+Δ - 激活的宏基站数量限制
- 激活的微基站数量限制
- 激活的基站应该能提供足够的容量,满足容量需求并且有剩余
2、使用的数据集
- Telecom Italia 意大利电信 2015
链接指路- 数据集介绍:
- This dataset was collected in the city of Milan, Italy, from November 1, 2013, to January 1, 2014.
- 空域被分为100x100的网格,每个网格是235x235平方米
- 在每个网格中记录了三种流量信息:short message service(SMS), call service(Call), Internet service
- 原始数据包括Square ID, Time stamp, SMS-in, SMS-out, Call-in, Call-out and Internet
- 这个数据集可以用于单变量、多变量的时空预测流量问题
- 数据集介绍:
- POI(points of interest)信息
POI information was recorded using Google Places API. Available:https://developers.google.com/maps
每个方格手机12个不同的POI,包括银行,酒吧等数量 - 基站数量信息
BS information is obtained from OpenCellID. Available: https://opencellid.org/
记录每个网格的基站数量 - 社交活动:
Social activity is collected through Dandelion API. Available:
https://dandelion.eu
社交活动对于流量预测有着很大的影响
3、结果及分析
ARIMA模型的偏差最大,因为ARIMA特别关注过去时刻的平均值。此外,LSTM优于ARIMA,因为LSTM能够捕获时间相关性。此外,ConvLSTM能够同时提取时空特征,因此具有比LSTM更好的预测性能。最重要的是,所提出的MGCNLSTM的性能最好,特别是图13中小区流量预测曲线的波峰和波谷。这是因为MGCN-LSTM利用了多图卷积,从各个方面捕捉空间特征。
误差的CDF图:
对于SMS流量,ARIMA、LSTM、ConvLSTM和MGCN-LSTM的绝对误差分别小于1335、622、158、103,概率为80%。与ConvLSTM相比,**MGCNLSTM的性能提高了34.8%。**同样,在图13(e)和图13(f)中,MGCN-LSTM比ConvLSTM分别提高了约47%和11.6%。
流量预测的优势:
- 通过GCN模块,采用多图技术提取多个空间特征
- 时域预测涉及POIs、BSs、社会活动和多周期特征
- 采用注意机制对提取的特征进行优化
结论:网络容量取决于BS数量,和环境差异无关(POI数量,社交活动数量,基站数量)
宏基站的数量增加,网络容量和基站数量成线性增长趋势,但是在成熟中心,容量不会一直随基站的数量增加而增加,而是逐渐趋向饱和,这是因为小区密集化过程的干扰也不断增加
但是微基站的容量随基站数量的变化曲线却没有饱和区属,因为微基站的传输功率较低,告饶引起的容量饱和只出现在超密集网络的场景中,米兰的流量数据微基站并没有达到超密集的程度(我想在超密集网络的场景下做诶)
结论:激活的微基站数量和流量的变化有关,宏基站变化不大。因为宏基站目标是无缝覆盖小区和用户移动,我们的策略是激活最少数量的宏基站,但流量负载超过基本水平时,才会激活更多的宏基站微基站增加网络容量,由于微基站的功耗是远小于宏基站的,所以肯定会为了节能尽可能多的启动微基站来提高网络容量。
结论:非线性模型和穷举搜索得到的最优数很接近。二次函数比线性函数更加精确
结论:郊区的流量比城市的流量小,所以基站数量也少
结论:能耗和激活的基站数量有关
4、郭郭有话说
这篇文献就是通过时域和空域对流量进行预测,用预测的结果来决定基站激活的数量,进而降低消耗。其中基站的容量通过建模来获得,使用聚类把不同地区的基站聚为一类,然后使用迁移学习,农村包围城市的方法来得到全部基站的容量信息。