文章目录
- 摘要
- 文献阅读
- 1.题目
- 2.摘要
- 3.介绍
- 4.模型
- 4.1 研究区域
- 4.2 自相关分析
- 4.3 LSTM
- 5.实验与讨论
- 5.1 高架道路不同位置空气污染物的变化
- 5.2 高架道路不同位置空气污染物的相关性
- 5.3 高架道路不同位置空气污染物预测
- 6.结论
- 7.展望
- 度规张量
- 1.曲率
- 2.度量张量
- 3.代码实现
- 4.平行四边形法则
- 5.定义坐标系
- 度规张量与神经网络的联系
- 1.本质
- 2.想法
- 总结
摘要
This week, I read a computer science that looked at the environmental impact of traffic pollutants on Shanghai’s roads. The effects of NO, NO2, CO and O3 were quantified using two years of observation data from roadside air quality monitoring stations in Shanghai. Therefore, this paper uses autocorrelation analysis to identify the periodic pattern of air pollutants. The results show that the traffic pollution under the elevated road is more serious, and the daily periodicity of air pollutants is more significant. Therefore, the paper proposes a new long-term memory model to predict air quality, which has higher match and lower prediction error compared with other baseline models. In addition, I learn about metric tensor, understand the nature of metric tensor, and thought about how to connect metric tensor with neural networks.
本周,我阅读了一篇旨在研究上海道路上的交通污染物对环境影响的文章。文章使用了上海路边空气质量监测站的两年观测数据,量化了NO、NO2、CO和O3的影响。于是,文章采用自相关分析方法去识别大气污染物的周期性模式。结果表明,高架道路下的交通污染更为严重,空气污染物的日周期性特征更为显著。因此,文章提出了一种新的长时间记忆模型来预测空气质量,该模型与其他基线模型相比,具有更高的匹配性和更低的预测误差。此外,我学习了度规张量的相关内容,理解了度量张量的本质,以及思考怎么将度规张量与神经网络联系起来。
文献阅读
1.题目
文献链接:Prediction of air pollutants on roadside of the elevated roads with combination of pollutants periodicity and deep learning method
2.摘要
The socio-economic effects of urban elevated roads have been well-documented in previous studies. Nevertheless, the environmental impacts of the elevated road location are rarely considered. In this study, we quantified such impacts on four traffic pollutants (e.g., NO, NO2, CO, and O3) in Shanghai, using the two-year observation data from Shanghai roadside air quality monitoring stations—under the elevated road and on the side of the elevated road. Auto-correlation analysis was employed to identify the periodic patterns of air pollutants. The results showed that the severer traffic pollution and more notable daily periodic characteristics of air pollutants were observed under the elevated road. This result may be attributed to the elevated “cap” structure, which has become a barrier to prevent the pollutant diffusion in street canyon. Further, a novel Long Short-Term Memory model with the identified periodicity was proposed to predict air quality. The proposed model achieved higher goodness of fit and lower prediction error in prediction of four pollutants compared to other baseline models, and that the forecasting accuracy was higher under the elevated road. These findings ascertain the effect of the elevated road location on the variations of atmospheric pollutants and could provide implications in taking control measures to mitigate traffic pollution under the elevated road.
3.介绍
1)在社会经济和城市化革命的推动下,对城市内和城市间交通的需求不断增加。
2)为了适应交通运输的需要,提高城市路网的承载能力,许多特大城市广泛修建城市高架道路,以延伸城市内外的联系。
3)由于密集的交通流量、街道峡谷和风场的共同作用,这些建筑物会加剧了当地的大气污染,特别是行人和居民区。
4)以往的现场测量研究主要描述了空气污染物在距离感兴趣位置不同距离处的水平分布,于是在一条繁忙的高速公路附近进行了这样的尝试。
5)将识别出的周期性结合LSTM模型的深度学习方法中进行预测。
4.模型
4.1 研究区域
研究区域位置:
研究区域具体信息:
1)为了解和明确高架道路周边交通污染特征,采集了2018-2019年上海市XHCX和JAGH两个路边空气质量监测站的环境污染物(NO、NO2、NOx、CO、PM2.5、PM10、SO2和O3)数据。
2)两者的区别是XHCX站位于高架道路下方,而JAGH站位于高架道路一侧。选择这两个站点的数据是为了揭示高架道路位置对环境空气质量的影响。
4.2 自相关分析
ACF 是一种识别时间序列中隐含的周期行为的有效技术。其目的是研究测量变量 s 的时间序列,并计算皮尔逊相关系数作为时间滞后 τ 的函数:
4.3 LSTM
LSTM 模型面临一个潜在的问题,即需要提前确定时间间隔。为了解决 LSTM 方法的不足,利用自相关分析来确定空气污染物的最佳时间间隔。模型框架如下所示:
1)O3 为上海市主要污染物,NO、NO2、CO 表示为与交通排放密切相关的其他污染物。
2)输入序列可以看作是两个不同序列的集成,分别为目标污染物数据的历史数据和其他污染物数据。
3)通过两个常用的评价参数来评价该算法的预测性能,即决定系数和均方根误差。其中较高的 r2 和较低的 RMSE 值与较好的模型性能相关,计算公式如下:
5.实验与讨论
5.1 高架道路不同位置空气污染物的变化
1)两个监测站的交通流量每日变化情况:
2)两个监测站空气污染物的日变化:
结果表明,高架道路已成为阻止污染物在街峡谷扩散的屏障,并且XHCX站的交通污染比JAGH站严重。
3)两个监测站空气污染物的自相关分析:
结果表明,在空气质量预测模型中加入污染物的日周期性特征,可以获得更高的预测精度。
5.2 高架道路不同位置空气污染物的相关性
XHCX 和 JAGH 站 2018-2019 年空气污染物的斯皮尔曼相关系数:
实验数据表明,XHCX 站污染物间的 Spearman 秩相关系数显著高于 JAGH 站,这也说明高架结构阻止了污染物扩散,使两者之间的相关性增强。
5.3 高架道路不同位置空气污染物预测
将具有日周期性的LSTM模型与基线模型的结果进行比较:
结果表明,具有日周期性的LSTM模型能够捕捉到时间序列数据中的时间依赖性,提高了预测NO、NO2、CO和O3的准确性。因此,该方法可用于预测不同空气污染物的浓度。
6.结论
1)高架路下部NO、NO2、CO、O3浓度均高于高架路侧边,特别是白天尤其明显。因此,现象表明高架道路已成为阻挡街道峡谷污染物扩散的屏障。
2)两个地点的NO、NO2、CO、O3变化均呈日周期性变化,且高架路下的周期性特征较高架路侧更为明显。
3)高架路面下污染物的Spearman秩相关系数比高架路面侧污染物的Spearman秩相关系数更显著,说明高架结构阻止了污染物的扩散,使两者的相关性更强。
4)深度学习模型结合周期特征,提高预测精度。与传统的空气质量预测模型相比,具有周期特征的LSTM深度学习模型具有更高的预测精度。
5)与高架道路侧相比,提出的具有日周期性的LSTM模型在高架道路下的性能更好。因此,这说明了空气污染物变化的周期性特征有利于城市空气质量的预测。
7.展望
研究的局限性在于数据集仅包括上海市的两个空气监测站,然而更广泛的目标区域可以提供更准确的结果和更深入的见解。因此,作者提到未来的研究会考虑更多车站的数据,以进一步揭示高架道路位置对空气污染物的影响。
度规张量
1.曲率
对于一些二维面,比如平面是“平”的,球面是“弯曲”的,这种对二维面的曲直的直观判断,其实借用了三维视角。我们总认为这些面是嵌入在一个平直的三维空间中的,而所谓“平直”,是指这个三维空间有一些几何规则:两点之间直线最短、三角形内角和是180度、勾股定理等。这样的空间就是欧几里得空间,
怎么判断某个面是弯曲的?人们可以根据直觉给出答案:因为这个面的面外法矢量并不是处处相等,即矢量的方向不同;或者说存在一条与这个面有两个以上交点,但不在这个面内的直线段。这两种说法借用了曲面外的第三个维度,这种从更高维度空间观察到的曲率称为外曲率。
如果不借助任何面外的矢量,又怎么去判断曲直呢?假如有一个生活在球面上的二维生物,它无法感知到球面以外的第三个维度,那么它怎么知道自己的世界是弯曲的呢?在球面上,两点之间最短的距离是一段大圆弧,在二维生物眼中,是一条直线段。如果以北极点、赤道上东经 0 度和赤道上东经 90 度三个点为顶点,以大圆弧为边,作一个三角形,那么这个三角形的内角之和是 270 度,这显然不符合欧氏空间中三角形的性质。因此,这个二维世界是弯曲的。
2.度量张量
什么是度量张量?度量张量就是用来把斜角坐标的读数转换成直角坐标读数,度量张量的本质就是坐标变换,是向量在任意坐标系的读数对自己点乘的算式结果中的基向量的那一部分。
举例说明,以g1,g2为基向量的斜角坐标系为例,其中g1,g2的直角坐标系读数分别是:
这就是坐标变换矩阵,这个矩阵负责将一个矢量在任意坐标系中的读数,转换为其对偶坐标系中的读数。具体来说,根据线性代数中坐标变换的原理,这个矩阵的元素是任意坐标系的基矢量在其对偶坐标系中的读数。在这个坐标系中,求长度的公式为:
于是,它的度量张量就是:
3.代码实现
理解度规张量,就是去理解坐标变换,即为什么一个向量左乘一个矩阵,等于将这个向量变形到这个变形坐标系,或者说将斜角坐标的读数转换成直角坐标读数的解释。
python验证:
import numpy as np
g1 = np.array([1.5, 0.5])
g2 = np.array([1, 2])
G = np.array([[1.5, 1],
[0.5, 2]])
# 列是斜角坐标系的两个基向量直角坐标读数
print("斜角坐标系到直角坐标系的变换矩阵\n", G)
# @运算符:矩阵乘法, 还可以表示A投影到B
metrics = np.array([[g1 @ g1, g1 @ g2],
[g2 @ g1, g2 @ g2]])
print("度量张量的第一种求法:基向量点乘\n", metrics)
metricsTensor = G.T @ G
print("度量张量的第二种求法:G的转置矩阵乘以G\n", metricsTensor)
print("G的转置\n", G.T)
Va = np.array([1, 1])
print("向量V的斜角坐标读数Va\n", Va)
# 已知斜角读数和转换矩阵G,求迪卡尔读数Ve,需要用G@Va, 或者Va@G.T, 不能用Va@G
Ve = G @ Va
print("迪卡尔读数Ve\n", G @ Va, Va @ G.T, Va @ G)
Vb = metricsTensor @ Va
print("向量V的对偶坐标读数Vb=metricsTensor@Va\n", Vb)
print("------------------------------\n")
print("度规张量的最原始解释, 其实就是将向量的斜角坐标转换成直角坐标再运算,"
"(Va @ G.T) @ (G @ Va)\n",
(Va @ G.T) @ (G @ Va))
print("------------------------------\n")
print("直角坐标点乘Ve@Ve\n", Ve @ Ve)
print("对偶点乘Vb@Va,Va@Vb\n", Vb @ Va, Va @ Vb)
print("用度量张量求长度\n", Va @ metricsTensor @ Va)
输出:
斜角坐标系到直角坐标系的变换矩阵
[[1.5 1. ]
[0.5 2. ]]
度量张量的第一种求法:基向量点乘
[[2.5 2.5]
[2.5 5. ]]
度量张量的第二种求法:G的转置矩阵乘以G
[[2.5 2.5]
[2.5 5. ]]
G的转置
[[1.5 0.5]
[1. 2. ]]
向量V的斜角坐标读数Va
[1 1]
已知斜角读数和转换矩阵G,求迪卡尔读数Ve,需要用G@Va, 或者Va@G.T, 用Va@G是不可以的
[2.5 2.5] [2.5 2.5] [2. 3.]
向量V的对偶坐标读数Vb=metricsTensor@Va
[5. 7.5]
------------------------------
度规张量的最原始解释, 其实就是将向量的斜角坐标转换成直角坐标再运算,(Va @ G.T) @ (G @ Va)
12.5
------------------------------
直角坐标点乘Ve@Ve
12.5
对偶点乘Vb@Va,Va@Vb
12.5 12.5
用度量张量求长度
12.5
4.平行四边形法则
1)一个合力和两个分力之间的关系,可以用平行四边形原则分解。其实这个规则具有普遍性,因此力是一种矢量,速度也是一种矢量,而不同的矢量也同样遵循平行四边形法则。
2)在平行四边形法则中,两个基矢量构成的平行四边形对角线的长度,可以作为一个基本度量,可以用它来衡量其他矢量的强度。两个分量的不同,又能定义其他矢量的方向。其中:投影矩形是平行四边形的特例。
3)一个力有无数种分解方法,矩形也是其中一种,甚至矩形分解也有很多种。如果已知一个基矢量,那么另一个基矢量都仍然有很多种选法。其中:另一个基矢量如果大小确定,调整它的方向,会导致两个坐标轴上的分量的变化;而方向确定,调整它的大小,也会导致两个分量的变化。
5.定义坐标系
1)任意两个尾部相连的向量,不一定垂直就可以定义一个坐标系。任何其他向量,都可以表示为这两个向量的和。
2)我们习惯了笛卡尔带来的直角坐标系,将一个矢量分解为 x, y,这会给我们带来误解。其实在坐标系中,一个矢量是对基矢量进行分解的,而不是两个数。在所有坐标系中,其实都是 x dot g1,y dot g2这种形式。只是在直角坐标系中比较特殊,我们很少带着基向量。
3)在斜角坐标系中,想要表示一个向量,需要使用平行四边形分解法则。但是怎么得到任意向量在g1,g2上面的分量呢?
度规张量与神经网络的联系
1.本质
度规张量是描述时空中曲面的几何结构的量。在广义相对论中,时空不再是平直的,而是被质量和能量所影响而弯曲,度规张量描述了时空的曲率和间距。而度规张量的本质是一种张量,它是一个数据集合,包含了时空的某种几何性质的数值。它可以用来计算两个点之间的距离、角度、面积和体积等量。
2.想法
1)第一个想法,可以将度规张量视为神经网络的权重。神经网络中的权重控制着模型如何处理输入,度规张量控制着相对论中的物理模型如何处理时空结构。我们可以使用神经网络来学习如何调节度规张量,以便更好地捕捉时空的结构和物理学中的现象。
2)第二个想法,可以将度规张量与神经网络中的梯度联系起来。因为梯度通常被用来确定神经网络中的权重,以最小化模型的损失函数。类似地,度规张量可以用来确定物理模型中的粒子或场的轨道或运动方式,以最小化相对论中的作用量。
总结
本周,我主要学习了度规张量,在学习的过程中,我了解到度量张量是一个坐标变换矩阵,它的作用是将一个矢量在任意坐标系中的读数,转换为其对偶坐标系中的读数。这个内容还是比较容易理解,但是什么是度规,以及在斜角坐标系中,怎样通过平行四边形分解法则得到任意向量在基矢量上的分量还没有理解清楚。下周,我将继续深入理解度规张量。