目录
- 1. 什么是时间序列
- 2. 什么是时间序列预测
- 3. 时间序列预测的范式
- 4. 时间序列的专有名词介绍
- 5. 时间序列评估
1. 什么是时间序列
按时间先后顺序出现的有序序列
2. 什么是时间序列预测
- 点预测:预测未来的某一个时间点,它的值到底是多少,例如明天的收盘股价、最高温度等。
- 区间预测:明天的温度范围,例如-8~4°,落在这个范围的概率是多少
时间序列预测,不仅可预测,还要可定量预测。例如股票,你除了告诉我明天股票会涨,还要告诉我明天能涨多少。本博客介绍内容为定量预测。
时间序列预测的前提:
- 预测不会影响试图预测的结果:例如你预测股票明天涨幅10%,结果很多人听说该消息之后,没等涨到10%就开始抛售,导致股票跌了。
- 过去的一些模式会在未来延续下去:过去的一些模式在未来一定会延续下去,我们一定是由于历史上出现了这样的时间序列趋势,所以我们才认为它未来有可能出现类似的趋势。例如2019年年底出现了新冠肺炎,导致2020年初每股有大通盘,这是黑天鹅事件。2020年一整年经济不好,对今天有很大影响。那如果想通过2019年以前的数据来预测2020年经济会不会出现崩盘,显然是不可能的。
3. 时间序列预测的范式
两个公式就是两个范式
- y t y_t yt是观察变量,例如股票价格,工场的销量等。要通过历史的销售量 y t − 1 y_{t-1} yt−1和 y t − 2 y_{t-2} yt−2等来预测未来的销售量。 ϵ \epsilon ϵ表示误差。
- 第二个范式,
x
t
x_t
xt称之为影响观察值的变量,又称为外部变量。
上式(1)和(2)为基本范式,在此基础上可以衍生出各种各样的范式,如下举例:
4. 时间序列的专有名词介绍
理解专有名词,提高学习时间序列、看论文的效率。
- 观察值: y t y_t yt
- 外部变量:
x
t
x_t
xt,可能随着时间变化,也可能不随时间变换。
5. 时间序列评估
无论哪种预测,都要对预测效果进行评估;通过评估,才能对模型进行优化和迭代。
不能做交叉验证;
- back test:也叫回测,意思是我用前面一段时间的数据做训练,后面一段时间的数据来做预测,这样就可以保证两边数据是没有交集的。不能出现训练数据中用到了未来的数据。
- data leak:用2021和2023的数据做训练,去评估2022,也就是用未来的数据做训练,去预测过去,就是data leak。
14:30