本章内容
- 文章概况
- 模型结构
- 数据集
- 实验结果
- 调包使用
- 一般性报错
- API报错
- 总结
文章概况
《TimeGPT-1》是2023年公开于arXiv的一篇文章,该文章以chatgpt为灵感,提出一种基础时序大模型TimeGPT。该方案的提出致力于解决数据集规模不够大、模型泛化能力不强以及调参难度不易的问题,证明了更复杂更多样的数据集提高了更大规模的模型预测效果。
文章链接
项目链接
模型结构
该模型以Transformer为主要结构,其余细节并没有透露太多。由上图可以看出,TimeGPT使用多种领域的数据进行训练,并可对新数据进行时序预测。
数据集
本文提出一种超大的集成数据集,包含超过1000亿个数据点,来源于金融、经济、人口统计、医疗保健、天气、物联网传感器数据、能源、网络流量、销售、运输和银行业。此外数据的噪声、周期性、季节性和趋势等特征也各不相同。丰富且庞大的数据量对于模型的训练来说极大地增强其鲁棒性和泛化能力,有效挖掘到时序数据的特征,从而使模型能够准确预测未见过的时间序列,同时削弱时序预测中的个性化要求。
实验结果
上图展示了TimeGPT在评估指标上的优势,但本文对于一些细节并未交代清楚,所以表格中的对比除了这个主要结论外,其他的我也没看太懂。
调包使用
首先需要安装nixtlats,具体使用方法可见调包手册。
在我个人进行使用的过程中出现了两个问题,分别为一般性报错和API报错。
一般性报错
- module ‘h11’ has no attribute ‘Event’
解决方法:pip install --force-reinstall httpcore==0.15 - ConnectionPool.init() got an unexpected keyword argument ‘socket_options’
解决方法:pip install httpx==0.24.1
API报错
目前个人申请的API只能调用一次,因此我在官方网页上测试了一次,后面几次网页或本地调用都显示API调用无效。这个没辙,在网上找到官方给出的API多次调用申请链接,有兴趣的可以申请试试,我一周前申请的,暂时没消息。
总结
这篇文章主打一个探索,尝试构建时序预测大模型,目前代码没有开源,数据集没有公开,相关API只能进行一次调用,再加上文章对技术描述很浅很模糊,所以看来看去主要还是看的一个新鲜,其实也没啥了,有兴趣的可以看看后续是否有细节公开和API释放。