论文笔记;LargeST: A Benchmark Dataset for Large-ScaleTraffic Forecasting

Neurips 2023

1 intro

  • 目前交通预测数据集的问题
    • 规模小,通常只包含数百个节点和边
    • 在时间覆盖范围上存在严重不足,通常不超过6个月
    • 单个节点的元数据不足

  • ——> 提出了一个新的基准数据集LargeST
    • 广泛的图大小,包括加利福尼亚州的8,600个传感器
    • 丰富的时间覆盖和丰富的节点信息——每个传感器包含5年的数据和全面的元数据
    • liuxu77/LargeST: LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting (NeurIPS 2023 DB Track) (github.com)

2  LargeST数据集

2.1 数据收集和组织

  • PeMS提供来自加州州际公路系统中18,954个传感器的实时交通数据。
  • 为确保LargeST数据集代表整个系统的整体交通状况,论文特意选择标记为“主线”的传感器,还排除了缺少坐标信息或与其他传感器距离极远的传感器。
    • ——>获得了一个包含8,600个传感器的数据集(CA)
  • 为了对加州不同地区的交通模式进行更细致的分析,论文通过选择CA内的三个代表性区域构建了三个CA子集
    • GLA,包括大洛杉矶地区5个县的3,834个传感器:洛杉矶、橙县、河滨、圣贝纳迪诺和文图拉
    • GBA,包括大湾区11个县的2,352个传感器:阿拉米达、康特拉科斯塔、马林、纳帕、圣贝尼托、旧金山、圣马特奥、圣克拉拉、圣克鲁斯、索拉诺和索诺马
    • SD,仅包括圣迭戈县的716个传感器
  • 除了县信息,还为每个节点提供其他元数据,包括它们的坐标、在PeMS中的区域、所在的高速公路、行驶方向和车道数
  • 为了构建传感器图的邻接矩阵,论文利用Open Source Routing Machine,一个在OpenStreetMap数据上运行的高性能路由引擎,查询基于坐标的传感器之间的最短驾驶距离
    • 然而,计算成对的道路网络距离在处理大量节点时可能非常耗时
    • ——>首先计算传感器之间的测地线距离,这比计算它们之间的最短路径要快得多
    • ——>然后,限制每个节点只查询与其相距4公里半径内的其他节点的道路网络距离
    • ——>最后,通过设置一个小阈值来规范化邻接矩阵,该阈值消除了弱节点连接
  • LargeST包含五年(2017年至2021年)的交通流量数据,时间间隔为5分钟(与PeMS相同),总共有525,888个时间帧
  • 论文选择不移除具有高缺失交通流量值的节点,以便用户可以自行决定是否填补缺失值

2.2 数据分析

3 实验

  • 基于12步历史数据预测未来12步
  • 训练集、验证集和测试集的比例为6:2:2

3.1 实验结果

3.1.1 各模型效果

3.1.2 效率比较

4 未来研究中的机会

  • 空间、时间和元数据特征的利用
  • 时间分布转移挑战的有价值试验场
    • 数据集提供了一个独特的视角来观察时间分布转移或分布外挑战。
    • 例如,研究人员探索非常事件对预测模型的影响时,可以利用该数据集作为一个测试场,以开发处理突然分布转移的策略。
  • 简单而有效方法的开发
    • 通过分析表2和表3,显而易见的是,尽管提出的方法在近年来展示了越来越高的准确性,但它们的模型也变得越来越复杂,这对它们在更大传感器网络中的效率和可扩展性有重大影响。
    • 因此,开发简单而有效的交通预测方法是至关重要的,以便在现实世界应用中实际实施和部署。
  • 基础预测模型的开发
    • 最近,开发基础模型在多个领域引起了广泛兴趣,例如自然语言处理中的ChatGPT和计算机视觉中的Segment Anything。拥有数十亿精选数据点的我们的数据集可能成为在交通预测或时间序列预测领域培训基础模型的宝贵资源。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/563888.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

向量的求导

参考: 向量的求导 向量内积求导

基于Vue3的openlayers地图显示

基于Vue3的openlayers地图显示 (1)接着上一篇将讲,在components文件夹下创建BaseMap.vue文件夹 (2)在App.vue文件里面引入BaseMap.vue文件,如下代码所示: (3)在BaseMa…

Rust异步编程简介

Rust异步编程简介 计算机已经尽可能快了。加快程序速度的一种方法是并行或并发执行操作。这两个术语之间有细微的区别。并行执行意味着我们同时在两个不同的 CPU 上执行两个不同的任务。并发执行意味着单个 CPU 通过交错执行这些任务,同时在多个任务上取得进展。 R…

【支付宝】对接手机网站支付踩坑点记录

前言 简单记录一下对接Wap支付的问题,alipay和wxpay认证过程差不多,有个体商户或企业即可,前者文档不易懂后者还好,但是wxpay门槛高,个人认为pc网站支付(native支付)就是为了收300认证费! 应用公私钥 第一…

【数据结构】时间复杂度的例题

🎁个人主页:我们的五年 🔍系列专栏:数据结构 🌷追光的人,终会万丈光芒 前言: 这篇文章是关于时间复杂度的一些例题,关于时间复杂度和空间复杂度和算法的计算效率的基本知识点我放在…

应变计技术解读:如何精确测量结构物的形变

振弦式应变计是一种用于精确测量结构物形变的高精度仪器。这种应变计利用了振弦原理,即物体的振动频率会因其尺寸、形状或应变状态的改变而改变。通过测量这种频率变化,振弦式应变计能够提供关于材料形变的详细信息,这在结构健康监测、工程试…

Apache POI报表统计

Apache POl是一个处理Miscrosoft Office各种文件格式的开源项目。简单来说就是&#xff0c;我们可以使用 POl 在 Java 程N序中对Miscrosoft Office各种文件进行读写操作。一般情况下&#xff0c;POI都是用于操作 Excel 文件。 导入Maven坐标&#xff1a; <dependency>&l…

【数据结构(八)上】二叉树经典习题

❣博主主页: 33的博客❣ ▶文章专栏分类: Java从入门到精通◀ &#x1f69a;我的代码仓库: 33的代码仓库&#x1f69a; &#x1faf5;&#x1faf5;&#x1faf5;关注我带你学更多数据结构的知识 目录 1.前言2.经典习题2.1相同的树2.2另一棵子树2.3翻转二叉树2.4平衡二叉树2.5对…

免费开源圈子社交交友社区系统 可打包小程序 支持二开 源码交付!

线上社交的好处&#xff1a; 当今社会&#xff0c;人们越来越依赖于网络社交。互联网无疑为人类带来了许多好处&#xff0c; 其中一个就是线上社交。通过各种社交平台&#xff0c;人们可以随时随地互动交流&#xff0c;扩大自 己的社交圈&#xff0c;丰富生活。但是&#xf…

智慧水务能效管理系统平台/地下污水厂配电系统电气安全设计

安科瑞电气薛瑶瑶18701709087 1、引言 地下水污厂在城市建设中扮演着重要的角色,负责对城市污水和废物进行处理和排放。然而,由于地下水污厂中存在着许多危险因素,如有害气体、液体和固体废物等,因此要保证电气安全。电气安全系统是地下水污厂安全生产的重要保障措施之一,包括…

常见的软件架构模式

在软件开发过程中&#xff0c;软件架构模式是实现高质量、可扩展系统的关键。本文将介绍一些常见的软件架构模式&#xff0c;分析其优缺点和适用场景&#xff0c;从而帮助大家在实际项目中做出更明智的架构选择&#xff08;注意以下的架构模式相互之间并不一定互斥&#xff0c;…

imx6ull设备树驱动--pinctl、ioctl

添加pinctl节点 进入arch/arm/boot/dts目录下dts文件 在iomuxc下添加pinctlled节点 将 GPIO1_IO03 这个 PIN 复用为 GPIO1_IO03&#xff0c;电气属性&#xff08;配置GPIO一些列寄存器&#xff09;值为 0X10B0 添加led设备节点 与上一节一样&#xff0c;在 / 下面添加设备节…

2024年遥感技术与地理信息国际学术会议(ICRSTGI 2024)

2024年遥感技术与地理信息国际学术会议(ICRSTGI 2024) 2024 International Conference on remote sensing technology and geographic information 一、【会议简介】 2024年遥感技术与地理信息国际学术会议&#xff0c;将汇集世界各地的顶级专家和学者。 在这个会议上&#xf…

Springboot+Vue项目-基于Java+MySQL的网上购物商城系统(附源码+演示视频+LW)

大家好&#xff01;我是程序猿老A&#xff0c;感谢您阅读本文&#xff0c;欢迎一键三连哦。 &#x1f49e;当前专栏&#xff1a;Java毕业设计 精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; &#x1f380; Python毕业设计 &…

交通公路气象站:监测公路沿线气象

TH-GQX8交通公路气象站是一种专门用于监测公路沿线气象状况的设备系统。它通常由分布在公路沿线的若干个自动气象站联网组成&#xff0c;主要任务是实时监测和记录多种气象数据&#xff0c;为交通管理部门和驾驶员提供准确的路况信息。这些气象数据包括气温、湿度、风速、风向、…

高速公路交通运输大数据平台解决方案

前言 交通运输行业面临着多重挑战。其管控困难&#xff0c;涉及广泛地理范围&#xff0c;导致监控成本高且难以及时响应&#xff1b;同时&#xff0c;行业内数据量大&#xff0c;地理信息数据繁多&#xff0c;缺乏高效的可视化工具来揭示数据规律并优化业务&#xff1b;货运和…

润石科技(RUNIC)汽车电子应用方案和物料选型

一、润石科技&#xff08;RUNIC&#xff09;简介 江苏润石科技有限公司是一家专注于高性能、高品质模拟/混合信号集成电路研发和销售的高科技半导体设计公司。公司主要产品线分为两类&#xff1a;信号链和电源管理&#xff0c;其中信号链包含运算放大器、比较器、模拟开关、数…

微信小程序开发

微信小程序隶属于前端&#xff0c;因此我们只需要了解掌握一些基本的功能与业务逻辑即可。 HttpClient HttpClient 是Apache Jakarta Common 下的子项目&#xff0c;可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包&#xff0c;并且它支持 HTTP 协议…

APP自动化测试-Android SDK SDK Manager.exe或者uiautomatorviewer.bat打不开,点击就一闪而已的原因

原因是找不到Java.exe的路径&#xff0c; 如果是uiautomatorviewer.bat打不开&#xff0c;则使用文本编辑器打开它&#xff0c;然后添加java安装路径 set java_exeC:\Program Files\Java\jdk1.8.0_321\bin\java.exe 同理&#xff1a; 如果是SDK Manager.exe和AVD Manager.ex…

一个不同长度元素排序找行和列的需求

1、需求&#xff1a;三种长度的元素&#xff0c;分别是4、8、12&#xff0c;每一行的长度是12&#xff0c;超过12就排到下一行&#xff0c;我们将这三种类型的多个元素打乱&#xff0c;然后找到这些元素对应的行和列。 如下图&#xff1a; 2、解决思路&#xff1a; 创建一个长…