基于 7 大城市实景数据,清华大学团队开源 GPD 模型

城市,是人们安居乐业的故土,是政府开展经济建设的基石,承载着细腻的人文情怀与宏伟的国家发展脉络。长期以来,管理者一直在探寻更加高效、科学的城市治理方法,解决不同地区资源供给不平衡、交通拥挤、人口流失等问题。在物联网、AI、大数据等技术的加速迭代下,智慧城市应运而生,在越来越多的国家开始了因地制宜的革新。

如果将智慧城市建设比喻成「盖房子」,那么时空数据便是必不可少的「砖瓦」,基于时空数据的时空预测模型更加是构成智慧城市框架的重要基础。时空数据,顾名思义,记录了事件在时间和空间两个维度上的发生与变化,包含地理信息、气象数据、交通数据、人口数据、卫星遥感数据等。

但是,由于城市发展水平不尽相同、数据收集政策也存在差异,导致部分城市的时空数据匮乏,难以支撑预测模型的构建。对此,现有方法主要是利用数据丰富的源城市数据训练模型,并将其应用于数据稀缺的目标城市。但这一过程往往依赖于复杂的匹配设计,如何实现对源城市和目标城市之间更加泛化的知识迁移仍是一个重要挑战。

针对城市计算中广泛存在的数据稀缺性问题,清华大学电子工程系城市科学与计算研究中心发布了最新研究成果《Spatio-Temporal Few-Shot Learning via Diffusive Neural Network Generation》,提出了 GPD (Generative Pre-Trained Diffusion) 模型, 利用扩散模型生成神经网络参数,将时空少样本学习转变为扩散模型的预训练问题。该研究已被ICLR2024接收,数据代码均已开源。

其优势在于,通过预训练一个扩散模型,从源城市的数据中学习到有关优化神经网络参数的知识,然后根据提示生成适应目标城市的神经网络。

图片

论文链接:
https://openreview.net/forum?id=QyFm3D3Tzi
数据集下载链接:
https://hyper.ai/datasets/30453

关注公众号,后台回复「清华GPD」下载完整论文

覆盖多城市的人流与交通数据集

研究人员在两种类型的时空预测任务上进行了实验——人群流动预测、交通速度预测。

在人群流动预测中,研究人员在 3 个真实世界数据集上进行了实验,包括纽约市、华盛顿特区和巴尔的摩。每个数据集包含所有区域的每小时城市人流量。

图片

人群流动预测的3个真实世界数据集

在交通速度预测中,研究人员在 4 个真实世界数据集上进行了实验,包括 MetaLA、PEMS-BAy、滴滴成都和滴滴深圳。

图片

交通速度预测的4 个真实世界数据集

在上述两个测试任务中,研究人员将数据集分类为源城市与目标城市。例如,如果将某个特定城市设置为目标数据集,则假设只能访问有限数量的数据,如 3 天的数据(现有模型通常需要几个月的数据来训练模型),而扩散模型是使用源城市提供的丰富数据进行训练的。

双 buff 加持:预训练 + 提示微调

如下图所示,GPD 作为一种条件生成框架,共分为 3 个关键阶段:

图片

模型概览

(a) 神经网络准备阶段

研究人员针对每个源城市区域训练了单独的时空预测模型,并保存其优化后的网络参数。每个区域的模型参数都经过独立优化,转换为基于向量的格式,没有参数共享,以确保模型能够最大程度地适应各自区域的特征。

(b) 扩散模型预训练

该框架使用收集到的预训练模型参数作为训练数据,训练扩散模型来学习生成模型参数的过程。扩散模型通过逐步去噪来生成参数,可以在给定提示的情况下从噪声中生成神经网络参数。这个过程类似于从随机初始化开始的参数优化过程,因此能够更好地适应目标城市的数据分布。

© 神经网络参数生成

在预训练后,可以通过使用目标城市的区域提示来生成参数。这种方法利用提示促进了知识转移和精确参数匹配,充分利用了城市间区域之间的相似性。

其中,去噪网络的网络结构如下图所示:

图片

去噪网络的网络结构

如上图 (a) 所示该研究的去噪网络架构采用了基于 prompt 的 Transformer 扩散模型,在层分割 (layer segmentation) 之后,参数被重组为标记序列。

在去噪过程中,除了噪声序列外,Transformer 扩散模型还考虑了时间步长 k 和区域提示 p。研究人员探索了多种调节方法,例如后适应调节、自适应规范调节,对 Transformer 层设计进行了微小但重要的修改,调整策略如上图 (b) 和 © 所示。

值得一提的是,在预训练-提示微调的框架中,提示的选择具有很高的灵活性,只要能够捕捉特定区域的特征即可。 例如,可以利用各种静态特征,如人口、区域面积、功能和兴趣点 (POI) 的分布等。

这项工作从空间和时间两个方面利用区域提示:

  • 空间提示来自于城市知识图谱中节点表征,仅利用区域邻接性和功能相似性等关系,这些关系在所有城市中都很容易获取;

  • 时间提示来自于自监督学习模型的编码器。

GPD 在数据稀缺的场景中表现出色,性能提高 7.87%

为了评估所提框架的有效性,该研究在两类经典的时空预测任务上进行了实验:人群流动预测和交通速度预测,该研究表明,GPD 在数据稀缺的场景中表现出色,在四个数据集上比最佳基线平均提高了 7.87%。

图片

GPD在4个数据集上相对于最先进基线方法的比较结果

在华盛顿特区、巴尔的摩、洛杉矶和成都数据集中,与上表中划线标记的最佳基线方法相比,GPD 的平均误绝对差 (MAE) 分别降低了 4.31%、17.1%、2.1% 和 8.17%。这表明,GPD 在不同数据场景下一致表现优越,实现了有效的神经网络参数层面的知识迁移。

图片

不同时空预测模型的性能对比

此外,该研究还验证了 GPD 框架对于不同时空预测模型适配的灵活性。除了经典的时空图方法 STGCN 外,该研究还引入了 GWN 和 STID 作为时空预测模型,并使用扩散模型生成其网络参数。实验结果表明,框架的优越性不会受到模型选择的影响,因此可以适配各种先进的模型。

加速打造「实景三维中国」

近年来,随着新兴基础设施建设提速,时空数据的采集难题已经得到了很大程度上的缓解,加之如上述这一类少样本学习方法的成功应用,因地制宜的城市时空大数据平台已经在越来越多的城市落地。

人民日报在 2023 年 5 月的报道显示,国产卫星遥感影像自主保障率达 90% 以上;1∶50000 基础地理信息数据库保持按年度动态更新,1∶10000 基础地理信息数据陆地国土覆盖率达到 65%。

据介绍,实景三维中国纳入数字中国建设整体布局规划并全面启动,国家和省、市、县协同推进地形级、城市级、部件级实景三维建设,产品覆盖从陆地表面向海洋、水下、地下等方面延伸。目前实景三维中国建设成果已实时接入国土空间基础信息平台,应用于第三次全国国土调查申报数据核查、国土变更调查变化图斑提取、国土空间规划编制论证与方案推演等工作中。

截至 2023 年 5 月,40 个智慧城市时空大数据平台建设完成, 开展了面向自然资源监测管理、城市精细化管理、交通和市场监管等 400 余项行业应用系统,为城市精细化管理、经济发展和公众生活提供了实时、丰富、全面、权威的时空基础支撑。

可以肯定的是,在「数字中国」的大背景之下,以宜居、可持续发展为目标的智慧城市建设将持续深化,而时空数据、时空模型作为城市大脑的底座,重要程度不言而喻,相信在数据采集能力提升,以及少样本学习方法的迭代之下,时空预测也将更加准确。

参考资料 :
https://www.gov.cn/lianbo/bumen/202305/content_6874554.htm

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/506931.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Qt项目通过.pri文件将众多文件按功能模块分类显示,开发大型项目必备

Chapter1 Qt项目通过.pri文件将众多文件按功能模块分类显示,开发大型项目必备 Chapter2 在Qt项目中添加pri文件 原文链接:在Qt项目中添加pri文件_qtpri-CSDN博客 前言 一般我们创建Qt项目工程的时候,都是直接把所有的项目,头文…

Chatopera 云服务的智能问答引擎实现原理,如何融合 #聊天机器人 技术 #Chatbot #AI #NLP

观看视频 Bilibili: https://www.bilibili.com/video/BV1pZ421q7EH/YouTube: https://www.youtube.com/watch?vx0d1_0HQa8o 内容大纲 提前在浏览器打开网址: Chatopera 云服务:https://bot.chatopera.comChatopera 入门教程:https://dwz…

微机原理-基于8086电压报警器系统仿真设计

**单片机设计介绍,微机原理-基于8086电压报警器系统仿真设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于8086的电压报警器系统仿真设计概要主要涉及到系统的整体架构设计、硬件组成、软件逻辑设计以及仿真环境…

【智能算法】黄金正弦算法(GSA)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献 1.背景 2017年,Tanyildizi等人受到正弦函数单位圆内扫描启发,提出了黄金正弦算法(Golden Sine Algorithm, GSA)。 2.算法原理 2.1算法思想 GSA来源于正弦函…

前端学习<二>CSS基础——14-CSS3属性详解:Web字体

前言 开发人员可以为自已的网页指定特殊的字体(将指定字体提前下载到站点中),无需考虑用户电脑上是否安装了此特殊字体。从此,把特殊字体处理成图片的方式便成为了过去。 支持程度比较好,甚至 IE 低版本的浏览器也能…

C语言内存函数(超详解)

乐观学习,乐观生活,才能不断前进啊!!! 我的主页:optimistic_chen 我的专栏:c语言 点击主页:optimistic_chen和专栏:c语言, 创作不易,大佬们点赞鼓…

安全用电监控系统在工厂的研究与应用论述

摘 要:随着社会时代的发展,人们的安全意识越来越强烈,在人们生活和工作中离不开各种用电设备,用电设备的安全使用是保障人们生命安全的重要内容。工厂因自身厂内工作环境的特殊性,用电设备的种类多且复杂,如…

【数据结构与算法初阶(c语言)】插入排序、希尔排序、选择排序、堆排序、冒泡排序、快速排序、归并排序、计数排序-全梳理(万字详解,干货满满,建议三连收藏)

目录 1.排序的概念及其运用 1.1排序的概念 1.2排序运用 1.3常见的排序算法 2.插入排序 2.1 原理演示:​编辑 2.2 算法实现 2.3 算法的时间复杂度和空间复杂度分析 3.希尔排序 3.1算法思想 3.2原理演示 3.3代码实现 3.4希尔算法的时间复杂度 4.冒泡排序 4.1冒泡排…

二、图的表示和带权图

文章目录 1、图的表示1.1 邻接矩阵1.2 邻接表1.3 关联矩阵 2、带权图2.1 最短路径问题2.2 中国邮递员问题2.3 旅行商问题 THE END 1、图的表示 1.1 邻接矩阵 \qquad 将图的所有顶点分别构成一个二维矩阵的行列,将顶点之间的边关系表示在构成的矩阵之中,…

在CentOS 8.5.2111下安装vncserver

# 参考: 如何在 CentOS 8/RHEL 8 上安装配置 VNC 服务器 安装CentOS 8.5.2111 及 vncserver # 标准安装步骤 安装GNOME桌面环境使用屏幕号:1。安装VNC服务器(tigervnc-server tigervnc)设置VNC密码设置VNC服务器配置文件开启vnc服务。开放防…

FX110网:货币交易5个亏损典型,你有中招吗?

人生百年几今日,今日不为真可惜!若言姑待明朝至,明朝又有明朝事。很多投资朋友总是抱怨,为什么总是看见别人赚钱,自己一进场就亏损,那么在这里投资失败无非两点:一是自身原因,自己没…

SAP 销售分销中的免费货物

销售业务中,免费货物在您与客户协商价格时起着重要作用。在零售、化工或消费品这样的行业部门中,通常以免费货物的形式向客户提供折扣。 作为用户,业务用户希望能自动确定免费货物并将它们归入销售凭证中。同时需要向成本控制部门提供免费货物…

密码算法概论

基本概念 什么是密码学? 简单来说,密码学就是研究编制密码和破译密码的技术科学 例题: 密码学的三个阶段 古代到1949年:具有艺术性的科学1949到1975年:IBM制定了加密标准DES1976至今:1976年开创了公钥密…

盘点那些好用的SAP FIORI App(一) Display Customer/Supplier List

做SAP运维的人可能都知道,SAP标准的菜单里面基本没有好用的report可以用来批量显示并导出客户清单,或者供应商清单。T-code MKVZ 可以导出供应商的采购数据,但仅限于部分字段,客户清单的话系统标准的有这个S_ALR_87012179 - Custo…

电脑端手机配置检测工具推荐与使用指南

摘要 本文介绍了如何使用克魔助手工具在电脑上检测手机的配置信息。通过该工具,用户可以全面了解手机的硬件和操作系统信息,包括电池、CPU、内存、基带信息和销售信息等。 引言 在日常工作中,了解手机的配置信息对于开发和测试人员非常重要…

算法刷题笔记(3.25-3.29)

算法刷题笔记 3.25-3.29 1. 相同的树2. 二叉树的最近公共祖先3. 二叉搜索树中第K小的元素通过双端队列duque 中序遍历 4. 二叉树的锯齿形层序遍历new LinkedList<Integer>(levelList)双端队列复制 数组需要左右顺序&#xff0c;考虑双端队列 5. 岛屿数量6. 字典序排数&am…

【应用浅谈】Odoo的库存计价与产品成本(一)

序言:时间是我们最宝贵的财富,珍惜手上的每个时分 Odoo的库存&#xff08;Stock&#xff09;模块拥有众多功能&#xff0c;其中库存计价是一项非常重要的功能&#xff0c;原生的成本方法分三种&#xff1a;【标准成本】&#xff0c;【平均成本】&#xff0c;【先进先出】&#…

个人博客系统|基于Springboot的个人博客系统设计与实现(源码+数据库+文档)

个人博客系统目录 目录 基于Springboot的个人博客系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、管理员功能实现 &#xff08;1&#xff09;用户管理 &#xff08;2&#xff09;文章分类管理 &#xff08;3&#xff09;公告信息管理 &#xff08;4&#…

微服务之分布式事务概念

微服务之分布式事务概念 CAP定理和Base理论 CAP定理 CAP定理在1998年被加州大学的计算机科学家 Eric Brewer 提出&#xff0c;分布式系统有三个指标&#xff1a; 一致性&#xff08;Consistency&#xff09;可用性&#xff08;Availability&#xff09;分区容错性&#xff…

Taro 关于微信订阅消息的调用

requestSubscribeMessage 是微信提供的方法 封装的调用requestSubscribeMessage的方法 示例图如下 import {getWechatTemplates,postSubscribeNotice } from /magic-sdk/apis/wechat-service; import {WechatTemplateType,SubscribeNoticeObjTypeOptions,WechatTemplateEvent…