AI论文速读 | 【综述】城市计算中跨域数据融合的深度学习:分类、进展和展望

题目:Deep Learning for Cross-Domain Data Fusion in Urban Computing: Taxonomy, Advances, and Outlook

作者:Xingchen Zou, Yibo Yan, Xixuan Hao, Yuehong Hu, Haomin Wen(温皓珉), Erdong Liu, Junbo Zhang(张钧波), Yong Li(李勇), Tianrui Li(李天瑞), Yu Zheng(郑宇), Yuxuan Liang(梁宇轩)

机构:香港科技大学(广州),京东科技&京东智能城市,清华大学,西南交通大学

关键词:城市计算,数据融合,多模态数据,大语言模型,可持续发展

网址:https://arxiv.org/abs/2402.19348

项目地址:https://github.com/yoshall/Awesome-Multimodal-Urban-Computing

Cool Paper:https://papers.cool/arxiv/2402.19348

`标题与作者
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

摘要:

随着城市的不断发展,城市计算通过利用不同来源(例如地理、交通、社交媒体和环境数据)和模态(例如时空数据,视觉和文本模态)的跨域数据融合的力量,成为可持续发展的关键学科。 最近,看到利用各种深度学习方法促进智慧城市跨域数据融合的上升趋势。 为此,提出了第一篇综述——系统地回顾了为城市计算量身定制的基于深度学习的数据融合方法的最新进展。 具体来说,首先深入研究数据视角,以理解每种模式和数据源的作用。 其次,将该方法分为四个主要类别:基于特征、基于对齐、基于对比和基于生成的融合方法。 第三,将多模态城市应用进一步分为城市规划、交通、经济、公共安全、社会、环境和能源七类。 与之前的综述相比,本文更关注深度学习方法与城市计算应用的协同作用。 此外,还阐明了大型语言模型(LLM)和城市计算之间的相互作用,提出了可能彻底改变该领域的未来研究方向。 作者们坚信(firmly believe),综述中所描述的分类、进展和前景将极大地丰富研究界。

跨域城市计算蓝图。 左:通过数据融合过程整合来自不同模式的城市数据,包括时空、视觉、文本和其他模态。 右图:城市数据的多种来源,例如地理数据、交通、社交媒体、人口和环境。

本篇综述的动机:深度学习带来的范式转变使得之前关于城市数据融合的综述,有些过时了,因为传统的分类法可能无法恰当地捕捉这些先进方法之间的细微差别和差异。 鉴于这个问题,该综述致力于弥补这一差距,并通过提供符合深度学习时代的全面且更新的分类法来提供当代视角。

Q: 这篇论文试图解决什么问题?

A: 这篇论文旨在系统地回顾和分类针对城市计算的跨域数据融合方法,特别是在深度学习领域的最新进展。城市计算是一个多学科领域,它利用来自不同来源(如地理、交通、社交媒体和环境数据)的跨域数据融合来支持城市的可持续发展。随着城市化进程的加快,城市计算在解决能源消耗、环境污染、社会经济差异和交通问题等全球性挑战中发挥着越来越重要的作用。

论文的主要贡献和解决的问题包括:

  1. 数据视角:深入理解每种数据模态(如时空、视觉、文本等)和数据源(如传感器、卫星、社交媒体和公民生成数据)在城市计算中的作用。
  2. 方法分类:将城市计算中的跨域数据融合方法分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。
  3. 应用分类:将多模态城市应用分为七类:城市规划、交通、经济、公共安全、社会、环境和能源。
  4. 深度学习与城市计算的结合:探讨深度学习方法与城市计算应用的结合,特别是大型语言模型(LLMs)在城市计算中的应用前景。
  5. 未来研究方向:提出未来研究的方向,包括数据隐私保护、开放基准的建立、应用多样化以及效率优化等。
  6. 资源和实践应用:提供资源和实践应用的详细说明,帮助研究人员和利益相关者更好地理解城市数据模态的复杂性,并通过深度学习方法进行有效的数据融合。

通过这些贡献,论文旨在为城市计算领域的研究人员提供一个全面的资源,促进该领域的发展,并为解决城市化带来的挑战提供新的视角和工具。

Q: 有哪些相关研究?

相关综述与本文的比较(3方面:重点关注范围,相关模态和主要关注的主题)

A: 论文中提到了多个与城市计算和跨域数据融合相关的研究工作。以下是一些关键的相关研究:

  1. Zheng et al. (2015): 提供了跨域大数据融合方法的全面综述,特别是在城市计算领域。这项工作强调了跨域数据融合在整合多个信息源方面的关键作用。
  2. Wang et al. (2020): 对深度学习在时空数据挖掘中的应用进行了详尽的回顾,特别关注了多源时空数据的融合。
  3. Liu et al. (2020): 提供了城市大数据融合方法的总结,这些方法在2020年之前被广泛研究。
  4. Xie et al. (2020): 研究了基于生成对抗网络(GAN)的时空数据融合模型,特别是在人群流动预测方面。
  5. Yuan and Li (2021): 在智能交通领域,探讨了深度学习在城市计算中的应用。
  6. Afyouni et al. (2022): 研究了在社会事件检测中的应用,这是城市计算的一个子领域。
  7. Gao et al. (2022): 总结了基于生成对抗网络的融合模型,特别是在时空数据方面。
  8. Deldari et al. (2022): 集中在多模态数据融合的自监督表示学习上,这是一般领域的研究。
  9. Gao et al. (2023): 提出了一种基于Transformer的模型,用于交通需求预测,结合了多视图信息。
  10. Wang et al. (2023): 提出了一种基于扩散模型的街道视图图像生成方法,用于城市计算。
  11. Zhang et al. (2023): 提出了一种基于LLM的城市区域嵌入方法,用于城市计算。

这些研究为城市计算领域的数据融合提供了不同的视角和方法,涵盖了从基础理论到实际应用的广泛范围。论文通过这些相关工作,展示了城市计算领域在深度学习和数据融合方面的最新进展,并指出了未来研究的潜在方向。

Q: 论文如何解决这个问题?

A: 论文通过以下几个关键步骤来解决城市计算中跨域数据融合的问题:

  1. 系统分类:首先,论文提出了一个新颖的分类法,将现有的城市数据源分为五种类型(地理数据、交通数据、社交媒体数据、人口统计数据和环境数据),并从模态的角度(时空数据、视觉数据、文本数据等)对数据进行分类。这种分类有助于系统地理解和分析城市计算研究中使用的不同数据类型。
  2. 融合方法综述:论文详细回顾了城市计算中使用的融合方法,并将它们分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。每一类方法都有详细的技术描述和实例分析。
  3. 应用场景分析:论文进一步将城市应用分为七个领域:城市规划、交通、经济、公共安全、社会、环境和能源。对于每个领域,论文探讨了数据融合方法如何支持特定的下游任务。
  4. 数据集编译:为了支持研究和实践,论文全面编译了城市计算中常用的数据集,考虑了它们的来源、时间覆盖范围和空间分布特征。
  5. 未来研究方向:论文提出了未来研究的潜在方向,包括数据隐私保护、开放基准的建立、应用多样化以及效率优化等。这些方向旨在解决当前城市计算领域面临的挑战,并推动该领域的发展。
  6. LLMs与城市计算的结合:论文探讨了大型语言模型(LLMs)在城市计算中的应用,特别是在处理多模态和多源数据方面。LLMs的引入为城市计算提供了新的视角和工具。
  7. 资源和实践应用:论文提供了一个全面的资源列表,包括最新的论文列表和相关的开源数据集,以帮助研究人员和实践者更好地理解和应用深度学习技术进行城市数据融合。

通过这些步骤,论文不仅为城市计算领域的研究人员提供了一个全面的资源,而且为解决城市化带来的挑战提供了新的视角和工具。

综述中的城市计算中基于深度学习的跨域数据融合的分类框架。 该框架自下而上围绕三个维度构建:数据、融合方法和应用。 在每个视角中,将现有研究分为不同类别,以提供全面且组织良好的回顾。

Q: 论文做了哪些实验?

A: 在这篇论文中,作者并没有进行实验来验证某个特定的模型或算法,而是进行了一项全面的文献综述。这项综述旨在系统地回顾和分类针对城市计算的跨域数据融合方法,特别是在深度学习领域的最新进展。因此,论文的重点在于理论分析、方法论的分类和未来研究方向的提出,而不是实验验证。

论文的主要贡献包括:

  1. 数据视角的分析:对城市计算中使用的不同类型的数据源和模态进行了分类和讨论。
  2. 融合方法的分类:将现有的数据融合方法分为四类,并提供了每种方法的详细描述和应用实例。
  3. 应用领域的分类:将城市计算的应用分为七个主要领域,并探讨了深度学习在这些领域中的应用。
  4. 数据集的编译:提供了一个关于城市计算中常用数据集的全面列表,包括它们的来源、时间覆盖范围和空间分布特征。
  5. 未来研究方向的提出:基于当前研究的局限性和挑战,提出了未来研究的潜在方向。
  6. LLMs与城市计算的结合:探讨了大型语言模型(LLMs)在城市计算中的应用前景。

由于这项工作的性质是文献综述,所以没有包含实验部分。相反,作者通过分析现有的研究工作来建立一个全面的理论框架,并为未来的实证研究提供指导。

数据视角的分析

地理数据,交通数据,社交网络数据,人口数据,环境数据及其它。

城市计算跨域数据融合范围内强相关论文中数据集类型的比例。

融合方法的分类

基于特征融合,基于对齐融合,基于对比融合和基于生成融合

城市计算基于深度学习跨域数据融合的方法分类

应用领域的分类

城市规划,经济,社交,能源,交通,公共安全以及环境

城市计算中跨域数据融合的应用(类别)和常见下游任务(子类别)的分类

数据集的编译

地理数据,交通数据,社交网络数据,人口数据和环境数据

在城市计算中用于跨域数据融合的开源数据集的分类和总结

城市计算中基于深度学习的跨域数据融合模型的总结。方法名称将基于原始引用模型名称进行分配;否则,它们将以第一作者的名字命名。

Q: 有什么可以进一步探索的点?

A: 论文提出了几个未来研究方向,这些方向为城市计算和跨域数据融合领域的研究提供了潜在的探索点:

  1. 大型语言模型(LLMs)的应用:探索LLMs在城市计算中的应用,特别是在处理多模态和多源数据方面。研究LLMs如何与城市数据融合相结合,以及它们在城市分析和预测中的潜在作用。
  2. 智能体模拟(Agent-based Simulation):开发基于LLM驱动的智能体模型,以模拟城市动态并提高城市系统的适应性和响应性。这可以帮助创建更加智能和响应性强的未来城市。
  3. 多模态因果学习:研究如何将因果推断技术应用于城市数据,以提高对城市系统复杂动态的解释能力。这包括开发新的算法和技术来理解和预测城市环境中的因果关系。
  4. 多源数据隐私保护:研究如何在保护个人隐私的同时利用多源数据进行城市计算。这涉及到开发新的隐私保护技术,如差分隐私和联邦学习。
  5. 开放基准(Open Benchmark):合作开发标准化的数据格式、统一的评估指标和共享基准,以便于跨域数据融合模型的评估和比较。
  6. 下游任务多样性:扩展城市研究的范围,涵盖更多领域的应用,如经济、社会和环境,以全面理解城市环境中的挑战。
  7. 计算效率:优化城市计算模型的计算效率,包括模型压缩、高效训练和高效架构设计,以提高模型在实际城市环境中的可行性和有效性。
  8. 跨域数据融合的挑战:解决跨域数据融合中的具体挑战,如数据异构性、数据质量、数据集成和模型泛化能力。

这些研究方向不仅有助于推动城市计算领域的科学进步,而且对于解决实际城市问题和提高城市生活质量具有重要意义。

Q: 总结一下论文的主要内容

A: 这篇论文提供了一个全面的综述,专注于城市计算领域中跨域数据融合的最新进展,特别是深度学习方法的应用。以下是论文的主要内容总结:

  1. 背景与动机:随着城市化进程的加快,城市计算成为了一个关键领域,它通过整合和分析来自不同来源(如地理、交通、社交媒体和环境数据)的跨域数据来支持城市的可持续发展。
  2. 数据视角:论文首先从数据的角度出发,探讨了城市计算中使用的不同数据模态(如时空、视觉、文本等)和数据源(如传感器、卫星、社交媒体等)的作用。
  3. 方法分类:提出了一个新颖的分类法,将城市计算中的跨域数据融合方法分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。
  4. 应用领域:将城市计算的应用分为七个主要领域,包括城市规划、交通、经济、公共安全、社会、环境和能源,并探讨了深度学习在这些领域的应用。
  5. 数据集编译:提供了一个关于城市计算中常用数据集的全面列表,包括它们的来源、时间覆盖范围和空间分布特征。
  6. 未来研究方向:指出了城市计算领域中的一些潜在研究方向,如LLMs的应用、智能体模拟、多模态因果学习、数据隐私保护、开放基准、下游任务多样性和计算效率。
  7. LLMs与城市计算:探讨了大型语言模型(LLMs)与城市计算的结合,以及它们在处理多模态和多源数据方面的潜力。
  8. 资源和实践应用:提供了一个资源列表,包括最新的论文列表和相关的开源数据集,以帮助研究人员和实践者更好地理解和应用深度学习技术进行城市数据融合。

总的来说,这篇论文为城市计算领域的研究人员提供了一个全面的资源,展示了深度学习在跨域数据融合中的应用,并为未来的研究提供了新的方向和视角。

项目概览

项目地址:https://github.com/yoshall/Awesome-Multimodal-Urban-Computing

项目目录:

  • 相关综述
  • 分类框架
  • 数据融合方法
  • 开源数据集的分类总结
  • 强相关的论文列表

项目内容

相关综述

按照时间顺序的相关综述

相关综述

分类框架

分类框架

数据融合方法

数据融合方法

数据融合方法分为4类:

  1. 基于特征(Feature Based Data Fusion
  2. 基于对齐(Alignment Based Data Fusion
  3. 基于对比(Contrast Based Data Fusion
  4. 基于生成(Generation Based Data Fusion

开源数据集的分类总结

开源数据集的分类总结

开源数据集的分类总结分为(分类,内容,形式):

  1. 地理数据(Geographical Data)
    1. 卫星图像(Satellite Image):图像
    2. 街道图像(Street View Image):图像
    3. POIs:点向量(Point Vector)
  2. 交通数据(Traffic Data)
    1. 交通轨迹(Traffic Trajectory):时空轨迹
    2. 交通流(Traffic Flow):时空图
    3. 路网(Road Network):时空图
    4. 物流(Logistics):时空轨迹
  3. 社交网络数据(Social Network)
    1. 文本(Text):文本
    2. 地理标记的图像和视频(Geo-tagged Image&Video):图像和视频
    3. 用户信息(Users’ Info):时间序列
  4. 人口统计数据(Demographic Data)
    1. 犯罪(Crime):时间序列
    2. 土地利用(Land Use):时间序列
    3. 人口(Population):时序
  5. 环境数据(Environmental Data)
    1. 气象(Meteorology):时间序列
    2. 绿化(Greenery):时间序列
    3. 空气质量(Air Quality):时间序列

强相关论文列表

按照国内外城市计算实验室总结

强相关的论文列表

国内外高校和企业里时空数据挖掘相关的团队有哪些?
环境数据(Environmental Data)

  1. 气象(Meteorology):时间序列
  2. 绿化(Greenery):时间序列
  3. 空气质量(Air Quality):时间序列

强相关论文列表

按照国内外城市计算实验室总结

[外链图片转存中…(img-CBkZy1XP-1709808431165)]

国内外高校和企业里时空数据挖掘相关的团队有哪些?
https://www.zhihu.com/question/617528629/answer/3177883285
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/437088.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java适配器设计模式

Java适配器设计模式这一节后面的内容

面向对象中不可变性

软件设计中的不可变性是一个非常重要的概念,它可以在多个方面提高代码的可靠性、可维护性和安全性。 从开发者角度(代码提供者): 在软件开发过程中,当某个对象的属性是不可变的时候,这意味着这些属性的值…

用java实现A*寻路算法

前言: 最近的开发中遇到了寻路这个知识点,然后去了解了一下最常见的A算法,本会会结合我的理解,用最通俗易懂的话语讲解A算法的原理,下面会给出代码示例。 说到寻路算法,就涉及到了图的遍历,然…

开年采购云服务器,怎么买最划算?看这篇!

在2024年开年之际,对于许多企业和个人而言,采购云服务器已成为一项重要的决策。云服务器以其灵活性、可扩展性和高可用性等特点,吸引了越来越多的用户。然而,市场上的云服务器提供商众多,如何选择一家值得入手的服务商…

Domain Driven Design (DDD)

Domain Driven Design (DDD领域驱动设计)主要是业务分类例如(订单、合同、生产、检测、物流、运输等),独立单元相互不干扰,仅暴露接口的模型。核心在Domain,所有业务模块放这边,当然我们做的时候微服务是一…

如何对接1688平台官方开发平台的商品发布/商品过期处理/商品订单接口?

custom-自定义API操作 API测试 注册开通 1688.custom 1688平台官方开放接口 公共参数 名称类型必须描述keyString是调用key(必须以GET方式拼接在URL中)secretString是调用密钥api_nameString是API接口名称(包括在请求地址中)[…

windows部署ruoyi-vue-pro

前提 安装java 安装maven 安装redis mysql 源代码下载 后端 ruoyi-vue-pro 前端 yudao-ui-admin-vue3 后端项目 配置maven 导入数据 CREATE DATABASE ruoyi_vue_pro;修改mysql连接配置 修改redis 打包项目 mvn clean install package -Dmaven.test.skiptrue启动YudaoSe…

TC397 Tasking CMake Gitlab CI CD 环境配置

文章目录 Aurix Development Studio 新建工程与配置Tasking 环境配置CMake 集成Win CMake MinGW 安装Tasking Toolchain 工具链CMakeLists.txtPowershell 脚本 Gitlab CI CDGithub Link 本篇先演示了ADS新建激活编译工程, 讲述了浮点模型, 链接脚本文件, 静态库集成等的设置, 接…

python并发编程:IO模型

一 IO模型 二 network IO 再说一下IO发生时涉及的对象和步骤。对于一个network IO \(这里我们以read举例\),它会涉及到两个系统对象,一个是调用这个IO的process \(or thread\),另一个就是系统内核\(kernel\)。当一个read操作发生时&#xff…

C语言学习--摩尔投票算法

目录 1.引入 2.摩尔投票算法 3.具体步骤 3.1抵消阶段 3.2检验过程 4.代码实现 5.总结 1.引入 今天做题看到一个解题思路真的看不懂&#xff0c;一艘才知道是这个算法。 int majorityElement(int* nums, int numsSize) { int notenums[0]; int count1; for(int i1;i<n…

day7-网络编程

1>基于UDP的网络聊天室 Ser.c #include <myhead.h> #define SER_IP "10.211.55.9" // 服务器IP #define SER_PORT 9999struct user {char usrName[20];struct sockaddr_in cin; }; int main(int argc, char const *argv[]) {// 1.创建用于监听的套接字int…

coqui-ai/TTS 案例model文件

GitHub - coqui-ai/TTS: &#x1f438;&#x1f4ac; - a deep learning toolkit for Text-to-Speech, battle-tested in research and production Coqui AI的TTS是一款开源深度学习文本转语音工具&#xff0c;以高质量、多语言合成著称。它提供超过1100种语言的预训练模型库&…

Elemenu中el-table中使用el-popover选中关闭无效解决办法

主要是技术太菜,没找到原因,一点点才找到这个办法解决 因为在el-table-column里,因为是多行,使用trigger"manual" 时,用v-model"visible"来控制时,控件找不到这个值,才换成trigger"click" 先找到弹出关闭事件,再找元素的属性 右键>审核元素…

哪款洗地机值得买?希亦、追觅、米博、美的谁才是行业标杆?

在家庭清洁中&#xff0c;最让我们苦恼的便是厨房垃圾了&#xff0c;油渍跟食物残渣&#xff0c;用扫把扫了后&#xff0c;要反反复复的湿拖五六次&#xff0c;期间不停的手洗拖把&#xff0c;这套流程下来&#xff0c;往往容易腰酸背痛&#xff0c;手指皱巴巴的&#xff0c;这…

Java项目:40 springboot月度员工绩效考核管理系统009

作者主页&#xff1a;源码空间codegym 简介&#xff1a;Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 本系统的功能分为管理员和员工两个角色 管理员的功能有&#xff1a; &#xff08;1&#xff09;个人中心管理功能&#xff0c;添加管理员账号…

【BUG修复日志】Anaconda + VSCode 编码错误

【BUG修复日志】Anaconda VSCode 编码错误 平台: Windows11家庭版 (v22621.3155) 软件: Visual Studio Code (v1.87.0) 插件: Python (v2024.2.1) 版本: Conda (v24.1.2)问题描述 VSCode 在安装 Python 插件的情况下自动提示配置 Conda 环境&#xff0c;但是在自动配置完成后…

SpringMVC实用技术

1.校验框架 1.表单校验框架入门 表单校验的重要性 数据可以随意输入&#xff0c;导致错误的结果。表单校验保障了数据有效性、安全性 表单校验分类 校验位置&#xff1a; 客户端校验 服务端校验 校验内容与对应方式&#xff1a; 格式校验 客户端&#xff1a;使用Js技术…

【linuxC语言】系统调用IO文件操作

文章目录 前言一、文件描述符介绍二、系统调用IO API介绍2.1 open函数2.2 close函数2.3 read函数2.4 write函数2.5 lseek函数 三、示例代码总结 前言 在Linux系统中&#xff0c;C语言通过系统调用实现对文件的输入输出&#xff08;I/O&#xff09;操作。系统调用提供了访问操作…

LLM - 使用 Langchain 实现本地 Naive RAG

目录 一.引言 二.构建本地 Langchain 库 1.Doc 知识文档 2.Split 文档切分 3.Encode 内容编码 4.Similar 本地库构建 三.缓存本地 Langchain 库 四.读取本地 Langchain 库 1.Load 读取缓存 2.Similar 预测 3.Add 添加文档 五.总结 一.引言 上一篇博客介绍了当下 R…

M2TS转MP4怎么转?超快的方法~

M2TS格式的优点主要体现在对高清视频的完美支持&#xff0c;能够提供极致的视觉体验。然而&#xff0c;由于其相对较大的文件大小&#xff0c;有时可能不太适合网络传输。此外&#xff0c;部分不支持M2TS的播放设备可能导致一定的兼容性问题。 想要播放m2ts视频&#xff0c;可…