论文笔记:LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry

2023 KDD

1 intro

1.1 背景

  • 随着城市化进程的加快和电子商务的发展,最后一公里配送已成为一个关键的研究领域
    • 最后一公里配送,如图1所示,是指连接配送中心和客户的包裹运输过程,包括包裹的取件和配送
    • 除了对客户满意度至关重要外,最后一公里配送还是整个运输过程中最昂贵和最耗时的部分
      • 路线规划
      • 预计到达时间(ETA)预测
      • 路线预测
  • 这些研究的一个关键前提是高质量、大规模数据集的可用性。
    • 然而,在最后一公里配送研究领域,虽然已经开发了大量算法,但仍缺乏广泛认可的、公开可用的数据集
    • 因此,这一领域的研究主要集中在少数工业研究实验室中,限制了透明度并阻碍了研究进展。

1.2 论文思路

  • 提出了LaDe,这是由菜鸟收集的首个综合性最后一公里配送数据集
    • 包含了包裹的取件和配送数据
    • Cainiao-AI/LaDe · Datasets at Hugging Face
  • LaDe具有以下几个优点:
    • (1) 大规模,涵盖了21,000名快递员在6个月内配送的10,677k个包裹
      • 这是目前最大规模的公开数据集
    • (2) 全面,提供了有关包裹、位置、任务事件和快递员的详细信息
    • (3) 多样性,收集了来自不同城市的取件和配送过程的数据
    • ——>凭借这些优势,LaDe可以用于评估与最后一公里相关的广泛任务
  • 论文通过三个任务来研究其特性,包括路线预测、预计到达时间预测和时空图预测

2 相关工作

2.1 数据集视角

  • 目前没有公开可用的最后一公里配送数据集同时包含包裹取件和配送数据
  • 最接近的相关工作来自亚马逊[21](本文称为AmazonData)
    • 这是一个由亚马逊提出的快递员执行的序列数据集,旨在为亚马逊主办的最后一公里路线研究挑战提供数据支持
    • 包含了2018年亚马逊快递员在美国五个大都市区执行的9,184条历史路线
    • D. Merchán, J. Arora, J. Pachon, K. Konduri, M. Winkenbach, S. Parks, and J. Noszek, “2021 amazon last mile routing research challenge: Data set,” Transportation Science, 2022.
    • 存在三个局限性:
      • 1) 没有取件数据,仅包含包裹配送过程中的数据;
      • 2) 在时空范围和轨迹数量方面规模较小;
      • 3) 缺乏与快递员及任务事件相关的信息,无法惠及有不同研究兴趣的更广泛研究群体

2.2 应用视角

  • 广义上,最后一公里物流有四个分支
    • 1) 新兴趋势和技术,重点研究最后一公里物流中的技术解决方案和创新
      • 快递员路线及到达时间预测
        • A deep learning method for route and time prediction in food delivery service
        • Graph2route: A dynamic spatial-temporal graph neural network for pick-up and delivery route prediction
      • 自助技术
        • What’s in the parcel locker? exploring customer value in e-commerce last mile delivery
      • 无人机辅助配送
        • What’s in the parcel locker? exploring customer value in e-commerce last mile delivery
    • 2) 与最后一公里相关的数据挖掘,旨在从现实世界运营产生的数据中挖掘潜在的知识模式,以改进物流管理
      • “Discovering actual delivery locations from mis-annotated couriers’ trajectories
    • 3) 运营优化,主要关注优化最后一公里运营并做出更好的运营决策
      • 车辆路径问题
        • Last-mile delivery made practical: An efficient route planning framework with theoretical guarantees
        • Appointment scheduling and routing optimization of attended home delivery system with random customer behavior
      • 配送调度
        • “Last-mile delivery made practical: An efficient route planning framework with theoretical guarantees
      • 设施选址选择
        • “Solution of two-echelon facility location problems by approximation methods
        • “Locating collection and delivery points for goods’ last-mile travel: A case study in new zealand
    • 4) 供应链结构,关注为最后一公里物流设计结构,例如网络设计[30]
      • “Locating collection and delivery points for goods’ last-mile travel: A case study in new zealand

3 数据

3.1 数据收集

3.1.1 包裹运输流程

  • 该数据集由菜鸟网络收集.包裹运输的典型过程包括以下步骤:
    • 1,客户(发件人)通过在线平台下单取件。
    • 2,平台将订单分派给合适的快递员。
    • 3,快递员在指定时间窗口内取件并返回配送站(这构成了包裹的取件过程)。
    • 4,包裹从配送站出发,通过物流网络运输至目标配送站。
    • 5,在目标配送站,配送快递员取出包裹并送达收件人(称为包裹配送过程)。
    • 在这些步骤中,第3步和第5步被称为最后一公里配送,快递员从/向客户取件/送件。

3.1.2 取件和配送场景异同 & LaDe的两个子数据集

  • 取件和配送场景之间存在显著差异。
    • 在包裹配送过程中,分配给某快递员的包裹在快递员离开配送站前就已确定
    • 而在取件过程中,分配给快递员的包裹并不是一开始就确定的,而是随着时间推移逐步揭示的,因为客户可以随时请求取件。
      • 取件过程的动态性给研究领域带来了巨大挑战。

3.1.3 LaDe数据集

——>LaDe包含了两个子数据集,分别针对取件和配送场景,命名为LaDe-P和LaDe-D

  • 收集了在中国不同城市中产生的数百万条取件/配送数据,数据涵盖6个月的时间

  • 一个城市包含不同的区域,每个区域由多个AOI(感兴趣区域)组成,供物流管理使用
    •  快递员负责在若干指定AOI内取件或送件
    • 为了收集每个城市的数据,论文首先随机选择该城市中的30个区域。
    • 随后,论文在每个区域中随机抽取快递员,并收集所有选定快递员在6个月内的取件/配送包裹数据

3.2 数据集详情

  • 每条记录包含与取件或配送包裹相关的信息,主要涉及“谁、何地、何时”等方面。
    • 具体来说,记录中说明了哪位快递员取件或送件、包裹的位置及相应的时间。
    • 记录的信息大致可分为四类:
      • 包裹信息,记录包裹ID及时间窗口要求
      • 站点信息,如坐标、AOIID和AOI类型;
      • 快递员信息,记录快递员的ID,每位快递员都配备了个人数字助理(PDA),该设备会持续向平台报告快递员的状态(例如GPS);
      • 任务事件信息,记录包裹接受、取件或配送事件的特征,包括事件发生时间和快递员的位置信息。

3.3 数据集统计

  • a——快递员工作时间
  • b,c——包裹空间分布
  • d——数据中前五大AOI类型的分布
  • e——随机选择的10位快递员的实际到达时间
  • f——数据集中两位快递员的工作概况

3.4 数据集特征与挑战

3.4.1 大规模

  • LaDe数据集总共包含10,667k个包裹和619k条轨迹,这些轨迹由21,000名快递员生成,涵盖16,755k个GPS定位点,覆盖5个城市,跨越6个月的时间。
  • 单次取件和配送场景中,快递员一次最多可处理的包裹数分别达到95个和121个
  • 如此大规模的数据给最后一公里配送算法带来了显著挑战。

3.4.2 全面性

  • LaDe旨在提供与最后一公里配送相关的丰富信息,涵盖了各种数据类型
    • 详细的包裹信息
    • 任务事件日志
    • 快递员轨迹详细信息
    • 上下文特征
  • 如何有效利用这些综合特征来改进现有任务或启发新任务,仍然是不同领域研究人员面临的一个开放性问题。

3.4.3 多样性

  • 场景多样性——我们通过收集代表取件和配送两个场景的子数据集引入场景多样性。
  • 任务动态性(仅针对LaDe-P)。与LaDe-D不同,LaDe-P中的快递员任务在一天的开始时并未确定,而是随着取件过程的进行逐步揭示,因为客户可以随时下单。
    • 这种快递员任务的动态性在多个研究领域中带来了显著的技术挑战,动态路线优化便是一个典型例子

4 任务

4.1 路线预测

4.2 ETA

4.3  时空图 (STG) 预测

计算出特定区域在一定时间段内的包裹数量

4.4 其他应用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/902988.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

诺基亚的裁员风暴

大家好,我是鸭鸭! 不知道 80、90 后还记得童年神机诺基亚吗? 虽然诺基亚早就把自家手机业务出售,但依然是一代通信巨头。 鸭鸭最近看到新闻,诺基亚已经在大中华区裁减了近 2000 名员工 。 根据 2023 年底&#xff0…

YOLOv8实战野生动物识别

本文采用YOLOv8作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv8以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对野生动物数据集进行训练和优化,该数据集包含丰富的野生动物图像样本…

9.Linux按键驱动-工作队列

1.思路 1.1在gpio结构体中定义工作队列 1.2 在probe函数中初始化工作队列 1.3.在中断服务程序中调度工作队列 1.4工作队列处理函数&#xff1a; 2.编程 程序&#xff1a; #include <linux/module.h> #include <linux/fs.h> #include <linux/errno.h> #…

C语言程序设计:现代设计方法习题笔记《chapter6》下篇

第七题 square3.c代码 #include<stdio.h>int main() { int i, n, odd, square;printf("This program prints a table of squares.\n");printf("Enter number of entries in table: ");scanf_s("%d", &n);i 1;odd 3;for (square 1;…

数据库课程 第一周

1.数据库的安装与卸载 1.1数据库的卸载&#xff1a; &#xff08;1&#xff09;第一种卸载方式&#xff1a;删除文件目录 &#xff08;2&#xff09;第二种卸载方式&#xff1a;在控制面版中卸载&#xff0c;然后在c盘里找到mysql文件删除 1. 2.在隐藏目录programdata里 1.2…

新王Claude 3.5的6大应用场景

Anthropic AI深夜发布了备受期待的Claude 3.5系列更新&#xff0c;包括了全新升级的Claude 3.5 Sonnet和首发的Claude 3.5 Haiku。 Claude 3.5 Sonnet能够理解细微的指令和上下文&#xff0c;识别并纠正自身错误&#xff0c;还能从复杂数据中生成深入的分析和洞察。 结合最先进…

从零入门扣子Bot开发

从零入门扣子Bot开发 工作流简单介绍问题思考工作流实例 图像流简单介绍瘦脸图像流的设计创建图像流设计流程 总结参考链接 工作流简单介绍 工作流起源于生产组织和办公自动化领域&#xff0c;是指在计算机应用环境下&#xff0c;对业务过程的部分或整体进行自动化处理。它通过…

文理学院数据库应用技术实验报告0

文理学院数据库应用技术实验报告0 实验内容 打开cmd,利用MySQL命令连接MySQL服务器。 mysql -u root -p查看当前MySQL服务实例使用的字符集(character)。 SHOW VARIABLES LIKE character_set_server;查看当前MySQL服务实例支持的字符序(collation)。 SHOW VARIABLES LIKE c…

Unity编辑器 连接不到SteamVR问题记录

问题表现&#xff1a;之前正常的工程&#xff0c;某天打开后运行&#xff0c;在SteamVR未打开时&#xff0c;Unity工程运行后无法调用起来Steam VR&#xff0c;无任何反应&#xff0c;但用其他软件则可以调用起来SteamVR&#xff0c;并且运行正常&#xff0c;在重装了XR的一些插…

【网络面试篇】从输⼊ URL 到⻚⾯展示到底发⽣了什么?

目录 一、大致流程 1. 流程概述 2. 全流程描述 二、流程解析 1. URL 解析 2. DNS 查询 3. TCP 连接 4. 渲染页面 一、大致流程 1. 流程概述 &#xff08;1&#xff09;URL 解析 &#xff08;2&#xff09;DNS 查询 &#xff08;3&#xff09;TCP 连接 &#xff08…

「C/C++」C/C++标准库之#include<cstdlib>通用工具库

✨博客主页何曾参静谧的博客&#x1f4cc;文章专栏「C/C」C/C程序设计&#x1f4da;全部专栏「VS」Visual Studio「C/C」C/C程序设计「UG/NX」BlockUI集合「Win」Windows程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「PK」Parasoli…

消息会话—发送消息自动滚动到最底部

背景 在项目开发中&#xff0c;实现用户友好的输入交互是提升用户体验的关键之一。例如&#xff0c;在消息会话页面中&#xff0c;为了确保用户在发送新消息后页面能自动滚动到最底部&#xff0c;从而始终保持最新消息的可见性&#xff0c;需要实现自动滚动功能。这不仅提升了…

【教程】如何查看IEEE会员证书Membership Card

转载请注明出处&#xff1a;小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你&#xff0c;欢迎[点赞、收藏、关注]哦~ 1、先打开以下网站&#xff0c;并登录你的账号&#xff1a; https://www.ieee.org/profile/myprofile/myprofile.html 2、如果你没有缴费注册会员&…

ENGAGE SHE连锁品牌盛启,寻找更多城市合伙人

在这个充满个性与品质追求的时代,饰品已悄然超越了单纯装饰的范畴,它成为了每个人独特个性的展现,是生活态度的鲜明宣言。自2021年成立以来,ENGAGE SHE凭借其“自在、自然、清新”的独特品牌风格,以及“简约、品质、设计”的核心理念,迅速在时尚界掀起了一股清新之风,赢得了无数…

Segugio:一款针对恶意软件的进程执行跟踪与安全分析工具

关于Segugio Segugio是一款功能强大的恶意软件安全分析工具&#xff0c;该工具允许我们轻松分析恶意软件执行的关键步骤&#xff0c;并对其进行跟踪分析和安全审计。 Segugio允许执行和跟踪恶意软件感染过程中的关键步骤&#xff0c;其中包括从点击第一阶段到提取恶意软件的最…

中航资本:什么是主板创业板及科创板?主板创业板及科创板有什么区别?

什么是主板创业板及科创板&#xff1f; 主板、创业板和科创板都是股票商场的组成部分。 主板商场分为沪市主板和深市主板&#xff0c;首要服务与有安稳的盈利才华、较大的本钱规划和较强的商场竞争力的企业。 创业板首要服务于成长型、中小型、高新技术企业等&#xff0c;包…

1.3 面向对象 C++面试问题

1.3.1 简述一下什么是面向对象,面向对象与面向过程的区别 什么是面向对象 面向对象&#xff08;Object-Oriented Programming&#xff0c;OOP&#xff09;是一种编程范式&#xff0c;它通过将现实世界中的实体抽象为“对象”来组织代码。面向对象编程关注对象及其交互&#x…

酷睿 Ultra 200S核显相当于GTX 1050Ti?4核心表现出人意料

原文转载修改自&#xff08;更多互联网新闻/搞机小知识&#xff09;&#xff1a; 酷睿 Ultra 200S核显评测&#xff0c;GTX 1050Ti水平能玩3A 酷睿 Ultra 200S系列CPU是真没什么好聊的&#xff0c;不过作为陪衬&#xff0c;毫无存在感的Arc核显倒还算真的有点意思&#xff0c;…

netty之导入源码到idea

写在前面 本文看下如何导入netty源码到idea中。 1&#xff1a;环境准备 idea&#xff1a;IntelliJ IDEA 2021.1 (Ultimate Edition) jdk&#xff1a;1.8 netty&#xff1a;4.1.58.Final os&#xff1a;win102&#xff1a;开始 2.1&#xff1a;下载netty源码 点击。 2.2&…

k8s部署使用有状态服务statefulset部署eureka集群,需登录认证

一、构建eureka集群镜像 1、编写dockerfile文件&#xff0c;此处基础镜像为arm版本&#xff0c;eureka目录中文件内容&#xff1a;application-dev.yml、Dockerfile、eureka-server-1.0-SNAPSHOT.jar(添加登录认证模块&#xff0c;文章最后附上下载连接) FROM mdsol/java8-j…