亚洲唯一!京东荣获2024年度Gartner供应链技术创新奖背后的创新探索

序言:

序言:2月14日晚间,Gartner公布了2024年度Garter Power of the Profession供应链大奖,京东集团荣获供应链技术创新奖,成为获得该奖项的唯一亚洲企业。Gartner Power of the Profession供应链奖项已经举办十年,是衡量企业供应链创新能力的国际权威奖项。入围决赛的共有5家企业,另外4家分别是谷歌、思科、MTN集团、Allina Health。京东智能供应链Y业务部研发的“基于概率分布预测以及解释性AI的弹性计划技术”,在激烈的竞争中获得冠军,历年的冠军包括微软、辉瑞、壳牌等。此外,几个月前,京东还凭借端到端库存管理等技术入围了2023年弗兰兹厄德曼奖(Franz Edelman Award)总决赛,这是一项由美国运筹学与管理科学学会(INFORMS)设立的管理科学界的最高奖项,被誉为工业工程领域的“诺贝尔奖”,旨在表彰运用运筹学和管理科学在实际应用中产生巨大价值的工作。

过去一年,京东零售技术团队持续探索创新。在供应链方向,通过提出并应用端到端库存管理技术和可解释AI技术,实现了更快的库存周转和更高效的供应链决策、协同。这是2023京东零售技术年度盘点深度文章系列的第三篇,希望能为技术同学们带来一些启发或帮助。



一、供应链决策中的超级难题:如何在保证可解释性的情况下提升预测精度?

销量预测是供应链决策的关键组成部分,其准确性直接影响库存控制、资金安排、生产计划和市场策略。销量预测在传统上依赖于基于统计方法的时间序列模型,但是随着计算能力的提升和数据采集技术的进步,预测方法逐渐演变为更为复杂的机器学习算法,能够处理更多维度的数据并捕捉更深层次的非线性关系。

总体来看,销量预测的发展经历了三个阶段:传统统计方法、机器学习方法以及混合算法。传统的统计方法如ETS、ARIMA等,具有清晰的数学结构,但只能处理简单的时间序列数据,无法捕获外生变量的影响,很难进一步提高预测精度。随着电商规模快速发展,商品规模越来越大,传统方法在复杂场景的效果劣势则逐渐显现出来,而机器学习算法由于其强大的拟合能力开始备受追捧,如 xgboost、LSTM、Transformer等。

然而,目前的机器学习算法普遍是黑盒化的,可解释性的缺乏已经成为这些算法在供应链实践中的一个关键障碍。针对传统方法及机器学习方法的劣势,混合算法逐渐走进大众的视野。混合算法通过将统计模型与黑盒 ML 算法相结合以提高预测准确性和可解释性,如N-BEATS 和 NBEATSx 。但是这些混合算法存在明显的问题:一方面,现有的混合算法与供应链场景匹配度低,仅仅考虑趋势、季节等固有的时序因素,无法量化营销、促销等特有因素的影响,因此在供应链场景下无法保证可解释性;另一方面,现有的混合算法通常依赖于具有统计假设的理论模型,只关注各成分的准确性,不考虑全局信息,导致准确性的下降。

而对于京东供应链来说,商品补货的决策直接影响生产,所以对于算法的要求不仅仅是准确率,而需要有高度的可解释性,才能获取业务的信任。尤其是针对头部商品,会有补货不足的风险,造成缺货,影响采销的销售计划达成,所以业务需要知道预测结果是如何得到的,比如预测考虑了哪些因素,每种因素带来的影响有多大等等,提升业务的可控度及信赖度。京东智能供应链团队致力于打造一套针对供应链场景下全新的可解释预测算法,其中如何保证可解释性的情况下提升预测精度是最主要的挑战,关键要解决两个技术难点:

(1)高可解释性约束下现有的算法准确性较差

在时间序列预测中,基于时序分解的算法将时序分解为不同的成分,可解释性较强,因此被广泛使用,但是基于传统统计的时序分解算法由于其无法考虑多序列预测及对于复杂场景的拟合能力较差,所以准确性较差。采用这些方法会造成大量的低质量的备货及库存冗余,增加仓储成本。因此如何保证可解释性的情况下提升预测准确率是最大的技术难点。

(2)现有的混合算法全局拟合能力差,与供应链场景匹配度低

为了提高预测精度,最近的可解释算法通常将机器学习方法(ML)与分解相结合,但是现有的混合算法通常依赖于具有统计假设的理论模型,只关注各成分的准确性,不考虑全局信息,而供应链场景下各成分的因素相互依赖,采用统计假设的理论模型难以拟合,这种方式脱离了实际的业务场景,从而导致系统使用率较低,补货不及时等,缺货导致用户买不到自己想要买的商品,影响商品的销售额。

由此,智能供应链团队提出了一种新的可解释预测技术,这是一种新的混合算法,构建了通用的可解释算法框架保证高扩展性,在不同的复杂场景下可解释性及准确性均大幅的提升,主要创新包括:

1.预测流程及结果可解释,大幅提升用户的信任

新的可解释预测技术输出给下游的预测不再是一个最终预测值,预测输出由多个需求因素组成,如基线、促销、营销等,并且基于京东大规模的订单销售、促销等数据,通过因果推断的方式实现数据到模型输入及过程的因果逻辑,既提升了复杂场景的拟合能力,同时让业务了解整个预测流程的流转。比如促销场景下,通过因果算法刻画促销预测量的上升是由于输入的促销数据中业务提报的秒杀促销引起,从而让业务了解整个预测流程的流转,最终通过可解释性的预测指导用户做出准确的补货决策,大幅提升用户的信任。

2.提出了一种通用的结合分解和ML的可解释预测算法

智能供应链团队提出了一种通用的结合分解和ML的可解释预测算法(W-R算法),W-R算法构建了一种通过加权变体的加法组合函数形成的可解释加法模型,既通过分解的范式保证时序的可解释性,又通过深度的权重及残差网络考虑全局信息提升预测准确性,提升了模型全局化拟合能力,解决了现有时序分解算法准确性较差问题。W-R算法整体分成两个阶段,第一阶段是初始分解模块,通过自定义的分解模块去估计分解的成分,保证预测的可解释性,如在自营场景下:预测 = 基线+促销+营销 。第二阶段为ML调整模块,通过构建加权变体加法组合函数去拟合初始分解成分的全局参数,提升预测准确性,自营场景下:预测 = 基线权重*基线+促销权重*促销+营销权重*营销 +残差,根据权重及残差网络估计相应的权重及残差,最终输出加权的加法组合预测,总体来看既保证可解释性,也保证了准确性。

未来来看,可解释的预测将是供应链领域的重点方向之一,后续智能供应链团队将从全流程可解释、自动诊断归因、计划可解释等多个方向迭代优化可解释预测技术,从而更好的服务下游决策,提升供应链效率。

二、端到端库存管理的策略和模型设计

库存管理是供应链管理中重要的一环,决策者需要根据用户需求、销售计划和供应商能力等信息,安排合理的补货和销售计划。实践中,诸多因素导致库存管理是一项复杂的难题。例如用户需求具有高度的不确定性,商品的种类和数量十分庞大,供应链中间环节较多,供应商送货时间和送货量也有波动性。另一方面,如果库存管理的决策失准,造成的影响也是巨大的。如果对消费者需求预估不足,导致补货数量偏低,会造成频繁的缺货现象,从而影响消费者购物体验,也给平台造成销售损失。如果过高估计了消费者需求,造成补货数量偏高,会导致大量的冗余库存,产生过高的存储费用,同时也占用大量现金流,造成资金浪费。因此,如何应对库存管理这一既重要又有挑战的任务,成为供应链管理中的首要任务。

传统的库存补货方法大多先基于历史数据来预估未来需求,再结合供应商补货提前期(VLT,从向供应商订货到收货完成的时间)等信息,来确定合适的补货策略。这种方式被称为“先预测再优化”框架(Predict-then-optimize, PTO)。然而,PTO框架将整个补货过程拆分为了预测和优化两个阶段,而输入数据经过第一阶段处理后往往会造成信息损失,因此在后续的优化阶段中无法充分利用原始数据,导致决策偏差。而对于京东场景而言,庞大的商品种类和数量,用户需求的高度随机性,各类意外事件(例如恶劣天气、疫情等)对供应链的影响和冲击,均会进一步提升需求预测中的误差,最终导致供应链成本增加,消费者满意度下降。

为解决上述问题,京东智能供应链团队提出端到端(End-to-end)库存管理技术,基于多分位数循环神经网络(MQRNN)算法,利用商品历史销量、历史采购节奏、供应商履约等数据,直接通过模型来决策最佳补货量。

该模型先使用历史采购数据、销量数据、库存数据,采用基于动态规划框架提出的最优补货量决策模型,确定历史各个下单时间的最优补货量;再基于历史销量信息、送货提前期信息、下单周期、初始库存以及最优补货量构建特征库并生成学习样本;随后设计基于多分位数循环神经网络的深度自学习模块,针对学习样本进行训练优化;最后基于学习后的深度自学习模块进行预测销量、送货提前期以及下单量,实现端到端补货方法。

如图所示,端到端模型的输入项包含5类,分别是需求预测相关特征、商品基础特征(例如品类、品牌、仓库信息等)、供应商送货时长特征、库存盘点周期特征和初始库存水位信息。这些输入信息经处理后进入隐藏层,包括需求预测子模块、送货时长模块和优化决策模块。模型最终输出项包括3类,第一项是最终的补货决策,是模型的主要输出,第二、三项是同时生成的需求预测结果和供应商送货时长预测结果。由于缩短了决策流程,减少了中间环节预测误差累积对决策效果的影响,端到端模型提升了补货精准度,有效降低成本。

图 端到端补货模型示意

这两项技术上线以来,供应链预测准确度提升7%,现货率提升2%,库存周转优化接近2天,带来数亿元的持货成本节约。以这两项技术为基础的自动补货系统,已实现超过85%的自动化率。

目前,京东作为中国最大的零售商,为近6亿活跃用户提供超过1000万种自营商品。京东自建的覆盖全国的完善物流体系,管理着超过1600个库房,运营着超大规模的物流车队。京东如此庞大的零售和物流业务,背后离不开卓越的供应链管理技术,包括库存管理、库房运营、配送履约等。得益于完善的供应链设施和先进的数智化技术,超过95%的京东自营订单可以实现当日达或次日达,平均库存周转天接近30天,现货率高于97%,达到了行业领先水平。未来,京东将继续通过数智化技术持续优化成本、效率、体验,致力于创造更大的产业价值和社会价值。

本文相关的具体技术细节,可分别参考论文:

https://doi.org/10.1287/mnsc.2022.4564

https://arxiv.org/abs/2212.06620

作者:京东零售智能供应链Y

来源:京东零售技术 转载请注明来源

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/410838.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

驻场人员严重划水,愈演愈烈,要请领导出面吗?

你有没有遇到过团队成员偷懒的情况?比如你们一起完成某个项目目标,干着干着你发现,就只有你和几个核心人员比较上心,很多人都在划水。 你可能会觉得这是因为大家工作态度不好,甚至怀疑他们的人品,忍不住想…

MoonBit支持云原生调试功能

MoonBit 更新 1. 支持云原生调试功能 现在,你可以通过访问try.moonbitlang.cn,直接在浏览器中使用 devtools 调试 MoonBit 程序,无需安装任何软件。具体的使用步骤如下: 2. MoonBit 支持使用 for 关键字定义的函数式循环控制流 …

ShardingJDBC分库分表

目录 ShardingSphere ShardingJDBC客户端分库分表 ShardingProxy服务端分库分表 两者对比 ShardingJDBC分库分表实战 需求 步骤 分片策略汇总 ShardingSphere ShardingSphere最为核心的产品有两个:一个是ShardingJDBC,这是一个进行客户端分库分表…

Linux命令行常用命令

初识shell shell是系统的用户界面,提供了用户与内核进行交互操作的一种接口。它接收用户输入的命令并把它送入内核去执行。实际上shell是一个命令解释器,它解释用户输入的命令并且把用户的意图传达给内核。(可以理解为用户与内核之间的翻译官…

npm/nodejs安装、切换源

前言 发现自己电脑上没有npm也没有node很震惊,难道我没写过代码么?不扯了,进入正题哈哈…… 安装 一般没有npm的话会报错: 无法将“npm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称而且报这个错,我们执行…

Order By Limit不稳定性

文章目录 前置解决不确定性场景1 Order By索引1.1 背景1.2 不确定性产生原因1.2.1 正常情况下1.2.2 但是 1.3 补充1.4 场景1总结 场景2 Order by id2.1 背景2.2 不会产生不确定性原因1原因2 2.3 推荐使用方式 场景3 filesort3.1 背景3.2 不确定性产生原因3.3 内存排序和磁盘临时…

内衣洗衣机哪个牌子好用?甄选安利四款优质好用的内衣洗衣机

内衣洗衣机是近几年新兴的一种家用电器产品,正日益引起人们的重视。但是,面对市面上品牌繁多、款式繁多的内衣洗衣机,使得很多人都不知道该如何选择。身为一个数码家电博主,我知道这类产品在挑选方面有着比较深入的了解。为此&…

数据结构2月25日

第一道: 第二道: 1、插入到prev和next中间 1.new(struct list_head*)malloc(sizeof(struct list_head*)); if(newNULL) { printf("失败\n"); return; } new->nextprev->next; prev->nextnew; return; 2、删除prve和next…

redis——客户端

Redis是一个典型一对多服务器程序,一个服务器可以与多个客户端进行网络连接,每隔客户端可以向服务器发送命令请求,而服务器则接收并处理客户端发送的命令请求,并向客户端返回命令请求。 通过是一个I/O多路复用技术实现的文件事件处…

3分钟快速实现串口PLC远程下载程序操作说明

3分钟快速实现串口PLC远程下载程序操作说明 搜索蓝蜂物联网官网,即可免费领取样机使用!!先到先得!!! 一. 适用产品型号 其余型号网关此功能正在开发中,敬请期待。 二. 远程下载功能使用流程 …

数据结构--双向链表专题

目录 1. 双向链表的结构2. 实现双向链表预先的准备初始化尾插、头插尾删、头删查找在pos位置之后插⼊数据删除pos位置的数据 3. 顺序表和双向链表的分析 1. 双向链表的结构 注意:这里的“带头”跟前面我们说的“头结点”是两个概念,为了更好的理解直接称…

Nginx的反向代理:实现灵活的请求转发和内容缓存

一、引言:代理服务器的简介 本节介绍代理服务器的基本配置。学习如何通过不同协议将 NGINX 请求传递给代理的服务器,修改发送到代理服务器的客户端请求标头,以及配置来自代理服务器的响应缓冲。 代理通常用于在多个服务器之间分配负载&…

tigramite教程(二)生物地球科学案例研究

文章目录 数据生成与绘图因果发现分析平稳性假设、确定性、潜在混杂因素结构假设参数假设使用PCMCIplus的滑动窗口分析聚合因果图非参数因果效应估计假设的图形和调整集干预的真实情况假设的参数模型和因果效应的估计使用关于图的不同假设进行估计非因果估计项目地址 这个文件…

力扣随笔之颜色分类(中等75)

思路:定义两个指针划分left,right划分三个区域left左边是红色区域,right右边是蓝色区域,left和right之间是白色区域;定义一个遍历指针遍历整个数组,遇到红色与left所指位置数字交换,并将left自加…

鸿蒙开发实战-手写一个Openharmony投屏工具

实战手写一个Openharmony投屏工具,实现代码分享如下: java import javax.imageio.ImageIO; import javax.swing.*; import java.awt.*; import java.awt.event.*; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOExcepti…

一篇文章告诉你ELK Stack是什么

目录 ELK Stack简介 ELK Stack优点 ELK Stack组成 Elasticsearch Elasticsearch简介 Elasticsearch主要特点 Elasticsearch核心概念 Elasticsearch的配置 Logstash Logstash简介 Logstash过滤器之grok正则匹配 Logstash过滤器之mutate数据修改 Logstash过滤器之Ge…

如何快速将每个图片做二维码?批量生成图片码的步骤

现在很多商品的包装上扫码都会展现出物品的图片信息,每个物品都会有单独的一张物品信息图片。那么当导出一批图片后,如何快速将每张图片单独生成一个二维码来使用呢?本文小编将通过图文内容给大家讲解一下图片二维码生成器的批量建码功能该如…

automatic_mine_sweeper —— A project review to improve myself

1. How to understand the whole structure of the project? 1.Cbutton.h 和 Cbutton.cpp文件: Cbutton.h文件- // Cbutton.h : main header file for the CBUTTON application //#if !defined(AFX_CBUTTON_H__240DD99D_BEDE_49BD_A960_3268C3644816__INCLUDED_…

Python实用技巧:处理JSON文件写入换行问题

Python实用技巧:处理JSON文件写入换行问题 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程 👈 希望得到您的订阅…

05 Flink 的 WordCount

前言 本文对应于 spark 系列的 Spark 的 WordCount 这里主要是 从宏观上面来看一下 flink 这边的几个角色, 以及其调度的整个流程 一个宏观 大局上的任务的处理, 执行 基于 一个本地的 flink 集群 测试用例 /*** com.hx.test.Test01WordCount** author Jerry.X.He* ver…