前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

京东零售总监胡浩深度解析:大模型如何重塑京东供应链,实现智能预测与决策

NEXTECH
Last updated: 2025年10月16日 上午6:54
By NEXTECH
Share
27 Min Read
SHARE

京东零售总监胡浩深度解析:大模型如何重塑京东供应链,实现智能预测与决策

在AI大模型技术席卷各行业的当下,供应链领域也迎来了深刻变革。京东零售智能供应链技术负责人胡浩在2025京东全球科技探索者大会上,围绕大模型在京东供应链的应用实践,从需求预测、智能决策两大核心环节,到技术挑战与未来愿景,展开了全面分享,为行业呈现了供应链智能化的清晰路径。

Contents
京东零售总监胡浩深度解析:大模型如何重塑京东供应链,实现智能预测与决策胡浩总监的核心观点:一、需求预测:供应链的“发动机”,从传统模型到大模型的跨越二、时序大模型构建:三大挑战与京东的破局之道三、智能决策:运筹大模型破解“建模难、求解难、解释难”四、未来愿景:从“精确求解”到“超级智能体”,构建供应链数字人

胡浩总监的核心观点:

  1. 双轮驱动定义下一代供应链。 大模型与运筹优化并非相互替代,而是优势互补。大模型有效解决了工业建模中模型繁多、迭代缓慢、泛化能力弱的痛点,使供应链更加智能灵活;运筹优化则坚守精准求解的底线,确保决策高效可靠。两者共同构成了下一代智能供应链的核心驱动力。

  2. 大模型实现供应链通用预测。 凭借海量跨领域数据预训练,大模型突破了传统模型的表征能力限制,无需大量微调即可快速适配新场景,从而使通用预测成为可能。

  3. 京东数据是时序大模型关键。 公开数据集普遍存在“量级小、规律性强”的问题,这使得大模型的“规模定律”难以充分发挥,小模型便足以满足需求。然而,京东的数据具备“复杂性、丰富性”的独特优势——其千万级SKU涵盖了长尾建设性需求与频繁促销的畅销品需求,为百亿级时序大模型的训练提供了优质样本。

  4. 运筹大模型破解决策难题。 结合大模型的认知推理能力与运筹优化的精确求解能力,可以实现自动化建模、加速求解,并能将复杂的数学语言转化为业务语言,提升方案采纳度,从而有效破解供应链决策中的三大难题。

  5. 未来目标是供应链数字人。 京东智能供应链的未来愿景是构建自主协同的数字人,形成数字员工与人类员工高度协同的供应链新模式。

京东零售智能供应链技术负责人 胡浩

一、需求预测:供应链的“发动机”,从传统模型到大模型的跨越

需求预测是供应链的源头与“发动机”,直接驱动库存计划、采购、履约等下游所有运营动作。目前京东每天需预测千万级SKU的未来需求量,若细化到区域、DC维度,预测量级更是达到亿级别,持续优化预测准确度成为核心工作。

回顾技术演进,京东的需求预测经历了多代模型迭代:

  • 统计预测阶段: 以ARIMA、指数平滑为代表,能有效捕捉简单线性趋势,但面对复杂非线性关系则“力不从心”。

  • 机器学习阶段: 依靠SVM、XGBOOST等模型,通过特征工程学习到比较复杂的非线性关系,但优质特征工程高度依赖专家经验与海量实验。

  • 深度学习阶段: 2017年起,以Transformer为代表的深度模型实现突破,能自动拆解时间序列、完成表征自动化学习,解决了海量特征工程难题,同时在长序列预测上取得了突破进展。

  • 大模型阶段: 2022年至今,大模型彻底改变了预测逻辑。过去,京东在尝试将销量预测模型迁移至其他零售商时,受限于模型规模,需要工程师进行大量微调。如今,大模型凭借海量跨领域数据预训练,使得通用预测成为可能,并真正突破了传统模型的表征能力。

以某款手机销量预测为例,传统模型仅依赖历史销量、促销信息,而大模型能整合发布会热度、竞品口碑、消费者购机周期等多元信息,将预测准确度提升到新高度。

二、时序大模型构建:三大挑战与京东的破局之道

要打造适配供应链的时序大模型,京东面临数据、架构、幻觉三大核心挑战,并逐一找到了针对性解决方案。

You Might Also Like

ChatPPT与魔搭社区合作,MCP 2.0重磅升级:全链路智能体服务及多模式开源
Transformer大模型驾驭计算机视觉:四大核心任务实战与交互应用
LLaMA Factory 安装与配置指南:在 Ubuntu 上快速搭建大模型微调平台
语义治理:AI时代新一代数据治理方法(下)——实施落地、关键技术与组织变革

挑战一:数据规模与质量,决定模型效果的“基石”

训练百亿级参数的时序大模型,充足且高质量的数据是前提。公开时序数据集普遍存在“量级小、规律性强”的问题,这使得大模型的“规模定律”难以充分发挥,小模型便足以满足需求。然而,京东的数据具备“复杂性、丰富性”的独特优势——其千万级SKU涵盖了长尾建设性需求与频繁促销的畅销品需求,为百亿级时序大模型的训练提供了优质样本。

为进一步提升数据质量,京东构建了包含京东数据、公开数据、合成数据的混合数据集,总规模达218B Token。其中,合成数据是关键创新:通过拆解原始数据(基线销量、趋势、周期性)、多维度汇总(区域→DC→全国、SKU→品牌→品类),让模型更快学习数据规律。经过实验验证,三者按7:2:1的配比投入训练,效果最优。

挑战二:模型架构选型,平衡“准确度”与“适配性”

时序预测的大模型技术路线主要有两种:基于现有大模型微调、从头训练时序大模型。前者需解决时序数据与大模型的适配问题,但受限于大语言模型内在结构,无法很好捕捉时序长期依赖。

因此,京东选择“从头训练”,基于Transformer设计工业时序大模型,采用“Encode only+PatchConv”架构:Encode only用于强化大模型的表征能力与长期模式捕捉能力,PatchConv通过时序分段、转移,更好地提取时序特征。同时,京东训练了0.3B、1.6B、6B、10B四种不同尺寸的模型(10B为业界当前最大尺寸时序大模型),以平衡性能与精度。

挑战三:幻觉问题,时序预测的“隐形陷阱”

相比语言大模型,时序大模型对幻觉的要求更高、判断更难——例如,销量突然激增的异常情况隐藏在连续时间序列中,难以通过语义理解检测。传统基于人类反馈的强化学习(RLHF)框架在此不适用,核心问题包括:连续时序输出无法用离散奖励函数评估、PPO框架训练收敛慢、幻觉检测需重新设计规则。

针对这些痛点,京东设计了专属的时序策略优化框架(TPO):通过简化奖励函数(对预测准确度奖励、对稳定性惩罚),大幅提升训练效率与预测稳定性。实践显示,加入TPO后,模型训练效率提升3倍,预测准确度在基础提升10个点的前提下,进一步再提升4-5个点。

目前,名为“OxygenForecast”的时序大模型已正式投入京东生产系统,支持百万级商品自动化补货,显著提升供应链计划与库存运营准确性;在电力、天气、交通等七大公开数据集测试中,无论Zero Shot还是微调后效果,均大幅领先行业标杆模型。

三、智能决策:运筹大模型破解“建模难、求解难、解释难”

需求预测之后,供应链的智能决策同样关键。过去,京东面对仓网规划、库存布局等不同场景,需建立高度细分的模型,过程中面临三大难题:建模难、求解难、解释难。

  • 求解难: 京东拥有1000万+SKU和1600多个仓库,不同场景(如仓网规划需考虑节点层级、线路,目标是降本提效;库存布局需关注单量、SKU规模,目标是快周转、高现货)的约束条件差异大,导致问题复杂度飙升。

  • 解释难: 运筹优化模型求解后,需将数学语言转化为业务语言(如“为何从这个仓库发货”、“成本节约来自哪里”),帮助业务人员理解并采纳方案,这一过程往往耗时费力。

而大模型与运筹优化的结合,催生出了“运筹大模型”——通过大模型的认知推理能力,搭配运筹优化的精确求解能力,可实现自动化建模、加速求解、方案自解释,完美破解三大难题。

针对不同类型的决策问题,京东运筹大模型采取了差异化策略:

  • 易解问题: 构建“问题-数学模型-求解代码”的PMPMC数据集,基于大模型微调后实现自动化求解。测试显示,常规线性规划问题的求解准确度已达93%。

  • 难解问题: 聚焦仓库选品调拨、凑车等9类供应链垂直场景,在PMC模型基础上增加“问题类型标签”(如大规模信息问题),让大模型学习用启发式方法求解。目前已完成100次以上规模化解题。

  • 解释性问题: 搭建完整解释性框架,大模型先梳理优化模型的决策逻辑,再用分层框架拆解复杂问题,最后通过多目标量化(时效、成本、拆单等指标对业务的影响),让业务人员不仅拿到方案,更理解“为何是这个方案”。

四、未来愿景:从“精确求解”到“超级智能体”,构建供应链数字人

胡浩强调,大模型给京东智能供应链带来的变革,远不止预测与决策的优化。当前,京东智能供应链正从“基于运筹优化的精确求解阶段”,迈向“以大模型为核心的认知理解阶段”,最终将走向“超级智能体自主决策阶段”。

这一演进的愿景,是希望构建“自主协同的供应链数字人”——未来,供应链不再依赖零散的补货建议或配置下单,而是拥有像“采购专员”一样的数字员工:

  • 能自主完成库存布局、主动发起采购、持续优选周转效率;

  • 可实时感知库存波动、趋势变化、流量起伏与市场动态;

  • 能接收业务人员指令,自动完成需求预测、采购下单、供应商跟单;

  • 遇到问题时,可主动发起协同、升级流程以解决问题。

届时,供应链将进入“人类员工与数字员工高度协同”的新时代,无数智能体相互配合,推动供应链效率与灵活性实现质的飞跃。

从时序大模型革新需求预测,到运筹大模型优化智能决策,再到对供应链数字人的未来构想,京东用实践证明:大模型不是对传统供应链技术的替代,而是与运筹优化等技术“优势互补、双轮驱动”的核心力量,它正在重新定义供应链的智能化边界,为行业提供了可借鉴的宝贵经验。

TAGGED:供应链大模型智能预测运筹优化
Share This Article
Email Copy Link Print
Previous Article RAG系统架构图 2025年RAG最佳Reranker模型:深入解析其工作原理、优势与选择
Next Article 20251016065749854.jpg Meta联手Arm:AI系统告别x86,迈向高效新纪元
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技
20251202112744609.jpg
马斯克预言:AI三年内解决美国债务危机,可信吗?
科技

相关内容

RAGFlow 聊天执行过程详情查看
AI 前沿技术

RAGFlow 开源RAG引擎深度解析:功能、部署与优化实践

2025年11月1日
ChatGPT调用Zillow搜索公寓示例
AI 前沿技术

Apps inside ChatGPT:OpenAI从模型卖家到平台帝国的跃迁与影响

2025年10月8日
AI 前沿技术

谷歌DeepMind CEO与Gemini负责人深度对话:揭秘Gemini 3三大技术突破

2025年11月20日
传统工具调用流程示意图
AI 前沿技术

MCP上下文爆炸怎么办?Anthropic给出了新答案(图文示例) 介绍 MCP 上下文爆炸问题及 Anthropic 给出的代码执行模式解决方案

2025年11月8日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up