聊一聊电商中的需求预测

发布时间：2022-12-12 13:35:18 所属栏目：教程来源：网络

导读： 分享一点做需求预测的经验。我们先看应用场景，然后介绍问题，再分析它的难点，最后讲解题思路。说明一下，个人经验仅供参考，难免有不对的地方，欢迎读者朋友指出问题。
业务场景
需求预测

分享一点做需求预测的经验。我们先看应用场景，然后介绍问题，再分析它的难点，最后讲解题思路。说明一下，个人经验仅供参考，难免有不对的地方，欢迎读者朋友指出问题。

业务场景

需求预测的主要目的是补货，而补货需要提前计划。换句话说，不会等到缺货了再补。

问题是什么时候补，以及补多少货。补多了占用资金，还增加仓储成本，补少了又损失销售。做需求预测就是为了缓解这样的问题。

需求预测除了补货，其他场景也会用到。下面举几个例子。

包材采购运货需要包材，比如纸箱、塑料袋、填充物。商品的需求量越大，包材的需求量也越大。

库存调度如果有多个仓库，仓库之间要调拨库存，那么调度量与商品的需求量相关。

人力安排仓库要安排人力，人力需求取决于单量需求，与商品需求正相关。

选品定价电商搞促销，涉及选品和定价，这就需要预测商品在某个价格段的需求量。

总的来说，需求预测是电商业务的基础服务，在各业务环节都有应用，比如营销、供应链、物流，甚至是客服。做好需求预测，可以改善整个业务链路的成本和效率。

问题介绍

需求预测就是预测商品未来的需求量。

具体来说，可以按商品、时段、渠道等维度，对问题进行定义。商品可以是 SKU、SPU、类目等，时段可以是日、周、月、年等，渠道有自营渠道、三方渠道等等。

从时效性看，可以分为离线预测和实时预测。离线预测产出离线数据表。实时预测是线上服务，由用户提供输入，例如价格、渠道等信息，然后输出预测结果。

从结果来看，可以分为点预测、区间预测、概率分布预测。常见的是点预测，每个预测结果是一个数值。区间预测输出的是一个范围，或者说区间。

而概率分布预测，预测的是概率分布，既可以输出点预测值，又能输出区间。

电子商务发展测试与预测方法_成都商务酒店收入预测_惠州房价五年发展预测

总结一下，需求预测不是一个问题，而是一系列的问题。定义它的时候，维度不同，取值不同，那么问题就不同，难易程度也不同。

难点分析

需求预测很难，技术只是一方面，更多是业务层面。处理好这些难点，是做需求预测的基础。

理解业务

这里说的业务，不是概念或者框架层面，而是在执行层面，是要理解数据背后的细节。

举个例子，缺货怎么定义。

销量为零是不是？不一定，没有销量，但可以有库存。

库存为零呢？也不一定，可能是清仓。排除清仓，还可能是组合装，没库存也不影响单品销售。

这还没完，如果用户退货，库存从零变为正，还算不算缺货？

计算库存的时候，其实是分渠道的。有些渠道可以共享库存，有些则不会，所以说还要看共享库存。

你看看，理解业务不简单。

业务变化

业务是快速变化的。这直接影响到商品的销售。下面举几个例子。

第一，商品迭代。包括上新、改进和废弃。产品在变，需求也跟着变。

第二电子商务发展测试与预测方法，客户端迭代。电商业务的交易主要在线上，客户端的迭代，会影响流量入口，甚至是交易链路。

第三，运营策略变化。比如定价策略、运营栏目、促销玩法、图片文案等等，这些直接影响销售结果。

你想想，怎么捕捉业务变化。

周期性

电商业务有周期性，周期越长越难处理。下面说两个例子。

一是商品的季节性。比如衣服，大多只卖一季，次年出新款；二是促销活动，年年有大促，但玩法不同，定价也不同。

周期长或者重复性低，意味着历史数据的参考性就弱，于是预测就不好做。在估不准的情况下，要想办法降低损失。

脏数据

脏数据主要体现在数据的失效、异常、错误和缺失。由于业务变化、系统问题、操作不当、或者取数逻辑不一致等原因，脏数据很难避免。

避免不了脏数据，至少得识别。识别出来，就要改善。这属于基建，投入大减小慢，那怎么实现短期业务价值。

提前期

商品从下订单，到生产，再到入库，总的时间称为提前期，这是补货需要提前的时间长度。

不同商品的提前期不同，短的两周左右，长的六个月甚至一年。提前期越长，未知因素越多，越不容易做预测。

缩短提前期，其实是一条捷径。预测的时段缩短，问题就更容易。但是呢，改进业务流程也很难。

作为技术同学，要不要推业务，或者怎么推，这是个问题。

解释性

从算法的角度看，预测效果最重要。但这样不够，还要能解释预测逻辑，并且在出现异常后，给出原因分析。

这么做是必要的：一是容易发现异常；二是方便调整预测结果；三是让使用方觉得可靠。

难点是怎么解释，才能让人信服。如果对方不懂技术，应该怎么做。

技术方案

从技术角度来看，需求预测的流程大致是这样的。

成都商务酒店收入预测_电子商务发展测试与预测方法_惠州房价五年发展预测

这个流程没什么新东西，关键在于执行。每一步是不是做到位，是不是发挥作用，而不是在走过场。

强调一下数据探查，这个环节很必要，不要急着建模调参。

这一步主要是可视化，去发现数据规律，甚至是业务问题，便于快速验证想法。这样可以减少试错的成本。

下面重点讲模型和评估。

模型

常见的预测模型可以分为四类：

规则模型

根据人的经验（先验知识）来拟合历史数据。例如，先计算基础销量，再叠加节日、营销、季节等参数。不同参数可以用不同的数据去拟合。常用的方法是统计和回归。

它的优势是解释性好，缺点是工作量大。业务如果变化快，规则就容易失效，就需要更新规则。

时序模型

主要指低维的时间序列模型，比如自回归模型 (ARIMA)、指数平滑方法 (Holt-Winters)、分解方法 (STL)，或者这些方法的结合 (Prophet)。

时序模型的优点是可以拟合周期性和趋势（下图），缺点是不适合处理大量特征。

惠州房价五年发展预测_电子商务发展测试与预测方法_成都商务酒店收入预测

话务量、单量、流量等数据，常常会有类似的特点。

决策树模型

决策树是树结构的分类模型。输入特征向量，经过树的节点判断，然后输出预测值。常见的树模型有 XGBoost、LightBGM 等。

树模型的优点是，能够处理较多的特征，可以把售价、商品属性、节假日、运营玩法、优惠券、红包等多种因素，都综合考虑进来，而且对计算资源要求不高。

树模型的缺点主要有两个：一是需要做特征工程，清洗数据和构建特征有一定的成本；二是由于考虑因素较多，训练和推断是黑盒，不容易解释结果。

深度学习

深度学习的优点是自动化处理特征（例如做卷积），进而去拟合海量的数据，比如 DeepAR、WaveNet、Transformer 等。

它跟树模型比起来，省去了人工构建特征的工作。缺点是更难解释，对数据量和计算资源要求高。

总的来说，这四类模型各有利弊，没有绝对的好和坏。具体怎么选择，取决于业务实际，比如数据质量、计算资源、业务流程、人员水平等等。

评估

要评估预测效果，就要看准确率，或者说偏差率。但定义它并不容易。

举个例子，业界常用“百分比绝对误差”，即预测偏差的绝对值与真实值的比值。注意到，如果预测值偏低，误差的上界是100%；如果预测偏高，误差上界是无穷大。

换句话说，这个指标对偏高的惩罚大。为了降低误差，算法结果就得偏低，于是容易造成缺货。

定义误差指标应该慎重，最好是结合下游的业务目标。下游是补货，还是营销，或者安排人力等等，业务不同要求就不同。例如，人力安排可以接受预测偏高，但不太接受偏低。

由于篇幅有限，关于误差指标的选择这里不展开讨论。

总结

需求预测很难，因为需求本身有随机性。除此以外，既有业务因素，又有技术因素。要做预测，算法模型很重要，但模型不是全部。

其他环节也很重要，比如信息收集、流程审批、仓网规划、采销联动等等，这些都可以去优化需求预测或者补货的效果。

既然预测是不准的，如何衡量这种不确定性，又如何降低损失，也是要考虑的问题。前文没有讲到，这里提一下思路。

用概率分布描述不确定性，计算每一种情形下的损失，选择平均损失最小的方案。这就是决策模型该做的事。

从补货场景来看，需求预测与补货决策不应该割裂，而是要把它们看成一个系统，因为根本问题是如何决策。有决策模型的帮助，可以让决策的效率和质量更高，具体可以参考这篇《智能补货系统的设计思路》。

（编辑：天瑞地安资讯网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

linux里nagios pnp4na	电脑死机,教您如何处理
内存卡,教您如何解决内	intelcpu哪款好 intel