加入收藏 | 设为首页 | 会员中心 | 我要投稿 天瑞地安资讯网 (https://www.52baoding.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 网站设计 > 教程 > 正文

聊一聊电商中的需求预测

发布时间:2022-12-12 13:35:18 所属栏目:教程 来源:网络
导读: 分享一点做需求预测的经验。我们先看应用场景,然后介绍问题,再分析它的难点,最后讲解题思路。说明一下,个人经验仅供参考,难免有不对的地方,欢迎读者朋友指出问题。
业务场景
需求预测

分享一点做需求预测的经验。我们先看应用场景,然后介绍问题,再分析它的难点,最后讲解题思路。说明一下,个人经验仅供参考,难免有不对的地方,欢迎读者朋友指出问题。

业务场景

需求预测的主要目的是补货,而补货需要提前计划。换句话说,不会等到缺货了再补。

问题是什么时候补,以及补多少货。补多了占用资金,还增加仓储成本,补少了又损失销售。做需求预测就是为了缓解这样的问题。

需求预测除了补货,其他场景也会用到。下面举几个例子。

包材采购 运货需要包材,比如纸箱、塑料袋、填充物。商品的需求量越大,包材的需求量也越大。

库存调度 如果有多个仓库,仓库之间要调拨库存,那么调度量与商品的需求量相关。

人力安排 仓库要安排人力,人力需求取决于单量需求,与商品需求正相关。

选品定价 电商搞促销,涉及选品和定价,这就需要预测商品在某个价格段的需求量。

总的来说,需求预测是电商业务的基础服务,在各业务环节都有应用,比如营销、供应链、物流,甚至是客服。做好需求预测,可以改善整个业务链路的成本和效率。

问题介绍

需求预测就是预测商品未来的需求量。

具体来说,可以按商品、时段、渠道等维度,对问题进行定义。商品可以是 SKU、SPU、类目等,时段可以是日、周、月、年等,渠道有自营渠道、三方渠道等等。

从时效性看,可以分为离线预测和实时预测。离线预测产出离线数据表。实时预测是线上服务,由用户提供输入,例如价格、渠道等信息,然后输出预测结果。

从结果来看,可以分为点预测、区间预测、概率分布预测。常见的是点预测,每个预测结果是一个数值。区间预测输出的是一个范围,或者说区间。

而概率分布预测,预测的是概率分布,既可以输出点预测值,又能输出区间。

电子商务发展测试与预测方法_成都商务酒店收入预测_惠州房价五年发展预测

总结一下,需求预测不是一个问题,而是一系列的问题。定义它的时候,维度不同,取值不同,那么问题就不同,难易程度也不同。

难点分析

需求预测很难,技术只是一方面,更多是业务层面。处理好这些难点,是做需求预测的基础。

理解业务

这里说的业务,不是概念或者框架层面,而是在执行层面,是要理解数据背后的细节。

举个例子,缺货怎么定义。

销量为零是不是?不一定,没有销量,但可以有库存。

库存为零呢?也不一定,可能是清仓。排除清仓,还可能是组合装,没库存也不影响单品销售。

这还没完,如果用户退货,库存从零变为正,还算不算缺货?

计算库存的时候,其实是分渠道的。有些渠道可以共享库存,有些则不会,所以说还要看共享库存。

你看看,理解业务不简单。

业务变化

业务是快速变化的。这直接影响到商品的销售。下面举几个例子。

第一,商品迭代。包括上新、改进和废弃。产品在变,需求也跟着变。

第二电子商务发展测试与预测方法,客户端迭代。电商业务的交易主要在线上,客户端的迭代,会影响流量入口,甚至是交易链路。

第三,运营策略变化。比如定价策略、运营栏目、促销玩法、图片文案等等,这些直接影响销售结果。

你想想,怎么捕捉业务变化。

周期性

电商业务有周期性,周期越长越难处理。下面说两个例子。

一是商品的季节性。比如衣服,大多只卖一季,次年出新款;二是促销活动,年年有大促,但玩法不同,定价也不同。

周期长或者重复性低,意味着历史数据的参考性就弱,于是预测就不好做。在估不准的情况下,要想办法降低损失。

脏数据

脏数据主要体现在数据的失效、异常、错误和缺失。由于业务变化、系统问题、操作不当、或者取数逻辑不一致等原因,脏数据很难避免。

避免不了脏数据,至少得识别。识别出来,就要改善。这属于基建,投入大减小慢,那怎么实现短期业务价值。

提前期

商品从下订单,到生产,再到入库,总的时间称为提前期,这是补货需要提前的时间长度。

不同商品的提前期不同,短的两周左右,长的六个月甚至一年。提前期越长,未知因素越多,越不容易做预测。

缩短提前期,其实是一条捷径。预测的时段缩短,问题就更容易。但是呢,改进业务流程也很难。

作为技术同学,要不要推业务,或者怎么推,这是个问题。

解释性

从算法的角度看,预测效果最重要。但这样不够,还要能解释预测逻辑,并且在出现异常后,给出原因分析。

这么做是必要的:一是容易发现异常;二是方便调整预测结果;三是让使用方觉得可靠。

难点是怎么解释,才能让人信服。如果对方不懂技术,应该怎么做。

技术方案

从技术角度来看,需求预测的流程大致是这样的。

成都商务酒店收入预测_电子商务发展测试与预测方法_惠州房价五年发展预测

这个流程没什么新东西,关键在于执行。每一步是不是做到位,是不是发挥作用,而不是在走过场。

强调一下数据探查,这个环节很必要,不要急着建模调参。

这一步主要是可视化,去发现数据规律,甚至是业务问题,便于快速验证想法。这样可以减少试错的成本。

下面重点讲模型和评估。

模型

常见的预测模型可以分为四类:

规则模型

根据人的经验(先验知识)来拟合历史数据。例如,先计算基础销量,再叠加节日、营销、季节等参数。不同参数可以用不同的数据去拟合。常用的方法是统计和回归。

它的优势是解释性好,缺点是工作量大。业务如果变化快,规则就容易失效,就需要更新规则。

时序模型

主要指低维的时间序列模型,比如自回归模型 (ARIMA)、指数平滑方法 (Holt-Winters)、分解方法 (STL),或者这些方法的结合 (Prophet)。

时序模型的优点是可以拟合周期性和趋势(下图),缺点是不适合处理大量特征。

惠州房价五年发展预测_电子商务发展测试与预测方法_成都商务酒店收入预测

话务量、单量、流量等数据,常常会有类似的特点。

决策树模型

决策树是树结构的分类模型。输入特征向量,经过树的节点判断,然后输出预测值。常见的树模型有 XGBoost、LightBGM 等。

树模型的优点是,能够处理较多的特征,可以把售价、商品属性、节假日、运营玩法、优惠券、红包等多种因素,都综合考虑进来,而且对计算资源要求不高。

树模型的缺点主要有两个:一是需要做特征工程,清洗数据和构建特征有一定的成本;二是由于考虑因素较多,训练和推断是黑盒,不容易解释结果。

深度学习

深度学习的优点是自动化处理特征(例如做卷积),进而去拟合海量的数据,比如 DeepAR、WaveNet、Transformer 等。

它跟树模型比起来,省去了人工构建特征的工作。缺点是更难解释,对数据量和计算资源要求高。

总的来说,这四类模型各有利弊,没有绝对的好和坏。具体怎么选择,取决于业务实际,比如数据质量、计算资源、业务流程、人员水平等等。

评估

要评估预测效果,就要看准确率,或者说偏差率。但定义它并不容易。

举个例子,业界常用“百分比绝对误差”,即预测偏差的绝对值与真实值的比值。注意到,如果预测值偏低,误差的上界是100%;如果预测偏高,误差上界是无穷大。

换句话说,这个指标对偏高的惩罚大。为了降低误差,算法结果就得偏低,于是容易造成缺货。

定义误差指标应该慎重,最好是结合下游的业务目标。下游是补货,还是营销,或者安排人力等等,业务不同要求就不同。例如,人力安排可以接受预测偏高,但不太接受偏低。

由于篇幅有限,关于误差指标的选择这里不展开讨论。

总结

需求预测很难,因为需求本身有随机性。除此以外,既有业务因素,又有技术因素。要做预测,算法模型很重要,但模型不是全部。

其他环节也很重要,比如信息收集、流程审批、仓网规划、采销联动等等,这些都可以去优化需求预测或者补货的效果。

既然预测是不准的,如何衡量这种不确定性,又如何降低损失,也是要考虑的问题。前文没有讲到,这里提一下思路。

用概率分布描述不确定性,计算每一种情形下的损失,选择平均损失最小的方案。这就是决策模型该做的事。

从补货场景来看,需求预测与补货决策不应该割裂,而是要把它们看成一个系统,因为根本问题是如何决策。有决策模型的帮助,可以让决策的效率和质量更高,具体可以参考这篇《智能补货系统的设计思路》。

(编辑:天瑞地安资讯网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!