云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

网站建设_公司企业邮箱怎么填写_最新活动

小七 141 0

改进供应链需求预测的新方法

企业正在迅速接受精细化的需求预测零售商和消费品制造商正越来越多地寻求改进他们的供应链管理,以降低成本,释放营运资金,为OmiNhannEL创新奠定基础。消费者购买行为的变化正在给供应链带来新的压力。通过需求预测更好地了解消费者需求被认为是这些努力的一个良好起点,因为对产品和服务的需求推动了有关劳动力、库存管理、供应和生产计划、货运和物流以及许多其他领域的决策。在来自人工智能前沿的报告中,麦肯锡公司强调,零售供应链预测准确率提高10%至20%,库存成本可能降低5%,收入增加2%至3%。传统的供应链预测工具已经不能达到预期的效果。由于零售商供应链需求预测的行业平均误差为32%,即使是适度的预测改进,对大多数零售商来说,潜在的影响也是巨大的。因此,许多组织正在摆脱预先打包的预测解决方案,探索将需求预测技能引入内部的方法,并重新审视过去在计算效率方面影响预测精度的做法。这些工作的一个关键焦点是在更精细的时间和(位置/产品)层次粒度上生成预测。精细谷物需求预测有可能捕捉到影响需求的模式,这些模式更接近于必须满足需求的水平。而在过去,零售商可能会在某个月或一周的市场或分销水平上预测某一类产品的短期需求,然后使用预测值分配该类产品的单元,该单元应放置在给定的商店和日期中,精细谷物需求预测允许预测人员建立更本地化的模型,以反映特定地区特定产品的动态。粮食需求预测面临挑战尽管精细谷物需求预测听起来令人兴奋,但它也带来了许多挑战。首先,由于远离了总体预测,必须生成的预测模型和预测的数量激增。所需的处理级别要么是现有预测工具无法达到的,要么是大大超出了服务窗口,使这些信息变得有用。这一限制导致公司在处理的类别数量或分析中的粒度级别上做出权衡。正如在之前的一篇博客文章中所研究的,apachespark可以用来克服这个挑战,允许建模人员并行化工作,以便及时、高效地执行。当部署在云本地平台(如Databricks)上时,计算资源可以快速分配然后释放,从而将这项工作的成本控制在预算之内。要克服的第二个也是更困难的挑战是理解在更细的粒度级别检查数据时,聚合中存在的需求模式可能不存在。套用亚里士多德的话来说,整体往往大于各部分之和。当我们在分析中转向较低的细节级别时,在更高粒度级别上更容易建模的模式可能不再可靠地呈现,这使得使用适用于更高级别的技术生成预测变得更具挑战性。许多从业者从1950年代的亨利·泰尔(Henri Theil)就注意到了这个预测问题。当我们接近事务的粒度级别时,我们还需要考虑影响单个客户需求和购买决策的外部因果因素。总的来说,这些可能反映在构成时间序列的平均值、趋势和季节性中,但在更细的粒度级别上,我们可能需要将这些直接纳入我们的预测模型中。最后,移动到更细的粒度级别会增加数据结构不允许使用传统预测技术的可能性。我们越接近事务粒度,就越有可能需要处理数据中的非活动时段。在这种粒度级别上,我们的因变量,特别是在处理计数数据(如售出的单位)时,可能呈现出不适合简单转换的倾斜分布,并且可能需要在许多数据科学家的舒适区之外使用预测技术。访问历史数据详见资料准备笔记本。为了研究这些挑战,我们将利用纽约市自行车共享计划(也称为Citi Bike NYC)的公共出行历史数据。Citi Bike NYC是一家承诺帮助人们"解锁自行车"的公司。他们的服务允许人们到纽约地区850多个不同的租赁地点中的任何一个,租自行车。该公司库存超过13000辆自行车,计划将数量增加到40000辆。花旗自行车拥有超过10万的订户,每天有近1.4万辆自行车。花旗自行车纽约分公司将自行车从原来的位置重新分配到他们预计未来需求的地方。花旗自行车纽约分行面临的挑战与零售商和消费品公司每天所面临的挑战相似。我们如何最好地预测需求,将资源分配到正确的领域?如果我们低估了需求,我们就错失了收入机会,并可能损害客户情绪。如果我们高估了需求量,就会有多余的自行车库存闲置。这个公开的数据集提供了从上个月底一直到2013年年中该计划开始的每辆自行车租赁的信息。行程历史数据确定从特定租赁站租用自行车的确切时间以及自行车返回到另一个租赁站的时间。如果我们将花旗自行车纽约项目中的站点视为门店位置,并将租赁的启动视为一项交易,那么我们就有了一个非常接近于一个漫长而详细的交易历史记录的东西,我们可以据此做出预测。作为这个练习的一部分,我们将需要识别外部因素,以便将其纳入我们的建模工作中。我们将利用假日事件和历史(和预测)天气数据作为外部影响因素。对于holiday数据集,我们将使用Python中的holidays库简单地标识从2013年到现在的标准假日。对于天气数据,我们将使用visualcrossing每小时提取一次,visualcrossing是一个流行的天气数据聚合器。Citi Bike NYC和VisualCrossing数据集的条款和条件禁止我们直接共享它们的数据。希望重新创建我们的结果的用户应访问数据提供商的网站,查看其条款和条件,并以适当的方式将其数据集下载到其环境中。我们将提供将这些原始数据资产转换为分析中使用的数据对象所需的数据准备逻辑。检查事务性数据有关详细信息,请参阅探索性分析笔记本。截至2020年1月,花旗自行车纽约市共享自行车计划由864个活跃的站点组成,这些站点在纽约市大都会区,主要在曼哈顿。仅在2019年,客户发起的独特租赁就超过400万次,高峰日的租赁量高达14000次。自从项目开始以来,我们可以看到租房的数量逐年增加。这种增长的部分原因可能是自行车利用率的提高,但大部分似乎与整个车站网络的扩张相一致。根据网络中活跃站点的数量将租金标准化表明,在过去几年中,每个站点的乘客量增长缓慢,我们可以认为这是一个轻微的线性上升趋势。使用这个标准化的租金值,乘客人数似乎遵循明显的季节性模式,在春季、夏季和秋季上升,然后在冬季下降,因为室外天气变得不利于骑自行车他的模式似乎与城市最高气温(华氏度)的模式密切相关。虽然很难将月客流量与温度模式区分开来,但降雨量(以月平均英寸计)并不那么容易反映这些模式研究一下星期日为1、星期六为7的每周乘车模式,看来纽约人将自行车作为通勤工具,这一模式在许多其他自行车共享项目中都可以看到。按照一天中的小时来细分这些乘客模式,我们可以看到不同的工作日模式,即在标准通勤时间内,乘客数量会出现峰值。在周末,模式表明程序的使用更加悠闲,这支持了我们之前的假设。一个有趣的模式是,无论是哪一天的假日,其消费模式大致模仿了周末的使用模式。很少发生的假期可能是这些趋势不稳定的原因。不过,这张图表似乎支持假日的确定对于产生可靠的预测很重要。总的来说,每小时的数据似乎显示纽约市是一个真正的不眠城。事实上,有许多车站有很大一部分时间不租自行车。在尝试生成预测时,活动中的这些间隙可能会产生问题。通过从1小时间隔移动到4小时间隔,单个站点没有租赁活动的时段数量显著下降,尽管在此时间段内仍有许多站点处于非活动状态。我们将尝试在每小时一级进行预测,而不是通过向更高的粒度级别回避非活动时段的问题,探索替代预测技术如何帮助我们处理这些数据