云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

京东云_mongodb创建数据库_代金券

小七 141 0

SAP Analytics Cloud(SAC)的预测功能旨在供业务分析师使用。这意味着他们在预测工作流程中得到指导,不需要具备预测技能。预测性输出以一种方便的方式显示,便于解释并包含在SAP Analytics云故事或规划中。你可能对我们的技术有疑问?这是一个对所提出预测的信任问题吗?这个博客的目的是解释Smart Predict是如何发现预测的。为什么它们是相关的!

在SAP Analytics Cloud中,当您创建新的预测场景时,有三种选择。

分类根据目标对总体进行排序。它产生一个新事件将发生的分数。例如,我的客户中谁会对我的营销活动做出积极的反应?

回归用于找出描述事件的变量之间的关系。对于每个新事件,您将获得目标变量值的估计值。例如,人工智能本科,你可以通过观察相似的房子来预测房价。

时间序列用于预测未来某一指标的演变。例如,应该提前生产多少产品?

这个博客是关于时间序列的。

我解释了时间序列预测问题的类型以及需要收集什么样的数据。然后,我将通过一个特定的用例来说明Smart Predict所使用的技术。

时间序列预测对于估计一个度量值的未来值非常有用,在这个度量值中,您可以使用时间维度来帮助您识别趋势。在进入细节之前,让我们看看Smart Predict的时间序列预测处理什么样的数据。下面是一些典型的问题:

如果现在问题的类型已经明确定义,那么让我们检查一下您拥有的数据类型是否可用于时间序列。有两个不同的方面:

这里有一些正确准备数据集的建议。

首先,问问你自己,我需要预测到未来多远?这是地平线。它是你将来要做的预测的数量。这个数字直接取决于历史数据的大小。5: 1是一个很好的比率来估计视界并得到具有相关置信区间的预测。这意味着,如果您有100个历史案例,您可以预测未来目标变量的20个值。当然,地平线的长度也取决于您的用例,您可以选择少于20个值。但如果你需要更多的,最好收集更多的历史案例

图1:信号和预测其在给定视界的演变

其次,你需要考虑预测的规模。如果您的历史数据是每月、每周、每天、每小时、每分钟甚至每秒钟捕获的,那么预测将以相同的时间单位生成。很明显,如果你每个月都记录数值,那么要求预测下一分钟的数值是没有意义的!相反的情况可能会出现:由于技术原因,如果传感器每分钟记录一次数据,但是每分钟与您的用例无关;那么您需要更高的时间单位,如小时。

第三,您应该考虑以您需要的时间单位对数据进行聚合。为此,必须定义聚合函数。此函数从每小时60分钟测得的60个值中计算一个小时值。它可以是第一个值、最后一个值、中间值或计算值(例如,平均值或更复杂的公式)。要记住的一个重要点是聚合的大小,因为大型聚合可能会隐藏信息,从而无法被发现。其结果是降低了预测的质量。但是,当有大量噪声时,适当的聚合可以平滑信号。现在已经没有秘密了,你需要测试和实验来选择最佳的聚合函数。

第四,你应该按时间顺序对历史数据集进行排序,并对其进行清理,使每个时间单位只对应于目标变量的一个值。请注意,Smart Predict会自动对数据进行排序。

在结束本节时,我不能不提及我上面提到的候选影响者。它们对于增加信号成分的检测非常有用。通常,云服务器哪个好,这些变量只有在您的业务领域中才有意义,因此有必要操纵您的数据来获取它们。以下是这些影响因素的例子:

产品的特定销售周期限时折扣月结日/季结日每月第一天/每月最后一天排名第1周的第1天

在分析信号的至少两个组成部分(趋势和周期将在下面解释)的过程中,对候选影响者有适用的限制:

我们将遵循一个用例来说明本节,使用一个带有Smart Predict的数据集来向您展示如何处理信号以提出预测。这个用例是关于一个公司的差旅成本和费用的,这个公司已经失去了控制,对损益分析和公司的财务业绩产生了负面影响。公司的目标是分析这些成本,了解在哪些方面可以降低成本,同时更好地预测成本,以避免超出预算。

过去收集的数据(见图2)是:

图2:差旅成本和费用用例数据集

所有电路板区域的信号图形视图如图3所示。但是,LOB的成员有不同的活动。这会影响航行次数,从而影响航行成本。如果可以区分和预测每个LOB的差旅和费用,网站服务器租用,那么从预算的角度来看,分析和预测将变得更细。

图3:数据集的信号

希望在使用SAC Smart Predict创建预测场景时,有一个选项(参见图4)允许我们按所选变量。

图4:分割数据集上的LOB值