云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

文件存储_网站建设一般多钱_免费领

小七 141 0

2020年即将结束,在很多方面都很特别。我想我会用一个预测性的计划博客来结束这一年

感谢我的同事大卫斯托克在这个话题上激励了我。大卫是美国国家公园的超级粉丝,尤其是锡安国家公园,一块自然瑰宝!顺便说一句,我希望有一天能参观一下这个公园。

美国国家公园管理局有一个名为NPS Stats的网站。它维护得很好,充满了有趣的统计数字。你可以用它来创建你自己的预测性计划方案。

从这个网站,我创建了一个数据文件。它包含了82个美国国家公园的每月娱乐参观。大多数公园的数据始于1979年1月,到2019年底才停止。这是一个真正的数据宝藏。

如果您想重新创建此示例,可以在此处找到数据文件。

预测性规划加快了SAP Analytics Cloud中的规划活动并为其提供了指导。预测性规划预测关键指标随时间的演变。它运行在计划模型之上。

要创建计划模型,大数据的数据库,我有两个选项:

我可以直接从我的数据源创建计划模型我也可以从我的数据源创建一个数据集,然后在数据集上创建计划模型。

我选择第二个选项,然后首先创建一个数据集。SAP Analytics Cloud为我选择了正确的日期格式,数据集也很好。很好!

然后我从数据集创建计划模型。同样,这是一个简单的过程。我选择数据集作为计划模型的源。我唯一需要记住的是检查启用规划复选框以确保我的模型是计划的。让我们预测一下!

首先,我会保留2019年的12个月。我的意思是,我将用于创建预测模型的数据将在2018年底停止。2019年的数据将不可见,也不为预测模型所知。

我知道2019年不同公园的访问量(实际)。我想确认预测方法对我的计划有好处。事实上,在过去的几年里,公园里游客财富的增加被证明是一个挑战。

预测性规划对我预测的方式非常灵活。实际上,我可以用国家层面的数据进行预测。我还可以预测公园层面的演变,然后把预测结果汇总起来,得到全国的数字。我将比较这两种方法。

预测2019年全国访问量

我创建一个时间序列类型的预测场景。

以下是设置:

数据源是规划模型,实际版本。要预测的值是娱乐访问量2019年1月至2019年12月的预测数为12。我使用过去60个月的数据——从2014年1月到2018年12月。负面访问没有意义,所以我只想要正面预测。

预测模型是准确的。它的视界范围不到2%,这给了我一种方法来估计模型可能会犯的错误。我们可以注意到,访问是非常周期性的,他们在7月和8月达到高峰,返利app,在冬季减少。

这个预测模型包含三个部分:

一个随时间增加的趋势(红色部分)一个月的周期,这和我们确定的一样(橙色部分)波动–给定月份的值取决于过去10个月的值(紫色部分)。

请注意预测模型是加性的。这意味着对趋势、周期和波动的总结给了我一个预测。

预测2019年公园级别的访问量

我现在配置了一个新的预测模型。唯一的区别在于每个美国国家公园有一个时间序列模型。我通过在名为Entity的设置字段中选择ParkName来指定这一点。

在这种情况下,海量数据,我没有得到一个模型,我得到的预测模型和美国国家公园(82)一样多。一些模型非常精确(以大峡谷NP为例),而另一些则不太精确(维尔京群岛NP)。

将预测写回

我创建了两个私人版本:

其中一个将接收国家级生成的预测第二个将收到在公园层面生成的预测预测

我现在有:

2019年实际值的公开版本2019年的两个预测,每个都存储在一个单独的私有版本中,我可以比较。

比较2019年的实际情况和故事中的预测

我创建了一个故事来比较实际情况和2019年的预测。

我使用交叉计算来确定绝对数和百分比的方差。

第一个表根据全国的数字和实际情况

我们可以注意到以下几点:

预测模型的准确性与实际情况相比是好的。实际值被低估了430万,相当于-3.8%在2019年第二季度,低估更为重要。

第二个表比较:

根据单个公园数量创建并在国家层面汇总的2019年预测2019年实际情况

我们可以注意到以下几点:

预测模型的准确性与实际情况相比非常好。实际值被低估了200万,啥叫人工智能,相当于-1.8%。与使用国家数字的方法相比,增加了2%。第一季度被高估了8.4%,而其他季度则被低估了。

我使用了输入控制来查看各个公园的预测。