云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

企业网站_kafka消息中间件_9元

小七 141 0

这是我的小博客系列的第一部分,我将展示如何在SAP Analytics Cloud中建模和使用数据。我决定使用来自Coronavirus/COVID-19领域的数据集,希望您也可以在您的工作领域使用它。

为了做到这一点,您需要以下内容:

SAP Analytics Cloud(试用、演示或生产租户)COVID19数据集时间

重要更新(2020年3月26日):我在这篇博文中使用的所有文件都可以在这里找到,直到2020年6月23日。

这篇博文中的图片是我所做的截图。我使用过的数据源可以在

Humdata网页上找到(撰写本文时)Worldmeters网页

您可以在这里找到该系列的所有博客文章:

第1部分:冠状病毒/COVID-19–建模第2部分:冠状病毒/COVID-19–数据质量问题(本篇)第3部分:Coronavirus/COVID-19–可视化/分析数据(即将发布)

SAP Analytics Cloud是我们成熟的分析平台,使您能够在一个地方使用所有分析功能做出端到端决策。我们所说的BI,计划和预测/ML在一个单一的解决方案中。没有其他供应商在一个为软件即服务(SaaS)构建的平台上拥有商业智能(BI)、协作企业规划和增强分析功能。SAP Analytics Cloud允许您获得企业级的洞察力,什么是云服务器,并在业务流程中采取行动。此外,通过人工智能(AI)驱动的洞察力,我们可以更快地做出更明智的决策。

在我的案例中,我将在SAP Analytics Cloud中创建和使用规划模型,但您也可以仅使用分析模型。

用例

让我们首先定义我们计划处理的业务用例。这在与COVID-19无关的场景中也非常重要,因为每个平台都有几个不同的选项来选择如何到达终点,所以我们需要关注结果。否则这只是另一个特性和功能POC、pilot等

在我们的例子中,我想通过遵循不同的kpi或措施来跟踪冠状病毒的爆发。更具体地说,我想追踪确诊病例的数量、死亡人数、恢复情况、死亡率。此外,我想追踪疾病的进展或动态,以及它如何在不同国家传播。为了使我的分析更容易,我还想把数据可视化在地图上。因为我们还需要监控它是如何在一天一天之间传播的,所以我需要确保每天都有组织的数据。在一天结束时,我需要知道我是否可以去超市或我应该等待更好的时间。

初稿结果可能是这样:

概述页面:

地理视图:

一般来说,我们必须执行以下任务:

我们将处理三个不同的文件,如下所示(确认,死亡,恢复):

我们可以将它们加载到3个不同的模型中,人工智能行业分析,然后在SAP Analytics云中使用混合功能,但对于最终业务用户来说,仅使用一个模型的数据更容易。因此,我们计划将3个数据集加载到一个模型中。所有三个数据集的粒度都相同。

将数据上载到SAP Analytics Cloud

选择"创建">"模型">"从您的计算机导入文件",并使用您从上述站点下载的带有确认案例的文件。

数据上载后,这是我们可以在SAP Analytics Cloud中看到的数据集的结构。

在我们进行数据转换和建模之前,有几点值得指出。

AD1–修复"省/州"列的数据质量问题:因为我们计划在地理编码中使用"省/州"作为位置ID,我们需要确保此列不包含任何空格。在进一步检查数据集之后,我们可以清楚地看到,并非所有国家都有省/州一级的数据。为了正确地管理这个异常,我们将实现一个"业务规则",其中定义一个名为"CALC\u Province"的新列。如果存在"省/州"列中的值,则取此值,大数据分析数据库,否则取"国家/地区"列中的值。我们将使用IF语句,如下所示。为了更好的可见性/可读性,避免父子层次结构中的重复名称,以及在以后的地理编码过程中,我们还将添加前缀"Pă"(以省为单位)。

新建计算列:

添加IF语句,完成后按ok:

新建计算列,如下所示:

AD2–将日期列转置到行中:由于日期维度当前嵌入到列名中,我们需要使用转置功能,以便将数据移动到一个日期列的行中。

选择"将列转置到行":

在"转置"面板中,首先选择所有字段,然后取消选择前4个字段(省/州、国家/地区、纬度、经度)和(重要),数据集的最后一个字段-计算列CALC\u Province

You还可以激活"预览"并检查转置是否按预期方式工作:

完成后按"确定"即可完成转换。我们还可以为我们的日期维度添加更友好的描述,并确保系统已将其识别为日期维度。

如下图所示,SAP Analytics Cloud已将维度类型正确识别为日期,因此我们只需向其添加描述。双击列名"Key"并将其重命名为"Date":

将"Key"列重命名为"Date"后的结果:

AD3–按LAT/LONG进行地理编码:这一步我们将在模型中添加地理编码。这样,我们就可以在SAP Analytics Cloud中构建故事时可视化地图上的数据。

选择"GEO Enrich by Coordinates":

在弹出菜单中,请选择/定义显示的字段,完成后按"Create":

已创建一个名为"Location"的新"GEO"列,如下所示,包括所有位置的地理编码在后端,这意味着我们可以在地理地图上使用这些数据。