云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

大带宽_网站建设公司网站_稳定性好

小七 141 0

在这个博客中,我利用了我以前启用的3个HANA功能:

因此,我得到了一个SAP Agile Data Preparion 1.0 SP14安装,包括以下交付单元(请检查PAM中支持的组合):

HANA版本1.00.122.03HANA\ U IM\ U DP 1.3.4版HCO\规则\ FW版本1.8.3HANA\ U IM\ U ESS版本1.3.4HANA\ U IM\ U ADP版本1.14.0

在让SAP敏捷数据准备为您工作的基础上,我激活了HANA敏捷数据准备规则框架:

通过此操作,我登录到我的SAP敏捷数据准备驾驶舱,装箱一个项目,并使用远程连接从启用HANA上的智能数据集成下载我的数据,速成版:

我选择了所有可用的专栏(对于这个博客,我扩展了前成员的这个优秀博客系列的数据模型,并添加了数据.cfg以及数据.csv附录中的文件-请注意,数据并不完整,很可能甚至是错误的,但希望适合本教程以及虚构的数据基础):

下载数据后,我从Functional Dependency选项卡获得了第一个见解。事实上,敏捷的数据准备确定了国家和ISO之间存在功能依赖关系,什么是淘客,反之亦然,但由于国家代码GB映射到英格兰、苏格兰和威尔士,因此值相互冲突,这是有意义的,可以用来简化以后的数据分析:

但是国家代码DE主要映射到德国但德国有2次,这表明数据不一致的挑战必须加以考虑:

接下来我将研究数据质量,尤其是重复数据。不幸的是,大数据应用前景,内置个人匹配策略不适用于我,因为我缺少一些必填字段:

因此我创建了一个自定义字段,假设名字、姓氏和国家的组合将唯一地定义一个玩家:

,我看到的是那些在多家俱乐部赢得欧洲冠军联赛冠军的球员,因此他们的剩余记录已经被删除了不止一次。这是否正确或者这些记录是否应该聚合是另一个问题,但是对于我定义的自定义匹配策略,这是一个结果:

对于一个干净的数据集,我对一些聚合的概述信息感兴趣,在这种情况下,俱乐部赢得了欧洲冠军联赛的球员来自英国。为此,我定义透视表,云是什么,从函数依赖性分析中知道,我可以使用国家代码GB覆盖我感兴趣的国家:

并在预览中显示结果,如果我想进一步处理此问题,可以将其另存为新工作表:

最后,我将在规则选项卡上进行一些复杂的分析,利用HANA规则框架。我对所有赢得一场以上比赛的苏格兰球员都感兴趣,好评返现怎么操作,因此我定义了一个相应的表格规则:

使用此规则作为过滤器:

我得到了我想要的苏格兰球星的结果(669人中有6人):

当然SAP Agile数据准备中还有很多功能,用云服务器,但通过本教程,我希望您了解了其中5个关键问题:

利用智能数据集成进行数据采集函数依赖分析删除重复项综合数据利用HANA规则框架进行复杂的数据分析

附录

请注意,这些数据并不完整,甚至可能是错误的,但希望能够很好地适合本教程,作为一个虚构的数据基础: