云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

域名备案_数据库默认端口_企业级

小七 141 0

域名备案_数据库默认端口_企业级

随着SAP Lumira 1.27中引入数据混合,大数据数据处理,业务分析师现在可以选择是对其数据执行连接,还是使用新功能。所以一个简单的问题是:我应该加入还是混合?

加入回顾

让我们回顾一下SAP Lumira在数据合并/加入方面的能力。根据定义,联接是(到数据库的)指令,用于组合来自多个表的数据。结果是一个包含所有数据的表,由数据与其他数据段的关系连接在一起。这些关系或链接对于像SAP Lumira这样的产品执行连接非常重要。这些链接被称为外键。

现在SAP Lumira支持左外部和内部连接。左外部联接将生成一个集合,淘客小程序,其中第一个或左侧表中的所有行都将保留。第二个表或右侧表中的行仅在与第一个表中的行匹配时显示。左表中不在右表中的值将显示为null。

内部联接选择两个表中基于联接谓词的表之间匹配的所有行。两个表中匹配对的组合行是结果表中的结果行。

在两种合并情况下,都会创建一个结果表,然后可以在准备室通过数据操作或计算进一步调整,然后在可视化室的这个表上创建图表。

数据合并还需要一个或多个唯一的键来将两个数据集连接在一起。因此,重要的是要了解数据集如何以及是否以这样一种方式相互关联,即可以找到一个键来匹配数据。如果匹配(在SAP Lumira中以百分比计算)不够,我们将不允许合并继续。这并不是产品中的缺陷,而是在SQL中如何完成连接的限制。

混合起到了一定的作用

数据混合通过认识到业务级别的信息有时不包括允许合并的ID值或列来克服其中的一些限制。相反,它认识到,在数据集中,有一些特定的列,其中的信息对于在图表或表格中显示是有价值的,这些信息将与适当的度量或计算一起聚合或汇总。正是在这个聚合级别上,来自不同来源的数据可以一起可视化。这些数据源只需有一个或多个公共维度即可将其相关数据链接在一起,空值用于填充两个数据集中都不存在的列或值。

混合通常在数据来自不同数据源的情况下非常有用。SAP Lumira 1.27支持混合所有离线数据源产品,包括SAP HANA、SAP BW extension、SAP Query Panel Universe extension、Microsoft Excel、CSV和Freehand SQL源。例如,这允许最终用户将公司数据与独立的个人数据源混合。一个更为明显和常见的情况是,数据有时并不存在于同一个数据库中,例如,当使用外部或公共数据与内部或甚至其他外部来源进行比较时。

有时它会受到限制,并且在将请求的数据正确地放在一个地方时会很慢。在等待ETL过程完成所需的时间里,我们不妨研究数据混合,以便在数小时或数天内快速发现见解,否则就需要数周或数月的时间。诚然,从性能的角度来看,如果繁重的工作可以由它推送到后端或数据源,那么总是值得考虑的,这样就不必依赖于客户机来处理所有的工作。

混合的一般机制已经在以前的一篇博文中介绍过,但是混合是通过在服务器上聚合数据集来实现的混合的任意一边,并根据混合上下文(即我们链接的维度)将聚合结果连接在一起。在SAP Lumira 1.27中,混合上下文是通过可视化中存在哪些链接维度(即每个数据集聚集的维度)来标识的。聚合表的联接是作为左外联接执行的;因此,确定要用作主数据集或左表的表非常重要。否则你可能会失去你所关心的价值观。有时,您希望看到更多维度值的数据集将成为混合中的主要数据集。

首选混合而非加入的一个示例-一对多关系中的比较度量

假设您在一个数据集中有一个销售数字表,在另一个数据集中有一个销售配额表。要回答的问题是要了解所有销售总额与月度或季度配额的对比情况。在本例中,我将使用SAP Lumira附带的Sales Commission示例。

Sales Deals Enterprise数据集包括订单ID、订单过账日期、负责销售的销售代表ID以及每个订单的销售交易总额。很容易按日期和代表对他们进行分组,大数据技术,以获得每个代表每月的总数。例如,大数据培训班,如果您在Sales Rep ID 228上进行筛选,您将从2010年1月到2014年6月收到49个订单。有些月份将有一个条目,而其他月份,如2014年6月,将有3个条目。让我们更仔细地看看这个2014年6月的销售代表。为了简化屏幕截图,我将专门筛选Sales Rep 228,2014年6月:

在Sales Commissions数据集中,我可以查看Sales Rep 228的配额,2014年6月:

要回答我原来的业务问题,我可以将Sales Rep ID字段和date字段上的表连接在一起–我会从之前的日期字段中提取月份和年份。因为我从Sales Enterprise Deals数据集开始联接,所以使用合并支持的左外部联接,我得到了每个订单事务的配额值。