云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

香港服务器_数据备份服务器_免费领

小七 141 0

机器学习驱动的数据发现方法的结果

现在让我们将第1部分中基于手动可视化的方法与SAP Analytics Cloud(SAC)的机器学习(ML)数据发现方法的结果进行对比。SAC有一个称为Smart Predict的功能,这是一个ML驱动的预测自动化方法。SAC的优点在于它将BI、计划和预测结合在一个解决方案中。这意味着您可以从数据中获得精确的机器学习见解,然后创建一组具体的行动,并跟踪单个应用程序中的计划进度。

首先,智能物联,让我们在SAC中创建一个"预测场景":

因为我们的目标问题是,"哪些员工离开了公司(而不是留在了公司)以及为什么离开了公司",我们选择"分类"是因为目标值在本质上是分类的,而且是无序的(如"维度")。相反,回归分析(非常类似于分类分析)将应用于连续值或有序值的"度量"或范围(即,如果我们问问题,"影响每周工作时间的因素"):

我们将指出SAC Smart Predict与我们从中进行手动/可视数据发现的数据相同,并告诉Smart Predict哪列数据是我们的"目标"。目标是标记我们要了解的行为的数据列,在本例中,当员工离开公司时(相对于留在公司),箭头显示评估数据所需的内容:

第1步:输入数据集:'人力资源流失数据–培训'

第2步:选择目标:'离开工作'

第3步:点击'培训'按钮启动自动ML驱动的数据发现过程

结果

在几秒钟内(有时根据数据的体积和宽度在几分钟内)我们的预测自动化过程已经完成。智能预测"分类"算法根据这些数据"训练"自己,牢记目标,现在我们可以看到它学到了什么,淘客公众号,如果有的话,

我们首先要看的是数据对员工离职原因的描述程度:

预测力表示描述性数据对员工离职情况的描述程度描述性数据将是所有非目标数据列。在这种情况下,我们看到的预测力为87.15%,太好了!这意味着我们可以相信结果,因为我们的分类算法发现数据中的某些属性或行为大多发生在某人离开公司时。

注意:如果"预测能力"在15%的范围内,那么这将告诉我们描述性列不能告诉我们营业额的情况在这种情况下,我们会寻找其他属性,关于员工的列或"特征"可以告诉我们原因,然后我们会再次运行它,看看准确度是否有所提高。拥有低预测能力也可以很好地知道,因为这将节省我们大量的时间,而这些时间本可以花在构建可能被误解的视觉效果上。

现在我们知道我们看到的是正确的数据,让我们看看员工离职的原因。

影响者贡献

Smart Predict打开盒子,按贡献最大贡献最小的顺序给我们列出了员工离职的贡献列。这被称为"解释能力",并不是所有的ML工具都能做到这一点,但这是流程的一个非常重要的方面要知道"ML发现了什么"和"为什么"对我们的目标有贡献。还要注意的是,这些影响因素是我们从手动数据发现中找不到的另一件事。Smart Predict发现,"每周工作时间"对员工流动率的影响最大,其次是"每月晋升间隔"、"工资",然后是"终身教职"。

现在,还记得我们的故事板的发现,我们建立了基于我们的手动可视化尝试?"影响者贡献"更进一步,告诉我们这些员工特征如何影响员工流动,但按顺序排列。这是一个非常精确且经过数学验证的KPI列表,我们应该关注它。没有人可以使用手动可视化工具生成这些结果。

还要注意,前三名的贡献在我们最初的数据发现中是如何不存在的,因为它们是度量值。如果不做任何额外的事情,企业大数据分析,我们的自动ML将这些纳入分析。奖金!!

更深入

SAP的ML方法将"影响者贡献"提升到一个新的层次,并告诉我们,不仅要关注哪些关键绩效指标,而且,每列中的值的范围会影响目标行为(员工离职率)。例如:

影响者#1:每周工作时间–在"每周工作时间"中,我们发现平均每周工作43.8到48小时的员工最有可能离职。

见下表:0.00右边的所有内容都是离开的影响者和0.00左边的影响者是留下来的。从上到下,最高的范围被认为是"有风险"的行为,当你走向底部时,你会看到代表员工最有可能留下的"桶"小时数。所以我们得到了硬币的两面!

注意:什么人会想出这样的范围?每周43.8到48小时?只有ML方法才能如此精确地看到数据中的模式。

影响者#2:晋升间隔–我们在下面看到,在22到28个月内没有晋升的员工最有可能离职。0到6个月最有可能留下。现在,假设你加班43.8到48小时,22到28个月没有升职!这是双重打击!我们的ML模型现在将把所有这些影响因素加起来,并根据每个员工在公司的独特情况,对他们离职的可能性进行单独评分。这一新的信息列将作为离职概率的百分比添加到我们的原始数据中。真正巧妙的是,我们现在可以根据员工是谁来对他们进行分类最有可能离开或最有可能留下来。

还有一件事手动可视化方法无法提供。

结果总结

在ML的帮助下,我们现在知道:

下一步是什么?采取精确的行动