云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

负载均衡_数据库管理dba_超低折扣

小七 141 0

根据事物的本质做出一个好的商业决策和基于错误信息做出一个坏的商业决策之间的区别可能会导致决策者夜不能寐。更糟糕的是,根据我们认为可信但不可信的信息做出决策!我们一直使用可视化来执行数据发现和获取见解以推动业务决策的方式已经发生了根本性的改变,一旦您开始采用这种更好的方法,您可能就再也不会回到原来的方法了。但眼见为实,行业大数据分析,对吧?

走在记忆的小路上

我大学毕业后的第一份工作是在分析领域做报告开发人员。创建报告以获取见解是一项非常IT密集的功能,数据分析与大数据,需要大量的手工工作和管理积压的请求。我必须非常注重创建内容和如何解释需求来自业务(经常会发生变化)。而且,实际上没有一个选项可以很好地"切分"数据。自助报告和数据发现工具应运而生,使调查业务问题变得更容易和更直观。因此,那些直接了解业务复杂性的业务用户现在可以在不需要我的帮助的情况下,动态地调查、发现并创建自己的内容。只需拖放、切片、骰子和钻取!

Aha时刻

几年前,我试图弄清楚预测和机器学习如何提高我从数据中获取答案的能力。我没有数据科学背景,但我非常擅长处理数据和构建令人信服的视觉内容。那时我有了一个很大的Aha那一刻。不仅仅是"跨越沟壑"的一刻。这就像是学习我可以"坐上喷气式飞机飞越太平洋"的一刻!我的一位熟悉SAP预测自动化技术的导师向我展示了如何使用基于"点击"的预测自动化方法来发现数据。这就是我学到的:

手动数据发现与机器学习主导的数据发现

尽管之前的所有方法(自助报告和基于可视化的数据发现解决方案)都在将洞察力更快地传递到决策者手中,但没有一种方法接近于什么机器学习或预测自动化可以做到。机器学习可以发现数据中与我们的业务问题的直接关联,然后建议下一步做什么。毕竟,这不是BI的全部内容吗?找到业务问题的答案,然后制定行动计划?Gartner谈到了这一点。在未来的5到10年内,很难找到任何人以旧的手动方式进行数据发现。我的目标是帮助您也拥有"啊哈"时刻。因为在您看到差异之前,可能很难理解。

数据发现仍然是一种非常手动的方法来寻找答案它有一个主要的缺陷。数据发现需要人类的眼睛看到和解释我们在视觉上看到的东西。但问题是,我们在可视化中看到的并不是全貌。我们(人类)并不能像数学函数和计算机那样全面地看到数据。我们不能很好地看到多个数据元素和多个视觉效果之间的关联。这种认识是在我看到一个可视化的结果之后才出现的SAP预测自动化套件中的分类算法。分类是使用ML获取见解的最流行方法之一,数据分析,也是一个很好的起点,因为您可以向它提出类似于我们使用传统数据发现工具所做的问题。

手动数据发现的一个示例:员工离职率

让我们来看看员工离职率的例子,大数据是干什么的,其中员工离职率%随着时间的推移而不断增加。这就是引发我们提出发现问题的火花,哪些员工会离职,为什么?如果我们要以"手动"的方式得到这些问题的答案,我们可能会打开一个可视化工具,尽可能多地查看员工流失率,云服务器试用,例如:

总体员工流失率%–9.18%高于我们正常的7%流失率

现在让我们切片,骰子与发现

调查问题的一种流行方法是选择衡量指标(在本例中为营业额%),然后根据用户认为可能导致问题的关键员工特征创建尽可能多的可视化效果。数据集可以有数百列数据,因此最终用户知道他们无法查看所有数据,选择他或她"认为"可能导致问题的特征。这就是人的偏见产生的原因。在这种情况下,我们会看到一只充满特征的手

(组织单位)-如果我们将员工离职率%调整为组织单位名称,我们会看到许多组织的员工离职率高于平均水平,这里。有什么组织需要我们关注吗?当然。我们可以关注前五名左右。

(公司任期)-我们可以看到一些任期组在0-1类别中的员工流动率高于平均水平。任期是问题还是组织单位?

(年龄范围)-现在我们可以看到某些年龄段的员工流动率较高。请注意,这些年龄段是人为造成的,而不是ML驱动的,因为有人决定根据10年的桶来划分这些年龄段。稍后会有更多关于这一点的信息,但一个人的年龄对营业额的增长有很大的贡献吗?

在一个故事中展示我们的发现——如果我们把所有这些放在一个故事中,感觉我们有一些重要的见解。但是我们有一个完整的画面吗?这些员工流动领域中,哪一个对整体流动影响最大?下一步我们有什么建议?

信息缺失和人为偏见