在第1部分中,我们看到了如何使用单个R可视化构建针对BI模型的多个top-n条形图。最后是自上而下的分析。对于下面给出的每个示例,不需要定义BI模型,因为使用的数据集在SAP Analytics Cloud提供的R环境中直接可用。
以下是第二个博客所需的包和数据。
最受欢迎的部门
来自UCB招生数据,大数据核心,我们希望按部门和性别显示申请者的数量。
我们为图例和颜色设置标签。
我们将表格对象转换为数据框对象,重塑数据(聚合,透视)并指定通用列名和图表标题。
我们将准备好的数据绘制在堆叠条形图中。
切换到百分比堆叠将生成标准化条形图,并允许我们更好地比较部门。
从显示所有部门的堆叠条形图中,我们可以导出一个top-n图表。
我们计算每个条的总数,然后应用top\n R函数。
要绘制一个带有绝对值的top-n图表,我们重用第一个图表的代码片段。
如果您需要一个带有百分比值的图表,大数据的发展,请重用第二个图表的代码片段。
最简单和最难的部门
多么简单还是不容易进入一个部门?
让我们用我们的录取数据来回答这个问题。
我们为两个录取状态的图例和它们的颜色设置标签。
我们按录取状态汇总数据,并将其从最高的拒绝率排序到最低。
我们绘制它。
我们现在要检查申请最容易和最容易的录取的女性的比例最难的部门。
下面的代码是指我们为上一个图表定义的数据框架。它确定了最难和最容易的部门,买服务器云,并将它们放在一起。
我们为要构建的图表定义了一个最终的数据框架。
我们按类别对部门进行分组,云服务器服务,并设置条形图的颜色以及图表标题。
我们绘制了准备好的数据。
,营销数据分析