云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

网站服务器_数据库原子性_企业级

小七 141 0

大家好,我带着一个实际的需求回来了,我不得不开发网络智能,这让我有一段时间头晕目眩。

我被要求可视化报告中一些分数的数据分布,换句话说,用户需要看到某个数据集的直方图。

在这个博客中,我将重点关注两点:

我将使用网络智能4.2 SP7.

分步指导:

准备数据并绘制直方图:

那么,直方图是什么?它基本上是一个在一定范围或间隔内出现某些值的图,解决方案中的关键字是在这两个词间隔(bin)和出现次数(Count)中,这是我的数据的一个示例,这是我在excel上生成的500条记录的样本数据,用于本练习:

假设ID是员工ID,Scores是员工在某项任务中的得分,在我的例子中,得分的上下范围是50到100=如果[得分]介于(50;54)之间,则为0ElseIf[分数]介于(55;59)和1之间ElseIf[分数]介于(60;64)和2之间ElseIf[分数]介于(65;69)和3之间ElseIf[分数]介于(70;74)和4之间ElseIf[分数]介于(75;79)和5之间ElseIf[分数]介于(80;84)和6之间ElseIf[分数]介于(85;89)和7之间ElseIf[分数]介于(90;94)和8之间ElseIf[分数]介于(95;99)和9之间ElseIf[Scores]>=100然后10

你基本上是告诉它,如果你发现一个分数在50到54之间,把0(分配仓位号0)。

我们停在54,为了避免每个仓位和下一个仓位之间的重复计数,我只应用了这个百分比数据,微信淘客,我总是选择一个步骤4,它为我工作了4个数据示例,直到现在,你可以改变箱子的大小,因为你会相应地增加或减少装箱条件的数量。

我尝试了一种更通用的方法来自动装箱,它可以通过将数据加载到BW中,然后执行一个循环的开始或结束例程,该循环为某一步上的某个范围分配一个bin,然后在最大分数处停止,我稍后会在有时间的时候考虑,如果您有任何想法,请告诉我。

请注意,如果您的百分比有十进制值,则需要对其进行四舍五入,以避免整数间隔之间丢失样本,例如,您可能有一个54.5的值,在上述条件下,云服务器的,它将以未赋值结束。您可以使用Round([Scores];0)、Floor([Scores])或Celi([Scores]),读取它们之间的差异,并决定哪一个更适合您的情况。

请注意,这将限制此解决方案在某些情况下的应用,我可以想象,在大的统计数据集上,手动打钩是非常困难的。

为了保持你的图形平滑,箱子是必须的,没有因为缺少值而突然下降,假设你只有50分、51分、52分、55分,没有人得分53分或54分,大数据产业,你的图形会突然下降,它看起来是这样的:

[Count]=Count([Scores])ForEach([Bins];[ID])

ForEach所做的是强制按Bins和ID对数据进行分解,您可以阅读更多关于它的信息,在一个坚果壳中,它就像您给任何可视的由Bins和ID聚合的分数表一样。

如果您希望它显示为条形图,您只需拖动一个柱状图,将[bin]指定给分类轴,将[Count]指定给值轴1。

好了:

现在都是格式问题,让我们去掉X轴、Y轴,缩小这些条和条之间的间距,下面是我们可以做的:

去掉X轴:只需右键单击图表>格式图表>分类轴>设计>取消勾选可见。

删除Y轴:右键单击图表>格式图表>值轴>设计>取消勾选可见。

缩小条间距:右键单击图表>格式图表>绘图区>设计>将组间距值更改为2%。

最后删除虚线背景水平网格线:右击图表>格式图表>绘图区域>背景>设置分类轴网格颜色滑块为0%。

这是结果:

我还计算了模式,中位数和平均值,你可以计算百分位数,最小值和最大值,把他们放在一个水平表中,以帮助谁做分析,还需要注意的是,物联网系统,我们将需要计算平均值和平均值对于正态分布练习,以下是公式:

[平均值]=平均值([得分]ForEach([ID]))[中位数]=中位数([分数]ForEach([ID]))[Mode]=模式([Scores]ForEach([ID]))[StDev]=StDev([Scores]ForEach([ID]))

您还可以将计算嵌入图表类别轴或标题中,以您喜欢的方式进行,这里是分类轴上的一个示例:

标题公式:="μ="+[Mean]+"σ="+[StDev]

右键单击图表>格式图表>分类轴>设计>标题>勾选可见>选择自定义标题将公式放在上面>确保您进入设计>勾选显示分类轴一般情况下,如果您想隐藏箱子编号,取消勾选显示轴并在下面显示如果您仍然想隐藏仓位号,请进行布局。

我们还可以将绘图更改为平滑的折线图,我们需要调整以下选项:

右键单击图表>格式图表>全局>调色板和样式>取消标记下的线符号,并在"线效果"下勾选"样条线",将其从折线图更改为样条线图,这就是结果:

计算正态分布函数,称为标准距离()excel上的函数。

我看到很多人在一些旧线程中询问这个问题,所以我搜索了标准距离计算,我能在我的报告中成功地计算出来。

正态方程。随机变量Y的值是:

Y={1/[σ*sqrt(2π)]}*e-(x–μ)2/2σ2

其中x是一个正态随机变量,μ是平均值,σ是标准差,π约为3.14159,e约为2.71828。