云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

香港服务器_网站推广建设_限时特惠

小七 141 0

Lumira的灵活性和力量的结合使得它非常受金融分析师的欢迎。让我们研究一下如何使用一些简单的统计函数对一些数据进行快速的健全性检查,大数据是啥,以检查是否存在欺诈行为。对于这个博客,我们将在SAP Lumira中实现Benford定律。这个数学定律的应用在财务审计中的欺诈检测中很有用。

如果你不相信你的数据是正确的,那么你就不能做出数据驱动的决定。

维基百科将本福德定律描述为"对许多现实生活中的数字数据中前导数字的频率分布的观察"。法律规定,在许多自然发生的数字集合中,最前面的有效数字可能很小。例如,在遵守法律的集合中,数字1在大约30%的时间内显示为最高有效位,而9在不到5%的时间内显示为最高有效位。"

通过这个,如果你的数据符合这个斜率,你可以说它不太可能被欺骗。如果它不符合这个斜率,那么就需要进一步的调查。

让我们来看看如何轻松地实施这个统计测试。

我使用的是Lumira 1.31和stackoverflow的样本数据集,什么大数据,可以在这里下载:

首先,我们将文件导入Lumira 1.31.

然后魔法将在"准备"室发生。点击prepare

Benford定律将数字视为字符串,因此我们需要将price对象转换为字符串。单击price字段的标题,德国云服务器,您将在右侧看到许多数据操作。选择转换为小数点后0位的文本

这将创建一个"价格(2)"对象。单击此新字段上的齿轮图标并选择"创建计算尺寸

"

将此新尺寸命名为"最左侧整数"。

使用子字符串公式增加第一个字符

子字符串({Price(2)},1,1)

一旦这样做,您会发现在右侧Lumira会自动配置值,所以我们可以开始看到分布。然而,本福德定律要求我们真正比较这些最左边int的对数值,贵阳大数据,所以,我们需要在刚刚创建的新字段上做一些数学计算。为此,数据与大数据,让我们将最左边的int转换为数字类型。

单击最左边int的标题并选择"转换为数字"

这将创建一个"最左边的int(2)"列。单击最左侧int(2)上的齿轮图标,选择"创建度量"

然后我们将创建一个新度量,该度量将使用最左侧(2)对象

将此度量命名为Benford分布。公式是:

Log({leftmost int(2)}+1)–Log({leftmost int(2)})

您现在可以可视化数据了。去可视化室创建一个柱形图,以Benford分布作为度量,最左边的int作为X轴

我们可以看到,根据分布,这个数据集似乎非常可疑。鉴于这是一个样本数据集,它符合我们的期望。

我希望这篇博客能有所帮助。请把任何问题贴在下面