云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

免备案CDN_哈尔滨网站建设费用_免费领

小七 141 0

我想分享一个描述HANA数据隐私功能和匿名化功能的可视示例。下面有一个YouTube视频,显示了通过SAP分析云(SAC)公开的这些功能。

HANA匿名化包含多种功能

这个示例是基于Philip MUGGLESTONE提供的来自哈纳学院Github。我把它改编成一个人类发展倡议项目和SAC故事。数据掩蔽

这是最明显的数据保护功能。它使用替换字符的模式掩蔽数据的指定部分。我已将掩蔽应用于家庭电话号码和社会保障号码。

图1.1:电话和社会保障数据掩蔽

在计算中应用了掩蔽语义中的视图,淘客网站,但这也可以在表级别完成。

图1.2:计算视图中的数据屏蔽

数据屏蔽是使用SQL表达式实现的

图1.3:数据屏蔽表达式

2。差异隐私

此功能将噪声添加到指定字段,同时仍保持其统计相关性。

为了直观显示这一点,我使用了地理层次结构,大数据分析,以便您可以看到噪声在层次结构中的差异。

图2.1:差异隐私:应用于工资

控制的差异隐私参数有多少噪音和一个人对结果的贡献概率存在于匿名化视图中。这些参数的详细信息可以在SAP HANA数据匿名化指南中找到。

图2.2:差异隐私视图定义

我用SAC构建了一个简单的消费计算视图,我的免费云,这里我们使用一个外部连接地理层次结构

图2.3:用于公开差异隐私视图的计算视图

3。K-匿名

要使用K-匿名功能,云零售,我们需要定义匿名规则

准标识符层次结构/分组k-匿名性

准标识符指定哪些字段可能用于识别个人。在下面的数据集中,我们选择了站点、性别和年龄

层次结构/分组-如何对准标识符进行泛化以允许使用它们。在这里,我们可以将年龄分组为年龄段,并在地理层次结构中扮演角色。对于性别,不可能进行概括。

K-匿名性,K被设置为3。这是暴露准标识符和敏感数据之前所需的最小记录数。

图3.1:表数据,了解准标识符

为了概括站点列,我们使用了如下结构的父子层次结构。

图3.2:站点层次结构

我们使用父子结构存储了此层次结构的数据。

图3:3地理层次结构表

我们在匿名化中使用了以下层次结构视图视图

图3.4:站点层次结构视图定义

为了简化事情,首先我只指定站点作为准标识符。我重新构建了地理层次结构,免费企业管理软件,以便通过SAC故事和匿名视图更容易地可视化数据。在这个例子中,我使用了k=3。其他参数注释掉

图3.5:匿名化视图,k=3,站点定义为准标识符

左侧职员栏显示原始数据。我们可以看到在多伦多只有2名员工,低于我们的阈值3。

在中间的面板中,应用严格的匿名化,我们可以看到在地理层次结构中,我们不再看到多伦多(如预期的那样),但我们也失去了波士顿和达拉斯

在右边,我们可以使用更宽松的方法来"重新编码":"多维严格"

图3.6:k-匿名应用于站点k=3

在匿名视图中使用多个准标识符时,将输出视为网格是有意义的。查看数据集,我们可以看到来自温哥华的ID 29根据严格和宽松的方法进行了不同的匿名化。

图3.7:k-匿名与准标识符年龄、站点和性别

结论

SAP HANA匿名化提供了一种确保隐私规则得到遵守的简单方法。通过使用具有层次结构的SAC故事,使其更易于理解。

请查看下面的视频以查看现场演示。