云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

数据库_阿里云edas详解_学生机

小七 141 0

数据是了解企业方方面面(从客户和员工行为到市场趋势)的关键。尽管数据的价值是无可争辩的,解锁也不总是那么容易。数据受到应有的保护,尊重这种保护对所有组织来说都是法律和道德上的义务。

利用(个人)数据进行分析和机器学习有可能改善我们的生活、环境和健康。它可以帮助预测能源需求,从而更好地利用可再生能源。它可以帮助改善我们管理交通的方式,以避免交通拥堵,更好地规划我们的城市。它可以帮助我们发现治疗癌症等疾病的方法。因此,问题仍然存在——我们如何才能在不危及公众隐私的情况下,发掘数据的潜在见解它属于谁?

这是一个我从十年前开始攻读数据保护博士学位以来就一直在研究的问题。然后,在SAP大数据团队工作了大约一年之后,我看到了一个关于他们营销野心潜力的客户演示。该客户解释说,出于对数据隐私的考虑,公司所能做的有限。

我认识到这是一个巨大的机会,有各种各样的潜在用例,因此我开始开发一种方法来生产匿名化方法-基本上把我的研究变成一种产品。

在2016年底,我有机会实现我的梦想,开始了SAP HANA数据匿名化功能的工作。数据匿名化方法允许企业使用数据进行应用和分析,同时确保每个人的隐私都得到保护。为此,仅仅删除姓名或其他类型的标识符(如社会保险号码)来匿名化数据集是不够的。

举个例子,假设一个教室里老师让穿红衫的学生离开教室,假设只有一个人穿红衫,每个人都知道谁需要离开教室,而老师不必指认学生的名字。简单地说,由于教室里只有一个人穿着红衫,就有可能准确地知道老师指的是谁。如果教室里有很多人穿着红衫,情况就完全改变了。在这种情况下,没有人会知道老师的意思:特定的个体隐藏在人群中。

这与我们在SAP HANA中的一种数据匿名化方法中应用的基本原则相同。我们确保匿名中至少有"k"个具有相同属性的个体(如红衫军)数据集。此方法称为k-匿名,是SAP HANA中实现的不同匿名方法之一,以提供不同的隐私和实用性保证。使用研究充分的方法并对匿名工作方式保持透明是在处理非常复杂的问题时建立信任的关键敏感数据。这是我们在著名的VLDB会议上发表我们的工作的原因之一。最终,这也使我们能够创建以前无法想象的新应用程序。

今天,这项技术被广泛的组织使用,帮助他们从敏感信息(如医疗数据)中获得宝贵的见解,大数据用什么数据库,而不必透露背后的任何人。

我现在与其他三位同事一起研究这个话题。除了构建软件,我的大部分工作还包括提高人们对软件功能的认识,如何帮助客户,以及向他人介绍技术和我们的软件。

我个人的一个亮点是在数千名同事面前的员工会议上演示软件。我们只有几分钟的时间来解释这个非常技术性的话题,这是学习如何真正关注软件的核心信息的一个很好的练习。是的,确实有怯场的成分,但也很有趣。

在舞台上演示SAP HANA数据匿名化

但是除了演示之外,对我来说,一个主要的亮点实际上是从事SAP HANA工作的同事的协作方式。SAP HANA显然提供了内存中的速度和性能,但它也超越了核心数据库管理,具有应用程序开发、多模型处理、数据集成和质量功能。

什么使SAP HANA数据匿名化如此独特的一个事实是,我们是这一系列功能的一部分,这些功能可以无缝地协同工作。市场上没有其他公司提供相同类型的集成数据匿名化,物联网架构,因此从体系结构的角度来看,家庭人工智能,我们提供的不是单独的匿名化,而是集成在更大的安全框架和处理引擎(如spatial)中的匿名化。

例如,SAP HANA管理原始的个人和敏感数据数据,以及这些数据的匿名化视图。安全框架必须确保用户只能访问他们被允许看到的数据。访问也需要可审核,因此匿名化总是在更大的安全框架下工作。

拥有所有这些功能的第二个优势在一个集成的产品中,是团队内部的广泛知识。SAP-HANA团队由涉及众多主题的专家组成。这是一个由开发人员和产品经理组成的庞大而活跃的社区,他们总是乐于接受技术讨论。

就像这些特性和功能在产品中无缝地结合在一起一样,我们都是一个团队。我称之为"锐化特征"-如果有人有想法,十大淘客软件排名,他们可以与SAP HANA其他领域的同事交流。这种综合的专业知识和不同的视角意味着,我们对特定领域的任何想法最终都会得到完善和进一步改进。因此,不仅仅是匿名书呆子自己在工作,整个团队都在研究如何适应这种想法并补充了SAP HANA的其他元素。最终的结果是为客户提供更好的功能和产品。