云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

专属服务器_服务器型号_最新活动

小七 141 0

在今天和过去关于需求的数据治理会议和讨论中,有很多关于元数据扫描、导入技术元数据(如表名和列)以及查找列和数据的重复项的讨论。但是在这些讨论中,我们常常没有意识到数据沿袭的必要性,仅仅技术元数据不足以帮助DBA理解和建模数据,从而实现高效的数据管理。从源系统到目标系统的数据沿袭以及到业务元数据(如业务术语定义和规则)的沿袭对dba和技术用户至关重要。有一个所有数据资产的目录是很重要的,并且知道什么是可用的,数据在哪里(哪些表、数据库和系统)。在Collibra中,我们可以从不同的源(比如数据库)导入这个元数据目录。但DBA还需要了解:表和列的含义和用途是什么谁是企业主哪个应用程序拥有它它是如何从源到目标链接和转换的可以要求DBA用一些字段和列创建一个新的数据库,或者转换现有的表、列和数据库。dba通常使用带有所有数据库和系统目录的大型电子表格来工作。但他们很少知道每个表、数据库或列的用法以及它们将如何相互连接在一起。因此,很难确定该内容的数据库、表或列是否已经存在。因此,很多时候,dba只是简单地创建相同数据的副本,代价是消耗更多的资源,并产生数据质量问题。DBA不知道表或列从业务角度表示什么这一事实使得无法做出任何数据建模决策,这可以极大地提高数据系统的性能和质量。因此,技术人员在他们的数据上看到语义层非常重要,原因如下:正确的数据建模减少冗余以获得更好的磁盘和内存容量通过更好地控制冗余和改进数据模型来提高性能控制访问也会带来更好的性能更容易管理DBA不喜欢处理不代表任何内容的名称,如表ABC和列XYZ,因为这无助于DBA高效地管理数据库系统。此外,当用户询问包含他或她所需数据的列和表是什么时,DBA应该能够给出正确的答案。但是,只有当DBA知道数据的含义时,才会发生这种情况。这就是为什么Collibra不仅帮助商务人士,而且也帮助技术部门。下面是一个DBA将表和列的元数据信息导入Collibra的示例。这可以通过Collibra Connect自动完成。图1:将技术元数据导入Collibra的示例-表和列的示例现在,可以通知DBA或数据管理员一个任务,将这些列链接到适当的业务术语,这些术语具有如下示例所示的含义:图2:将表列(例如mobbh)链接到业务术语Customer Mobile Phone和主资产(用于MDM)的示例通过这种方式,列成为业务术语的权威源或另一种类型的数据源,数据衍生开始形成并围绕数据创建意义。此外,Collibra会自动提供与这些数据相关的其他资产的建议,这样DBA就可以更快、更高效地决定什么是关系。图3:Collibra为资产向其他资产的沿袭提供的建议示例最重要的是,Collibra提供了从数据资产(列或表、数据库或系统)到业务术语以及其他资产(如问题、系统、甚至进一步的策略和业务规则)的数据沿袭的可视化表示。图4:从表列到业务术语、主数据,甚至链接到问题、使用系统和MDM系统因此,DBA可以很容易地确定哪个列表示报表、应用程序或其他业务用户请求所需的业务资产。此外,Collibra还为DBA提供了识别冗余的功能,例如在所有数据库和系统中搜索重复列:图5:过滤重复列及其所有属性、表、模式和它们所属的数据库的示例通过检查列与其他资产的连接,DBA可以更容易地识别列/表的值,并根据需要对其存在或修改做出正确的决定。总之,业务术语到技术元数据的数据沿袭有助于dba和技术管理员以更好、更高效的方式执行他们的工作。它有助于他们了解数据的位置和意义,以便更好地管理数据质量、减少冗余、提高数据建模效率,并在业务需要时减少搜索数据的时间和成本。Collibra提供了一个独特、用户友好且功能丰富的平台,以完整的方式实现这一沿袭,通过工作流和通知,允许对数据资产进行轻松的持续维护和更改管理。