云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

域名注册_域名服务器_企业0元试用

小七 141 0

数据智能化的12个步骤:第一部分

总是有类比来描述数据的价值。英国数据科学家克莱夫·亨比(Clive Humby)曾将其称为"新石油",为现代商业提供动力。这个比喻持续了十多年,但有点迂腐,被嘲笑为错误的对等。例如,石油是由少数人囤积起来的,而数据必须是无所不在和共享的。有人进一步将其与原子能甚至外层空间作了比较,表明了其中无限的可能性和危险性冒着提出另一个没有抓住重点的类比的风险,我们相信数据最像水:基本的、基本的、生命的肯定。可以肯定的是,它可以是泥泞的和危险的。但当它是明确的和控制的,它是关键。是的,水可能含有毒素,把你带到险恶的急流中,误导你,使你迷失方向,等等。但毫无疑问,水贯穿了自然界的方方面面——人类和系统——它不仅帮助生物体生存,而且还使它们繁衍生息。这就是数据的工作原理。它贯穿于所有公司的所有业务,帮助它们建立市场地位,支持创新和成功,这也是我们实现数据智能的途径。对于一家公司来说,实现数据智能化并不是一个"简单的按钮"。它需要来自多个团队的协调、来自领导层的认同以及从a点到Z点的清晰路径。我们已经制定了一个12步的过程,以使过程尽可能清晰。在这个由五部分组成的系列文章中,我们将探索数据智能化之旅。我们将开发一个真实的、易于理解的场景,以了解数据如何推动关键决策和可操作的计划,在每个里程碑处暂停以整理情报,然后继续前进首先,让我们安排一下场景。想象一下一个好公司的好时机——销售额上升,新产品受到好评,前景似乎光明。但在上个季度末,出现了一个黑点:客户流失。新客户源源不断地涌入,这很好,但现有客户正在流失。没有人预料到这一点,如果董事会还没有出现恐慌,那只是时间问题。投资者在问问题,而管理层还没有答案于是我们遇到了"克里夫",他被告知要找出问题所在:顾客为什么要离开?他们有什么共同点?在数据分析中可以找到防止流失的原因和方法这是一项至关重要的任务,但克里夫是一名商业分析师。为了完成他的工作,他需要获得正确的数据,而且他需要以思维的速度。但和许多公司一样,这是一个冒险的提议。数据由组织中的多个团队管理和保护。这是一个抽样…举几个例子。信息技术顺从合法的技术安全数据管理员/数据科学家财务这是最基本的部落知识,要想突破这一困境,克里夫需要确定哪些数据是可用的,以及在哪里可以找到最好、最值得信赖的版本。授权访问需要安全性、合规性以确保访问不会违反行业规定、技术人员需要提取不同的来源和格式、数据科学家需要帮助建立血统和透明度等这就是为什么我们科利布拉公司如此强烈地提倡数据民主,这是数字化转型的真正支柱。数据必须属于每一个知识工作者或数据公民,以这样一种方式在系统中流动,以便业务专业人员能够与个人风格和优先级进行连接、交流和协作。它可以是随机的,也可以是自动化的,也可以是扩展的或者重新聚焦的,但是它必须是可信的和相关的。作为一名业务分析师,Cliff知道当他有好的、值得信赖的数据时该怎么做,但是从哪里开始搜索,如何获得许可,谁可以使用SQL、Python、R等技术来帮助提取和转换数据,何时以及由谁来批准,这些问题仍然存在。在某些方面,他和我们其他人一样——一个信息消费者,一个寻找正确数据的网上购物者。他想在货架上浏览,比较不同的产品,在购物车里放一些,然后回家制定一个计划。他在生活中的其他活动中都是这样做的;为什么这个练习就不能这么简单呢?随着舞台的设置,让我们跟随克里夫踏上他的12步数据智能之旅…步骤1:构建业务词汇表我们需要一种共同的语言来互相理解。这与国籍、编程工具甚至不同的数据源无关。它指的是,在几乎任何一家规模相当大的公司,都有多种方法来表达同一件事。企业中的不同用户使用相同的术语来表示不同的事情。例如,什么是客户?你如何计算独特客户的数量?不管你问谁,你会得到同样的答案吗?如果没有商业术语表,答案很可能是"不"不同的分类或数据集之间的差异不需要人们去理解。缺乏共同理解会削弱信任,阻碍组织绩效,并挑战特定业务决策的可信度业务术语表成为您公司的语义翻译程序。强迫一个大型组织中的每个人都采用一种新的语言并不是一种选择;但是,帮助组织中的每个人学习如何使用语义翻译与其他人进行交流,将导致清晰、高效和更深入的理解。业务用户可以本能地、直观地找到他们想要的东西,而不必掌握表、字段、列名和元数据—实际上,也不必成为数据科学家。它通过提供所有业务术语及其相关数据、元数据和数据沿袭的全面视图来提高透明度从任何角度和理解,克里夫都可以用自然语言开始他的旅程。Cliff可以从"客户流失"这样的术语开始,不仅可以查看已批准的定义,还可以查看公司所有部门、业务部门等如何定义该定义,最好使用什么类型的数据来理解它,并使用Collibra的数据智能服务,克里夫将在他的路上发现哪里可以找到支持他的分析的最佳数据。步骤2:建立数据域模型每一家公司,无论是公共的还是私人的,无论是营利性的还是非营利的,都有一个共同的需要,那就是确定最重要的东西来实现他们的使命。这些"东西"是公司的焦点,通常最好用客户、员工、产品和位置等名词来描述。我们称之为这些域,它们作为驱动业务的每个关键名词的逻辑表示,并为您希望考虑的任何分析建立上下文让我们以客户域为例。在任何规模的组织中,特别是向其客户提供多种产品或服务的组织中,您可能会找到两个或多个系统或应用程序来捕获和存储有关客户的信息。很有可能的是,虽然它们存储了大量相同的信息,但这些不同的系统不会以相同的方式存储这些信息,也不会对相同类型的信息使用相同的名称。例如,假设部门A使用Salesforce实现Salesforce自动化,而部门B使用Netsuite CRM。这两个SFA解决方案都捕获有关客户的信息,但是它们的底层数据库并没有以相同的方式组织或引用这些信息(通常称为属性或字段)。Salesforce可能将出生日期引用为"DOB",并将其存储在与客户姓名相同的表中,而Netsuite CRM可能将其引用为"出生日期",并将其存储在不包含客户姓名的表中。客户的逻辑表示有助于您的组织将部署在您环境中的许多系统和应用程序之间的差异合理化为通用或共享的描述和结构。就像businessglossary提供了一个语义转换器一样,领域模型也为您提供了一个一致的、通用的表示,来表示对您的公司最重要的内容。你可以立即将你的商业智能领域的一个术语,比如一个自然的术语表和一个自然的术语表关联起来。您可以将许多事情与您的逻辑域关联起来,这将有助于自动化和确保组织管理方式的一致性,确保法规遵从性,并在整个数据驱动业务中提高生产率。例如,当您对客户域建模时,您可以识别每个逻辑属性,这些属性是个人可识别的信息,如全名、SSN、电子邮件地址等。这将有助于塑造和描绘整个组织中数据的使用、访问和监控方式。数据域位于数据智能领域的中心,与数据智能图中管理的任何其他概念、数据、报表、算法、API或其他任何概念都提供了强大且可传递的关系。步骤3:定义策略管理和引用管理什么是数据治理?关于这一定义,不乏观点、文章和坚定的信念。许多都是自私自利的,大多数都不是完全错误或完全正确的,但它们都有一个共同点:数据治理是建立和实施以数据为中心的策略的实践。我们认为这些是正确使用和管理数据的指南,有助于确保整个公司的一致性。角色和责任、数据所有权、数据使用协议、保留和销毁策略等等,都是执行和遵守规则的框架,无论是公司定义的还是法规定义的,这样您的公司仍然是合规的