云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

腾讯云_阿里云身份证实名认证_企业级

小七 141 0

腾讯云_阿里云身份证实名认证_企业级

本文摘自Timo Elliott、John Schitka、Michael Eacrett和Carolyn Marsan的"数据湖:深刻的洞察"

大数据正在演变为海量数据。新一代技术将带来洞察和关联,如何学习大数据,云服务器好吗,云服务器,揭示新的战略甚至新的商业模式。

从农业、运输和金融服务到零售业,各种类型的公司都在利用被称为数据湖的海量数据存储库。他们希望发现相互关系,可以利用这些关系来扩大产品范围、提高效率、提高盈利能力,并发现他们不知道存在的新商业模式。

如何避免陷入困境

如果不小心管理实施和数据所有权,数据湖的好处可能会被浪费。部署管理海量数据存储是一个巨大的挑战。以下是如何解决公司面临的一些最常见问题:

确定投资回报率。开发数据湖不是一件小事。你需要一个好的商业案例,你需要一个可衡量的投资回报率。最重要的是,数据和大数据,你需要初始的问题,可以回答的数据,这将证明其价值。寻找数据拥有者。随着带有传感器的设备在整个组织中大量增加,大数据分析网站,数据拥有者的问题变得更加重要。制定一个数据保留计划。公司过去不得不挑选数据,因为数据存储成本太高。现在公司可以成为数据囤积者。你把它存放多久?你会永远保留它吗?管理描述性数据。允许您标记一个或多个数据池中的所有数据并使其保持最新的软件尚未成熟。我们仍然需要工具将元数据整合在一起以支持自助服务,并自动化元数据以加快数据的准备、集成和分析。培养数据管理技能。数据存储库开发存在巨大的技能差距。但如果公司愿意支付培训和认证费用,许多人会抓住机会学习这些新技能。要足够灵活地利用这些发现。过去,你向It部门提出数据请求,要等六个月才能得到答复。现在,你马上就能得到答案。公司必须灵活地利用这些见解。保护数据。除了黑客攻击和漏洞等长期存在的问题外,许多数据湖软件都是开源的,比典型的企业级软件更不安全。衡量数据的质量。不同的用户可以使用不同级别的数据质量。例如,处理大量数据点的数据科学家可能不需要完全准确的数据,因为他们可以根据需要使用机器学习对数据进行聚类或丢弃外围数据。然而,金融分析师可能需要数据完全正确。避免创建新的筒仓。数据湖应该与现有的数据架构(如数据仓库和数据集市)协同工作。

所有人的数据

考虑到多年来围绕大数据的大量炒作,人们很容易将数据湖视为在一个已经熟悉的技术领域向前迈出的一小步。但重要的不是技术,而是它使组织能够做什么。通过向任何需要数据的人提供数据,只要他们需要数据,数据湖就是跨行业创新和颠覆的强大杠杆。