云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

阿里云_数据库表分区_速度快

小七 141 0

最近,企业信息管理软件,您可能听说过来自SAP的新流行词"SAP Data Hub"。那么,什么是SAP Data Hub?它与SAP企业信息管理(EIM)和其他技术有何不同?

企业信息管理是针对传统分析的

要了解SAP Data Hub的功能,我们首先需要研究信息管理市场在过去几十年中是如何演变的。传统上,大多数组织构建和维护一个集中式的数据仓库环境,目标是获得真相的单一版本。此外,您可能还希望实现元数据管理解决方案,以捕获和维护数据实体的定义以及它们之间的关系;或者跟踪沿袭和影响分析,以确保数据质量。随着时间的推移,我们最终会对传统EIM使用不同的工具,因为每种工具都是随着新用例的出现而引入的。

在几乎所有情况下,当您拥有一个以结构化数据为主的独立内部环境时,传统分析流程的EIM都会实现。在将数据加载到企业数据仓库以进行商业智能(BI)报告和分析决策之前,您可以使用E-T-L工具将来自各种企业源的数据转换为可用状态。E-T-L流程包含以下任务:

以上所有数据处理都发生在中间件层。你能想象一下采用这个过程来运行复杂的计算(例如机器学习、多媒体处理等)来处理分布在网络上的数PB的不同数据吗?将如此大的数据量转移到ETL应用服务器中进行复杂的数据处理基本上是自找麻烦。简单地说,传统的E-T-L方法不适合分布式环境下大数据的机器学习场景

随着数据源数量和种类的不断爆炸,以及用于连接数据源的开源和云技术的激增,越来越需要更好的方法来管理和管理所有这些数据和工具。

一种更好的管理数据、工具和人员的方法

相比之下,SAP data Hub是一个多对一的数据协调解决方案,它集成、协调、处理和管理任何类型和数量的数据—跨越整个分布式环境。它旨在解决在复杂环境中发布的数据孤岛问题,在复杂环境中,大量不同的数据存储在分布式位置(如数据湖、云存储、企业应用程序等),但一直在为数据集成和数据处理任务而挣扎。

下图说明了企业正面临着当今日益多样化和分布式的环境—概述了许多企业在大数据项目中失败的原因。

许多企业发现,在整个数据环境中生产大数据场景非常具有挑战性。首先,你需要弄清楚什么工具和资源是可用的,谁需要参与,以及你能以多快的速度得到结果。然后,您还需要考虑其他技术方面,例如:

解决方案是否针对在大量不同数据(如视频、图片、音频、文档等)上运行复杂计算进行了优化?应用程序能否轻松地与开源和第三方解决方案集成?它能帮助我减少与这些技术进行点对点集成的工作量吗?如何以可扩展的方式实现解决方案?这个过程是可重用和可重复的吗?该解决方案是否可以部署在不同的环境中(例如内部部署、云和混合环境)?解决方案有多开放?是否可以引入自定义代码?该解决方案是否提供现成的机器学习和数据科学支持?该工具是否有助于鼓励IT数据工程师和所有大数据专业人员(数据科学家、业务分析师、数据管理员等)之间的沟通、协作、集成和自动化?

如果您熟悉上述问题,那么SAP Data Hub就是您的答案。该产品的创建是为了解决跨多个网络分布着不同数据源的不同系统所固有的挑战。因为SAP Data Hub是基于云本地架构的概念构建的,所以它可以部署在任何环境(例如内部部署、云、混合)上,并且可以弹性地扩展以处理大量数据处理。

那么为什么选择SAP Data Hub呢?

一个促进跨团队协作的灵活解决方案

我认为LEGO是一个很好的类比,可以解释SAP Data Hub与其他EIM产品的不同之处。每个人都喜欢乐高,因为乐高玩起来很有趣,可以让你表达你的创造力,让你自由地建造几乎任何东西。我们使用同样的原则来创建sapdatahub,这是一个专为满足所有角色需求而设计的产品。无论您是负责将原始数据转换为可用格式的数据工程师,还是正在编写从数据中检索有价值见解的新算法的数据科学家,您都会发现SAP data Hub以有趣的方式为您的数据提供了所需的一切,以解决无限的可能性。

您拥有完全的自由控制你想要建造的东西。把每个数据操作想象成一块乐高积木,可以组合成多种配置。最酷的部分是,您可以在任何给定的时间分解您所创建的内容,企业开发软件,并重新组装它,以多种不同的方式重新组合数据和逻辑。同样的概念也适用于SAP Data Hub,在这里,您可以使用运营商构建复杂的数据管道,以支持多种类型的用例,例如: