云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

分布式存储_架设代理服务器_高性能

小七 141 0

ETL工具和分析:天作之合

博客想象一下:你订购了一件扁平包装的家具,结果却发现它是解构的、扁平包装的,而且说明书上有韩语。这些说明没什么不对的——当你懂这门语言的时候,它们就很有意义了——但是你一个字也听不懂。如果没有一种方法来解释它是如何组合在一起的,你所能做的就是乐观地摆弄这些碎片,看看你是否能创造出一些有意义的东西——即使有一些被拧错了,你也不确定它是否真的在做它应该做的事情。本质上,这就是将数据放入ETL过程时发生的情况。数据使用SQL进行组织,打包并清理以进行传输,然后存放在另一端,包装精美,但使用的语言根本不适用于分析。正因为如此,一些人举起手来说:"啊,ETL和分析——它们不能混合在一起!"……这很可惜,因为事实上,ETL和分析可以很好地匹配。你只需要让他们说同一种语言。没有他们就活不下去了事实上,仅靠ETL是不够的。一旦您将数据从一个数据仓库提取、传输和加载到另一个数据仓库(或数据集市或分隔的平面文件,或其他任何地方),您就需要能够使用这些数据来获得有关业务的重要见解,这意味着要找到某种方法链接到功能强大的可视化工具。不确定您是否需要针对您的业务场景使用独立的ETL还是集成工具?点击这里下载我们的免费白皮书"ETL:独立还是集成?价值的快速回答"媒人,媒人…解决这一问题的一种方法是使用一种集成工具,该工具将ETL与更广泛的BI平台相结合,允许您将数据从原始仓库直接提取到系统中,并将其输入到自助服务、面向用户的仪表板中,以便查询和分析。例如,Sisense的ElastiCubes可以处理99%的ETL功能,完全不需要为许多类型的业务和数据项目提供外部工具。尽管它在大多数情况下都能很好地工作,但是在某些情况下,单独的ETL仍然是更好的选择。例如,如果您是一个拥有大量数据要处理的大型全球联合企业,您大量使用多个复杂的数据源,或者您需要记录流程的每一步以实现法规遵从性,则内置的ETL工具可能没有您所需的容量。在这些情况下,通过投资于外部ETL功能,您可能会获得更好的性能。但这会给你的分析语言障碍留下什么问题呢?好吧,你只需要一些能充当翻译的东西。回到我们的平面包装类比,一个系统,可以跳进一个关键,向你确切地显示所有的部分是如何结合在一起的,这样你可以迅速地把所有的部分拉到一个优雅和功能性的东西,而不会丢失或误解任何东西。数据天堂里的匹配?例如,通过使用复杂的连接器,您可以让外部ETL完成它的工作,然后在过程完成后从目标数据存储中提取数据。像ElastiCube这样的解决方案可以毫不费力地处理SQL,允许您将所需的数据导入BI平台,并开始以几乎实时的方式将数据输入到漂亮的可视化中。自助式仪表盘更妙的是,从最终用户的角度来看,如果您使用真正的自助式解决方案,整个流程应该流畅而优美,而不必了解幕后复杂的翻译和转换。您选择的可视化工具应该足够灵活和强大,以允许业务用户构建和操作自己的仪表板,并使用他们有权访问的任何数据源运行即席查询,而不会牺牲速度或粒度。他们也应该能够自主地完成所有这些,而不必向它寻求帮助。额外津贴理想情况下,无论您选择哪种工具将ETL提升到分析领域,您的数据都应该保持不变:它不应该再次传输到第三个位置。例如,我们在Sisense的工作方式是部署一个列式数据库和芯片技术的独特组合,以便只有计算所需的数据加载到系统中,即使平台可以在您需要时立即访问它所连接的所有源中的所有数据。这些数据仍然是按需提供的,当问题被问到时,被称为"超快速贷款",以获得越来越快的答案。这使您的数据安全,并意味着您可以在本地存储所有敏感数据(如果出于法规遵从性的原因而需要),而不必为处理报告和分析而支付昂贵的基础架构费用。换言之,找到一个可以像这样直接与数据对话的系统意味着性能、治理和数据安全性得到改善,同时也意味着用户友好的仪表盘可以将有价值的数据转化为宝贵的见解。不确定您是否需要针对您的业务场景使用独立的ETL还是集成工具?点击这里下载我们的免费白皮书"ETL:独立还是集成?价值的快速回答"标签:数据准备|数据库| ETL