云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

百度云_dell服务器硬盘_代金券

小七 141 0

亚马逊服务器_表较好的_人工智能教育平台

编者按:我们请金融机构KeyBank分享他们将数据仓库从Teradata转移到Google云的故事。以下是他们为什么转向云的细节,他们是如何进行研究的,以及云可以带来什么好处。

在KeyBank,我们在线和亲自为350万客户提供服务,管理和分析数据对于提供优质服务至关重要。我们每天处理超过40亿条记录,并将这些数据转移到40多个下游系统。我们的团队以多种方式使用这些数据;我们有大约400名SAS用户和4000名Tableau用户探索分析结果和运行报告。

我们在四五年前引入Hadoop作为我们的数据湖架构,使用Teradata进行高性能分析。我们在Hadoop中在大约150台服务器上存储了超过1 PB的数据,在Teradata环境中存储了超过30 PB的数据。当我们开始触及内部数据仓库能够满足我们业务需求的极限时,我们决定将操作转移到云上。我们希望快速转向云计算,并为我们的团队开发新的分析功能。

考虑和测试云平台

Teradata在我们首次部署它时对我们非常有用。当时,淘客qq群,Teradata是数据仓库领域的市场领导者,许多领先的银行都在这方面进行了投资。我们选择它是因为它的高性能分析功能,我们的营销和风险管理团队大量使用它。它还与我们使用的其他SAS工具配合得很好,SAS仍然是访问我们大型机的好工具。

使用Teradata十年来,大数据+,我们有很多特定于产品的数据存储。它不是一个完整的数据湖架构。我们还维护200多个SAS模型。2019年,我们的Teradata设备接近产能,我们知道2021年它们将需要更新。我们希望避免这种更新,并开始使用Snowflake和Google cloud进行概念验证云测试。

当我们进行这些测试时,我们运行了加载时间、ETL时间、性能和查询时间的比较基准。雪花看起来就像Teradata,但在云中。通过Google,我们了解了平台的所有相关技术。如果我们选择Snowflake,我们就不可能在一个云平台上。我们选择了googlecloud,因为它可以让我们简化,并为我们提供更多的发展选择。

适应云平台

随着技术的不断变化,我们的团队将不得不学习一些新的技能。当我们转向云架构时,我们的主要目标是以Hadoop为代价在单一平台上获得Teradata的性能。管理运行在Teradata体系结构上的Hadoop数据湖非常复杂,实际上需要两种不同的技能集。

在做出这类传统与现代企业技术决策时,有一些重要的考虑因素。使用Teradata这样的内部数据仓库,您可以控制容量,因此性能会随硬件在任何给定时间的负载而变化。例如,这导致分析用户在月末处理时达到极限。有了谷歌云,我们可以选择几乎无限的容量。

成本节约是我们转向云的一个重要原因。云计算的定价模式有很大的不同,但最终我们的目标是不为仅仅停留在那里而不是在使用中的存储付费。云计算给了我们一个机会,淘大客,如果需要的话,我们可以扩大一个月的规模,然后在高峰过后再缩小规模,更好地管理成本。弄清楚这是我们学到的一项新技能。例如,在Teradata或Hadoop中运行一个错误的查询不会改变该查询的内部开销,但会消耗马力。在Google云上运行这个查询不会影响其他用户的性能,但会让我们付出代价。因此,我们正在进行培训,以确保人们不会犯这些类型的错误,确保他们运行正确类型的查询。

转向云计算

实际的云迁移需要与安全团队密切合作,以满足他们的需求。我们还需要调整数据格式。例如,我们必须确保ETL处理可以与Google云存储桶和BigQuery数据集进行通信。我们发现大部分查询都无缝地移植到BigQuery。我们不得不调整一些数据类型。

自从移动到云计算后,早期的结果非常有希望;我们看到查询性能提高了3到4倍,而且我们可以轻松地提高或降低容量。我们有五个数据集市正在测试中,以使用真实世界的数据量来获取比较查询。

我们仍在修改我们在云中设置和配置服务的方式。当您现在在云中安全地拥有和操作数据资产时,这些都是变化的一部分。我们必须确保任何个人识别信息(PII)都被安全地存储和标记化。随着生产数据的增加,我们还将继续调整成本管理。

管理变化和规划未来

云的变化管理是迁移过程的一个重要组成部分。即使有了现代的数据架构,当我们将工作负载转移到Google云时,大数据是什么概念,我们仍然在改变既定的模式和用例。向基于容量的模式转变是一个很大的变化,在这种模式下,我们可以按需更改容量以满足我们的需求,而不是使用旧的Teradata方法需要更多的硬件。帮助400个用户迁移到更新的工具需要一些时间和计划。我们在谷歌的帮助下举办了培训课程,并确保业务分析师能够提前提供反馈。我们还为分析员提供了培训和认证。