云网站服务器_国内数据云存储_移动云数据库服务器主机-搜集站云

美国cn2服务器_如何选_学习人工智能技术

小七 141 0

美国cn2服务器_如何选_学习人工智能技术

编者按:我们今天听到的是来自英国华纳音乐集团的一个演唱会发现服务。Songkick每年帮助全球超过1.75亿音乐迷追踪他们最喜爱的艺术家,发现音乐会和直播流,并通过他们的移动应用程序和网站自信地在线购买门票。以下是团队如何通过将数据从物理服务器移动到云端来简化流程并开拓新的潜力。

自2007年以来,我们一直致力于让粉丝尽可能轻松、有趣和公平地观看他们喜爱的艺术家的现场表演。为此,我们收集艺术家、促销员和票务合作伙伴共享的信息,将其存储在事件信息数据库中,并在跟踪数据库中对照用户标记的数据进行交叉引用。这让我们的用户知道谁在他们最喜欢的场地演出,他们最喜欢的艺术家在哪里演出,以及如何在门票一上市就买到门票。

多年来,所有这些都依赖于物理服务器空间。我们在一个非现场位置管理了三个机架,因此每当我们遇到任何硬件问题时,就意味着需要有人亲自前往该位置进行更改,即使是在半夜。这对我们的团队来说意味着更多不必要的、耗时的工作,以及更大的长时间停机的可能性。当我们被华纳音乐集团收购时,我们评估了作为一个工程团队,我们应该专注于什么以及我们想要实现什么样的价值。很明显,维护物理机器或数据库服务器不是其中的一部分。

移动到全球场所

移动到云是显而易见的解决方案,当我们做研究时,我们发现谷歌云是我们最好的选择。通过采用谷歌云管理服务,我们的所有数据库基础设施都为我们管理,这意味着我们不必处理硬件故障等问题,尤其是凌晨4点。这也意味着我们不再需要处理最令人头痛的基础设施之一,即软件升级,在测试和准备工作之间,以前升级物理异地服务器需要一个多月的时间。老实说,我们很高兴让谷歌来处理这个问题,企业应用平台,大淘客网,我们的工程师可以专注于开发软件。

幸好谷歌云的迁移非常容易。使用外部复制,我们一次移动一个数据库实例,每个实例大约有5分钟的停机时间。我们本可以做到几乎零停机时间,但这不是我们的场景所必需的。今天,我们的四个数据库都运行在cloudsqlformysql上,其中最大的数据库是音乐事件信息和艺术家巡演以及在专用实例上托管的节目跟踪信息。这些数据非常大;我们的总数据使用量约为1.25TB,其中包括约400 GB的事件数据和100 GB的跟踪数据。两个较大的数据库是8cpu,30gb内存,另外两个是4cpu,物联网操作系统,15gb内存。我们将这些数据复制到我们的暂存环境中,因此CloudSQL中的总数据约为2.5 TB。

总体而言,我们可以减少思考和处理MySQL的时间,更多的时间进行直接影响业务的改进。

使用云SQL保持数据的干净和清晰

Songkick的一大优点是我们直接从艺术家、促销员、场馆和售票员那里获取数据,自建站平台,这意味着我们可以在数据可用时尽快获得更准确的信息。这样做的缺点是,大数据的未来,当数据来自所有这些来源时,意味着它以多种格式出现,而这些格式通常不是为了协同工作而创建的。这也意味着我们经常从多个来源获得相同的信息,这会让用户感到困惑。

云SQL充当我们的真实数据源,确保我们所有的团队和包含我们业务逻辑的30个应用程序共享相同的信息。我们在传入数据存储到云SQL之前对其应用重复数据消除和规范化规则,从而降低不正确、不一致、重复或不完整数据的风险。

这只是我们在Google Cloud上寻求改进的Songkick的开始。我们计划扩大我们的数据处理业务,包括为艺术家创建一项服务,向他们展示他们最吸引观众的地方,帮助他们规划更好的巡演。我们希望通过聚合BigQuery上的查询,然后将汇总的结果存储回cloudsql来简化这个过程。对于歌迷和艺术家来说,这意味着更好的体验,而这一切都是从更好的云数据库开始的。