云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

免备案CDN_网易企业邮箱注册入口_12月免费

小七 141 0

现代数据中心的即时虚拟机恢复注意事项-第1部分

在设计备份解决方案时,我们进行了大量的讨论和思考,以合理的成本实现足够的容量和性能。通常重点是备份,但我们也需要考虑恢复。恢复速度越快,停机时间和经济损失就越少。即时虚拟机恢复可以实现最快的恢复时间。这很好用,但在规模上,您需要担心那些快速可用的虚拟机的性能,以及所涉及的操作如何影响您的环境。我们将讨论一些关键的设计考虑事项,以使即时虚拟机恢复大放异彩。如果您还没有听说过即时虚拟机恢复,您需要去阅读用户指南中的相关内容。Veeam将其描述如下:"使用即时虚拟机恢复,您可以通过直接从压缩和重复数据消除的备份文件运行虚拟机,立即将其恢复到生产环境中。即时虚拟机恢复有助于改进恢复时间目标,最大限度地减少生产虚拟机的中断和停机时间。"除了即时虚拟机恢复之外,这里的许多设计点还将有助于优化"正常"备份和恢复。但是,当时间和可伸缩性是恢复过程中最重要的因素时,即时虚拟机恢复是一个很好的功能。当服务启动并运行时,速度的好处是显而易见的。当您只对一个或几个vm执行此操作时,知道这个选项的存在可能是您应该关心的全部。但是,当您可能有不同的外部和/或内部客户拥有数百甚至数千个vm时,情况会发生一些变化。考虑这样一种情况:当您有一个子集的虚拟机非常重要时,您的恢复时间目标变得至关重要。您可以拥有所需的所有高可用性和冗余性,如果没有计划在出现问题时尽快恢复它,就不应该存在任务关键型服务。如果您希望或需要同时恢复多个虚拟机(几十个或更多),该怎么办?如何确保快速可用的虚拟机的性能足够,并且能够在特定时间范围内处理所需数量的并发恢复?除此之外,您能否做到这一点,而不会对仍在运行或同时恢复的工作负载造成太大的负面影响?优化与过度设计我为一些小型的任务恢复设计了一些小型的虚拟机服务解决方案。参与调查的虚拟机数量从6个到30个不等。我还帮助提出了一个更大规模的设计,以实现更广泛的功能。这种情况是由于希望减少从整个销售灾难中恢复所需的时间,例如存储损坏(确实会发生)甚至勒索软件攻击。即使备份本身不受影响(与虚拟机不同的存储)或未加密,因此不需要从非现场/空气间隙系统中恢复,恢复也可能需要太长时间。这可能使支付成为更经济可行的选择,如果这可行的话(是的,勒索软件运营也可能存在SLA问题)。设计目标是为所有虚拟机提供快速、并行的虚拟机恢复以及已知的已确定的恢复优先级,以便尽快启动并运行。所有这些都比在一次重大勒索软件攻击和解密备份和/或工作负载后支付解密密钥的成本和时间都要低。这很简单,但也许不是那么容易做到的。除了速度之外,最大的问题是保护基于磁盘的备份免受勒索软件的攻击。加强存储库和保护访问(多因素身份验证)是这里的关键。我自己总是喜欢有多种选择来快速恢复数据,如跨阵列复制的应用程序一致性SAN快照或空隙拷贝(即磁带或虚拟磁带库)。有些组织没有这种能力,对他们来说,更重要的是要确保他们所拥有的是坚如磐石的。优化总是与制衡有关,否则它就会成为沉迷于过度设计的极客。明确地说,我并没有声明或声称您需要能够通过即时虚拟机恢复来快速恢复所有虚拟机,并且不会对性能造成太大影响。但是,如果您通过这种方式让20个、50个、100个……最重要的任务关键型服务虚拟机恢复在线,那么您将在等待其余服务恢复在线的同时,让您的业务再次运转。我所构建的东西有时被称为过度,但我见过太多的情况,备份和恢复只是一个低优先级的问题,只要有一个解决方案,任何解决方案都能做到。通常情况下,在恢复时间到来之前这一切都很顺利。请注意,在优化备份和恢复时,您必须始终关注备份设计和Veeam组件在多站点环境中的位置。在这方面,即时虚拟机恢复并不是魔术。最后,我不介绍在勒索软件事件中你将面临和需要克服的黑暗时刻。比如你的集群在加密资源上表现不佳。您需要停止攻击,否则您只需向环境中添加要加密的新文件。那些日子漫长,黑暗,绝非易事。性能的先决条件这里的目标是尽可能快速地恢复多个虚拟机,并使这些虚拟机运行时不会造成显著的性能损失或对其他工作负载造成影响。这需要:快速读取备份目标一种用于数据移动的快速网络结构一个快速恢复目标(可以是备份源),用于接收所有涉及的IO这就是我们关注的地方。本质上,这很简单。你需要充足的资源(计算、网络、存储)。简单是好的,但是容易做吗?调整大小是困难的,但是优化的选项和技术对于普通的和即时的虚拟机恢复来说并没有什么不同。备份存储目标的速度越快,即时恢复的虚拟机的性能就越好,因为要从那里读取数据,以便恢复和操作虚拟机。您的网络需要能够优雅地处理流量。10Gbps(或更好)是最好的选择。最后,虚拟机恢复到的存储也需要性能良好。首先,所有新的IO都写在那里,所以您希望存储器能够在从备份目标同时恢复数据的同时处理这些问题。当您从单个组件的性能(向上扩展)考虑计算、网络和存储时,横向扩展就开始发挥作用了。在这里,您可以添加多个备份目标和恢复目标,以便即时虚拟机恢复能够同时恢复更多虚拟机。让我们更详细地看一下这个。即时虚拟机恢复的备份目标注意事项在备份方面,我们尝试使用一种解决方案,其中最新的备份将降落在快速存储上,从而提供巨大的备份吞吐量。这会增加成本,因此我们需要将较旧的备份转移到更经济高效的解决方案中。根据存储阵列的不同,较旧的备份可以分层到较便宜的存储或复制到较低层的备份存储库。这里有入门级SANs和S2D的选项,不是所有的解决方案都提供共享存储,也不需要。这取决于对备份目标可用性的要求。这里的目标是提供一种经济高效的方法,将最新的备份存储在性能存储上。这可能是一天中的前四次备份,也可能是过去两天的每日备份,等等。同样,这取决于您的需要。这肯定会涉及一些SSD甚至NVMe层。这里的关键点是,您将在即时虚拟机恢复场景中使用的备份很可能是来自最新还原点的最新备份。它们驻留在一个快速存储上,因此在即时虚拟机恢复过程中可以提供最佳性能。尤其是当多个即时恢复作业正在运行且其他备份作业仍处于活动状态时。正在读取虚拟机IO的数据,因为虚拟机"立即"可用(磁盘装载)。但是数据也被读取以恢复虚拟机(数据恢复)。而其他备份作业可能正在写入该目标。让我们看一些例子。根据规模和预算,你有不同的选择。我们来看看其中的三个。任何对你有用的东西都会做,而且这些还有其他的选择。例1购买一个像样的入门级SMB/SME SAN(不必再让银行破产)和可配置的分层。为备份提供较低容量的第1层存储层,并设置存储进度策略,将较旧的数据向下移动到第2层更高容量的存储层。您可以使用它来构建高可用性或非高可用性备份存储库。只要遵循IOPS和延迟,就可以将存储库添加到SAN中。如果没有,你可以有更多的,并扩大规模。通常,尽量避免为工作负载和备份使用相同的存储阵列类型。可能导致数据损坏的固件错误确实存在,您希望将风险降到最低。例2直接部署存储空间以从高可用性、多目标服务器和ReFS多弹性卷(MVR)中获益,提供保护和镜像加速奇偶校验,您可以调整大小,以便在将"冷"(超过移动数据的阈值时无法访问的数据)数据移动到较便宜的容量层之前,它可以将"热"(最近写入的)数据保存在SSD镜像中一段时间。它具有扩展和扩展能力。例3构建一个第2层备份解决方案,也许只用于那些需要最快备份和恢复的虚拟机的备份。这可能涉及两个2TB的SSD/NVMe驱动器,这些驱动器具有较短的保留备份作业,并将这些备份复制到更便宜的长期存档备份目标。它们可以在同一存储库主机上,也可以在不同的存储库主机上。你可以利用Vee