云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

对象存储_王牌特工黄金圈百度云_排行榜

小七 141 0

云数据库服务器_便宜的_哪一个云服务器好

与许多组织一样,您采用各种风险管理和风险缓解策略来保持系统运行,包括Google Kubernetes引擎(GKE)环境。这些策略确保了在可预测和不可预测的停机期间的业务连续性,现在,当您努力限制流感大流行对您的业务的影响时,它们尤其重要,我们将提供关于如何在所谓的第0天设置GKE集群以提高可用性的建议和最佳实践。然后,请继续关注第二篇文章,它描述了集群启动并运行后第2天的高可用性最佳实践。

在考虑GKE集群的高可用性时,第0天常常被忽略,因为许多人认为中断和维护是第2天运行的一部分。实际上,在部署工作负载之前,有必要仔细规划GKE集群的拓扑和配置。

为工作负载选择正确的拓扑、规模和运行状况检查

在创建GKE环境和部署工作负载之前,需要确定一些重要的设计点。

选择正确的拓扑对于您的集群,电力物联网,gke提供两种集群:区域集群和区域集群。在分区集群拓扑中,集群的控制平面和节点都运行在创建集群时指定的单个计算区域中。在区域集群中,控制平面和节点跨单个区域内的多个区域复制。

区域集群由三个Kubernetes控制平面仲裁组成,提供比区域集群可以为集群的控制平面API提供更高的可用性。尽管在控制平面不可用的情况下,节点上运行的现有工作负载不会受到影响,但有些应用程序高度依赖于集群API的可用性。对于这些工作负载,您最好使用区域集群拓扑。

当然,选择区域集群也不足以保护GKE集群:扩展、调度和替换pod是控制平面的责任,如果控制平面不可用,则可能会影响集群的可靠性,这可能会导致只有当控制平面再次可用时才恢复。

您还应该记住,区域集群有冗余的控制平面和节点。在区域拓扑中,节点在不同区域之间是冗余的,这可能会导致昂贵的跨区域网络流量。

最后,尽管区域群集自动缩放尽最大努力在三个区域之间分布资源,但除非发生缩放操作,否则不会自动重新平衡资源。

总之,为了获得更高的可用性为了最大限度地减少在控制平面上维护时对群集的中断,我们建议您设置一个区域群集,其中节点部署在三个不同的可用性区域中,并注意自动缩放。

横向和纵向缩放容量规划很重要,但您无法预测一切。为确保您的工作负载在峰值负载时正常运行,并在正常或低负载时控制成本,我们建议探索GKE最适合您需求的自动缩放功能。

将垂直Pod自动缩放(VPA)与节点自动配置(NAP a.k.a.)结合使用。,Nodepool Auto Provisioning)允许GKE有效地横向(pods)和纵向(nodes)扩展集群。VPA自动为CPU、内存请求和容器限制设置值。NAP自动管理节点池,并从用户创建的节点池集中删除仅启动新节点的默认限制。

以上建议优化了成本。例如,关于云服务器,NAP通过在未充分利用的时段关闭节点来降低成本。但也许您不太关心成本,而更关心延迟和可用性在这种情况下,您可能希望从一开始就创建一个大型集群,并使用GCP预留来保证您所需的容量。但是,这可能是一种成本更高的方法。

检查默认的监视设置Skubernetes非常擅长观察工作负载的行为,并确保负载在开箱即用的情况下均匀分布。然后,通过将工作负载中的特定信号暴露给Kubernetes,可以进一步优化工作负载可用性。这些信号,即就绪和活跃度信号,为Kubernetes提供有关您的工作负载的额外信息,帮助它确定它是否正常工作并准备好接收流量。让我们来检查准备就绪和活跃性探测之间的差异。

每个应用程序的行为都不同:有些应用程序可能需要比其他应用程序更长的时间来启动;有些是运行更长时间的批处理进程,云购,可能会被错误地认为不可用。就绪性和活跃性探测器正是为此目的而设计的,目的是让Kubernetes知道工作负载的可接受行为。例如,一个应用程序可能需要很长时间才能启动,在此期间,您不希望Kubernetes开始向它发送客户流量,因为它还没有准备好为流量提供服务。当应用程序完成初始化并准备好为最终用户服务时,使用就绪探测,您可以向Kubernetes提供准确的信号。

确保设置就绪探测,以确保Kubernetes知道您的工作负载何时真正准备好接受流量。同样地,当一个工作负载实际上没有响应或者只是忙于执行CPU密集型工作时,设置一个活跃度探测会告诉Kubernetes。

最后,准备和活跃度探测只有在它们被定义和编码时才是好的。确保您测试并验证您创建的任何探测。

正确设置部署