云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

数据库服务器_服务器url_返现

小七 141 0

通过NoOps自动化消除云端的麻烦

野生动物摄影师通常在拍摄结束后返回,512GB存储卡上有数百GB的原始视频文件。将文件导入桌面设备大约需要40分钟,包括从计算机发出保存、复制或替换文件的各种提示。然后摄像师必须在视频编辑工具中创建一个新项目,将文件移动到正确的项目中并开始编辑。项目完成后,必须将视频文件移动到外部硬盘并复制到云存储服务。所有这些活动都可以归为体力劳动,重复性工作,没有持久的价值,并随着需求的增长而扩大。辛劳每天都会影响各个行业的生产力,包括云基础设施上托管的系统。好消息是,通过自动化,利用现有的多个云提供商工具,可以缓解大部分问题。然而,开发人员和运营商必须正确配置基于云的系统,而且在许多情况下,这些系统没有得到充分优化,需要不时进行手动干预。识别辛劳辛劳无处不在。让我们以amazonec2为例。EC2提供Amazon弹性块存储(EBS)计算和存储能力,以在云中构建服务器。与EC2相关联的存储单元是磁盘,其中包含随时间增长的操作系统和应用程序数据,最终必须扩展磁盘和文件系统,这需要许多步骤才能完成。扩展磁盘所涉及的高级步骤非常耗时。它们包括:获取您最喜爱的监控工具的警报确定AWS帐户登录AWS控制台找到实例找到EBS卷扩展磁盘(EBS)等待磁盘扩展完成扩展磁盘分区展开文件系统消除这些任务的一种方法是分配大量的磁盘空间,但这并不经济。未使用的空间会增加EBS的成本,但空间太小会导致系统故障。因此,优化磁盘使用是至关重要的。这个例子被称为toil,因为它具有以下一些关键特性:磁盘扩展过程是手动管理的。另外,这些手动步骤没有持久的价值,并且随着用户流量线性增长。这个过程将来也需要在其他服务器上重复。这个过程可以自动化,我们很快就会知道。搬到NoOps传统上,这项工作是由IT运营部门(称为Ops团队)执行的。作战团队形式多样,但他们的主要目标仍然是相同的——确保系统平稳运行。如果没有,操作团队会响应事件并解决问题。NoOps是一个操作任务自动化的概念,不需要专门的团队来管理系统。NoOps并不意味着运营商将慢慢从组织中消失,但他们现在将专注于识别辛苦,找到自动化任务的方法,最终消除它。noop驱动的一些任务需要额外的工具来实现自动化。工具的选择并不重要,只要它省去了辛苦。图1–响应系统警报的NoOps方法在我们的磁盘扩展示例中,Ops团队通常会收到系统空间不足的警报。监视工具将在IT服务管理(ITSM)工具中发出一张罚单,这将是周期的结束。在NoOps下,监控工具将向API网关发送一个webhook回调,其中包含警报的详细信息,包括磁盘和服务器标识符。然后API网关转发这些信息并触发简单的SystemsManager(SSM)自动化命令,这将增加磁盘大小。最后,Ops团队的一名成员会自动收到问题已经解决的通知。AWS系统管理器自动化监控工具和API网关在检测和转发警报方面起着重要作用,但NoOps的大脑是AWS Systems Manager automation。该服务为磁盘扩展所需的九个手动步骤构建自动化工作流,该文档是由操作员编写的系统可读指令。有些任务甚至可能涉及调用其他系统,如AWS Lambda和AWS服务,但工作流的编排是通过SSM自动化实现的,如下表所示:台阶#任务名称SSM自动化操作评论1获取触发器详细信息并扩展卷aws:invokeLambdaFunction调用使用Lambda时,系统必须确定精确的体积,并根据预定义的百分比或值进行扩展。2等待磁盘扩展aws:等待直到olumeisokonaws如果不等待时间完成就进入下一步,磁盘扩展将失败。三获取操作系统信息aws:executeAwsApiWindows和Linux发行版有不同的命令来扩展分区和文件系统。4根据操作系统分支工作流aws:分支机构自动化任务现在将基于操作系统进行分支。5展开磁盘aws:运行命令分支工作流将在操作系统上运行命令,以优雅地扩展磁盘。6向ITSM工具发送通知aws:invokeLambdaFunction调用发送关于NoOps任务成功或失败的报告以获取文档。在IT运营中应用NoOps这个例子展示了通过自动化提高运营商生产力的潜力,自动化是AWS云服务的一个关键好处。这一级别的noop也可以通过其他云提供商提供的工具和服务来实现,以高效地操作和保护大规模的混合环境。对于AWS部署,Amazon EventBridge和AWS系统管理器OpsCenter可以帮助构建事件驱动的应用程序体系结构,快速、最终地解决问题,并消除繁琐的工作。其他noop用例包括:通过提取日志的适当部分并将其附加到警报工作流中,自动确定系统故障的原因。批量执行破坏性任务,例如在多个AWS帐户上批准EC2实例的脚本重启。在监控工具上触发安全警报时,自动修改安全组的allowlist/denylist中的ip。使用服务请求自动恢复数据/数据库。识别高CPU/内存进程,并在需要时自动终止/重新启动。磁盘利用率高时自动清除临时文件。当EC2实例死亡时自动执行EC2救援。在任何计划或计划的更改之前自动拍摄快照/Amazon机器映像(AMI)。对于野生动物摄像师来说,NoOps原则可以用来消除重复性工作。脚本可以自动完成复制、加载、创建项目和归档文件的过程,节省了无数小时的工作,并使摄像师能够专注于制作的核心方面。对于云架构,NoOps应该被视为Ops团队的下一个逻辑迭代。为了帮助运营商专注于站点的可靠性和改善服务,省去了繁重的工作。