导读: AzonWebServices(AWS)在其故障注入服务(FIS)中添加了新的中断模拟器,以帮助客户了解其公司对重大中断的恢复能力。该公告是在该公司的AWSre...
AzonWebServices(AWS)在其故障注入服务(FIS)中添加了新的中断模拟器,以帮助客户了解其公司对重大中断的恢复能力。
该公告是在该公司的AWSre:Invent活动期间发布的,通过引入针对AWS可用区完全断电或与另一个AWS区域的连接丢失的模拟,让客户“将混沌工程大规模付诸实践”。
亚马逊表示,工程师可以这样做,以便更好地了解其直接和间接依赖关系,并测试中断后的恢复时间。
尽管云服务总体上被证明是可靠的,但日益加剧的地缘政治紧张局势让企业担心潜在的中断及其对业务可能产生的影响。更不用说最近发生的一些相当尴尬的错误,包括一个简单的拼写错误导致巴西的Azure中断长达数小时。
FIS的新增内容包括“AZ可用性:电源中断”。亚马逊表示,这将伪造可用区中一组目标资源的“拔掉插头”,包括“EC2实例(包括EKS和ECS集群中的实例)、EBS卷、AutoScaling组、VPC子网、AzonElastiCache适用于Redis集群和AzonRelationalDatabaseService(RDS)集群。”
另一项测试“跨区域:连接”将阻止应用程序访问另一个目标区域中的资源,包括来自“EC2实例、ECS任务、EKSPod、附加到VPC的Lambda函数……流经TransitGateway的流量”和VPC对等连接,以及跨区域S3和DynamoDB。”
Azon已确认,这些测试将在所有已提供FIS的AWS商业区域中提供,并且将花费运行实验所消耗的操作分钟数。