Spring Cloud GateWay + Nacos Config实现灰度发布(reactive版)

  |   0 评论   |   0 浏览

应用程序升级面临最大挑战是新旧业务切换,将软件从测试的最后阶段带到生产环境,同时要保证系统不间断提供服务。

互联网大厂产品发布的策略

  • 蓝绿发布
  • 金丝雀发布
  • 灰度发布
  • A/B测试

蓝绿发布(Blue-Green Deployment)

通过部署两套环境来解决新老版本的发布问题。如果新版本( New Version )发生问题要进行回滚的时候,直接通过切流将流量全部切到老版本( Old Version )上。

项目逻辑上分为AB组,在项目系统时,首先把A组从负载均衡中摘除,进行新版本的部署。B组仍然继续提供服务。

当A组升级完毕,负载均衡重新接入A组,再把B组从负载列表中摘除,进行新版本的部署。A组重新提供服务。

最后,B组也升级完成,负载均衡重新接入B组,此时,AB组版本都已经升级完成,并且都对外提供服务。

特点

  • 如果出问题,影响范围较大。
  • 发布策略简单。
  • 用户无感知,平滑过渡。
  • 升级/回滚速度快。
  • 升级切换和回退比发布回滚迅速。

缺点

  • 需要准备正常业务使用资源的两倍以上服务器,防止升级期间单组无法承载业务突发;
  • 短时间内浪费一定资源成本;
  • 基础设施无改动,增大升级稳定性。

蓝绿发布在早期物理服务器时代,还是比较昂贵的,由于云计算普及,成本也大大降低。

金丝雀发布( Canary Release )

金丝雀发布也叫灰度发布,它和滚动发布很像,但是服务的替换是用流量这个维度来做替换的而不是节点这个维度。所以金丝雀发布抽象程度更高。

结合一些业界先进的工具,其实可以做到在不增加机器的情况下流量的平滑过渡,稳定回滚,替换期健康指标检查,替换前后条件核验等,是最推荐的方案。

  • 优点:灵活,策略自定义,可以按照流量或具体的内容进行灰度(比如不同账号,不同参数),出现问题不会影响全网用户。
  • 缺点:没有覆盖到所有的用户导致出现问题不好排查。

灰度发布

阿里巴巴内部有安全生产三板斧概念:可灰度、可观测、可回滚。所有研发同学必须要掌握发布系统的灰度、观测和回滚功能如何使用。

灰度发布只升级部分服务,即让一部分用户继续用老版本,一部分用户开始用新版本,如果用户对新版本没什么意见,那么逐步扩大范围,把所有用户都迁移到新版本上面来。

灰度发布(又名金丝雀发布)是指在黑与白之间,能够平滑过渡的一种发布方式。在其上可以进行A/B testing,即让一部分用户继续用产品特性A,一部分用户开始用产品特性B,如果用户对B没有什么反对意见,那么逐步扩大范围,把所有用户都迁移到B上面来。灰度发布可以保证整体系统的稳定,在初始灰度的时候就可以发现、调整问题,以保证其影响度。

特点

  • 保证整体系统稳定性,在初始灰度的时候就可以发现、调整问题,影响范围可控。
  • 新功能逐步评估性能,稳定性和健康状况,如果出问题影响范围很小,相对用户体验也少。
  • 用户无感知,平滑过渡。

缺点

  • 自动化要求高。

部署过程

  • 从LB摘掉灰度服务器,升级成功后再加入LB。
  • 少量用户流量到新版本。
  • 如果灰度服务器测试成功,升级剩余服务器。

灰度发布是通过切换线上并存版本之间的路由权重,逐步从一个版本切换为另一个版本的过程。

滚动发布( Rolling Release )

滚动发布是指每次只升级一个或多个服务,升级完成后加入生产环境,不断执行这个过程,直到集群中的全部旧版本升级新版本。

  • 红色:正在更新的实例
  • 蓝色:更新完成并加入集群的实例
  • 绿色:正在运行的实例

特点

  • 用户无感知,平滑过渡。
  • 节约资源。

缺点

  • 部署时间慢,取决于每阶段更新时间。
  • 发布策略较复杂。
  • 无法确定OK的环境,不易回滚。

部署过程

  • 先升级1个副本,主要做部署验证。
  • 每次升级副本,自动从LB上摘掉,升级成功后自动加入集群。
  • 事先需要有自动更新策略,分为若干次,每次数量/百分比可配置。
  • 回滚是发布的逆过程,先从LB摘掉新版本,再升级老版本,这个过程一般时间比较长。
  • 自动化要求高。

A/B测试

首先需要明确的是,A/B测试和蓝绿发布、金丝雀发布、灰度发布等,完全是两回事。

蓝绿部署、金丝雀和灰度发布是发布策略,目标是确保新上线的系统稳定,关注的是新系统的BUG、隐患。

A/B测试是效果测试,同一时间有多个版本的服务对外服务,这些服务都是经过足够测试,达到了上线标准的服务,有差异但是没有新旧之分(它们上线时可能采用了蓝绿部署的方式)。

A/B测试关注的是不同版本的服务的实际效果,譬如说转化率、订单情况等。

A/B测试时,线上同时运行多个版本的服务,这些服务通常会有一些体验上的差异,譬如说页面样式、颜色、操作流程不同。相关人员通过分析各个版本服务的实际效果,选出效果最好的版本。

在A/B测试中,需要能够控制流量的分配,譬如说,为A版本分配10%的流量,为B版本分配10%的流量,为C版本分配80%的流量。

灰度发布(金丝雀发布( Canary Release ))

  • 在Nacos Config配置中心对GateWay的路由策略进行更改,设置权重。
spring:
  cloud:
    gateway:
      routes:
        # v1和v2服务名不一样
        - id: product-center-v1
          uri: lb://product-center-v1
          predicates:
            - Path=/product/**
            - weight=product-center-v1, 95
        - id: product-center-v2
          uri: lb://product-center-v2
          predicates:
            - Path=/product/**
            - weight=product-center-v2, 5

原文链接:https://www.jianshu.com/p/c4952ef14660


标题:Spring Cloud GateWay + Nacos Config实现灰度发布(reactive版)
作者:michael
地址:https://blog.junxworks.cn/articles/2024/01/17/1705482362135.html