云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

智数先锋说
• 阅读 76

作者:周静、吴宇奇、泮圣伟

在应用开发测试验证通过后、进行生产发布前,为了降低新版本发布带来的风险,期望能够先部署到灰度环境,用小部分业务流量进行全链路灰度验证,验证通过后再全量发布生产。本文主要介绍如何通过阿里云 MSE 微服务引擎和云效应用交付平台AppStack 实现灰度发布。

读完本文,你将了解到:

  • 以 SpringCloud 应用为例,了解全链路灰度场景及其工作原理;
  • 如何基于云效 Appstack 完成应用基线环境的部署,实时观测环境部署进度;
  • 如何平滑为存量应用添加灰度环境、灰度发布流程,不影响已有发布流程;
  • 如何基于 MSE 实现自定义多种灰度路由规则条件,精准测试灰度流量;
  • 如何实现应用灰度环境下线,及时清理无用资源。

场景描述

本文将以 A、B、C 三个 SpringCloud 应用为例,展示如何通过阿里云云效 AppStack 来整合 MSE 全链路灰度的功能,实现将应用一键部署到灰度环境,并进行全链路灰度的测试。

假设已有 A、B、C 三个应用的基线版本正在运行。整体上应用的调用链路是,客户端入口流量首先到达网关应用,而后按顺序经过 A、B、C 三个应用:

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

一次需求发布窗口中,应用 A 和 C 进行了迭代,需要对 A 和 C 的新版本进行全链路灰度测试,调用链路如下:

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

整体方案

通过云效 AppStack,在应用发布流程上增加一个灰度流程。每个应用走到生产环境部署前,都会先发布到灰度环境。通过灰度标识对灰度环境进行验证,等到开发/测试人员对灰度环境的应用测试没有问题时,再手工放行流水线走到真正的线上发布部署阶段。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

操作实践

前提条件

1)开通云效高级版(可免费试用 1 个月),确保在云效应用交付 AppStack 内打开研发流程功能 [ 1] 了。

2)开通 MSE 微服务治理 [ 2]

3.1 开启 MSE 微服务治理

1)将 ACK 微服务应用接入 MSE 治理中心。具体操作,请参见 ACK 微服务应用接入 MSE 治理中心 [ 3]

2)创建 MSE nacos,并复制其内网域名。具体操作,请参见创建 Nacos 引擎 [ 4]

3)创建 MSE 云原生网关,并关联第一步创建的 Nacos。具体操作,请参见创建 MSE 云原生网关 [ 5] 和新建服务来源 [ 6]

3.2 在云效 AppStack 创建三个应用,部署应用基线版本

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

在云效 AppStack 创建三个应用,部署应用基线版本。

我们以 spring-cloud-a 应用为例,详细介绍一个应用的配置流程:

第 1 步:应用关联代码仓库,可以在云效 Codeup 中导入示例代码:https://github.com/aliyun/alibabacloud-microservice-demo.git

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

第 2 步:应用环境配置,一个应用通常可以划分为测试环境(test)、预发环境(pre)、灰度环境(gray)、生产环境(prod),环境关联不同的部署资源(如 K8s 集群),部署服务分别用于不同阶段进行测试验证,并最终提供线上服务。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

第 3 步:应用 Kubernetes 部署编排 YAML 配置。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

  • 将容器镜像定义成占位符 {{ .AppStack.image.backend }},由流水线运行时传入构建好的镜像。
  • 在应用配置的 spec.template.metadata.labels 下加入 MSE 基本配置及灰度相关。

🔔 说明:

  • msePilotCreateAppName 为 MSE 服务治理接入的应用名;msePilotAutoEnable 为是否接入 MSE 服务治理的开关 on 表示开启,off 表示关闭;alicloud.service.tag 则是 MSE 用于灰度发布的节点标签。您可以在 MSE 服务治理控制台,节点详情页面看到节点的标签情况。更多信息,请参见 ACK 微服务应用接入 MSE 治理中心微服务治理 [ 7] 、节点详情 [ 8]
  • {{if eq .AppStack.envName "gray" }} 是基于 GO template 的方式识别当前云效发布的应用环境。如果环境名称为 gray,则为灰度服务。更多信息,请参见 Kubernetes 部署编排 [ 9]
  • nacos-server 需要替换成上述创建的 Nacos 内网域名。

<!---->

apiVersion:apps/v1
kind:Deployment
metadata:
name:spring-cloud-a-{{.AppStack.envName}}
labels:
run:spring-cloud-a-{{.AppStack.envName}}
namespace: {{ .Values.namespace }}
spec:
selector:
matchLabels:
app:spring-cloud-a-{{.AppStack.envName}}
template:
metadata:
labels:
app:spring-cloud-a-{{.AppStack.envName}}
# MSE 灰度相关配置
msePilotCreateAppName:spring-cloud-a
msePilotAutoEnable:'on'
{{ ifeq.AppStack.envName"gray" }}
alicloud.service.tag:gray
{{ end }}
spec:
containers:
-name:spring-cloud-a
image: {{ .AppStack.image.backend }} # 应用镜像占位符,由流水线运行时传入
imagePullPolicy:Always
ports:
-containerPort:20001
livenessProbe:
tcpSocket:
port:20001
initialDelaySeconds:30
periodSeconds:60
env:
-name:spring.cloud.nacos.discovery.server-addr
value:'nacos-server'# nacos-server 替换为上述创建的 Nacos 内网域名
-name:dubbo.registry.address
value:'nacos://nacos-server:8848'# nacos-server 替换为上述创建的 Nacos 内网域名

第 4 步:应用研发流程配置,通常一个应用的研发流程可以分为测试阶段、预发阶段、生产阶段。

生产阶段通常包括镜像构建(也可以选择已有镜像发布)、发布审核、生产发布多个任务。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

  • 镜像构建:选择「镜像构建」组件,配置需要推送到的镜像仓库、标签默认 ${DATETIME}、用于构建的 Dockerfile 路径本示例为 mse-simple-demo/A/Dockerfile。
  • 人工卡点:配置生产发布的审批人。
  • 生产环境部署:选择「AppStack 部署」组件,应用自动填充当前应用、环境选择「生产环境-prod」,制品选择构建的镜像。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

第 5 步:点击「运行」生产发布流程,触发应用镜像构建,镜像构建成功后推送到目标镜像仓库。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

人工审批通过后,触发部署正式环境。点击查看「部署单详情」,查看部署进度。部署单成功后即完成了正式(基线)环境的部署。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

进入环境详情可以查看 Deployment 资源状态和详细信息。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

以上即完成了应用 spring-cloud-a 的代码、环境、编排 YAML、研发流程等配置,完成了 spring-cloud-a 基线环境的部署。spring-cloud-b、 spring-cloud-c 应用配置和上线流程相同。

🔔 注: 当应用较多时,推荐使用应用模板,来完成应用的批量初始化(详见应用模板 [ 10] )。

3.3 配置灰度流程

3.3.1 创建 MSE 全链路灰度泳道

创建全链路灰度泳道组:进入 MSE 治理中心 > 全链路灰度,单击+创建泳道组及泳道(如果您已经创建过泳道组,则单击+创建泳道组)。入口类型选择「MSE 云原生网关」,泳道组流量入口选择目标云原生网关,泳道组涉及应用选择 spring-cloud-a、spring-cloud-b、spring-cloud-c。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

创建分流泳道:泳道标签设置为 gray,路由规则条件列表添加 Parameter group=gray,则请求参数中携带 group=gray 的去往灰度泳道。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

3.3.2 AppStack 应用增加灰度流程

进入云效 AppStack 应用-设置-研发流程,编辑「生产阶段」流程:

在人工卡点任务后添加「灰度环境部署」任务:选择「AppStack 部署」组件,应用自动填充当前应用,环境选择「灰度环境-gray」,制品选择构建的镜像。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

在生产发布任务后添加「灰度环境清理」任务:选择「AppStack 清理环境」组件,应用自动填充当前应用,环境选择「灰度环境-gray」,选择「仅清理资源保留环境元数据」,下次发布时可以重新部署拉起灰度服务资源。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

配置完成后,保存生产阶段流程,即可进入下一步。

3.4 新需求发布,部署灰度环境,灰度验证

3.4.1 灰度环境部署

当接收到一个新的业务需求,涉及 spring-cloud-a 和 spring-cloud-c 两个应用的改动。A、C 两个应用各自完成代码开发、测试预发验证后,进入生产发布阶段。分别点击「运行」A、C 生产阶段研发流程,触发 A、C 灰度环境部署,点击查看「部署单详情」,部署单成功后即完成 A、C 灰度环境的部署。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

3.4.2 开始灰度验证

发起带灰度标识的请求,则结果如下(A 和 C 进行了灰度发布,B 没有进行灰度发布,所以请求去往了 B 的基线环境):

curl -X GET http://47.96.XX.XXX/A/a?group=gray
Agray[192.168.110.161][config=base] -> B[192.168.110.14] -> Cgray[192.168.110.160]

如果请求不带灰度标识,则去往 A、B、C 的基线环境:

curl -X GET http://47.96.XX.XXX/A/a?group=gray
Agray[192.168.110.161][config=base] -> B[192.168.110.14] -> Cgray[192.168.110.160]

可以在 MSE 控制台上看到刚刚发起的灰度请求:

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

3.5 灰度验证通过,发布生产环境

上述灰度验证通过后,即可继续发布生产环境。点击手动触发生产环境发布,查看生产发布批次,观测新老版本号,部署完成后观测生产监控日志。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

3.6 生产发布成功后,销毁灰度环境

生产发布成功后,销毁灰度环境资源,所有流量都进入生产环境。

云效 AppStack + 阿里云 MSE 实现应用服务全链路灰度

至此即完成了应用基线环境的准备、灰度流程配置、灰度发布验证、生产发布、灰度销毁完整流程。

相关链接:

[1] 确保在云效应用交付 AppStack 内打开研发流程功能

https://help.aliyun.com/document_detail/2399732.html

[2] 开通 MSE 微服务治理

https://help.aliyun.com/zh/mse/getting-started/activate-micro...

[3] ACK 微服务应用接入 MSE 治理中心

https://help.aliyun.com/zh/mse/getting-started/enable-microse...

[4] 创建 Nacos 引擎

https://help.aliyun.com/zh/mse/getting-started/create-a-nacos...

[5] 创建 MSE 云原生网关

https://help.aliyun.com/zh/mse/getting-started/create-a-cloud...

[6] 新建服务来源

https://help.aliyun.com/zh/mse/user-guide/add-a-service-sourc...

[7] ACK 微服务应用接入 MSE 治理中心微服务治理

https://help.aliyun.com/zh/mse/user-guide/enable-microservice...

[8] 节点详情

https://help.aliyun.com/zh/mse/user-guide/node-details

[9] Kubernetes 部署编排

https://help.aliyun.com/document_detail/461384.html

[10] 应用模板

https://help.aliyun.com/document_detail/2674996.html

点赞
收藏
评论区
推荐文章
美凌格栋栋酱 美凌格栋栋酱
7个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
基于Istio的灰度发布架构方案实践之路
灰度发布,是指能够平滑过渡的一种发布方式。尤其是对于toB业务和SAAS类平台,很多情况需要根据租户或用户维度进行灰度控制,实现业务上的A/Best功能。尽管几经迭代,但仍存在系统入侵性强、新版本接口异常等问题。因此,探索了一条基于Istio的服务流量治理方案下的灵活可配置的灰度发布方案。
Stella981 Stella981
3年前
Opentracing + Uber Jaeger 全链路灰度调用链,Nepxion Discovery
当网关和服务在实施全链路分布式灰度发布和路由时候,我们需要一款追踪系统来监控网关和服务走的是哪个灰度组,哪个灰度版本,哪个灰度区域,甚至监控从HttpHeader头部全程传递的灰度规则和路由策略。这个功能意义在于:不仅可以监控全链路中基本的调用信息,也可以监控额外的灰度信息,有助于我们判断灰度发布和路由是否执行准确,一旦有问题,也可以快速定位
Stella981 Stella981
3年前
Nepxion Discovery Agent
前言基于SpringCloud的全链路灰度蓝绿发布功能,其中一个场景是,基于Header传递的全链路灰度路由,采用配置中心配置路由策略映射在网关或者服务上,支持根据用户自定义Header跟路由策略整合,最终转化为路由Header信息而实现,路由策略传递到全链路服务中。这是一个非常普遍的需求,但如果业务方用了服务之间异步调用的方式,会导致存储在Th
Stella981 Stella981
3年前
Nepxion Discovery【探索】图形化全链路发布编排建模和流量侦测
全链路编排建模全链路编排建模工具,只提供最经典和最常用的蓝绿灰度发布场景功能,并不覆盖框架所有的功能全链路蓝绿发布编排建模!(https://oscimg.oschina.net/oscnet/488106cc287b4e6aa1dcc5bb092148e2.png)①导航栏上选择〔全链路服务蓝绿发布〕
Stella981 Stella981
3年前
Nepxion Discovery 5.5.0 发布
!(https://oscimg.oschina.net/oscnet/f81c043194ef4732880459d00c1a720e.png)发布日志功能更新:增加基于Opentracing调用链的支持,目前支持UberJaeger,实现在SpringCloudGateway、Zuul和服务上的灰度
Stella981 Stella981
3年前
Nginx + lua +[memcached,redis]
精品案例1、Nginxluamemcached,redis实现网站灰度发布2、分库分表/基于Leaf组件实现的全球唯一ID(非UUID)3、Redis独立数据监控,实现订单超时操作/MQ死信操作SelectPollEpollReactor模型4、分布式任务调试Quartz应用
Stella981 Stella981
3年前
Knative 基本功能深入剖析:Knative Serving 的流量灰度和版本管理
作者|冬岛阿里云技术专家本篇主要介绍KnativeServing的流量灰度,通过一个restapi的例子演示如何创建不同的Revision、如何在不同的Revision之间按照流量比例灰度。部署restapiv1代码测试之前我们需要写一段 restapi的代码,并且还要能够
Stella981 Stella981
3年前
Kubernetes 时代的安全软件供应链
作者汤志敏 阿里云容器服务高级技术专家汪圣平 阿里云云平台安全高级安全专家导读:从Dockerimage到Helm,从企业内部部署到全球应用分发,作为开发者的我们如何来保障应用的交付安全。本文会从软件供应链的攻击场景开始,介绍云原生时代的应用交付标准演进和阿里云上的最佳实践。“没有集装箱,就不会有全球化”。在软件行业里,
Stella981 Stella981
3年前
CODING DevOps 微服务项目实战系列最后一课,周四开讲!
随着软件工程越来越复杂化,如何在Kubernetes集群进行灰度发布成为了生产部署的”必修课“,而如何实现安全可控、自动化的灰度发布也成为了持续部署重点关注的问题。CODINGDevOps微服务项目实战系列最后一课:《DevOps微服务项目实战:基于Nginxingress的自动化灰度发布》将由CODINGDevOps后
Stella981 Stella981
3年前
Knative 应用在阿里云容器服务上的最佳实践
作者|元毅阿里云智能事业群高级开发工程师相信通过前面几个章节的内容,大家对Knative有了初步的体感,那么在云原生时代如何在云上玩转Knative?本篇内容就给你带来了 Knative应用在阿里云容器服务上的最佳实践。何为最佳实践,就是按照生产可用的方式部署服务,提供服务监控告警以及链路追踪。我们按照如下3个部分内容进行: