百川仓配切量接口成长史

京东云开发者
• 阅读 35

背景

百川专项是指物流统一打造企业级能力平台,战略上聚焦纯配、仓配类业务主线,以提升前台业务整体交付吞吐率为核心目标,支撑物流开放领域解决方案和标准产品的快速交付实施。计划以“百川”专项项目为契机,加速推动BP团队将ECLP中各自业务的单据和履约职能整理下沉到订单中心和各自业务的履约层中,以实现业务闭环。业务系统交互图如下:



百川仓配切量接口成长史





图中绿色部分就是判断是否切量,从交互可以看出是否走百川完全取决于切量结果的判断。那么如何精准灵活的控制流量成为切量系统的关键。

下面让我们随着切量接口的发展引出一些遇到问题,并在最后的设计中给出解答。

小树刚发芽

针对仓配的架构升级专项重点是重构原有的eclp-isv、eclp-so、eclp-bd等系统,将原来职责混乱、代码难以维护的老系统,分成接入层、订单中心、履约层三层结构。各系统职责分明、流程清晰,且在各层支持不同业务的横向扩展。这里好处就不在这里班门弄斧了。说回老系统,eclp-isv作为之前的接单入口,承接了多种业务的仓配接单场景。在针对这个入口的切量过程中,目前是以中小件业务作为先头部队打造三层标准能力,也是2022年切量的重点。所以,针对中小件业务,需要专项上上下下逐步赋能,逐步切量。

切量初始阶段,项目组能看清的是我想要什么流量,比如第一次切量,产品和研发确定其中一个事业部的单子百川可以承接。所以只需要按照事业部白名单切量就可以了。下面展示从ISV下单时切量判断的系统交互时序图。



百川仓配切量接口成长史





PS: 这里使用到的神行平台作为切量配置平台,感兴趣的可以了解下。图中红色部分就是切量接口交互过程。接口定义其实很简单,就是传入下单参数,返回布尔值。

快速成长



百川仓配切量接口成长史



随着标准能力不断完善,事业部切入的越来越多。也带来新的问题,单量较大的事业部可能覆盖的功能较多,如上图的A、B、C、D四个功能项。有的能力具备(图中绿色部分),而个别能力还在补齐中(图中灰色部分)。怎么切量才能筛选出我们可以承接的量呢?

很容易想到就是在切量接口里加规则,根据下单参数中某个标位或某几个参数组合去剔除那些明确接收不了的量,让它们走原流程下单。就这样不断迭代中,切量接口中从一个事业部白名单判断到几十种规则匹配,接口的代码量也膨胀到上千行。

程序迭代的过程中,必然会带来的维护成本提高。而作为流量入口,规则可能是几天一更新,也可能是一天更新好几次。如何在一个方法上千行里做到一天几次迭代,且要保证没有问题。一旦出问题,将承接不了的流量引入,三层可能就需要花费一周甚至数周时间去修复,相信所有人都会头疼。

随着切量进展更加深入,对于功能的开发周期经过了逻辑梳理、产品规划、开发、测试、AB比对、uat验证、上线。为了保证上线的切量平稳,就需要线上灰度验证,但是百川是多层结构,从上到下都搭建起灰度环境工作量较大,如何进行灰度,既能较少工作量又能保证稳定呢?

开枝散叶

2023年专项的目标已经从中小件业务扩展到大件、冷链、国际等业务线全面接入百川,而接单的入口都是eclp-isv,也就是所有业务公用一个切量接口。中小件切量积累的切量规则肯定跟其他业务线切量规则会冲突,如何将切量接口进行重构才能支持多业务线不同的切量规则呢?

上面提到的背景都是基于线上环境的。还有个不可忽视的重要手段,那就是AB环境。专项通常投入大量的人力物力在AB比对,就是为了保证在人工无法梳理到场景,通过AB环境录制线上流量的方式进行比对,反向输出需求,进而达到功能全覆盖。



百川仓配切量接口成长史



AB环境需要的流量本质上是以线上规则为基础,删除或修改某一个规则,组合成完整的AB录制规则。例如上图中D流量的录制。

AB录制规则有以下几个特征:

•基于线上规则,只有部分改动

•更新频率比线上规则更加频繁

•每次规则调整到线上同步改动周期不确定,可能1天也可能一两周甚至一两个月。

基于以上的特点,那么我们改如何设计AB录制规则合理呢,毕竟AB分支和线上分支切量方法有一千多行,合并起来总让人头疼。



梳理

说了这么多背景,相信大家对一个小小的切量接口是如何成长,又面临那些困境有了一些了解。那么审题之后,我们来梳理下有哪些痛点。

•单方法内容过多,难以维护

•方法在不同环境单独实现逻辑,合并分支困难

•切量方法不支持横向扩展,多业务线无法做到规则隔离

•新功能切到百川缺少灰度验证

设计

我一直相信 :针对痛点做出的设计才是合理的

那么针对上诉的痛点,我们一一思考如何通过设计来解决。

单方法内容过多

从根本上来看方法的职责,就是通过下单入参来匹配一串规则,规则都满足就进行切量,否则不切量。那么内容过多就需要进行拆分。将大方法拆成一个个小方法,依次执行,任意规则不匹配就中断。这里最关键的是如何拆分合理。那就要看方法内容的核心,在观察和整理所有规则后,提炼出了场景的概念。可以将所有规则按相似含义归类成一个个场景,比如事业部、承运商、加密、合同物流等等。这样用场景命名每个规则,做到直观清晰且语义明确,每个规则都高内聚低耦合。

下面就是定义每个切量规则的接口如下:

public interface RuleMatchPoint {
    /**
     * 切量规则
     * @param shuntContext 下单报文上下文
     * @return 切量规则结果
     */
    boolean match(ShuntContext shuntContext);
}

然后通过责任链模式依次串联起所有切量规则,通常最简单的方式就是利用Spring框架自动将RuleMatchPoint接口注入到一个List中,然后循环调用match方法。



百川仓配切量接口成长史



PS:这里只是展示,并非全部规则。

不同环境隔离

基于上面分析,AB环境的录制规则其实就是基于线上切量规则,然后在某个场景做放开流量调整,得到想要的线上流量。而通过场景拆分,切量规则已经不在臃肿,所以合并线上更新只会在某个场景出现代码冲突。所以我们核心解决两个问题:

•怎么复用线上切量规则

•怎么实现AB环境个性化切量规则。

这两个问题围绕着解决切量规则的“复用”与“个性化”问题,那么我们其实就可以将所有规则进行细分:

1.线上切量规则(个性)

2.AB切量规则(个性)

3.通用规则(复用)

而不同环境就用所属的个性规则+通用规则组成完整的切量规则集合。



百川仓配切量接口成长史





而实现方案Spring提供的@Profile注解可以完美支持,这里需要额外约定将AB环境的规则类命名要加AB前缀,与线上规则类区分开。



不支持多业务线规则隔离

目前切量工作分为系统入口和业务两种维度,其实有些业务还包含标准和KA更细力度。这里就大范围划分如下图。

ISV POP
中小件 ISV中小件切量规则 POP中小件规则
冷链 ISV冷链切量规则 POP冷链切量规则

PS:横向为接单系统入口维度,纵向为业务维度。

我们约定一个名词:业务身份业务身份=入口+业务。 那么一个业务身份对应一套切量规则,就类似一个业务身份对应一个流程编排。要做到根据业务隔离就要针对不同的业务身份定制不同的切量规则,说简单就是给切量规则打标。

根据上面的表我们定义两种维度的注解:

@ISV @POP
@Small ISV中小件切量规则 POP中小件规则
@Cold ISV冷链切量规则 POP冷链切量规则

不同业务身份所属的规则集合就找满足注解的切量规则即可。例如想要执行ISV中小件切量规则就找所有带有@ISV+@Small的RuleMatchPoint接口集合。



当流量从某种切量入口进入后就需要经历两个过程。

1.业务身份确认,如何确认需要业务测提供规则。

2.使用属于当前业务身份的切量规则集合去判断是否切量。

按照这两点,业务切量模板就定义成:

public interface ShuntStrategy {

    /**
     * 业务身份匹配
     * @param shuntContext 切量上下文
     * @return 业务身份是否匹配 true-匹配 false-不匹配
     */
    boolean businessIdentityMatch(ShuntContext shuntContext);

    /**
     * 业务规则匹配
     * @param shuntContext 切量上下文
     * @return 业务规则是否匹配 true-匹配 false-不匹配
     */
    boolean businessRuleMatch(ShuntContext shuntContext);
}

抽象出这两个过程后,我们以ISV入口为例,其中包含中小件和冷链两个业务,流程如下:



百川仓配切量接口成长史





按照这种结构规划后,每个流量只要从某个入口进入后依次进行业务身份判断,直到找到合适业务身份,然后进行规则匹配,最终返回是否切量结果,如果没有匹配的业务身份则不切量。



如何控制模板顺序

其实业务模板其实是需要顺序的,顺序的控制可以使用Spring框架的@Order注解或XML配置都是合理的。至于哪个业务线在前哪个在后就要综合业务流量规模和业务线其他属性共同决定了。



如此设计后,将单一的业务线的规则集合就扩展到支持业务线维度的横向扩展。而且新流程接入和某个业务线切量规则调整不会影响其他业务线。



我们还是设计了切量规则支持扩展功能。这是因为在各个业务线切量周期、节奏都不相同。我们第一步是完成中小件业务承接,所以规则集合写在切量应用中。而冷链、国际等其他业务线,将对应业务的流量是否切量的权限下发给各个业务线。这种权限下放,可以让业务灵活控制切量,而避免多方协同出错协同延时问题。



缺少灰度验证

这里的灰度验证实际上是指找到线上符合验证条件的流量,控制其中一小部分走到新流程中验证功能正确性,其他流量还走原流程。分析这个需求可以提炼出两点:

1.找到符合条件的流量

2.控制多少量允许进入新流程

找到符合条件流量容易,只要能说出条件就能写出规则。那么功能的重点就在如何实现控制流量,也就是限流。

通常限流采用redis,设置带有过期时间的key,获取key的值是否超过上限,超过限流,否则自增。这个用于灰度验证的场景也很合适,那么就需要考虑如何定义key合理。



百川仓配切量接口成长史



限流配置比较简单,这里就不赘述了。

截止到目前,有实现的限流规则有30多个。将所有限流规则打包成一个切量规则,然后集成到切量规则责任链的最后一个节点即可完成限流集成。那么切量规则已经支持按照业务身份分组了,限流规则是否需要也要分组呢?以图中SoMark限流为例,无论哪种业务都可能存在SoMark限流诉求,只不过限流的配置不同。所以设计要做到逻辑通用、配置根据业务身份独立两点。

•逻辑通用:在切量规则注解中扩展一个@Common注解,每个业务都集成这个注解的切量规则。

•配置独立:当限流读取配置时,根据所属的业务身份取不同的限流配置。



除了上面提到四个痛点的设计之前还有包括幂等设计、数据统计设计等等,篇幅有限就不一一展示了。

全景展示

最终落地的结构如下图所示:



百川仓配切量接口成长史





总结

从一个小小的接口演变成如此支持业务扩展、入口扩展、环境扩展的“3D”接口。也是我从参与专项一路摸爬滚打至今的缩影吧。欢迎大家一起探讨,有考虑不周的也欢迎指出。

其实我觉得,大到系统间规划小到接口重构,相对于重要战略落地、紧急需求上线来说,属于重要不紧急的那一类。但不应该等等再说,而应该未雨绸缪,随机应变。

感谢观看。

点赞
收藏
评论区
推荐文章
随机高并发查询结果一致性设计实践
物流合约中心是京东物流合同管理的唯一入口。为商家提供合同的创建,盖章等能力,为不同业务条线提供合同的定制,归档,查询等功能。由于各个业务条线众多,为各个业务条线提供高可用查询能力是物流合约中心重中之重。同时计费系统在每个物流单结算时,都需要查询合约中心,确保商家签署的合同内容来保证计费的准确性。
【提升团队运营效率】交易履约之订单中心实践
交易履约订单中心为履约行为提供必要的系统能力支撑,交易履约订单中心记录了交易流通的过程和状态,包括交易主体、产品信息、成交金额、计费、支付、业务信息等全流程信息,为上下游提供数据标准化、全集数据查询和串联流程的功能。
飞速成功案例 | MES系统升级重构,覆盖业务流程各场景功能
1个系统解决所有业务问题覆盖业务流程各场景功能(图片来源于:百度)筑友集团定位为智慧建筑整体解决方案服务商,旨在以EMPC为核心产品,打造涵盖研发、设计、PC构件、装备、施工、新材、装饰、园林、智能家居等业务的全生态链优势企业。筑友集团已在全国22省、45城布局智能化数字工厂,全球首创的EMPC业务模式得到社会和客户广泛认可,目前已服务全国项目600万㎡,工
SAP 发布2022年第三季度财报
云业务增长持续加速,中国市场表现更加突出。云收入分别增长了38%和25%(固定汇率)目前,要交付的云业务以38%和26%的速度增长(固定汇率)SAP(https://www.sap.cn/index.html)S/4HANA当前要交付
京东云开发者 京东云开发者
6个月前
全场景流量验证系统 | 京东物流技术团队
本文介绍了一种基于线上流量实现对重构系统进行功能和性能验证的实践方案。针对线上流量如何拦截、如何录制、如何存储、如何回放以及如何发压均作了详细说明,为具有类似需求的读者提供了一种可供参考的思路。1业务背景随着百川项目的启动,中台需要对订单流量收口,将ECL
京东云开发者 京东云开发者
5个月前
Batrix企业能力库之物流交易域能力建设实践 | 京东物流技术团队
简介Batrix企业能力库,是京东物流战略级项目技术中台架构升级项目的基础底座。致力于建立企业级业务复用能力平台,依托能力复用业务框架Batrix,通过通用能力/扩展能力的定义及复用,灵活支持业务差异化场景的快速能力编排组装,从而通过技术驱动的方式助力业务
京东云开发者 京东云开发者
3个月前
码上加速,低代码解锁高效交付案例
一、背景简介站长工作台,致力于为京东物流所有站长、运营管理人员提供高效工作平台,拥有多元化的业务形态。我们力求提升团队研发效率、实现敏捷业务交付,以打造一支具备灵活性、高度协作和强适应能力的敏捷团队。二、提效案例描述2.1、痛点分析站长工作台的报表页面和任
最佳案例 | 游戏知几 AI 助手的云原生容器化之路
作者张路,运营开发专家工程师,现负责游戏知几AI助手后台架构设计和优化工作。游戏知几随着业务不断的拓展,游戏知几AI智能问答机器人业务已经覆盖了自研游戏、二方、海外的多款游戏。游戏知几研发团队主动拥抱云原生,推动后台业务全量上云,服务累计核心1w。通过云上的容器化部署、自动扩缩容、健康检查、可观测性等手段,提高了知几项目的持续交付能力和稳定性,形成了
万界星空科技 万界星空科技
4星期前
万界星空科技WMS仓储管理包含哪些具体内容?
​wms仓库管理是通过入库业务、出库业务、仓库调拨、库存调拨和虚仓管理等功能,综合批次管理、物料对应、库存盘点、质检管理、虚仓管理和即时库存管理等功能综合运用的管理系统,有效控制并跟踪仓库业务的物流和成本管理全过程,实现完善的企业仓储信息管理。
飞速成功案例 | “ 腾讯+飞速 ” 互联网企业的数字化实践之路
​腾讯作为BAT三大巨头之一;在2018年引进了低代码平台,以低代码为核心的一体化高生产力平台赋能业务,在不同的业务领域中进行探索和突破。传统低代码无法适应市场发展随着腾讯的核心业务迅速发展,定制化需求的业务不断涌现,传统模块无法适应快速发展的市场定制化需求;尤其是标准化应用二次开发的限制成为了业务掣肘,信息化建设倾向于统建、大集中共享模式,对项目协同与管控要求较高。基于此,如何通过容器化优化资源使用、提升运维效率、加速微服务落地;使用国产化的底层资源和服务,做到自主可控,安全性强;实现系统云化、简单易用