接手遗留系统第一周,我做了三件事,团队从此不再怕改老代码
刚跳槽到新公司技术总监在入职谈话时递给我一杯咖啡语气沉重地说“我们最核心的交易系统已经跑了八年负责它的老张去年离职了。现在整个团队没人敢动里面的代码每次改需求都像在拆炸弹。”他停顿了一下看着我的眼睛“你是测试出身我希望你能从质量保障的角度帮团队找回安全感。”那一刻我知道我接手的不是一份工作而是一场硬仗。很多测试同行面对遗留系统时第一反应是抱怨没有文档、没有测试用例、代码像意大利面条一样纠缠在一起。这些抱怨都对但解决不了问题。我在第一周做了三件事这三件事没有一行代码是测试脚本却从根本上改变了团队对老代码的恐惧。今天我把这套方法论完整分享出来希望能给同样挣扎在遗留系统泥潭里的测试人一些启发。第一件事建立“安全网”而非“测试集”入职第一天我翻遍了整个项目的代码仓库发现测试覆盖率不到百分之八。更致命的是仅有的几十个测试用例中有一半因为环境依赖问题根本跑不通。按照常规思路我应该立刻开始补测试用例但我知道这条路走不通——在一个没有测试文化、代码高度耦合的系统上强行写单元测试只会产出大量脆弱且难以维护的测试代码最终被团队抛弃。我做了一个让开发团队意外的决定不写单元测试先建“特征测试”。特征测试的概念来自Michael Feathers的经典著作《修改代码的艺术》它的核心思想是在不理解内部实现的情况下通过测试来捕获系统当前的外部行为。具体做法很简单——找到系统对外暴露的接口无论是HTTP API、消息队列的消费端还是定时任务的输出用最粗粒度的方式把它们的输入和输出记录下来形成一份“行为快照”。那个星期我带着两个测试小伙伴用Postman和自动化脚本把交易系统最核心的十二条业务链路全部跑了一遍覆盖了正常路径、边界值场景和已知的异常分支。每一条链路我们都做了三件事记录请求参数、记录返回结果、记录数据库的关键状态变化。这些不是传统意义上的测试用例它们不判断对错只忠实记录“系统现在是怎么运行的”。这套特征测试的价值在第三天就体现出来了。一个开发同事需要修改订单状态机的流转逻辑他改完代码后我花了不到十分钟跑了一遍特征测试套件立刻发现有三条链路的数据库最终状态与修改前不一致。我们顺藤摸瓜定位到他修改的那段代码有一个隐藏的副作用——在特定条件下会额外触发一次库存扣减。这个问题如果带到线上后果不堪设想。更重要的是这套特征测试让团队第一次对遗留系统有了“掌控感”。以前改代码靠猜现在至少知道改完之后哪些地方的行为发生了变化。测试覆盖率这个数字本身没有魔力真正有价值的是“你敢不敢改代码”的底气。特征测试给了团队这个底气。第二件事用“考古学”方法重建知识图谱很多测试人员认为理解业务逻辑是产品和开发的事测试只需要验证功能是否符合需求文档。但在遗留系统中需求文档要么不存在要么早已过时。如果测试团队对业务一无所知所有测试都只能停留在表面发现不了深层次的逻辑缺陷。第二件事我发起了一个叫“代码考古”的活动每周两次每次一小时邀请开发、产品和测试一起参加。规则很简单每次选取系统中的一个核心模块由一个人在屏幕前阅读代码其他人一起推理这段代码背后的业务逻辑。我们的目标不是评判代码好坏而是回答三个问题这段代码在什么业务场景下被调用它做了什么事情为什么当时要这样设计第一次考古的对象是订单模块中一段三百行的核销逻辑代码里充斥着拼音缩写的变量名和令人费解的条件判断。开发同事读到一半就放弃了说“这代码简直不是人写的”。但我坚持让大家继续因为我在前一天的准备中用Git的blame功能追溯了这段代码的提交历史发现它在五年间被修改过二十三次每一次修改都对应着一个线上故障的修复。当我们把每一次修改的提交信息和当时的故障工单对应起来后那段看似混乱的代码突然变得清晰了。每一个奇怪的判断分支都是为了处理一种特殊的业务场景有的渠道订单不允许部分核销有的商品类型需要校验批次号有的客户因为合同条款的原因要走特殊的结算流程。这些知识原本只存在于老张的脑子里随着他的离职变成了团队的盲区。通过代码考古我们把这些隐性知识重新挖掘出来整理成了一份“业务逻辑决策记录”。这份文档不描述代码怎么写只记录业务规则是什么、为什么这样定、有哪些例外情况。三个月后这份文档成了团队最宝贵的资产新同事入职第一周就能通过它理解核心业务而不是对着代码发呆。从测试的角度看代码考古的价值在于它让我们从“验证需求”升级到“理解业务”。当你真正理解了一个功能为什么存在、它在整个业务链条中的位置是什么你设计的测试场景自然会覆盖到那些容易出问题的边界地带而不是机械地对照需求文档写用例。第三件事建立“修改影响地图”前两件事做完团队对遗留系统的信心明显提升了。但我发现还有一个痛点没有解决当产品提出一个新需求时开发和测试都无法快速判断这个改动会影响系统的哪些部分。每次评估工作量都像在赌博上线后经常发现改了一个地方另一个看似无关的功能却出了问题。第三件事我引入了“修改影响地图”这个工具。具体做法是我们把特征测试覆盖的十二条核心链路画成一张流程图标注出每条链路经过的模块、数据表和外部依赖。当一个修改需求提出时我们先在这张地图上标记出修改点然后顺着数据流向和调用关系找出所有可能被影响的链路。这张地图第一次派上用场是在一次需求评审会上。产品经理想在订单创建流程中增加一个新的校验规则按照他的理解这个改动只影响订单模块。但当我们在地图上标记出修改点后发现订单创建后的数据会被库存系统、财务系统和报表系统消费而新加的校验规则会改变订单数据的某个字段格式。如果不是这张地图我们根本不会意识到需要通知财务和报表团队做兼容性处理。从测试的角度修改影响地图直接决定了我们的回归测试范围。以前每次发布前我们只能凭经验选择要回归的场景要么范围太大导致测试资源不够要么范围太小漏掉了关键链路。有了影响地图之后回归测试的范围由修改点自动推导出来既不会过度测试也不会遗漏风险点。更重要的是这张地图让测试团队从被动执行变成了主动预警。当开发同事提出技术方案时我们能够基于影响地图给出质量风险提示告诉他们这个改动除了满足产品需求之外还需要关注哪些下游系统。这种能力让测试团队在项目中的话语权明显提升不再是被安排工作的角色而是质量风险的把控者。三件事做完团队对遗留系统的恐惧消失了。不是因为代码变好了而是因为我们建立了一套应对不确定性的机制。特征测试让我们知道改了什么代码考古让我们理解为什么这样改影响地图让我们预判改完之后会发生什么。这三者组合在一起就是面对遗留系统时最稀缺的东西——安全感。最后我想说遗留系统并不可怕可怕的是面对它时的无力感。作为测试从业者我们不需要成为代码高手才能发挥作用我们的核心价值在于建立反馈机制、挖掘隐性知识、管理系统风险。当你把这些能力用在遗留系统上你会发现那些让人头疼的老代码恰恰是你展现专业价值的最好舞台。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2617312.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!