AI 会取代测试工程师吗？来看看最新“AI程序员”Devine的翻车现场

news2026/5/21 15:56:35

引言：一条被炒得过热的赛道2024年3月，Cognition Labs发布了Devin——一款被官方冠以“世界首位AI软件工程师”头衔的产品。演示视频中，Devin自主浏览文档、编写代码、运行测试、提交PR，甚至能在Upwork上接单挣钱。资本市场迅速反应：Cognition Labs在A轮融资中拿到了2100万美元，公司估值一路飙升至20亿美元。一时间，“程序员即将失业”的论调铺天盖地。然而，就在Devin发布后的几个月中，一系列独立测试报告陆续曝光，结果比宣传视频所展示的“惨烈”得多。2025年1月，AI研发实验室Answer.AI的三名数据科学家公开发表了一篇名为《与Devin共度一个月的感想》的博客，系统记录了他们对Devin长达一个月的真实测试体验。测试结果震惊了整个开发者社区：在提交给Devin的20项真实任务中，它只圆满完成了3项，14项彻底失败，成功率仅为15%。更为讽刺的是，分析者亲自复现了Devin在演示视频中完成的任务，结果只用了大约36分钟就完成了，而Devin在演示中却花费了至少6个小时，甚至可能超过一天。人类效率远超AI——这就是被称为“世界首位AI软件工程师”的真实水平。但这篇文章不想停留在“嘲笑AI翻车”的层面。我们真正想探讨的问题是：当AI程序员的“翻车”成为常态，软件测试工程师这个职业究竟会走向何方？AI到底会取代测试工程师，还是会重新定义测试的价值？为了回答这个问题，我们将从Devin的架构设计出发，对比当前主流AI编程工具的能力边界，深入剖析AI生成代码的

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2631971.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！