【论文阅读】从过程技能到策略基因：走向经验驱动的测试时进化 From Procedural Skills to Strategy Genes: Towards Experience-Driven

news2026/5/21 1:54:29

从过程技能到策略基因：走向经验驱动的测试时进化From Procedural Skills to Strategy Genes: TowardsExperience-Driven Test-Time Evolution作者：Junjie Wang¹˒²* Yiming Ren¹˒²* Haoyang Zhang¹*¹ InfiniteEvolutionLab, EvoMap ² 清华大学wangjunjie@sz.tsinghua.edu.cn, rym24@mails.tsinghua.edu.cn, 17@evomap.ai摘要本Beta技术报告探讨了可复用经验应如何表示，才能作为有效的测试时控制信号以及迭代进化的载体。我们在45个科学代码求解场景中进行了4,590次受控实验来研究这一问题。我们发现，面向文档的Skill包提供的控制是不稳定的：其有用信号稀疏，将紧凑的经验对象扩展为更完整的文档包往往无济于事，甚至会降低整体平均水平。我们进一步表明，表示本身是一个一阶因素。紧凑的Gene表示产生了最强的整体平均水平，在大幅结构扰动下仍保持竞争力，并优于等预算的Skill片段，而重新附加面向文档的材料通常会削弱而非改善其效果。在一次性控制之外，我们展示了Gene也是迭代经验积累的更好载体：附加的失败历史在Gene中比在Skill或自由文本中更有效，可编辑的结构在内容之外也很重要，失败信息在被蒸馏为紧凑警告时最为有用，而非简单地附加。在CritPt上，基因进化的系统将其配对基础模型

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2630043.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！