【论文阅读】从过程技能到策略基因:走向经验驱动的测试时进化 From Procedural Skills to Strategy Genes: Towards Experience-Driven
从过程技能到策略基因:走向经验驱动的测试时进化From Procedural Skills to Strategy Genes: TowardsExperience-Driven Test-Time Evolution作者:Junjie Wang¹˒²* Yiming Ren¹˒²* Haoyang Zhang¹*¹ InfiniteEvolutionLab, EvoMap ² 清华大学wangjunjie@sz.tsinghua.edu.cn, rym24@mails.tsinghua.edu.cn, 17@evomap.ai摘要本Beta技术报告探讨了可复用经验应如何表示,才能作为有效的测试时控制信号以及迭代进化的载体。我们在45个科学代码求解场景中进行了4,590次受控实验来研究这一问题。我们发现,面向文档的Skill包提供的控制是不稳定的:其有用信号稀疏,将紧凑的经验对象扩展为更完整的文档包往往无济于事,甚至会降低整体平均水平。我们进一步表明,表示本身是一个一阶因素。紧凑的Gene表示产生了最强的整体平均水平,在大幅结构扰动下仍保持竞争力,并优于等预算的Skill片段,而重新附加面向文档的材料通常会削弱而非改善其效果。在一次性控制之外,我们展示了Gene也是迭代经验积累的更好载体:附加的失败历史在Gene中比在Skill或自由文本中更有效,可编辑的结构在内容之外也很重要,失败信息在被蒸馏为紧凑警告时最为有用,而非简单地附加。在CritPt上,基因进化的系统将其配对基础模型
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2630043.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!