【大模型LLM学习】天池Deep Research Agent开发赛
前言运气不错这次压线前10不过和top还是有差距的数据包括问题和答案可以在比赛官网获取包括初赛的100题和复赛100题。赛题为输入query输出answer通过搭建Search Agent分解问题、多跳搜索识别线索找到最佳答案并用题目要求的规范格式进行回答题目和答案例如question:一位物理学领域的学者为一种经典棋盘游戏设计的评分系统后来被一家北美游戏公司广泛应用于其一款多人在线战术竞技游戏中。这家公司的母公司是一家亚洲科技巨头该巨头在21世纪10年代完成了对前者的全资收购并涉足量子计算等前沿科技领域。在这家北美公司开发的另一款第一人称射击游戏中有一件适合近距离作战的武器其名称与上述亚洲巨头代理发行的一款格斗手游中的一名在登场角色中年龄偏大的武术教官角色相同。这款格斗手游的名字是什么answer:魂武者答案规则赛题的答案如果是实体取名顺序为百度百科英文wiki中文wiki没有特殊说明情况下答案语言和题目语言一致可以参考的解决方案阿里的deepresearch比赛限制为LLM上只能使用阿里的大模型API禁止微调模型。可以使用Google/bing/阿里IQS等web search网络搜索api的普通搜索模式和jina禁止调用Tavily的websearch每个问题总时长要求10分钟以内方案链接https://github.com/DXWEIE/tianchi_deepresearch_agent架构ReACT Best of N搜索引擎中文使用DDGS、阿里IQS英文在此基础上使用google同时如果触发了wiki搜索分别使用wikipedia和阿里IQS(搜xxx 百度百科)经验记录先把最简单的react跑通然后再尝试提升效果qwen3.5的效果一般速度也比较慢优先使用qwen3-maxqwen3.5qwen3-plus先提升单个链路的能力最后再尝试并发多rollout然后merge结果取best的后续等看完top的代码更
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2433354.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!