学习如何聚合零样本大型语言模型代理以进行企业披露分类
摘要本文研究一个轻量级训练聚合器是否能够将多样化的零样本大语言模型判断整合为更强的下游信号用于公司披露分类。零样本大语言模型无需针对特定任务进行微调即可阅读披露文本但其预测结果常因提示词、推理方式和模型家族的不同而存在差异。我采用一个多智能体框架来解决这一问题三个零样本智能体各自独立阅读每份披露文件输出情感标签、置信度分数和简短理由。随后一个逻辑回归元分类器将这些信号聚合起来预测次日的股票收益方向。我使用的样本包含2018年至2024年间纳斯达克和标普500指数成分公司发布的18,420份公司披露文件并与次日的股票收益进行匹配。结果表明经过训练的聚合器优于所有单一智能体、多数投票、置信度加权投票以及FinBERT基线。平衡准确率从最佳单一智能体的0.561提升至训练聚合器的0.612在那些当前业绩强劲但伴随弱指引或风险上升的披露文件中提升最为显著。这些结果表明零样本大语言模型智能体捕捉到了互补的金融信号而有监督的聚合可以将跨智能体的分歧转化为更有用的分类目标。1 引言文本信息在实证金融研究中扮演着日益重要的角色。过往研究表明新闻报道、公司披露以及投资者沟通中蕴含着关于资产价格和公司表现的可预测信息Tetlock, 2007; Tetlock et al., 2008; Price et al., 2015; Huang et al., 2014; Li, 2008。对监管文件、财报电话会议和在线平台的研究进一步表明从文本中提取的情感和注意力能够影响交易行为和收益动态Loughran and McDonald, 2011; Da et al., 2011; Chen et al., 2014。上述文献证实金融文本中包含了对于资产定价具有经济意义的信号。近期研究通过引入变换器模型和大语言模型扩展了这一领域这些模型能够捕捉到词典方法常常遗漏的上下文和语义信息Devlin et al., 2019; Liu et al., 2019; Zhang et al., 2022; Huang et al., 2023; Kirtac and Germano, 2024。更广泛地看最新的情感分析研究表明当特定领域的标注成本高昂或难以持续维护时零样本和少样本大语言模型方法会颇具吸引力Wang and Luo, 2023; Bai et al., 2024; Hellwig et al., 2025。然而零样本大语言模型的输出往往在提示词和推理路径上表现出不稳定性。这一问题对于公司披露而言尤为突出因为此类文本的语言通常是混合性的而非单一地积极或消极。一份披露文件可能报告了强劲的已实现盈利但同时降低了未来指引也可能宣布营收增长却同时揭示了诉讼、监管或流动性风险。一个提示词可能过度关注当前业绩而另一个提示词可能过度强调风险表述因此单一零样本判断反映的可能只是提示词的侧重点而非披露文件的完整权衡。这为自然语言处理和金融学两个领域都提出了一个自然的问题零样本智能体之间的分歧能否化劣势为优势多智能体大语言模型系统通常以推理的多样性为出发点近期研究表明引入更多智能体并加以聚合可以改进个体输出Li et al., 2024; Fei et al., 2023。公司披露提供了一个有用的测试场景因为此类文本包含竞争性信号、特定领域词汇以及可以通过下游市场结果来评估的短期后果。因此它非常适合研究聚合多个零样本视角所产生的分类信号是否能优于任何单一智能体或简单投票规则的表现。我通过一个用于公司披露分类的多智能体零样本框架来解答这一问题。三个零样本智能体从不同的金融视角阅读同一份披露文件并返回一个情感标签、一个置信度分数以及一段简短理由。随后我训练一个轻量级元分类器将这些联合输出聚合起来用于预测次日的股票收益方向。我并未对基础大语言模型进行微调仅训练聚合层。这种设计使系统保持简洁、数据高效并与近期零样本多智能体情感分析的研究方向保持一致Fei et al., 2023; Wang and Luo, 2023; Bai et al., 2024。这也符合实际的金融应用场景虽然有大量文本可用但高质量的情感标签稀缺或构建成本高昂Pustejovsky and Stubbs, 2013; Geva et al., 2019; Paullada et al., 2021。本文主要有三点贡献。第一我引入了一个紧凑的多智能体零样本框架用于公司披露分类。第二我检验了经过训练的聚合器在样本外收益方向分类上是否优于单一智能体和投票基线。第三我通过对混合信号披露的简短分析展示了聚合作用最为显著的场景。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2453923.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!