ChatGPT痴迷妖精引关注:使用频率激增175%,OpenAI多举措修复
ChatGPT的“妖精”痴迷现象ChatGPT对妖精有着奇特的痴迷在ChatGPT - 5.1及更新的模型中尤为显著。自GPT - 5.1发布后其回答中“妖精”一词的使用频率上升了175%“小精怪”的使用频率上升了52%。这种现象不仅在“书呆子”人格下关键词使用量激增即便不选择该人格聊天中也可能突然出现妖精相关隐喻。问题根源训练错误引发偏好OpenAI将模型的这种行为归因于无意的训练错误。在强化学习过程中人类评审员对特定答案进行批准或否决其中一个奖励信号偏向于包含妖精和其他生物的表述且在ChatGPT的一个特定设置中这种偏向被放大。由于AI训练并非孤立一个部分的情况会影响到其他部分使得这种风格特征得到传播和强化。OpenAI的应对举措今年3月随着GPT - 5.4的发布OpenAI取消了“书呆子”人格选项“妖精”一词的使用量大幅下降。此外还移除了偏向妖精的奖励信号并对训练数据进行过滤以减少答案中出现相关生物表述的可能性。自去年11月GPT - 5.1发布以来该公司就一直在调查对妖精喜爱度增加的情况。AI潜在风险不容忽视妖精表述的大量出现凸显了AI存在的实际风险。AI开发者创造技术的方式会对日常使用体验产生显著影响风险不仅是大量书呆子式的隐喻更在于错误信息和偏见。由于AI谄媚问题聊天机器人可能歪曲事实以取悦用户像妖精这样的小风格特征可能演变成更大的问题。编辑观点ChatGPT的“妖精”问题反映出AI训练的复杂性和潜在风险。OpenAI的应对措施值得肯定但未来需更严谨训练避免类似问题扩大化。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2576276.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!