阿里 Qwen 郁博文加入字节 + Qwen 新管理架构出炉
前段时间阿里 Qwen 技术负责人林俊旸离职同时还有多位高 P 核心成员离开本文汇总 2 个后续消息。①3 月 12 日多家科技媒体消息原阿里通义实验室 Qwen 大模型后训练负责人郁博文已正式加入字节跳动 Seed 团队负责视觉模型与多模态交互团队的后训练工作。郁博文为中科院博士2022 年以阿里星身份加入达摩院是 Qwen 大模型核心骨干长期负责模型对齐、指令微调与用户体验优化后训练直接决定大模型好不好用。3 月 3 日郁博文提交了辞职申请并于 3 月 4 日正式离职他的工作随后由前 DeepMind 高级资深研究员周浩接任。②3 月 9 日下午据晚点LatetPost报道阿里在对千问大模型团队有了新的管理安排1、Qwen 模型一号位由阿里云 CTO 和通义实验室负责人周靖人代管他会深入了解模型发展需要的资源提升各环节协作效率确保模型高效迭代。2、负责 Qwen 预训练的刘大一恒则将同时代管后训练和 Coding 团队。刘大一恒和 Qwen 模型团队的其他 leader 向周靖人汇报。参考鞭牛士、新浪科技、晚点LatePost
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2409903.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!