沐曦股份曦云C系列GPU完成腾讯混元翻译模型Hy-MT2 Day 0 深度适配

news2026/5/23 15:12:42

5月21日腾讯混元翻译模型Hy-MT2正式开源包含3个尺寸的模型Hy-MT2-1.8B、Hy-MT2-7B、Hy-MT2-30B-A3B。沐曦股份曦云C系列GPU凭借全栈自研技术优势率先实现对三个模型的Day 0深度适配。此次腾讯混元宣布开源的三个模型均重点支持33个语种互译支持5种民汉/方言。相比上一代翻译模型Hy-MT1.5Hy-MT2 效果提升明显尤其在多语言指令遵循、专业领域翻译和真实应用场景翻译中表现较好追平甚至超过大尺寸通用模型。全场景模型适配低成本迁移部署沐曦股份自研MXMACA软件栈拥有对主流编程生态的底层高度兼容能力。原生兼容PyTorch、TensorFlow等40主流AI框架支持500AI模型与4500开源项目覆盖95%主流AI场景开发者可实现“零代码”或极低改造成本迁移大幅降低部署门槛。依托MXMACA软件栈与曦云C系列GPU的深度协同沐曦平台在混元Hy-MT2系列开源当日即完成全功能适配满足不同算力需求的灵活部署。软硬一体充分释放模型潜力曦云C系列GPU凭借自主核心GPU IP与MXMACA软件栈深度优化充分释放模型潜力。Hy-MT2-1.8B仅单卡即可高效运行实现极低延迟的翻译推理Hy-MT2-7B与Hy-MT2-30B-A3B依托曦云C系列大显存与高带宽稳定支撑高并发推理与大规模训练任务。生态共建持续领跑模型适配2025年2月MXMACA软件栈正式开源至今已积累近50万的生态开发者用户。为混元Hy-MT2系列等国产大模型提供持续迭代优化的生态支撑。目前沐曦股份已经极速适配业内顶尖模型达24个全面覆盖DeepSeek、小米、阿里千问、百度等头部厂商最新旗舰模型品类涵盖语言、多模态、OCR、文生图、3D 生成等全领域。关于腾讯混元翻译模型Hy-MT2通用翻译能力出众重点优化专业领域和真实业务场景在通用翻译能力评测中Hy-MT2系列三个模型在 FLORES-200 平均表现上分别达到目前行业表现最好的翻译模型 Gemini 3.1 Pro 的 88.1%、 96.9%,和 98.1%水平已经十分接近。同时Hy-MT2-7B和 Hy-MT2-30B-A3B 的实测得分超过 DeepSeek-V4-Pro和Kimi K2.6等开源模型。在轻量级模型的横向对比中Hy-MT2-1.8B 也整体优于头部商业翻译 API。在保持通用翻译能力的同时Hy-MT2进一步面向真实业务场景和专业领域翻译进行优化。可以看到在真实场景测试集上Hy-MT2-1.8B 和 Hy-MT2-7B 的 GEMBA 评分基于大语言模型的翻译质量自动评估指标分别达到 Gemini 3.1 Pro 的 96.7% 和 99.9%水平并且这一场景下Hy-MT2-30B-A3B 效果已经超过 Gemini 3.1 Pro。在涵盖 8 个专业领域的 DomainMTBench 上三个模型的 GEMBA 评分分别达到 Gemini 3.1 Pro 的 96.2%、97.9% 和 99.0%水平几乎持平。另外可以看到Hy-MT2-30B-A3B在金融、政治、教育几个垂直领域的翻译表现已经部分超过主流翻译模型。相比上一版本模型Hy-MT2的最大提升体现在指令遵循能力上模型能够更准确地理解并执行用户关于术语、风格和输出格式等方面的具体要求。腾讯混元自建数据集IFMTBench测试结果表明Hy-MT2-7B和 Hy-MT2-30B-A3B的翻译效果已经超越等相近尺寸开源模型接近 Gemini 3.1 Pro。IFMTBench也随着模型发布一并开源这是一个翻译指令遵循测试集测试集中的指令主要是和翻译任务相关例如翻译风格变换、指定术语翻译等指令和待翻译的文本涵盖了多个语种。架构创新和极致量化极低比特量化版本仅需约 440MB 即可部署跟此前模型不一样的是为在翻译效果和推理效率之间取得更好的平衡Hy-MT2首次引入混合专家架构推出 Hy-MT2-30B-A3B通过扩大总参数规模提升模型容量同时控制每次推理时的激活参数量在增强翻译质量的同时降低推理开销相比单纯扩大稠密模型规模这种设计更适合面向真实应用场景的高质量翻译系统。此外上一版本的模型Hy-MT1.5-1.8B虽已提供 4-bit量化版本但该版本仍需要 1GB 以上的存储空间在移动端、边缘设备和其他资源受限环境中存在一定部署压力并且其推理速度也难以充分满足部分低延迟翻译场景的需求。针对这些问题Hy-MT2进一步探索极低比特量化方案。除4-bit、8-bit 和 FP16 版本外Hy-MT2还基于混元自研技术提供了 1.25-bit和2-bit版本以适配不同硬件环境下的部署需求。特别地基于混元自研Sherry 框架实现的1.25-bit 极低比特量化版本仅需约 440MB 存储空间即可部署。模型体验链接及开源地址HuggingFacehttps://huggingface.co/collections/tencent/hy-mt2Modelscopehttps://modelscope.cn/collections/Tencent-Hunyuan/Hy-MT2Githubhttps://github.com/Tencent-Hunyuan/Hy-MT2腾讯云https://console.cloud.tencent.com/tokenhub/text腾讯混元官网https://aistudio.tencent.com/llm/zh?tabIndex0沐曦开发者社区developer.metax-tech.com

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2638102.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！