IBM 发布 Granite 4.1 系列模型:多模态能力卓越,为企业 AI 应用提供全面解决方案
推出 IBM Granite 4.1 系列模型IBM 发布迄今为止规模最大的模型涵盖全新的语言、视觉、语音、嵌入和守护模型专为企业工作负载量身定制。可在 AnythingLLM、Artificial Analysis、Hugging Face 等平台开启使用之旅。人工智能日益成为企业应用和软件工作流程的核心IBM 此次发布的 Granite 4.1 系列模型是其 Granite 模型家族的最新版本涵盖小型语言模型、语音、视觉、嵌入和守护模型目标是让开发者能在企业级人工智能系统中轻松使用这些模型。具备出色指令遵循和工具调用能力的语言模型Granite 4.1 的核心是新一代密集型、仅解码器架构的语言模型提供 3B、8B 和 30B 参数的基础模型和指令模型性能显著超越同等规模的 Granite 4.0 语言模型。在指令遵循和工具调用方面与市场上其他开源模型相比颇具竞争力。Granite 4.1 语言模型的性能突破得益于 IBM 注重数据质量和分阶段优化的训练理念使用约 15 万亿个令牌将上下文长度扩展到 512K 令牌。预训练后通过监督微调以及多阶段强化学习流程进行优化。IBM 研究院杰出工程师 Rameswar Panda 表示Granite 4.1 是企业工作负载的强大且适合生产环境的选择。企业人工智能工作流程不仅仅处理文本Granite Vision 4.1是一种视觉语言模型专门为文档理解任务设计擅长理解表格、图表信息和提取键值对。IBM 研究院研究经理 Eli Schwartz 称它可作为前沿模型的替代方案。其性能提升得益于受 DeepStack 启发的特征注入方案和大量训练数据。此外团队还发布了用于图表理解的 ChartNet 数据集。Granite Speech 4.1IBM 研究院发布的一系列模型引入针对边缘用例调优的多语言语音识别和翻译模型。Granite Speech 4.1 2B 的单词错误率达到 5.33%在 OpenASR 排行榜上跻身顶尖模型之列。还发布了另外两个变体其中 Granite Speech 4.1 2B NAR 可一次性生成整个序列提高了 GPU 利用率和吞吐量。此前IBM 和澳大利亚皇家飞行医生服务团队曾用早期版本构建转录引擎。Granite Guardian 4.1替代了 Granite Guardian 3.3 8B在 Granite 4.1 8B 基础上微调增加了更多风险定义。它旨在作为审核模型评估大语言模型输入和输出的安全性、质量和正确性可与任何语言模型一起运行。Granite Embedding Multilingual R2将检索支持扩展到 200 多种语言增加了上下文长度能在大型多语言文档集合中进行高效语义搜索预计在 MTEB 排行榜上排名靠前。企业人工智能的全面解决方案Granite 4.1 模型的发布代表了对基础模型作用的系统级思考为企业打造模块化、高效且可管理的人工智能系统。所有模型均根据 Apache 2.0 许可证发布可在 watsonx、Hugging Face 等平台试用针对流行的开源推理运行时进行了优化支持灵活部署。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2579993.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!